Оценка качества уравнения регрессии

Формулировка и доказательство теоремы Гаусса-Маркова. Анализ точности определения оценок коэффициентов регрессии. Понятие коэффициента детерминации. Построение доверительных интервалов по линейному уравнению регрессии и расчёт коэффициента вариации.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 28.07.2013
Размер файла 236,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Контрольная работа

Оценка качества уравнения регрессии.

План

1. Теорема Гаусса-Маркова

2. Анализ точности определения оценок коэффициентов регрессии

3. Качество уравнения регрессии. Коэффициент детерминации

4. Интервалы прогноза по линейному уравнению регрессии

Литература

1. Теорема Гаусса-Маркова

Вернемся к рассмотрению регрессионного уравнения . Сделаем некоторые предположения.

1) - спецификация модели, отражающая наше представление о механизме зависимости.

1) Хt - детерминированная экзогенная переменная. Случайный член должен быть распределен независимо от объясняющей переменной.

3) М() = 0, то есть случайный член не должен иметь систематического смещения. Это условие всегда можно выполнить, если модель включает свободный член, который будет учитывать любую систематическую тенденцию. Можно считать это условие выполняющимся автоматически.

D() = M(2) - M2() = M(2) = 2 = Const для всех наблюдений. Условие независимости дисперсии от номера наблюдений называют гомоскедастичностью. Случай не выполнения условия гомоскедастичности называют гетероскедастичностью - M(2) = 2 Const,

4) cov(i, j) = M(i j) -M(i)M(j) = M(i j) = 0. Предполагается отсутствие систематической связи между значениями для разных наблюдений. Случайные члены должны быть независимыми. В случае, когда это свойство нарушается (временные ряды), говорят об автокорреляции остатков - M(i j) 0.

Часто добавляется условие ~ N(0, ). В этом случае модель называют нормальной линейной регрессионной моделью. Таки образом, задача состоит в оценке параметров и по данным наблюдений.

Теорема Гаусса-Маркова:

в предположении 1)-4) оценки параметров регрессии, полученные МНК, имеют наименьшую дисперсию в классе всех линейных несмещенных оценок.

Доказательство:

1. Докажем несмещенность оценок: , .

.

.

2. Определим дисперсии оценок.

.

.

Следовательно, оценки состоятельны.

3. Оценки эффективны, то есть они имеют наименьшую дисперсию по сравнению с любыми другими оценками данных параметров.

2. Анализ точности определения оценок коэффициентов регрессии

Так как выборочные данные являются случайными величинами, оценки и также являются случайными величинами. В случае выполнения условий Гаусса-Маркова, оценки будут несмещенными и состоятельными. При этом они будут тем надежнее, чем меньше их разброс вокруг их математических ожиданий или меньше их дисперсия. Надежность получаемых оценок тесно связана с D(). Как уже известно , . Из соотношений можно сделать следующие очевидные выводы:

1) дисперсии и прямо пропорциональны D() = 2;

2) чем больше число наблюдений, тем меньше дисперсия;

3) чем больше (разброс х), тем меньше дисперсии оценок.

Так как случайные составляющие по выборке определены быть не могут, при анализе надёжности оценок коэффициентов регрессии они заменяются наблюдаемыми отклонениями , а дисперсии случайных отклонений D() = 2 заменяются несмещенной оценкой = (здесь (n-2) - число степеней свободы). S - называют стандартной ошибкой регрессии. Тогда оценки дисперсий оценок

и ,

Sa и Sb - стандартные ошибки коэффициентов регрессии.

Пример. Получим оценки S2, Sa, Sb для условий примера из лекции 2.

№ предприятия

1

2

3

4

5

6

7

Выпуск продукции, х

1

2

4

3

5

3

4

Затраты на производство, у

30

70

150

100

170

100

150

Решение

Ранее было получено уравнение регрессии , с использованием которого можно было рассчитать модельные значения . Чтобы получить стандартные ошибки, необходимо:

1) n = 7;

S2 = 263,1583/5 = 52,632; S = 7,255;

2)

3) Sb2 = Sb = 2,202;

4) Sa2 = Sa = 7,443.

Стандартные ошибки регрессии и её коэффициентов можно получить при использовании ППП Excel (см. Вывод итогов).

Если выполняется условие нормальности распределения случайного члена: ~ N(0; ), то МНК оценки коэффициентов регрессии тоже нормальны с соответствующими параметрами, так как они являются линейными функциями от Уt:

~ N() и ~ N().

Если условие нормальности ошибок не выполняется, то при некоторых условиях регулярности и росте n можно считать это распределение асимптотически нормальным.

Во время статистических исследований всегда проверяют гипотезы:

Н0: а = а0 или «о значимости» Н0: а = 0

Н0: b = b0 Н0: b = 0 .

Альтернативная гипотеза () предусматривает построение двусторонней критической области. В качестве критерия проверки используют случайные величины, называемые

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,991189256

R-квадрат

0,98245614

Нормированный R-квадрат

0,978947368

Стандартная ошибка

7,254762501

Наблюдения

7

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

14736,84211

14736,84211

280

1,39294E-05

Остаток

5

263,1578947

52,63157895

Итого

6

15000

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-5,789473684

7,443229276

-0,777817459

0,47185877

-24,92290365

13,34395628

x

36,84210526

2,201736912

16,73320053

1,39294E-05

31,18236035

42,50185017

t-статистиками: tb = или ta = ; которые имеют распределение Стьюдента с (n-2) степенями свободы. Проверка состоит в следующем:

- если , то нет оснований отвергать Н0;

- если , то Н0 отвергают.

При оценке значимости коэффициентов линейной регрессии на начальном этапе можно использовать «грубое» правило:

1) если стандартная ошибка коэффициента больше его по модулю (), то коэффициент не значим (надежность меньше 0,7);

2) если , то оценка может рассматриваться как относительно значимая, 0,7 <<0,95;

3) 2 , то оценка значима, 0,95 <<0,99;

4) , это почти гарантия наличия линейной связи.

В каждом конкретном случае имеет значение число наблюдений. Чем их больше, тем надежнее при прочих равных условиях выводы о значимости коэффициентов. При n>10 «грубое» правило практически всегда работает.

Соответствующие доверительные интервалы для оценок коэффициентов регрессии с надёжностью имеют вид: () и ().

Пример. Проверим гипотезу Н0: b = 37 при и 0,05 для нашего примера.

1)

2) tкр.дв(0,01;5) = 4,03; tкр.дв(0,05;5) = 2,57;

3) Так как = 0,072 < tкр.дв(0,05;5) = 2,57, то нет оснований отвергать Н0.

Если Н0 отвергается при , то она будет отвергнута и при . Если Н0 не отвергается при , то она не будет отклоняться и при автоматически. Стандартные ППП содержат проверку «значимости» полученных оценок. При этом если Н0: b = 0 не отклоняется, то коэффициент b статистически не значим, то есть нет зависимости между Х и У.

3. Качество уравнения регрессии. Коэффициент детерминации

Цель регрессионного анализа состоит в объяснении поведения зависимой переменной. Пусть для этого по выборочным данным построено уравнение регрессии. Тогда значение у в каждом наблюдении можно разложить на две составляющие , где е - остаток, т.е. та часть, которую невозможно объяснить. Разброс значений зависимой переменной характеризуется выборочной дисперсией

D(y) = D () = D () + D (e) + 2cov (, e).

Cov (, e) = cov (

D(y) = D() + D(e)

общая дисперсия факторная дисперсия, остаточная дисперсия,

объясненная уравнением необъясненная

Коэффициентом детерминации R2 называют отношение

,

характеризующее долю вариации зависимой переменной, объясненную уравнением регрессии, .

Если R2 = 1, то D(y) = D(), D(e) = 0, т.е. все точки наблюдений лежат на регрессионной прямой.

Если R2 = 0, то регрессия не дает ничего, линия регрессии параллельна оси Ох.

Чем ближе R2 к 1, тем более точно аппроксимирует у.

Вычисление R2 корректно, если включено в уравнение. Полезны следующие соотношения:

; ; .

Для определения статистической значимости R2 проверяется гипотеза

Н0: R2 = 0 с помощью статистики F = .

Если F < Fкр(, то Н0 нет оснований отвергать или R2 статистически не значим, в противном случае - значим. В случае парной регрессии R2 = r2. Коэффициент корреляции r выступает показателем тесноты линейной зависимости, тесная нелинейная связь возможна и при r , близких к нулю.

Для нашего примера:

, R2 = 0,982.

Следовательно, уравнение регрессии описывает 98,2% дисперсии признака у. Это означает очень тесную зависимость.

Можно показать, что в парном регрессионном анализе эквивалентны t-критерий для Н0: b = 0, t-критерий для Н0: r = 0 и F-критерий для Н0: R2 = 0. Таким образом, проверка значимости коэффициента b равносильна проверке значимости уравнения регрессии

, , F = и tb = tr = .

4. Интервалы прогноза по линейному уравнению регрессии

Одной из центральных задач эконометрики является прогнозирование значений зависимой переменной при определенных значениях объясняющих переменных. Различают точечное и интервальное прогнозирование. При этом возможно предсказать условное математическое ожидание зависимой переменной (т.е. ср. значение), либо прогнозировать некоторое конкретное значение (т.е. индивидуальное).

Пусть имеется уравнение регрессии . Точечной оценкой М(У¦Х=хр) = р = . Так как и имеют нормальное распределение ( в силу нормальности ), то р является случайной величиной с нормальным распределением.

,

М(р) = М() =

D(р) = D() + D() + xp2D() + 2cov(,)xp = +

+ xp2-2xp = (+ xp2 - 2 xp)¦=

= (+ - 2 xp + xp2) = .

- стандартная ошибка положения линии регрессии. Так как она минимальна при хр = , то наилучший прогноз находится в центре области наблюдений и ухудшается по мере удаления от центра.

уравнение регрессия детерминация вариация

Случайная величина имеет распределение Стьюдента с (n-2) степенями свободы. Поэтому, задавая = Р(<tкр(, n-2)), можно построить доверительный интервал для М(У¦Х = хр), то есть положения линии регрессии (рис. 1.): ()

Рис. 1. Доверительные интервалы положения линии регрессии - сплошная линия и индивидуального значения - пунктирная линия

Фактические значения у варьируются около среднего значения р. Индивидуальные значения у могут отклоняться от р на величину случайной ошибки . Пусть yi - некоторое возможное значение у при хр. Если рассматривать yi как случайную величину У, а р - как случайную величину Ур, то можно отметить, что:

Y ~ N(, Yp ~ N().

Y и Yp независимы и, следовательно, U = Y - Yp ~ N с параметрами

M(U) = 0; D(U) = .

Значит случайная величина, имеющая распределение Стьюдента с (n-2) степенями свободы. Аналогично строится доверительный интервал индивидуального значения.

Пример. Стандартная ошибка среднего расчетного значения

.

При , . При , . Следовательно, и, т.к. , то и .

Стандартная ошибка индивидуального расчетного значения

,

и .

Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии. Для сравнения используются величины отклонений, выраженные в процентах к фактическим значениям. Поскольку может быть как положительной, так и отрицательной величиной, ошибки аппроксимации для каждого наблюдения принято определять в процентах по модулю.

Для того чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, находят среднюю ошибку аппроксимации как среднюю арифметическую простую.

.

Допустимый предел 8 - 10 %, при котором подбор модели к исходным данным считается хорошим.

Возможно и другое определение средней ошибки аппроксимации:

.

Рассчитаем среднюю ошибку аппроксимации для нашего примера.

y

1

30

31,053

1,053

0,035

2

70

67,895

2,105

0,030

3

150

141,579

8,421

0,056

4

100

104,737

4,737

0,047

5

170

178,421

8,421

0,049

6

100

104,737

4,737

0,047

7

150

141,579

8,421

0,056

0,322

Окончательно получим: , что говорит о хорошем качестве уравнения.

Выборочный коэффициент вариации определяется отношением выборочного среднего квадратического отклонения к выборочной средней, выраженным в процентах:

и .

Коэффициент вариации - безразмерная величина, удобная для сравнения величин рассеивания двух и более выборок, имеющих разные размерности. Совокупность данных считается однородной и пригодной для использования МНК и вероятностных методов оценок статистических гипотез, если значение коэффициента вариации не превосходит 35 %.

Для нашего примера:

,

.

Пример. Фирма провела рекламную компанию. Через 10 недель фирма решила проанализировать эффективность этого вида рекламы, сопоставив недельные объемы продаж (у, тыс. руб.) с расходами на рекламу (х, тыс. руб.).

Полагая, что между переменными х и у имеет место линейная зависимость, определить выборочное уравнение регрессии.

х

5

8

6

5

3

9

12

4

3

10

у

72

76

78

70

68

80

82

65

62

90

Литература

1. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. М.: Дело,1999.

2. Фишер Ф. Проблемы идентификации в эконометрии. М.: Статистика, 1978.

3. Бородич С.А. Эконометрика. Мн.: Новое знание, 2001.

4. Кремер Н.Ш., Путко Б.А. Эконометрика. М.: ЮНИТИ - ДАНА, 2002.

5. Орлов А.И. Эконометрика. М.: Изд-во «Экзамен», 2002.

6. Новиков А.И. Эконометрика. М.:ИНФРА-М,2003.-106 с.

Размещено на Allbest.ru

...

Подобные документы

  • Ковариационная матрица оценок коэффициентов регрессии. Оценка дисперсии ошибок. Сущность теоремы Гаусса-Маркова. Проверка статистических гипотез, доверительные интервалы. Расчет коэффициента детерминации, скорректированного коэффициента детерминации.

    контрольная работа [1,4 M], добавлен 28.07.2013

  • Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.

    контрольная работа [222,5 K], добавлен 08.05.2014

  • Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.

    курсовая работа [233,1 K], добавлен 21.03.2015

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.

    лабораторная работа [2,1 M], добавлен 25.05.2009

  • Ознакомление с основами модели простой регрессии. Рассмотрение основных элементов эконометрической модели. Характеристика оценок коэффициентов уравнения регрессии. Построение доверительных интервалов. Автокорреляция и гетероскедастичность остатков.

    лекция [347,3 K], добавлен 23.12.2014

  • Экономическая интерпретация коэффициента регрессии. Нахождение статочной суммы квадратов и оценка дисперсии остатков. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента. Расчет средней относительной ошибки аппроксимации.

    контрольная работа [261,1 K], добавлен 23.03.2010

  • Параметры уравнения и экономическое толкование коэффициента линейной регрессии. Расчет коэффициентов детерминации и средних относительных ошибок аппроксимации. Построение структурной формы модели с использованием косвенного метода наименьших квадратов.

    контрольная работа [99,2 K], добавлен 27.04.2011

  • Нахождение уравнения линейной регрессии, парного коэффициента корреляции. Вычисление точечных оценок для математического ожидания, дисперсии, среднеквадратического отклонения показателей x и y. Построение точечного прогноза для случая расходов на рекламу.

    контрольная работа [216,6 K], добавлен 12.05.2010

  • Расчет параметров A и B уравнения линейной регрессии. Оценка полученной точности аппроксимации. Построение однофакторной регрессии. Дисперсия математического ожидания прогнозируемой величины. Тестирование ошибок уравнения множественной регрессии.

    контрольная работа [63,3 K], добавлен 19.04.2013

  • Выполнение кластерного анализа предприятий с помощью программы Statgraphics Plus. Построение линейного уравнения регрессии. Расчет коэффициентов эластичности по регрессионным моделям. Оценка статистической значимости уравнения и коэффициента детерминации.

    задача [1,7 M], добавлен 16.03.2014

  • Оценка адекватности эконометрических моделей статистическим данным. Построение доверительных зон регрессий спроса и предложения. Вычисление коэффициента регрессии. Построение производственной мультипликативной регрессии, оценка ее главных параметров.

    контрольная работа [1,2 M], добавлен 25.04.2010

  • Понятие модели множественной регрессии. Сущность метода наименьших квадратов, который используется для определения параметров уравнения множественной линейной регрессии. Оценка качества подгонки регрессионного уравнения к данным. Коэффициент детерминации.

    курсовая работа [449,1 K], добавлен 22.01.2015

  • Методика определения параметров линейной регрессии, составления экономической интерпретации коэффициентов регрессии. Проверка выполнения предпосылок МНК. Графическое представление физических и модельных значений. Нахождение коэффициентов детерминации.

    контрольная работа [218,0 K], добавлен 25.05.2009

  • Определение параметров уравнения линейной регрессии. Экономическая интерпретация коэффициента регрессии. Вычисление остатков, расчет остаточной суммы квадратов. Оценка дисперсии остатков и построение графика остатков. Проверка выполнения предпосылок МНК.

    контрольная работа [1,4 M], добавлен 25.06.2010

  • Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.

    контрольная работа [110,4 K], добавлен 28.07.2012

  • Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.

    контрольная работа [108,5 K], добавлен 28.03.2018

  • Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.

    контрольная работа [250,5 K], добавлен 11.04.2015

  • Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.

    контрольная работа [817,3 K], добавлен 01.04.2010

  • Факторные и результативные признаки адекватности модели. Исследование взаимосвязи энерговооруженности и выпуска готовой продукции. Построение уравнения регрессии и вычисление коэффициента регрессии. Графики практической и теоретической линии регрессии.

    контрольная работа [45,2 K], добавлен 20.01.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.