Проверка гипотез относительно коэффициентов линейного уравнения регрессии
Модель парной регрессии. Оценка надежности парной регрессии и корреляции. Интервальная оценка для коэффициента корреляции. Доверительные интервалы для зависимой переменной. Анализ коррелированности отклонений. Проверка наличия гетероскедастичности.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 21.02.2014 |
Размер файла | 160,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости б=0.05.
В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.
Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике).
Табличное значение определяется в зависимости от уровня значимости (б) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений.
Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-б) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.
Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости б.
tкрит (n-m-1;б/2) = (30;0.025) = 2.042
Поскольку 1.7 < 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.
Поскольку 0.56 < 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.
Доверительный интервал для коэффициентов уравнения регрессии.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(b - tкрит Sb; b + tкрит Sb)
(0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
(-0.13;1.41)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента b статистически незначима.
(a - tкрит Sa; a + tкрит Sa)
(24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
(-65.79;114.91)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента a статистически незначима.
2) F-статистика. Критерий Фишера.
Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.
где m - число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости б.
2. Далее определяют фактическое значение F-критерия:
где m=1 для парной регрессии.
3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости б. Уровень значимости б - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно б принимается равной 0,05 или 0,01.
4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-б) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Табличное значение критерия со степенями свободы k1=1 и k2=30, Fтабл = 4.17
Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством:
Показатели качества уравнения регрессии.
Показатель |
Значение |
|
Коэффициент детерминации |
0.0621 |
|
Средний коэффициент эластичности |
0.72 |
|
Средняя ошибка аппроксимации |
42.78 |
Проверка на наличие автокорреляции остатков.
Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.
Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.
В экономических задачах значительно чаще встречается положительная автокорреляция, нежели отрицательная автокорреляция. В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.
Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать по сезонным данным (зима-лето).
Среди основных причин, вызывающих автокорреляцию, можно выделить следующие:
1. Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводят к системным отклонениям точек наблюдения от линии регрессии, что может обусловить автокорреляцию.
2. Инерция. Многие экономические показатели (инфляция, безработица, ВНП и т.д.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Поэтому изменение показателей происходит не мгновенно, а обладает определенной инертностью.
3. Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом).
4. Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его интервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может служить причиной автокорреляции.
Последствия автокорреляции схожи с последствиями гетероскедастичности: выводы по t- и F-статистикам, определяющие значимость коэффициента регрессии и коэффициента детерминации, возможно, будут неверными.
3.6 Обнаружение автокорреляции
Графический метод
Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения еi с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат - отклонения еi (либо оценки отклонений).
Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии автокорреляции.
Автокорреляция становится более наглядной, если построить график зависимости еi от еi-1
Коэффициент автокорреляции.
Если коэффициент автокорреляции rei < 0.5, то есть основания утверждать, что автокорреляция отсутствует.
Критерий Дарбина-Уотсона.
Этот критерий является наиболее известным для обнаружения автокорреляции.
При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин ei.
Y |
y(x) |
ei = y-y(x) |
e2 |
(ei - ei-1)2 |
|
24.56 |
-24.56 |
603.23 |
0 |
||
790 |
113.49 |
676.51 |
457660.38 |
491494.47 |
|
57 |
99.42 |
-42.42 |
1799.3 |
516852.04 |
|
86 |
121.17 |
-35.17 |
1237.05 |
52.51 |
|
101 |
140.37 |
-39.37 |
1549.68 |
17.59 |
|
52 |
69.35 |
-17.35 |
300.93 |
484.82 |
|
65 |
87.9 |
-22.9 |
524.49 |
30.85 |
|
57 |
38.64 |
18.36 |
337.22 |
1702.82 |
|
62 |
76.39 |
-14.39 |
206.93 |
1072.48 |
|
73 |
101.34 |
-28.34 |
803.02 |
194.67 |
|
73 |
98.14 |
-25.14 |
631.95 |
10.23 |
|
69 |
127.57 |
-58.57 |
3430.42 |
1117.64 |
|
106 |
133.97 |
-27.97 |
782.2 |
936.48 |
|
186 |
158.28 |
27.72 |
768.37 |
3101.07 |
|
84 |
132.05 |
-48.05 |
2308.65 |
5740.77 |
|
80 |
114.13 |
-34.13 |
1165.12 |
193.62 |
|
49 |
30.96 |
18.04 |
325.49 |
2722.24 |
|
80 |
114.13 |
-34.13 |
1165.12 |
2722.24 |
|
51 |
68.71 |
-17.71 |
313.55 |
269.83 |
|
45 |
14.32 |
30.68 |
941.03 |
2340.98 |
|
54 |
80.22 |
-26.22 |
687.7 |
3237.64 |
|
82 |
128.21 |
-46.21 |
2135.32 |
399.42 |
|
69 |
127.57 |
-58.57 |
3430.42 |
152.77 |
|
58 |
101.34 |
-43.34 |
1878.15 |
232.02 |
|
51 |
69.35 |
-18.35 |
336.62 |
624.52 |
|
74 |
101.34 |
-27.34 |
747.35 |
80.83 |
|
63 |
82.14 |
-19.14 |
366.47 |
67.15 |
|
48 |
30.96 |
17.04 |
290.4 |
1309.33 |
|
56 |
43.75 |
12.25 |
149.94 |
23 |
|
55 |
82.14 |
-27.14 |
736.76 |
1551.45 |
|
81 |
120.53 |
-39.53 |
1562.77 |
153.47 |
|
24.56 |
-24.56 |
603.23 |
224.14 |
||
489779.25 |
1039113.1 |
Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона:
Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости б, числа наблюдений n = 32 и количества объясняющих переменных m=1.
Автокорреляция отсутствует, если выполняется следующее условие:
d1 < DW и d2 < DW < 4 - d2.
Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Поскольку 1.5 < 2.12 < 2.5, то автокорреляция остатков отсутствует.
Для более надежного вывода целесообразно обращаться к табличным значениям.
По таблице Дарбина-Уотсона для n=32 и k=1 (уровень значимости 5%) находим: d1 = 1.37; d2 = 1.50.
Поскольку 1.37 < 2.12 и 1.50 < 2.12 < 4 - 1.50, то автокорреляция остатков отсутствует.
Проверка наличия гетероскедастичности.
1) Методом графического анализа остатков.
В этом случае по оси абсцисс откладываются значения объясняющей переменной X, а по оси ординат либо отклонения ei, либо их квадраты e2i.
Если имеется определенная связь между отклонениями, то гетероскедастичность имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии гетероскедастичности.
2) При помощи теста ранговой корреляции Спирмена.
Коэффициент ранговой корреляции Спирмена.
Присвоим ранги признаку ei и фактору X. Найдем сумму разности квадратов d2.
По формуле вычислим коэффициент ранговой корреляции Спирмена.
Если среди значений признаков х и у встречается несколько одинаковых, образуются связанные ранги, т. е. одинаковые средние номера; например, вместо одинаковых по порядку третьего и четвертого значений признака будут два ранга по 3,5. В таком случае коэффициент Спирмена вычисляется как:
Где
j - номера связок по порядку для признака х;
Аj - число одинаковых рангов в j-й связке по х;
k - номера связок по порядку для признака у;
Вk - число одинаковых рангов в k-й связке по у.
X |
ei |
ранг X, dx |
ранг ei, dy |
(dx - dy)2 |
|
24.56 |
1.5 |
11.5 |
100 |
||
139 |
676.51 |
21 |
32 |
121 |
|
117 |
42.42 |
17 |
26 |
81 |
|
151 |
35.17 |
25 |
23 |
4 |
|
181 |
39.37 |
31 |
24 |
49 |
|
70 |
17.35 |
9.5 |
4 |
30.25 |
|
99 |
22.9 |
15 |
10 |
25 |
|
22 |
18.36 |
6 |
8 |
4 |
|
81 |
14.39 |
11 |
2 |
81 |
|
120 |
28.34 |
19 |
19 |
0 |
|
115 |
25.14 |
16 |
13 |
9 |
|
161 |
58.57 |
26.5 |
30.5 |
16 |
|
171 |
27.97 |
30 |
18 |
144 |
|
209 |
27.72 |
32 |
17 |
225 |
|
168 |
48.05 |
29 |
29 |
0 |
|
140 |
34.13 |
22.5 |
21.5 |
1 |
|
10 |
18.04 |
4.5 |
6 |
2.25 |
|
140 |
34.13 |
22.5 |
21.5 |
1 |
|
69 |
17.71 |
8 |
5 |
9 |
|
-16 |
30.68 |
3 |
20 |
289 |
|
87 |
26.22 |
12 |
14 |
4 |
|
162 |
46.21 |
28 |
28 |
0 |
|
161 |
58.57 |
26.5 |
30.5 |
16 |
|
120 |
43.34 |
19 |
27 |
64 |
|
70 |
18.35 |
9.5 |
7 |
6.25 |
|
120 |
27.34 |
19 |
16 |
9 |
|
90 |
19.14 |
13.5 |
9 |
20.25 |
|
10 |
17.04 |
4.5 |
3 |
2.25 |
|
30 |
12.25 |
7 |
1 |
36 |
|
90 |
27.14 |
13.5 |
15 |
2.25 |
|
150 |
39.53 |
24 |
25 |
1 |
|
24.56 |
1.5 |
11.5 |
100 |
||
1452.5 |
A = 60/12 = 5
B = 18/12 = 1.5
Связь между признаком ei и фактором X сильная и прямая
Оценка коэффициента ранговой корреляции Спирмена.
Значимость коэффициента ранговой корреляции Спирмена
Для того чтобы при уровне значимости б проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе Hi. p ? 0, надо вычислить критическую точку:
где n - объем выборки; p - выборочный коэффициент ранговой корреляции Спирмена: t(б, к) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости б и числу степеней свободы k = n-2.
Если |p| < Тkp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| > Tkp - нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.
По таблице Стьюдента находим t(б, k):
t(б, k) = (30;0.05) = 1.697
Поскольку Tkp < p, то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.
Проверим гипотезу H0: гетероскедастичность отсутствует.
Поскольку 2.042 > 0.21, то гипотеза об отсутствии гетероскедастичности принимается.
Размещено на Allbest.ru
...Подобные документы
Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.
контрольная работа [222,5 K], добавлен 08.05.2014Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.
контрольная работа [155,8 K], добавлен 11.12.2010Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.
контрольная работа [108,5 K], добавлен 28.03.2018Ковариационная матрица оценок коэффициентов регрессии. Оценка дисперсии ошибок. Сущность теоремы Гаусса-Маркова. Проверка статистических гипотез, доверительные интервалы. Расчет коэффициента детерминации, скорректированного коэффициента детерминации.
контрольная работа [1,4 M], добавлен 28.07.2013Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.
курсовая работа [233,1 K], добавлен 21.03.2015Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.
лабораторная работа [2,1 M], добавлен 25.05.2009Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.
лабораторная работа [100,5 K], добавлен 02.06.2014Выборка и генеральная совокупность. Модель множественной регрессии. Нестационарные временные ряды. Параметры линейного уравнения парной регрессии. Нахождение медианы, ранжирование временного ряда. Гипотеза о неизменности среднего значения временного ряда.
задача [62,0 K], добавлен 08.08.2010Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Параметры парной линейной, линейно-логарифмической функции. Оценка статистической надёжности. Ошибка положения регрессии. Расчёт бета коэффициентов, уравнение множественной регрессии в стандартизованном масштабе. Задача на определение тесноты связи рядов.
контрольная работа [192,2 K], добавлен 23.06.2012Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.
курсовая работа [243,1 K], добавлен 17.01.2016Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.
контрольная работа [817,3 K], добавлен 01.04.2010Исследование зависимости часового заработка одного рабочего от общего стажа работы после окончания учебы с помощью построения уравнения парной линейной регрессии. Вычисление описательных статистик. Построение поля корреляции и гипотезы о форме связи.
контрольная работа [226,6 K], добавлен 11.08.2015Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.
лабораторная работа [67,8 K], добавлен 26.12.2010Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.
лабораторная работа [1,8 M], добавлен 25.05.2009Расчет параметров уравнения линейной регрессии, экономическая интерпретация ее коэффициента. Проверка равенства математического ожидания уровней ряда остатков нулю. Построение степенной модели парной регрессии. Вариация объема выпуска продукции.
контрольная работа [771,6 K], добавлен 28.04.2016Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.
контрольная работа [298,2 K], добавлен 19.01.2011Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.
контрольная работа [250,5 K], добавлен 11.04.2015