Статистическая важность коэффициентов регрессии и корреляции
Расчет линейного коэффициента парной корреляции и оценка тесноты связи. Особенность статистической значимости параметров регрессии и корреляционной системы. Подсчет ошибки прогноза и его доверительного интервала. Вычисление коэффициента детерминации.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 28.08.2017 |
Размер файла | 123,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Задача 1
Имеются данные об уровне механизации работ Х (%) и производительности труда У (т/ч) для 12 предприятий:
Xi |
30 |
32 |
36 |
40 |
41 |
46 |
52 |
54 |
61 |
55 |
61 |
67 |
|
Yi |
23 |
20 |
27 |
32 |
30 |
33 |
34 |
36 |
38 |
40 |
41 |
43 |
По данным, приведенным в таблице:
1) построить линейное уравнение парной регрессии у на х;
2) рассчитать линейный коэффициент парной корреляции и оценить тесноту связи;
3) оценить статистическую значимость параметров регрессии и корреляции, используя F-статистику, t-статистику Стьюдента и путем расчета доверительных интервалов для каждого из показателей;
4) вычислить прогнозное значение у при прогнозном значении х, составляющем 108% от среднего уровня;
5) оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал;
6) полученные результаты изобразить графически и привести экономическое обоснование.
Решение.
1. Линейная модель регрессии
Уравнение парной регрессии:
где а и b - параметры уравнения
;
Составим вспомогательную таблицу.
i |
x |
y |
xy |
x2 |
(xi-x)2 |
(yi-y)2 |
yx |
yi-yx |
(yi-yx)2 |
|
1 |
30 |
23 |
690 |
900 |
321,13 |
101,61 |
19,08 |
3,92 |
15,37 |
|
2 |
32 |
20 |
640 |
1024 |
253,45 |
171,09 |
17,39 |
2,61 |
6,81 |
|
3 |
36 |
27 |
972 |
1296 |
142,09 |
36,97 |
21,32 |
5,68 |
32,26 |
|
4 |
40 |
32 |
1280 |
1600 |
62,73 |
1,17 |
24,13 |
7,87 |
61,94 |
|
5 |
41 |
30 |
1230 |
1681 |
47,89 |
9,49 |
23,01 |
6,99 |
48,86 |
|
6 |
46 |
33 |
1518 |
2116 |
3,69 |
0,01 |
24,70 |
8,30 |
68,89 |
|
7 |
52 |
34 |
1768 |
2704 |
16,65 |
0,85 |
25,26 |
8,74 |
76,39 |
|
8 |
54 |
36 |
1944 |
2916 |
36,97 |
8,53 |
26,38 |
9,62 |
92,54 |
|
9 |
61 |
38 |
2318 |
3721 |
171,09 |
24,21 |
27,51 |
10,49 |
110,04 |
|
10 |
55 |
40 |
2200 |
3025 |
50,13 |
47,89 |
28,63 |
11,37 |
129,28 |
|
11 |
61 |
41 |
2501 |
3721 |
171,09 |
62,73 |
29,19 |
11,81 |
139,48 |
|
12 |
67 |
43 |
2881 |
4489 |
364,05 |
98,41 |
30,32 |
12,68 |
160,78 |
|
S |
575,0 |
397,0 |
19942 |
29193 |
1640,96 |
562,96 |
- |
- |
942,64 |
;
;
;
Рассчитываем для каждого значения х значения ух. Заносим в таблицу.
2.Линейный коэффициент парной корреляции.
Если: умножить на , то получим:
,
Значит, коэффициент корреляции можно находить по формуле
;
r2 = 0,914
Найденное значение индекса детерминации говорит, что 91,4% вариации производительности труда (Y) объясняется вариацией фактора x - уровнем механизации работ.
Оценка статистической значимости параметров регрессии
Оценку статистической значимости параметров регрессии проведём с помощью t-статистики Стьюдента и путём расчёта доверительных интервалов для каждого из показателей. Выдвинем гипотезу Но: о статистически незначимом отличии показателей от нуля, то есть Но : a = b = rxy = 0. По таблицам t-критерия Стьюдента при и числу степени свободы в данном случае равном : n - 2 = 12 - 2 = 10 находим tтабл = 2,23.
Фактические значенияt-критерия определяются по формулам:
?2.23
>2.23
>>2.23
Из выше найденных фактических значений ta, tb, tr, видим что кроме параметра а они больше ранее найденного табличного (критического) значения критерия Стьюдента (t = 2,23) следовательно гипотеза Но - отклоняется, то есть a, b и rxy не случайно отличны от нуля.
Найдем F-статистику для оценки значимости уравнения регрессии (n=12, m=1).
Табличное значение критерия со степенями свободы k1=1 и k2=10, Fтабл= 4,96. Так как F > Fтабл, то уравнение парной регрессии признается статистически значимым и модель адекватной.
Доверительные интервалы для параметров уравнения регрессии:
Несмещенной оценкой дисперсии возмущений является величина:
S2y = 4.81 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
Sy = 2.19 - стандартная ошибка оценки (стандартная ошибка регрессии).
Sa - стандартное отклонение случайной величины a.
Sb - стандартное отклонение случайной величины b.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(b - tкрит Sb; b + tкрит Sb)
(0.56 - 2.228 * 0.0542; 0.56 + 2.228 * 0.0542)
(0.44;0.68)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a - tкрит Sa; a + tкрит Sa)
(6.25 - 2.228 * 2.67; 6.25 + 2.228 * 2.67)
(0.29;12.2)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
4. Прогнозное значение у при прогнозном значении х, составляющем 108% от среднего уровня
Ч 1,08= 47,92 Ч 1,08 = 51,75
Прогнозное значение производительности труда при увеличенном на 8% уровне механизации труда равно:
усл.ед.
5. Оценка точности прогноза, расчет ошибки прогноза и его доверительного интервала.
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
.
Доверительный интервал прогноза.
(12,71; 57,73)
6. Графическое изображение результатов и экономическое обоснование.
Получим уравнение парной регрессии:
Коэффициентам уравнения линейной регрессии можно придать экономический смысл.
Коэффициент регрессии b = 0.56 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 0.56.
Коэффициент a = 6.24 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
Связь между у и х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь прямая.
Задача 2
Используя данные приведенные в таблице:
1) построить линейное уравнение множественной регрессии;
2) рассчитать линейные коэффициенты частной корреляции и коэффициент множественной детерминации, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними;
3) вычислить прогнозное значение у при уменьшении вектора х на 6% от максимального уровня, оценить ошибку прогноза и построить доверительный интервал прогноза
Номер предприятия |
Прибыль, У (млн. руб.) |
Выработка продукции на 1 работника Х1 (единицы) |
Доля продукции производимой на экспорт Х2 (%) |
|
1 |
3 |
13 |
4 |
|
2 |
1 |
9 |
2 |
|
3 |
3 |
12 |
4 |
|
4 |
2 |
11 |
2 |
|
5 |
8 |
18 |
11 |
|
6 |
7 |
15 |
11 |
|
7 |
5 |
13 |
6 |
|
8 |
4 |
12 |
5 |
|
9 |
6 |
15 |
7 |
|
10 |
7 |
16 |
10 |
|
11 |
3 |
9 |
4 |
|
12 |
8 |
18 |
10 |
Решение.
1.Уравнение множественной регрессии:
y = a0+ a1x1+ a2x2
Матрица Х значений объясняющих переменных (матрица плана) имеет вид:
Транспонированная матрицаимеет вид:
Найдем произведение матриц ХТХ:
Найдем обратную матрицу:
Найдем произведение матриц:
Найдем уравнение регрессии Y по Х1, Х2в форме y = a0+ a1x1+ a2x2методом наименьших квадратов путем умножения матрицы на матрицу:
Итак: a0 = - 1,764; a1 = 0,255; a2 = 0,489.
Уравнение множественной регрессии имеет вид:
у = - 1,764 + 0,255 x1+ 0,489 x2.
2.Значимость параметров уравнения множественной регрессии
Составим расчетную таблицу:
i |
у |
у2 |
у(х) |
у-у(х) |
(у-у(х))2 |
|
1 |
3 |
9 |
3,503 |
-0,503 |
0,2529 |
|
2 |
1 |
1 |
1,506 |
-0,506 |
0,2563 |
|
3 |
3 |
9 |
3,248 |
-0,248 |
0,0616 |
|
4 |
2 |
4 |
2,016 |
-0,016 |
0,0002 |
|
5 |
8 |
64 |
8,199 |
-0,199 |
0,0397 |
|
6 |
7 |
49 |
7,435 |
-0,435 |
0,1894 |
|
7 |
5 |
25 |
4,481 |
0,519 |
0,2695 |
|
8 |
4 |
16 |
3,737 |
0,263 |
0,0690 |
|
9 |
6 |
36 |
5,479 |
0,521 |
0,2712 |
|
10 |
7 |
49 |
7,201 |
-0,201 |
0,0403 |
|
11 |
3 |
9 |
2,484 |
0,516 |
0,2660 |
|
12 |
8 |
64 |
7,710 |
0,290 |
0,0840 |
|
Сумма |
57 |
335 |
- |
- |
1,8002 |
Стандартная ошибка рассчитывается по формуле:
где - диагональный элемент матрицы,
Отсюда:
Доверительные интервалы коэффициентов регрессии рассчитываются по формуле:
aj - t,n-k * saj аj aj + t,n-k * saj
t0,95; 9 = 2,2622.
Для коэффициента а0имеемt0,95;
9 * Sa0 = 2,2622 * 0.8722 = 1.973
тогда a0 - t0,95; 9 * Sa0 = - 1,764 - 1,973 = - 3,737;
А0 - t0,95; 9 * Sa0 = - 1,764 + 1,973 = 0,209
и доверительный интервал имеет вид (- 3,737; 0,209).
Для коэффициента а1имеемt0,95; 9 * Sa1 = 2,2622 * 0,0994 = 0,225
тогда a1 - t0,95; 9 * Sa1 = 0,255 - 0,225 = 0,030;
а1 - t0,95; 9 * Sa1 = 0,255 + 0,225 = 0,480
и доверительный интервал имеет вид (0,030; 0,480).
Для коэффициента а2имеемt0,95; 9 * Sa2 = 2,2622 * 0,0896 = 0,203
тогда a2 - t0,95; 9 * Sa2 = 0,489 - 0,203 = 0,286;
а2 - t0,95; 9 * Sa2 = 0,489 + 0,203 = 0,692
и доверительный интервал имеет вид (0,286; 0,692).
Коэффициенты корреляции и детерминации
Составим расчетную таблицу:
№ |
х1 |
(х1-х1ср)2 |
х2 |
(х2-х2ср)2 |
у |
(у-уср)2 |
х1у |
х2у |
х1х2 |
|
1 |
13 |
0,1764 |
4 |
5,4289 |
3 |
3,0625 |
39 |
12 |
52 |
|
2 |
9 |
19,5364 |
2 |
18,7489 |
1 |
14,0625 |
9 |
2 |
18 |
|
3 |
12 |
2,0164 |
4 |
5,4289 |
3 |
3,0625 |
36 |
12 |
48 |
|
4 |
11 |
5,8564 |
2 |
18,7489 |
2 |
7,5625 |
22 |
4 |
22 |
|
5 |
18 |
20,9764 |
11 |
21,8089 |
8 |
10,5625 |
144 |
88 |
198 |
|
6 |
15 |
2,4964 |
11 |
21,8089 |
7 |
5,0625 |
105 |
77 |
165 |
|
7 |
13 |
0,1764 |
6 |
0,1089 |
5 |
0,0625 |
65 |
30 |
78 |
|
8 |
12 |
2,0164 |
5 |
1,7689 |
4 |
0,5625 |
48 |
20 |
60 |
|
9 |
15 |
2,4964 |
7 |
0,4489 |
6 |
1,5625 |
90 |
42 |
105 |
|
10 |
16 |
6,6564 |
10 |
13,4689 |
7 |
5,0625 |
112 |
70 |
160 |
|
11 |
9 |
19,5364 |
4 |
5,4289 |
3 |
3,0625 |
27 |
12 |
36 |
|
12 |
18 |
20,9764 |
10 |
13,4689 |
8 |
10,5625 |
144 |
80 |
180 |
|
Сумма |
161 |
102,9168 |
76 |
126,6668 |
57 |
64,25 |
841 |
449 |
1122 |
; ;
; ;
Коэффициент детерминации рассчитывается по формуле:
Уравнение регрессии значимо, если (критерий Фишера):
Отсюда F > Fтабл . Уравнение регрессии значимо.
4. Прогнозное значение у при уменьшении вектора х на 6% от максимального уровня
Уменьшаем вектор Х на 6% от максимального уровня:
Х1 max = 18; Х2 max = 10
Х*1 = 18 * 1,06 = 19,08; Х*2 = 10 * 1,06 = 10,6
По уравнению множественной регрессии находим прогнозное значение У:
Ур = - 1,764 + 0,255 * 19,08+ 0,489 * 10,6 = 8,28
Доверительный интервал прогноза:
Задача 3
Используя данные, представленные в таблице, проверить наличие гетероскедатичности, используя тест Голдфельда - Куандта.
Страна |
Индекс человеческого развития, У |
Расходы на конечное потребление в текущих ценах, % к ВВП, Х |
|
Австрия |
0,904 |
75,5 |
|
Австралия |
0,922 |
78,5 |
|
Англия |
0,918 |
84,4 |
|
Белоруссия |
0,763 |
78,4 |
|
Бельгия |
0,923 |
77,7 |
|
Германия |
0,906 |
75,9 |
|
Дания |
0,905 |
76,0 |
|
Индия |
0,545 |
67,5 |
|
Испания |
0,894 |
78,2 |
|
Италия |
0900 |
78,1 |
|
Канада |
0,932 |
78,6 |
|
Казахстан |
0,740 |
84,0 |
|
Китай |
0,701 |
59,2 |
|
Латвия |
0,744 |
90,2 |
|
Нидерланды |
0,921 |
72,8 |
|
Норвегия |
0,927 |
67,7 |
|
Польша |
0,802 |
82,6 |
|
Россия |
0,747 |
74,4 |
|
США |
0,927 |
83,3 |
|
Украина |
0,721 |
83,7 |
|
Финляндия |
0,913 |
73,8 |
|
Франция |
0,918 |
79,2 |
|
Чехия |
0,833 |
71,5 |
|
Швейцария |
0,914 |
75,3 |
|
Швеция |
0,923 |
79,0 |
Решение.
Проверим гипотезу о наличии гетероскедастичности с помощью теста Голдфельда-Куандта. Упорядочиваем выборку по возрастанию факторах
x |
y |
|
59,2 |
0,701 |
|
67,5 |
0,545 |
|
67,7 |
0,927 |
|
71,5 |
0,833 |
|
72,8 |
0,921 |
|
73,8 |
0,913 |
|
74,4 |
0,747 |
|
75,3 |
0,914 |
|
75,5 |
0,904 |
|
75,9 |
0,906 |
|
76 |
0,905 |
|
77,7 |
0,923 |
|
78,1 |
900 |
|
78,2 |
0,894 |
|
78,4 |
0,763 |
|
78,5 |
0,922 |
|
78,6 |
0,932 |
|
79 |
0,923 |
|
79,2 |
0,918 |
|
82,6 |
0,802 |
|
83,3 |
0,927 |
|
83,7 |
0,721 |
|
84 |
0,74 |
|
84,4 |
0,918 |
|
90,2 |
0,744 |
Полученную упорядоченную выборку делим на 3 примерно одинаковые части n/3 = 25 / 3 ?8,33. Тогда 8 первых наблюдений, соответствующих малым значениямх, и 8 последних, соответствующих большим значениямх, оставляем. А 9 центральных данных удаляем из рассмотрения.
Сформировались две подвыборки:
x |
y |
x |
y |
||
59,2 |
0,701 |
79 |
0,923 |
||
67,5 |
0,545 |
79,2 |
0,918 |
||
67,7 |
0,927 |
82,6 |
0,802 |
||
71,5 |
0,833 |
83,3 |
0,927 |
||
72,8 |
0,921 |
83,7 |
0,721 |
||
73,8 |
0,913 |
84 |
0,74 |
||
74,4 |
0,747 |
84,4 |
0,918 |
||
75,3 |
0,914 |
90,2 |
0,744 |
По известной процедуре МНК строим уравнения линейной парной регрессии для каждой из этих частей.
корреляция регрессия прогноз детерминация
где а и b - параметры уравнения
;
Для первой подвыборки:
i |
x |
y |
xy |
x2 |
|
1 |
59,2 |
0,701 |
41,4992 |
3504,64 |
|
2 |
67,5 |
0,545 |
36,7875 |
4556,25 |
|
3 |
67,7 |
0,927 |
62,7579 |
4583,29 |
|
4 |
71,5 |
0,833 |
59,5595 |
5112,25 |
|
5 |
72,8 |
0,921 |
67,0488 |
5299,84 |
|
6 |
73,8 |
0,913 |
67,3794 |
5446,44 |
|
7 |
74,4 |
0,747 |
55,5768 |
5535,36 |
|
8 |
75,3 |
0,914 |
68,8242 |
5670,09 |
|
S |
562,2 |
6,501 |
459,4333 |
39708,16 |
;
;
;
Для второй подвыборки:
i |
x |
y |
xy |
x2 |
|
1 |
79 |
0,923 |
72,917 |
6241 |
|
2 |
79,2 |
0,918 |
72,7056 |
6272,64 |
|
3 |
82,6 |
0,802 |
66,2452 |
6822,76 |
|
4 |
83,3 |
0,927 |
77,2191 |
6938,89 |
|
5 |
83,7 |
0,721 |
60,3477 |
7005,69 |
|
6 |
84 |
0,74 |
62,16 |
7056 |
|
7 |
84,4 |
0,918 |
77,4792 |
7123,36 |
|
8 |
90,2 |
0,744 |
67,1088 |
8136,04 |
|
S |
666,4 |
6,693 |
556,1826 |
55596,38 |
;
;
;
Находим остатки для каждого из этих уравнений, возводим их в квадрат и суммируем:
- первая подвыборка
x |
y |
ух |
е = у-ух |
е2 |
|
59,2 |
0,701 |
0,6804 |
0,0206 |
0,00042 |
|
67,5 |
0,545 |
0,78 |
-0,235 |
0,05523 |
|
67,7 |
0,927 |
0,7824 |
0,1446 |
0,02091 |
|
71,5 |
0,833 |
0,828 |
0,005 |
0,00003 |
|
72,8 |
0,921 |
0,8436 |
0,0774 |
0,00599 |
|
73,8 |
0,913 |
0,8556 |
0,0574 |
0,00329 |
|
74,4 |
0,747 |
0,8628 |
-0,1158 |
0,01341 |
|
75,3 |
0,914 |
0,8736 |
0,0404 |
0,00163 |
|
Сумма |
0,10091 |
- вторая подвыборка
x |
y |
ух |
е = у-ух |
е2 |
|
79 |
0,923 |
0,919 |
0,004 |
0,00002 |
|
79,2 |
0,918 |
0,9152 |
0,0028 |
0,00001 |
|
82,6 |
0,802 |
0,8506 |
-0,0486 |
0,00236 |
|
83,3 |
0,927 |
0,8373 |
0,0897 |
0,00805 |
|
83,7 |
0,721 |
0,8297 |
-0,1087 |
0,01182 |
|
84 |
0,74 |
0,824 |
-0,084 |
0,00706 |
|
84,4 |
0,918 |
0,8164 |
0,1016 |
0,01032 |
|
90,2 |
0,744 |
0,7062 |
0,0378 |
0,00143 |
|
0,04105 |
Находим отношение суммы квадратов остатков, оно подчиняется F-распределению Фишера
Сравниваем его с табличным значением F-критерия Фишера на уровне значимостиб = 0,05 с (k-1) и (k-1) степенями свободы, где k - объёмы оставшихся частей выборки.
На уровне значимостиб = 0,05 с 7 и 7 степенями свободы табличное значениеF0,05;7;7 = 3,79.
Т.к. наблюдаемое значение меньше табличного:Fн= 2,458 < Fт = 3,79, то гипотеза о наличии гетероскедастичности не отвергается.
Задача 4
По данным таблицы построить уравнение регрессии, выявить наличие автокорреляции остатков, используя критерий Дарбина - Уотсона и проанализировать пригодность полученного уравнения для построения прогнозов.
Год |
Оборот розничной торговли, % к предыдущему месяцу, Х |
Индекс потребительских цен, % к предыдущему месяцу, У |
|
Январь |
70,8 |
101,7 |
|
Февраль |
98,7 |
101,1 |
|
Март |
97,9 |
100,4 |
|
Апрель |
99,6 |
100,1 |
|
Май |
96,1 |
100,0 |
|
Июнь |
103,4 |
100,1 |
|
Июль |
95,5 |
100,0 |
|
Август |
102,9 |
105,8 |
|
Сентябрь |
77,6 |
145,0 |
|
Октябрь |
102,3 |
99,8 |
|
Ноябрь |
102,9 |
102,7 |
|
Декабрь |
123,1 |
109,4 |
|
Январь |
74,3 |
110,0 |
|
Февраль |
92,9 |
106,4 |
|
Март |
106,0 |
103,2 |
Решение.
Уравнение парной регрессии:
где а и b - параметры уравнения
;
Составим вспомогательную таблицу.
t |
x |
y |
xy |
x2 |
|
1 |
70,8 |
101,7 |
7200,36 |
5012,64 |
|
2 |
98,7 |
101,1 |
9978,57 |
9741,69 |
|
3 |
97,9 |
100,4 |
9829,16 |
9584,41 |
|
4 |
99,6 |
100,1 |
9969,96 |
9920,16 |
|
5 |
96,1 |
100 |
9610 |
9235,21 |
|
6 |
103,4 |
100,1 |
10350,34 |
10691,56 |
|
7 |
95,5 |
100 |
9550 |
9120,25 |
|
8 |
102,9 |
105,8 |
10886,82 |
10588,41 |
|
9 |
77,6 |
145 |
11252 |
6021,76 |
|
10 |
102,3 |
99,8 |
10209,54 |
10465,29 |
|
11 |
102,9 |
102,7 |
10567,83 |
10588,41 |
|
12 |
123,1 |
109,4 |
13467,14 |
15153,61 |
|
13 |
74,3 |
110 |
8173 |
5520,49 |
|
14 |
92,9 |
106,4 |
9884,56 |
8630,41 |
|
15 |
106 |
103,2 |
10939,2 |
11236 |
|
Сумма |
1444,0 |
1585,7 |
151868,5 |
141510,3 |
;
;
;
Рассчитываем для каждого значения х значения ух. Заносим в таблицу.
Критерий Дарбина-Уотсона:
yi |
yx |
ei = y-yx |
(ei - ei-1)2 |
ei 2 |
|
101,7 |
113,71 |
-12,01 |
- |
144,24 |
|
101,1 |
104,95 |
-3,85 |
66,59 |
14,82 |
|
100,4 |
105,20 |
-4,80 |
0,90 |
23,04 |
|
100,1 |
104,66 |
-4,56 |
0,06 |
20,79 |
|
100 |
105,76 |
-5,76 |
1,44 |
33,18 |
|
100,1 |
103,47 |
-3,37 |
5,71 |
11,36 |
|
100 |
105,95 |
-5,95 |
6,66 |
35,40 |
|
105,8 |
103,63 |
2,17 |
65,93 |
4,71 |
|
145 |
111,57 |
33,43 |
977,19 |
1117,56 |
|
99,8 |
103,82 |
-4,02 |
1402,50 |
16,16 |
|
102,7 |
103,63 |
-0,93 |
9,55 |
0,86 |
|
109,4 |
97,29 |
12,11 |
170,04 |
146,65 |
|
110 |
112,61 |
-2,61 |
216,68 |
6,81 |
|
106,4 |
106,77 |
-0,37 |
5,02 |
0,14 |
|
Сумма |
2929,09 |
1576,03 |
Так как значение критерия Дарбина-Уотсаона близко к 2,0, то можно считать что автокорреляция почти отсутствует.
Задача 5
В таблице приводятся данные о динамике выпуска продукции Финляндии (млн. долл.).
Задание:
1. Постройте график временного ряда
2. Найдите коэффициенты автокорреляции (для лагов r = 1; 2) данного ВР.
3. Дайте точечный и интервальный (с надежностью 0,95) прогнозы выпуска продукции на момент n+1
Год |
yt, млн. долл. |
|
1991 |
23085 |
|
1992 |
23980 |
|
1993 |
23444 |
|
1994 |
29657 |
|
1995 |
30570 |
|
1996 |
26800 |
|
1997 |
30100 |
|
1998 |
32560 |
|
1999 |
39020 |
|
2000 |
40012 |
|
2001 |
41010 |
|
2002 |
41250 |
|
2003 |
40200 |
|
2004 |
45680 |
Решение.
Построим график временного ряда
Год |
t |
yt, млн. долл. |
|
1991 |
1 |
23085 |
|
1992 |
2 |
23980 |
|
1993 |
3 |
23444 |
|
1994 |
4 |
29657 |
|
1995 |
5 |
30570 |
|
1996 |
6 |
26800 |
|
1997 |
7 |
30100 |
|
1998 |
8 |
32560 |
|
1999 |
9 |
39020 |
|
2000 |
10 |
40012 |
|
2001 |
11 |
41010 |
|
2002 |
12 |
41250 |
|
2003 |
13 |
40200 |
|
2004 |
14 |
45680 |
Для обнаружения тенденции в данном ВР воспользуемся критерием «восходящих и нисходящих» серий.
1) Для исследуемого ВР определяется последовательность знаков, исходя из условий: (+) при yt+1-yt > 0, (-) при yt+1-yt < 0. При этом, если последующее наблюдение равно предыдущему, то учитывается только одно наблюдение.
2) Подсчитывается число серий н(n). Под серией понимается последовательность подряд расположенных плюсов или минусов, причем один плюс или один минус считается серией.
3) Определяется протяженность самой длинной серииlmax(n).
4) Значениеl(n)находят из следующей таблицы:
Длина ряда,n |
n?26 |
26<n?153 |
153<n?170 |
|
Значениеl(n) |
5 |
6 |
7 |
5) Если нарушается хотя бы одно из следующих неравенств, то гипотеза об отсутствии тренда отвергается с доверительной вероятностью 0,95
Определим последовательность знаков:
t |
Выпуск продукции, yt млн.долл. |
д |
|
1 |
23 298 |
||
2 |
26 570 |
+ |
|
3 |
23 080 |
- |
|
4 |
29 800 |
+ |
|
5 |
28 440 |
- |
|
6 |
29 658 |
+ |
|
7 |
39 573 |
+ |
|
8 |
38 435 |
- |
|
9 |
39 002 |
+ |
|
10 |
39 020 |
+ |
|
11 |
40 012 |
+ |
|
12 |
41 005 |
+ |
|
13 |
39 080 |
- |
|
14 |
42 680 |
+ |
Определим число серийн(n) = 9. Определим протяженность самой длинной серииlmax(n) = 4, l(n) = 5, так какn=14<26. Проверим выполнение неравенств:
Второе неравенство не выполняются, следовательно, тренд (тенденция) в динамике выпуска продукции имеется на уровне значимости 0,05.
Среднее значение млн.долл.
Среднее значение млн.долл.
Вычислим коэффициенты автокорреляции первого и второго порядков, то есть для лагов ф=1;2.Подготовим данные для вычисления коэффициентов автокорреляции первого и второго порядков. Дополним таблицу данных двумя столбцами Yt-1 и Yt-2.
t |
Yt |
Yt-1 |
Yt-2 |
|
1 |
23 298 |
- |
- |
|
2 |
26 570 |
23 298 |
- |
|
3 |
23 080 |
26 570 |
23 298 |
|
4 |
29 800 |
23 080 |
26 570 |
|
5 |
28 440 |
29 800 |
23 080 |
|
6 |
29 658 |
28 440 |
29 800 |
|
7 |
39 573 |
29 658 |
28 440 |
|
8 |
38 435 |
39 573 |
29 658 |
|
9 |
39 002 |
38 435 |
39 573 |
|
10 |
39 020 |
39 002 |
38 435 |
|
11 |
40 012 |
39 020 |
39 002 |
|
12 |
41 005 |
40 012 |
39 020 |
|
13 |
39 080 |
41 005 |
40 012 |
|
14 |
42 680 |
39 080 |
41 005 |
r1 = 0,85188.
R2 = 0,8343.
Высокое значение коэффициента автокорреляции первого порядкаr1=0,85 свидетельствует об очень тесной зависимости между выпуском продукции текущего и непосредственно предшествующего годов, и, следовательно, о наличии в исследуемом временном рядесильной линейной тенденции.
Исследуемый ряд содержит только тенденцию, так как наиболее высоким оказался коэффициент автокорреляции первого порядка (0,85>0,83).
Скользящие средние найдем по формуле:
,
здесь m=2p-1.
При m=3, p=1
Вычисляем:
и так далее.
Результаты вычислений занесем в таблицу и построим графики исходного и сглаженногорядов в одной координатной плоскости.
t |
|||
1 |
23 298 |
||
2 |
26 570 |
24 315,76 |
|
3 |
23 080 |
26 483,07 |
|
4 |
29 800 |
27 106,40 |
|
5 |
28 440 |
29 299,04 |
|
6 |
29 658 |
32 556,67 |
|
7 |
39 573 |
35 888,31 |
|
8 |
38 435 |
39 002,94 |
|
9 |
39 002 |
38 818,61 |
|
10 |
39 020 |
39 344,27 |
|
11 |
40 012 |
40 011,93 |
|
12 |
41 005 |
40 031,93 |
|
13 |
39 080 |
40 921,26 |
|
14 |
42 680 |
Параметры (коэффициенты) уравнения тренда.
Анализ данных таблицы дисперсионного анализа показывает, что получено статистически значимое уравнение, так как наблюдаемое значение F=52,785, превышает его табличное значение Fтаб(0,05;1;12)=4,75, tтаб(05;12)=2,1788.
Таким образом, параметры уравнения тренда статистически значимы на уровне б=0,05: уравнение тренда можно использовать для прогноза.
Сделаем точечный и интервальный (с надежностью 0,95) прогнозы среднего и индивидуального значений прогнозов на 2003 год.
Определим точечный прогноз:
млн.долл
Вычислим интервальный прогноз.
Так как тренд является прямой, то доверительный интервал можно представить в виде:
Здесь стандартная ошибка предсказания по линии тренда вычисляется по формуле:
Здесь величинаS является стандартной ошибкой регрессии, и ее значение находится в таблице Регрессионная статистика
t(0,05;12)=2,1788.
Итак, по условию задачи:tn+x=15, n=14
Для вычисления стандартной ошибки предсказания по линии тренданеобходимо вычислить и сумму.
t |
yt |
||
1 |
23 298 |
42,25 |
|
2 |
26 570 |
30,25 |
|
3 |
23 080 |
20,25 |
|
4 |
29 800 |
12,25 |
|
5 |
28 440 |
6,25 |
|
6 |
29 658 |
2,25 |
|
7 |
39 573 |
0,25 |
|
8 |
38 435 |
0,25 |
|
9 |
39 002 |
2,25 |
|
10 |
39 020 |
6,25 |
|
11 |
40 012 |
12,25 |
|
12 |
41 005 |
20,25 |
|
13 |
39 080 |
30,25 |
|
14 |
42 680 |
42,25 |
|
7,5 |
Сумма |
227,5 |
(млн. долл.)
Максимальная ошибка прогноза будет равна:
(млн. долл.).
Нижняя граница прогноза имеет значение:
20111,2 - 4096 = 16014(млн. долл.)
Верхняя граница прогноза имеет значение:
20111,2 + 4096 =24707(млн. долл.)
Выв...
Подобные документы
Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.
контрольная работа [155,8 K], добавлен 11.12.2010Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.
контрольная работа [157,9 K], добавлен 06.08.2010Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.
курсовая работа [233,1 K], добавлен 21.03.2015Построение поля корреляции. Оценка данной зависимости линейной, степенной и гиперболической регрессией. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициента эластичности. Определение доверительного интервала прогноза.
контрольная работа [508,1 K], добавлен 13.11.2011Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.
контрольная работа [71,7 K], добавлен 17.09.2016Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.
лабораторная работа [100,5 K], добавлен 02.06.2014Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.
контрольная работа [250,5 K], добавлен 11.04.2015Параметры парной линейной, линейно-логарифмической функции. Оценка статистической надёжности. Ошибка положения регрессии. Расчёт бета коэффициентов, уравнение множественной регрессии в стандартизованном масштабе. Задача на определение тесноты связи рядов.
контрольная работа [192,2 K], добавлен 23.06.2012Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.
курсовая работа [1,1 M], добавлен 07.08.2011Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.
контрольная работа [817,3 K], добавлен 01.04.2010Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.
лабораторная работа [30,9 K], добавлен 05.12.2010Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.
контрольная работа [173,8 K], добавлен 22.11.2010Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.
лабораторная работа [2,1 M], добавлен 25.05.2009Расчет уравнений линейной и нелинейной парной регрессии. Оценка тесноты связи расходов на перевозки и грузооборота с помощью показателей корреляции и детерминации. Оценка ошибки аппроксимации уравнений регрессии. Расчет прогнозного значения расходов.
курсовая работа [2,5 M], добавлен 26.12.2014Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации; определение средней ошибки аппроксимации. Статистическая надежность регрессионного моделирования с помощью критериев Фишера и Стьюдента.
контрольная работа [34,7 K], добавлен 14.11.2010Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.
контрольная работа [681,9 K], добавлен 03.08.2010