Основы эконометрики
Определение и характеристика сущности парной регрессии и корреляции. Изучение примеров гетероскедастичности. Ознакомление с традиционном методом наименьших квадратов для многомерной регрессии. Рассмотрение критических значений критерия Стьюдента.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 26.09.2017 |
Размер файла | 319,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
lnу = 2,5 + 0,2lnx + e, r2 = 0,68.
(6,19)
у = 1,1 + 0,8lnх + е, r2 = 0,69.
(6,2)
у = 3 + 1,5х + 0,1х2 + е,r2 = 0,701.
(3,0)(2,65)
В скобках указаны фактические значения t-критерия.
Задания:
1. Определите коэффициент детерминации для 1-го уравнения.
2. Запишите функцию, характеризующую зависимость у от х во 2-м уравнении.
3. Определите коэффициенты эластичности для каждого из уравнений для х0 = 2,5 тыс. шт.
Решение:
1. Чтобы определить коэффициент детерминации воспользуемся формулой (21).
Для уравнения парной линейной регрессии коэффициент детерминации r2 = 0,70.
2. Уравнение 2 - это степенная функция, к которой применили преобразование. В качестве преобразования выполнили логарифмирование. Чтобы записать функцию проведем обратные преобразования.
lnу = 2,5 + 0,2lnx + e у = е2,5 • х0,2 у = 1,28х0,2.
3. Чтобы рассчитать коэффициенты эластичности воспользуемся данными табл. 2. Результаты расчетов объединим в табл. 6.
Таблица 6
Вид функции |
Коэффициент эластичности |
|
Линейная у = 3 + 2х + е |
||
Парабола у = 3 + 1,5х + 0,1х2 + е |
||
Степенная у = 1,28х0,2 |
Э = 1,28 |
|
Полулогарифмическая у = 1,1 + 0,8lnx |
Рассчитаем точечный коэффициент эластичности для значения х0 = 2,5.
1. Для линейной модели у = 3 + 2х + е.
= 0,625.
2. Для параболы у = 3 + 1,5х + 0,1х2 + е.
= 0,678.
3. Для степенной функции у = 1,28х0,2.
Э = 1,28.
4. Для полулогарифмической функции у = 1,1 + 0,8lnx.
= 0,436.
Задача 3
По совокупности 30 предприятий торговли изучается линейная зависимость между ценой товара А (тыс. руб.) х и прибылью торгового предприятия (млн ру6.) у.
При оценке регрессионной модели были получены следующие промежуточные результаты:
= 39000,
= 120000.
Задания:
1. Поясните, какой показатель корреляции можно определить по вышеприведенным данным:
2. Постройте таблицу дисперсионного анализа для расчета значения F-критерия Фишера.
3. Сравните фактическое значение F-критерия с табличным. Сделайте выводы.
Решение:
1. Оценим исходные данные задачи. Величина называется остаточная сумма квадратов (Qe), а полная сумма квадратов (Q). Исходя из условия задачи, можно рассчитать коэффициент детерминации по формуле (22), а затем индекс корреляции. Тогда,
= 0,675.
R = = 0,822
2. Для дисперсионного анализа воспользуемся табл. 1 и формулами (17), (18). Результаты расчетов приведем в табл. 7.
Таблица 7
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Дисперсия на одну степень свободы |
Fфакт |
|
Объясненная |
QR = 81000 |
m - 1 = 1 |
81000 |
58,15 |
|
Остаточная |
Qe = 39000 |
n - m = 28 |
1392,86 |
||
Общая |
Q = 120000 |
n - 1 = 29 |
3. По статистическим таблица представленным в приложении найдем F0,05;1;28 = 4,20. Так как наблюдаемое значение статистики Фишера Fфакт больше табличного (Fфакт > F0,05;1;28), то полученная модель является адекватной.
Задача 4
По 28 предприятиям концерна изучается зависимость дневной выработки (ед.) у от уровня механизации труда (%) х по следующим данным (табл. 8).
Таблица 8
i |
x |
y |
i |
x |
y |
i |
x |
y |
|
1 |
15 |
5 |
11 |
55 |
22 |
21 |
76 |
33 |
|
2 |
24 |
6 |
12 |
60 |
23 |
22 |
80 |
42 |
|
3 |
42 |
6 |
13 |
61 |
23 |
23 |
82 |
41 |
|
4 |
46 |
9 |
14 |
62 |
24 |
24 |
87 |
44 |
|
5 |
48 |
15 |
15 |
63 |
24 |
25 |
90 |
53 |
|
6 |
48 |
14 |
16 |
64 |
25 |
26 |
93 |
55 |
|
7 |
50 |
17 |
17 |
66 |
25 |
27 |
95 |
57 |
|
8 |
52 |
17 |
18 |
70 |
27 |
28 |
99 |
62 |
|
9 |
53 |
22 |
19 |
72 |
31 |
||||
10 |
54 |
21 |
20 |
75 |
33 |
Задания:
1. Проверьте гипотезу об отсутствии гетероскедастичности в линейной регрессии с помощью теста ранговой корреляции Спирмэна при вероятности 0,95.
2. С помощью теста Гольдфельда-Квандта исследуйте гетероскедастичность остатков.
Решение:
Тест ранговой корреляции Спирмэна
Проранжируем значения хi и абсолютные величины остатков в порядке возрастания, расчеты занесем в табл. 9.
Найдем коэффициент ранговой корреляции Спирмэна:
= 0,108.
Таблица 9
N |
X |
Ei |
Расчет ранговой корреляции |
||||
Ранг Х |
Ранг |Ei| |
d |
d^2 |
||||
1 |
15 |
13,27 |
1 |
28 |
-27 |
729 |
|
2 |
24 |
7,61 |
2 |
26 |
-24 |
576 |
|
3 |
42 |
-5,71 |
3 |
23 |
-20 |
400 |
|
4 |
46 |
-5,67 |
4 |
22 |
-18 |
324 |
|
5 |
48 |
-1,15 |
5 |
6 |
-1 |
1 |
|
6 |
48 |
-2,15 |
6 |
9 |
-3 |
9 |
|
7 |
50 |
-0,63 |
7 |
3 |
4 |
16 |
|
8 |
52 |
-2,11 |
8 |
8 |
0 |
0 |
|
9 |
53 |
2,15 |
9 |
10 |
-1 |
1 |
|
10 |
54 |
0,41 |
10 |
2 |
8 |
64 |
|
11 |
55 |
0,67 |
11 |
4 |
7 |
49 |
|
12 |
60 |
-2,03 |
12 |
7 |
5 |
25 |
|
13 |
61 |
-2,77 |
13 |
13 |
0 |
0 |
|
14 |
62 |
-2,51 |
14 |
12 |
2 |
4 |
|
15 |
63 |
-3,25 |
15 |
17 |
-2 |
4 |
|
16 |
64 |
-2,99 |
16 |
15 |
1 |
1 |
|
17 |
66 |
-4,47 |
17 |
19 |
-2 |
4 |
|
18 |
70 |
-5,43 |
18 |
20 |
-2 |
4 |
|
19 |
72 |
-2,91 |
19 |
14 |
5 |
25 |
|
20 |
75 |
-3,13 |
20 |
16 |
4 |
16 |
|
21 |
76 |
-3,87 |
21 |
18 |
3 |
9 |
|
22 |
80 |
2,17 |
22 |
11 |
11 |
121 |
|
23 |
82 |
-0,31 |
23 |
1 |
22 |
484 |
|
24 |
87 |
-1,01 |
24 |
5 |
19 |
361 |
|
25 |
90 |
5,77 |
25 |
24 |
1 |
1 |
|
26 |
93 |
5,55 |
26 |
21 |
5 |
25 |
|
27 |
95 |
6,07 |
27 |
25 |
2 |
4 |
|
28 |
99 |
8,11 |
28 |
27 |
1 |
1 |
|
Сумма |
0,00 |
3258 |
Найдем t-критерий для ранговой корреляции:
= 0,556.
Сравним полученное значение t с табличным значением t0,95; 26 = 2,06. Так как t < t0,95; 26, то на уровне значимости 5% принимается гипотеза об отсутствии гетероскедастичности.
Тест ГолфредаКвандта
Упорядочим п наблюдений по мере возрастания переменной х. Исключим из рассмотрения С = 6 центральных наблюдений (условие (п С)/2 = (28 - 6)/2 = 11 > р = 1 выполняется). Разделим совокупность из (п С) = (28 - 6) = 22 наблюдений на две группы (соответственно с малыми и большими значениями фактора х по 11 наблюдений) и определим по каждой из групп уравнения регрессии. Для первой группы оно составит = 3,70 + 0,39x. Для второй группы: = 1,16 + 53,11x. Определим остаточные суммы квадратов для первой (S1) и второй (S2) групп. Промежуточные расчеты занесем в табл. 10.
Таблица 10
N |
X |
Y |
Yрег = -3,70 + 0,39Х |
e=Y-Yрег |
e^2 |
|
1 |
15 |
5 |
2,15 |
2,85 |
8,1225 |
|
2 |
24 |
6 |
5,66 |
0,34 |
0,1156 |
|
3 |
42 |
6 |
12,68 |
-6,68 |
44,6224 |
|
4 |
46 |
9 |
14,24 |
-5,24 |
27,4576 |
|
5 |
48 |
15 |
15,02 |
-0,02 |
0,0004 |
|
6 |
48 |
14 |
15,02 |
-1,02 |
1,0404 |
|
7 |
50 |
17 |
15,8 |
1,2 |
1,44 |
|
8 |
52 |
17 |
16,58 |
0,42 |
0,1764 |
|
9 |
53 |
22 |
16,97 |
5,03 |
25,3009 |
|
10 |
54 |
21 |
17,36 |
3,64 |
13,2496 |
|
S1 |
121,5258 |
|||||
N |
X |
Y |
Yрег = -53,11 + 1,16Х |
e=Y-Yрег |
e^2 |
|
17 |
66 |
25 |
23,45 |
1,55 |
2,4025 |
|
18 |
70 |
27 |
28,09 |
-1,09 |
1,1881 |
|
19 |
72 |
31 |
30,41 |
0,59 |
0,3481 |
|
20 |
75 |
33 |
33,89 |
-0,89 |
0,7921 |
|
21 |
76 |
33 |
35,05 |
-2,05 |
4,2025 |
|
22 |
80 |
42 |
39,69 |
2,31 |
5,3361 |
|
23 |
82 |
41 |
42,01 |
-1,01 |
1,0201 |
|
24 |
87 |
44 |
47,81 |
-3,81 |
14,5161 |
|
25 |
90 |
53 |
51,29 |
1,71 |
2,9241 |
|
26 |
93 |
55 |
54,77 |
0,23 |
0,0529 |
|
27 |
95 |
57 |
57,09 |
-0,09 |
0,0081 |
|
28 |
99 |
62 |
61,73 |
0,27 |
0,0729 |
|
S2 |
32,8636 |
Найдем отношение R = S1/S2, где S1 > S2.
= 3,69.
Сравним эту величину с табличным значением F-критерия с числом степеней свободы 8 для каждой остаточной суммы квадратов F0,05;8;8 = 3,44. Так как R > F0,05;8,8, делаем вывод о наличие гетероскедастичности остатков.
Задача 5
Имеются данные среднегодовой стоимости основных фондов, (млн руб.) х1, среднегодовой стоимости оборотных средств (млн руб.) х2 и величины валового дохода за год (млн руб.) у по 25 предприятиям, которые представлены в табл. 11.
Таблица 11
i |
у |
х1 |
х2 |
|
1 |
45 |
17 |
54 |
|
2 |
48 |
20 |
78 |
|
3 |
50 |
80 |
100 |
|
4 |
52 |
65 |
114 |
|
5 |
56 |
124 |
42 |
|
6 |
45 |
100 |
38 |
|
7 |
63 |
28 |
56 |
|
8 |
69 |
36 |
59 |
|
9 |
75 |
98 |
46 |
|
10 |
80 |
114 |
65 |
|
11 |
88 |
102 |
56 |
|
12 |
90 |
96 |
50 |
|
13 |
99 |
102 |
87 |
|
14 |
75 |
116 |
54 |
|
15 |
113 |
50 |
63 |
|
16 |
118 |
60 |
75 |
|
17 |
65 |
56 |
28 |
|
18 |
111 |
87 |
56 |
|
19 |
121 |
112 |
45 |
|
20 |
160 |
115 |
88 |
|
21 |
176 |
120 |
74 |
|
22 |
186 |
110 |
90 |
|
23 |
192 |
111 |
102 |
|
24 |
203 |
118 |
105 |
|
25 |
237 |
154 |
106 |
Задания:
1. Построить линейное уравнение множественной регрессии и пояснить экономический смысл его параметров.
2. Рассчитать частные коэффициенты эластичности, а также стандартизированные коэффициенты регрессии; сделать вывод о силе связи результата и фактора.
3. Рассчитать парные, частные коэффициенты корреляции, а также множественный коэффициент корреляции; сделать выводы.
4. Проверить значимость уравнения регрессии на 5%-м уровне по F-критерию, проверить значимость коэффициентов регрессии по t-статистике.
Решение:
1. По данным табл. 11 найдем уравнение регрессии у по х1, х2. Расчеты произведем в Excel по формуле (32), промежуточные вычисления представим в табл. 12.
Система уравнений для расчета коэффициентов регрессии примет вид:
Таблица 12
i |
х1 |
х2 |
у |
yх1 |
yх2 |
х1^2 |
х2^2 |
x1x2 |
у^2 |
|
1 |
17 |
54 |
45 |
765 |
2430 |
289 |
2916 |
918 |
2025 |
|
2 |
20 |
78 |
48 |
960 |
3744 |
400 |
6084 |
1560 |
2304 |
|
3 |
80 |
100 |
50 |
4000 |
5000 |
6400 |
10000 |
8000 |
2500 |
|
4 |
65 |
114 |
52 |
3380 |
5928 |
4225 |
12996 |
7410 |
2704 |
|
5 |
124 |
42 |
56 |
6944 |
2352 |
15376 |
1764 |
5208 |
3136 |
|
6 |
100 |
38 |
45 |
4500 |
1710 |
10000 |
1444 |
3800 |
2025 |
|
7 |
28 |
56 |
63 |
1764 |
3528 |
784 |
3136 |
1568 |
3969 |
|
8 |
36 |
59 |
69 |
2484 |
4071 |
1296 |
3481 |
2124 |
4761 |
|
9 |
98 |
46 |
75 |
7350 |
3450 |
9604 |
2116 |
4508 |
5625 |
|
10 |
114 |
65 |
80 |
9120 |
5200 |
12996 |
4225 |
7410 |
6400 |
|
11 |
102 |
56 |
88 |
8976 |
4928 |
10404 |
3136 |
5712 |
7744 |
|
12 |
96 |
50 |
90 |
8640 |
4500 |
9216 |
2500 |
4800 |
8100 |
|
13 |
102 |
87 |
99 |
10098 |
8613 |
10404 |
7569 |
8874 |
9801 |
|
14 |
116 |
54 |
75 |
8700 |
4050 |
13456 |
2916 |
6264 |
5625 |
|
15 |
50 |
63 |
113 |
5650 |
7119 |
2500 |
3969 |
3150 |
12769 |
|
16 |
60 |
75 |
118 |
7080 |
8850 |
3600 |
5625 |
4500 |
13924 |
|
17 |
56 |
28 |
65 |
3640 |
1820 |
3136 |
784 |
1568 |
4225 |
|
18 |
87 |
56 |
111 |
9657 |
6216 |
7569 |
3136 |
4872 |
12321 |
|
19 |
112 |
45 |
121 |
13552 |
5445 |
12544 |
2025 |
5040 |
14641 |
|
20 |
115 |
88 |
160 |
18400 |
14080 |
13225 |
7744 |
10120 |
25600 |
|
21 |
120 |
74 |
176 |
21120 |
13024 |
14400 |
5476 |
8880 |
30976 |
|
22 |
110 |
90 |
186 |
20460 |
16740 |
12100 |
8100 |
9900 |
34596 |
|
23 |
111 |
102 |
192 |
21312 |
19584 |
12321 |
10404 |
11322 |
36864 |
|
24 |
118 |
105 |
203 |
23954 |
21315 |
13924 |
11025 |
12390 |
41209 |
|
25 |
154 |
106 |
237 |
36498 |
25122 |
23716 |
11236 |
16324 |
56169 |
|
Сумма |
2191 |
1731 |
2617 |
259004 |
198819 |
223885 |
133807 |
156222 |
350013 |
Решив систему уравнений методом Гаусса, получили следующие значения коэффициентов регрессии b0 = 34,121; b1 = 0,788; b2 = 1,008.
Уравнение множественной линейной регрессии примет вид:
у = 34,121 + 0,788х1 + 1,008х2.
Коэффициент регрессии b1 показывает, что при увеличении на 1 млн руб. среднегодовой стоимости основных фондов (х1) валовой доход (у) в среднем увеличится на 0,788 млн руб. при постоянном значении среднегодовой стоимости оборотных средств (х2). Если же увеличится среднегодовая стоимость оборотных средств (х2) на 1 млн руб., а стоимость основных фондов (х1) в среднем не изменится, то валовой доход (у) увеличится в среднем на 1,008 млн руб.
2. Рассчитаем коэффициенты и Ej для рассматриваемого примера по формуле (33).
Предварительно найдем значения среднеквадратичного отклонения для переменных задачи, используя данные табл. 12.
= 35,702;
= 23,624;
= 55,160.
Тогда,
= 0,510= 0,432.
= 0,659= 0,667
С увеличением среднегодовой стоимости основных фондов на 1 % от среднего уровня годовой валовой доход возрастет на 65,9% от своего среднего уровня при фиксированном значении среднегодовой стоимости оборотных средств. С увеличением стоимости оборотных средств на 1 % от среднего уровня годовой валовой доход возрастет на 66,7% от своего среднего уровня при фиксированном значении стоимости основных фондов. Сила влияния стоимости оборотных средств (х2) на доход несколько больше, чем сила влияния стоимости основных фондов (х1).
3. Определим парные коэффициенты корреляции, используя формулу (12) и данные табл. 12.
= 0,602;
= 0,540;
= 0,214.
Парный коэффициент между доходом (у) и стоимостью основных средств (х1) равен 0,602. Парный коэффициент между доходом (у) и стоимостью оборотных средств (х2) равен 0,540. Связь между переменными довольно тесная.
Рассчитаем частные коэффициенты корреляции:
= 0,591;
= 0,527.
При сравнении коэффициентов парной и частной корреляции приходим к выводу, что из-за слабой зависимости между факторами (rx1x2 = 0,214 - отсутствие мультиколлинеарности) коэффициенты парной и частной корреляции отличаются незначительно.
Рассчитаем коэффициент множественной корреляции по формуле
Коэффициент множественной корреляции больше значений парных коэффициентов корреляции. Совокупность факторов оказывает большее совместное влияние на результативный признак.
Для линейных моделей коэффициент множественной детерминации равен квадрату коэффициента множественной корреляции, тогда R2 = 0,7352 = 0,54.
4. Для оценки адекватность уравнения регрессии воспользуемся критерием Фишера. Для расчета Fнабл воспользуемся формулой
= 12,92.
По таблицам F-критерия прил. 1 F0,05;2;22 = 3,44. Так как F > F0,05;2;17, то уравнение регрессии значимо.
Чтобы оценить значимость параметров регрессии b1 и b2 необходимо найти значения t-статистики. Используя предыдущие расчеты, найдем частные F-критерии Фишера.
= 12,394;
= 8,881.
Для линейных моделей частный F-критерий Фишера связан с t-критерием Стьюдента следующим соотношением:
.
Выполнив расчеты, получим
= 3,521;
= 2,980.
По таблицам t-распределения прил. 1 t0,95;22 = 2,07. Тогда,
t1 = 3,521 > t0,95;47 = 2,07 - параметр b1 адекватен;
t2 = 2,980 > t0,95;47 = 2,07 - параметр b2 адекватен.
Задача 6
Имеются следующие результаты регрессионного анализа зависимости объема выпуска продукции (млн руб.) у от численности занятых на предприятии (чел.) х1 и среднегодовой стоимости основных фондов (млн руб.) х2 по 20 предприятиям отрасли:
Коэффициент детерминации0,81
Множественный коэффициент корреляции???
Уравнение регрессии ln y = ??? + 0,48 lnx1 + 0,62 lnx2
Стандартные ошибки параметров20,06???
t-критерий для параметров1,5???5
Задания:
1. Напишите уравнение регрессии, характеризующее зависимость у от х1 и х2.
2. Восстановите пропущенные характеристики.
3. Оцените адекватность полученной модели.
Решение:
1. Для данного уравнения примели преобразование, которое приводит модель нелинейную относительно оцениваемых параметров , к линейной модели: .
Чтобы написать уравнение регрессии сначала восстановим значение параметра а. Воспользуемся формулой (20), в которой отношение обозначим через стандартную ошибку параметра. Тогда
. (39)
Значение параметра а = b0 будет равно а = b0 = t • Sbj = 2 • 1,5 = 3.
Уравнение будет записано в виде: ln y = 3 + 0,48 lnx1 + 0,62 lnx2.
Проведем обратные преобразования и получим уравнение: .
2. Чтобы восстановить пропущенные значение стандартной ошибки коэффициента регрессии и t-критерия также воспользуемся формулой (38).
;
.
Так как коэффициент детерминации R2 в линейных моделях равен квадрату множественного коэффициента корреляции R, то .
Запишем исходные данные с восстановленными характеристиками:
Коэффициент детерминации0,81
Множественный коэффициент корреляции0,9
Уравнение регрессии
Стандартные ошибки параметров20,060,124
t-критерий для параметров1,585
3. Для оценки адекватность параметров регрессии воспользуемся значениями tнабл. По таблицам t-распределения прил. 1 t0,95;17 = 2,11. Тогда, t1 = 8 > t0,95;17 = 2,11 - параметр b1 адекватен; t2 = 5 > t0,95;17 = 2,11 - параметр b2 адекватен.
Для оценки адекватность уравнения регрессии воспользуемся критерием Фишера. Для расчета Fнабл воспользуемся формулой
= 16,22.
По таблицам F-критерия прил. 1 F0,05;2;17 = 3,59. Так как F > F0,05;2;17, то уравнение регрессии значимо.
Задача 7
При изучении уровня потребления мяса (кг на душу населения) у в зависимости от дохода (руб. на одного члена семьи) х1 и в соотношении с уровнем потребления рыбы (кг на душу населения) х2 результаты оказались следующими (по 50 семьям):
Уравнение регрессии = 180 + 0,2х1 0,4х2
Стандартные ошибки параметров20 0,01 0,25
Множественный коэффициент корреляции0,85
Задания:
1. Используя t-критерий Стьюдента, оцените значимость параметров уравнения.
2. Рассчитайте F-критерий Фишера.
3. Оцените по частным F-критериям Фишера целесообразность включения в модель:
а) фактора х1 после фактора х2;
б) фактора х2 после фактора х1.
Решение:
1. Чтобы найти t-критерий Стьюдента воспользуемся формулой (38).
= 9; = 20 = 1,6
Для оценки адекватность параметров регрессии воспользуемся значениями tнабл. По таблицам t-распределения прил. 1 t0,95;47 = 2,01. Тогда,
t0 = 9 > t0,95;47 = 2,01 - параметр b0 адекватен;
t1 = 20 > t0,95;47 = 2,01 - параметр b1 адекватен;
t2 = 1,6 < t0,95;47 = 2,01 - параметр b2 неадекватен.
2. Коэффициент детерминации R2 в линейных моделях равен квадрату множественного коэффициента корреляции R.
Отсюда R2 = 0,852 = 0,72.
Для оценки адекватность уравнения регрессии воспользуемся критерием Фишера. Для расчета Fнабл воспользуемся формулой
= 21,86.
По таблицам F-критерия прил. 1 F0,05;2;47 = 3,21. Так как F > F0,05;2;47, то в целом уравнение регрессии значимо.
3. Чтобы оценить целесообразность включения в модель дополнительных переменных, необходимо найти частный F-критерий Фишера. Для линейных моделей частный F-критерий Фишера связан с t-критерием Стьюдента следующим соотношением:
.
Для целесообразности включения фактора х1 после фактора х2 рассчитаем Fx1:
= 202 = 400.
Так как F = 400 > F0,05;2;47 = 3,21, то включение в модель фактора х1 после фактора х2 статистически оправдано.
Для целесообразности включения фактора х2 после фактора х1 рассчитаем Fx2:
= 1,62 = 2,56.
Так как F = 2,56 < F0,05;2;47 = 3,21, то включение в модель фактора х2 после фактора х1 статистически не оправдано.
Задача 8
Пусть имеются следующие данные об урожайности озимой пшеницы yt (ц/га) за 10 лет (табл. 13):
Таблица 13
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
yt |
16,3 |
20,2 |
17,1 |
7,7 |
15,3 |
16,3 |
19,9 |
14,4 |
18,7 |
20,7 |
Задания:
1. Построить линейную модель Y(t) = a0 + a1t, параметры которой оценить методом наименьших квадратов (МНК).
2. Оценить адекватность построенной модели на основе исследования:
случайной остаточной компоненты по критерию пиков;
независимости уровней ряда остатков по d-критерию (dн = 1,08 и dв = 1,36) и по первому коэффициенту автокорреляции (r = 0,36);
нормальности распределения остаточной компоненты по RS-критерию (критические уровни 2,67 - 3,69).
3. Построить точечный и интервальный прогнозы на два шага вперед (t = 1,12 для уровня вероятности 70% и n = 10).
4. Отобразить на графике фактические данные, результаты расчетов и прогнозирования.
Решение:
1. Расчеты коэффициентов модели будем проводить по формулам кривых роста оцененных МНК:
(40)
a0 = a1,(41)
где , средние значения уровней ряда и моментов наблюдения соответственно.
Промежуточные расчеты приведены в табл. 14.
Оценка параметров регрессии:
а1 = 0,3224;
а0 = 16,66 - 0,3224 5,5 14,8867.
Таблица 14
t |
yt |
(t-tcp) |
(t-tcp)^2 |
(y-ycp) |
(t-tcp)*(y-ycp) |
||
1 |
16,3 |
-4,5 |
20,25 |
-0,36 |
1,62 |
||
2 |
20,2 |
-3,5 |
12,25 |
3,54 |
-12,39 |
||
3 |
17,1 |
-2,5 |
6,25 |
0,44 |
-1,1 |
||
4 |
7,7 |
-1,5 |
2,25 |
-8,96 |
13,44 |
||
5 |
15,3 |
-0,5 |
0,25 |
-1,36 |
0,68 |
||
6 |
16,3 |
0,5 |
0,25 |
-0,36 |
-0,18 |
||
7 |
19,9 |
1,5 |
2,25 |
3,24 |
4,86 |
||
8 |
14,4 |
2,5 |
6,25 |
-2,26 |
-5,65 |
||
9 |
18,7 |
3,5 |
12,25 |
2,04 |
7,14 |
||
10 |
20,7 |
4,5 |
20,25 |
4,04 |
18,18 |
||
сумма |
55 |
166,6 |
0 |
82,5 |
0 |
26,6 |
|
среднее |
5,5 |
16,66 |
В результате ручного расчета получено линейное уравнение зависимости yt (урожайности) от t (время) в виде:
Y(t) = 14,89 + 0,32t.
Оценка параметров модели средствами мастера диаграмм представлена на рис. 4.
Рис. 4. Корреляционное поле и тренд
2. Оценим качество построенной модели.
Модель является адекватной, если математическое ожидание значений остатков близко или равно нулю, и если значения остаточного ряда случайны, независимы и подчинены нормальному закону распределения;
Проверка равенства нулю математического ожидания уровней ряда остатков
Для этого найдем значения ряда остатков и произведем суммирование (табл. 15). В нашем случае 0, поэтому гипотеза о равенстве математического ожидания значений остаточного ряда нулю выполняется.
Таблица 15
t |
Урожайность |
Yрег |
Е |
||
1 |
16,3 |
15,20909 |
1,090909 |
||
2 |
20,2 |
15,53152 |
4,668485 |
||
3 |
17,1 |
15,85394 |
1,246061 |
||
4 |
7,7 |
16,17636 |
-8,47636 |
||
5 |
15,3 |
16,49879 |
-1,19879 |
||
6 |
16,3 |
16,82121 |
-0,52121 |
||
7 |
19,9 |
17,14364 |
2,756364 |
||
8 |
14,4 |
17,46606 |
-3,06606 |
||
9 |
18,7 |
17,78848 |
0,911515 |
||
10 |
20,7 |
18,11091 |
2,589091 |
||
сумма |
55 |
166,6 |
0 |
Модель по данному свойству адекватна.
Проверка независимости (отсутствие автокорреляции)
Данное свойство проверяют с помощью критерия Дарбина-Уотсона. Для этого находится статистика Дарбина-Уотсона (d-статистика):
.(42)
Для проверки используют два пороговых значения dв и dн, зависящие только от числа наблюдений, числа регрессоров и уровня значимости.
Графически результат теста Дарбина-Уотсона можно изобразить следующим образом (рис. 5).
Рис. 5. Тест Дарбина-Уотсона
Расчетное значение d равно: = 1,9224
Значение рассчитанного параметра d больше dв и меньше 4dв, поэтому принимаем гипотезу об отсутствии автокорреляции по критерию Дарбина-Уотсона.
Также для проверки наличия автокорреляции можно воспользоваться первым коэффициентом автокорреляции:
.(43)
Для принятия решения об отсутствии или наличие автокорреляции в исследуемом ряду расчетное значение r(1) сопоставляют с табличным (критическим) значением r для = 0,05. Если r(1) < r, то гипотеза об отсутствии автокорреляции в исследуемом ряду может быть принята, иначе - делают вывод о наличии автокорреляции в ряду.
Вычислим r(1) для нашего примера:
r(1) = = 0,00662.
Рассчитанное значение меньше табличного. Это означает, что гипотеза об отсутствии автокорреляции в ряду урожайности может быть принята.
Модель по параметру независимости адекватна.
Проверка случайности возникновения отдельных отклонений от тренда
Используем критерий, основанный на поворотных точках. Значение случайной переменной считается поворотной точкой, если оно одновременно больше (меньше) соседних с ним элементов. Если остатки случайны, то поворотная точка приходится примерно на каждые 1,5 наблюдения. Если их больше, то возмущения быстро колеблются, и это не может быть объяснено только случайностью. Если же их меньше, то последовательные значения случайного компонента положительно коррелированны.
Критерий случайности отклонений от тренда при уровне вероятности 0,95 можно представить как
,(44)
где р фактическое количество поворотных точек в случайном ряду; 1,96 квантиль нормального распределения для 5%-го уровня значимости.
Квадратные скобки означают, что от результата вычисления следует взять целую часть (не путать с процедурой округления!).
Если неравенство не соблюдается, то ряд остатков нельзя считать случайным (т.е. он содержит регулярную компоненту), стало быть, модель не является адекватной. Построим график остатков (рис. 6).
Рис. 6. График остатков
Количество поворотных точек равно 4.
Значение = [2,9687] = 2.
Неравенство выполняется 4 > 2. Следовательно, свойство случайности выполняется. Модель по данному параметру адекватна.
Соответствие ряда остатков нормальному закону распределения
Данное соответствие можно проверить с помощью RS-критерия:
,(45)
где max, min - соответственно максимальный и минимальный уровни ряда остатков; S среднеквадратическое отклонение ряда остатков.
Если расчетное значение RS попадает между табулированными границами с заданным уровнем вероятности, то гипотеза о нормальном распределении ряда остатков принимается. В этом случае допустимо строить доверительный интервал прогноза.
Среднеквадратическое отклонение ряда остатков S = 3,6912.
RS = = 3,5611
Расчетное значение попадает в интервал [2,67-3,69], следовательно, выполняется свойство нормального распределения. Модель по этому параметру адекватна.
Если все пункты проверки дают положительный результат, то выбранная трендовая модель является адекватной реальному ряду экономической динамики, и, следовательно, ее можно использовать для построения прогнозных оценок. В противном случае модель надо улучшать.
3. Точечный и интервальный прогнозы на два шага вперед.
Точечный прогноз - это прогноз, которым называется единственное значение прогнозируемого показателя. Это значение определяется подстановкой в полученное (рассчитанное) уравнение выбранной кривой роста величины времени t, соответствующей периоду упреждения: t = n + 1; t = n + 2 и т.д.
Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, имеет малую вероятность. Возникновение соответствующих отклонений объясняется следующими причинами.
1. Выбранная для прогнозирования кривая не является единственно возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты.
2. Прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень обладает еще и случайной компонентой. Поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную компоненту.
3. Тенденция характеризует движение среднего уровня ряда динамики, поэтому отдельные наблюдения могут от него отклоняться. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем.
Интервальные прогнозы строятся на основе точечных прогнозов. Доверительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя. Ширина интервала зависит от качества модели, т.е. степени ее близости к фактическим данным, числа наблюдений, горизонта прогнозирования и выбранного пользователем уровня вероятности.
При построении доверительного интервала прогноза рассчитывается величина U(k), которая для линейной модели имеет следующий вид
,(46)
где р - число факторных переменных; k - период прогнозирования; t табличное значение t-статистики Стьюдента при заданном уровне значимости и числе наблюдений (значение t можно получить с помощью встроенной функции Excel СТЬЮДРАСПОБР); стандартная ошибка (среднеквадратическое отклонение от модели).
Для других моделей величина U(k) рассчитывается аналогичным образом, но имеет более громоздкий вид. Как видно из формулы, величина U зависит прямо пропорционально от точности модели, коэффициента доверительной вероятности t, степени углубления в будущее на k шагов вперед, т.е. на момент t = n + k, и обратно пропорциональна объему наблюдений. Доверительный интервал прогноза будет иметь следующий вид:
Uy = U(k)(47)
Если построенная модель адекватна, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границей.
После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом.
Построим прогнозы на два шага вперед (k = 1 и k = 2):
точечный
у11 = 14,887 + 0,32211 18,39
у12 = 14,887 + 0,32212 18,71
интервальный
Рассчитаем стандартную ошибку = 3,915
Тогда значение U(k) для расчета доверительного интервала будет равно:
U(1) = 3,915 1,108 = 5,254;
U(2) = 3,915 1,108 = 7,319.
Данные расчета верхних и нижних границ доверительного интервала приведены в табл. 8.
Таблица 16
n + k |
U(k) |
Прогноз |
Верхняя граница |
Нижняя граница |
|
10 + 1 |
5,254 |
18,39 |
23,644 |
13,136 |
|
10 + 2 |
7,319 |
18,71 |
26,029 |
11,391 |
4. График фактических данных, результатов расчета и прогнозирования. Для построения графика прогнозирования воспользуемся инструментом Excel Мастер диаграмм.
Для этого необходимо:
1. Выделить диапазоны ячеек значений t, урожайности и оценки урожайности.
2. Запустить Мастер диаграмм, в диалоговом окне мастера выбрать тип диаграммы Точечный, на котором значения соединены отрезками. Далее в мастере установить необходимые настройки и параметры. Желательно для исходных значений у задать параметр, который обозначает фактические значения урожайности.
3. В диалоговом окне Исходные данные на вкладке Ряд добавить ряды для значений точечного и интервального прогноза. Для этого выбрать кнопку Добавить, в поле Имя указать название ряда, в поле Значение Х диапазон прогноза (11 и 12), в поле Значение Y диапазон либо точного, либо интервального прогнозов. Пример окна (рис. 7).
Рис. 7. Рабочее окно исходных данн...
Подобные документы
Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.
контрольная работа [108,5 K], добавлен 28.03.2018Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.
лабораторная работа [67,8 K], добавлен 26.12.2010Понятие взаимосвязи между случайными величинами. Ковариация и коэффициент корреляции. Модель парной линейной регрессии. Метод наименьших квадратов, теорема Гаусса-Маркова. Сравнение регрессионных моделей. Коррекция гетероскедастичности, логарифмирование.
курс лекций [485,1 K], добавлен 02.06.2011Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [3,6 M], добавлен 29.05.2010Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [914,4 K], добавлен 01.12.2013Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Экономическая интерпретация коэффициента регрессии. Нахождение статочной суммы квадратов и оценка дисперсии остатков. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента. Расчет средней относительной ошибки аппроксимации.
контрольная работа [261,1 K], добавлен 23.03.2010Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Задачи эконометрики, ее математический аппарат. Взаимосвязь между экономическими переменными, примеры оценки линейности и аддитивности. Основные понятия и проблемы эконометрического моделирования. Определение коэффициентов линейной парной регрессии.
контрольная работа [79,3 K], добавлен 28.07.2013Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Оценка коэффициентов парной линейной регрессии, авторегрессионное преобразование. Трехшаговый и двухшаговый метод наименьших квадратов, его гипотеза и предпосылки. Системы одновременных уравнений в статистическом моделировании экономических ситуаций.
курсовая работа [477,2 K], добавлен 05.12.2009Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.
контрольная работа [155,8 K], добавлен 11.12.2010Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.
контрольная работа [173,8 K], добавлен 22.11.2010Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.
курсовая работа [233,1 K], добавлен 21.03.2015Оценка корреляционной матрицы факторных признаков. Оценки собственных чисел матрицы парных коэффициентов корреляции. Анализ полученного уравнения регрессии, определение значимости уравнения и коэффициентов регрессии, их экономическая интерпретация.
контрольная работа [994,1 K], добавлен 29.06.2013Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [58,3 K], добавлен 17.10.2009Уравнение нелинейной регрессии и вид уравнения множественной регрессии. Преобразованная величина признака-фактора. Преобразование уравнения в линейную форму. Определение индекса корреляции и числа степеней свободы для факторной суммы квадратов.
контрольная работа [501,2 K], добавлен 27.06.2011Параметры парной линейной, линейно-логарифмической функции. Оценка статистической надёжности. Ошибка положения регрессии. Расчёт бета коэффициентов, уравнение множественной регрессии в стандартизованном масштабе. Задача на определение тесноты связи рядов.
контрольная работа [192,2 K], добавлен 23.06.2012Параметры уравнений линейной парной регрессии. Показатели корреляции и детерминации. Изменение средней заработной платы и выплат социального характера. Средняя ошибка аппроксимации. Коэффициент эластичности и стоимость активных производственных фондов.
контрольная работа [1,1 M], добавлен 23.06.2011