Основы эконометрики
Определение особенностей матрицы парных коэффициентов корреляции. Расчет и характеристика параметров линейной парной регрессии. Изучение формулы коэффициента детерминации. Рассмотрение и анализ значимости полученных уравнений с помощью критерия Фишера.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 07.04.2016 |
Размер файла | 643,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Федеральное государственное образовательное бюджетное учреждение
высшего профессионального образования
«Финансовый университет при Правительстве Российской Федерации»
Кировский филиал
Контрольная работа
Студентка
Вохмянина Юлия Алексеевна
Специальность: Бакалавр экономики
Курс 3
Киров 2012
Матрица парных коэффициентов корреляции
1. Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Парные коэффициенты корреляции рассчитываются по формуле:
,
где n - объем выборки, - значение факторного признака, - значение результативного признака, - среднее значение факторного признака, - среднее значение результативного признака.
Используя инструмент «Корреляция» пакета «Анализ данных» в Excel получим матрицу парных коэффициентов корреляции.
Y |
X1 |
X2 |
X4 |
||
Y |
1 |
||||
X1 |
-0,01126 |
1 |
|||
X2 |
0,751061 |
-0,0341 |
1 |
||
X4 |
0,874012 |
-0,0798 |
0,868524 |
1 |
Качественно оценим взаимосвязь между результирующим признаком Y и каждым из факторов Хj, j=1,2,4 (силу зависимости определим по шкале Чеддока):
· , значит, между переменными Y и Х1 наблюдается обратная корреляционная зависимость. Однако зависимость между этими показателями очень слабая.
· , значит, между переменными Y и Х2 наблюдается прямая корреляционная зависимость: чем больше число комнат в квартире, тем выше ее цена.
· , значит, между переменными Y и X4 наблюдается прямая корреляционная зависимость: чем больше жилая площадь квартиры, тем выше ее цена.
- эта зависимость высокая, ближе к весьма высокой.
Это означает, что на 87,4 зависимая переменная Y (цена квартиры) зависит от показателя Х4 жилая площадь квартиры.
Оценим теперь статистическую значимость каждого коэффициента. Для этого рассчитаем значения t-критерия Стьюдента для каждого коэффициента
,
где - парный коэффициент корреляции результативного признака Y и факторного Xj, j=1,2,4, n - объем выборки.
ty,x1 = 0,069ty,x2 = 7,012ty,x4 = 11,088tкр. = (0,05; 38) = 2,024
По таблице критических точек распределения Стьюдента (или с помощью функции СТЬЮДРАСПОБР в Excel) при уровне значимости б=5% и числе степеней свободы k=n-2=40-2=38 определим критическое значение: tкр = 2.024
Т.к. (0,069<2.024), то коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой квартиры Y и городом области Х1 существует.
Т.к. (7,012>2.024), то коэффициент является значимым. На основании выборочных данных есть основания утверждать, что зависимость между ценой квартиры Y и числом комнат в квартире Х2 существует.
Т.к. (11,088>2.024), то коэффициент является значимым (значимо отличается от нуля). На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии тесной линейной корреляционной зависимости между признаками Y и Х4. Зависимость между ценой квартиры Y и жилой площадью квартиры Х4 является достоверной.
Таким образом, наиболее тесная и значимая зависимость наблюдается между ценой квартиры Y и жилой площадью квартиры Х4.
Поле корреляции результативного признака
2. Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
Для построения поля корреляции воспользуемся инструментом «Мастер диаграмм» в Excel. Выберем «Точечную» диаграмму. По оси абсцисс отложим значения фактора, наиболее тесно связанного с результативным фактором (X4), а по оси ординат - сам результативный фактор (Y).
Параметры линейной парной регрессии
3. Рассчитайте параметры линейной парной регрессии для каждого фактора Х.
Для построения линейной парной модели , j=4,5,6 используем инструмент «Регрессия» пакета «Анализ данных» в Excel.
Входной фактор Х1:
Регрессионная статистика |
||
Множественный R |
0,011259267 |
|
R-квадрат |
0,000126771 |
|
Нормированный R-квадрат |
-0,026185682 |
|
Стандартная ошибка |
58,03645994 |
|
Наблюдения |
40 |
Дисперсионный анализ |
df |
SS |
MS |
F |
Значимость F |
|
Регрессия |
1 |
16,22784091 |
16,22784091 |
0,004817913 |
0,945026312 |
|
Остаток |
38 |
127992,7659 |
3368,230682 |
|||
Итого |
39 |
128008,9938 |
Таким образом, уравнение модели (1) имеете вид:
Коэффициент регрессии -1.28, следовательно при изменении города области, в среднем на 1.28 тыс. долл. уменьшается цена квартиры. Свободный член 101.813 не имеет экономического смысла, но говорит о том, что сначала меняется фактор X1, а потом результат Y.
Оценим значимость каждого коэффициента регрессии:
- стандартная ошибка, - расчетное значение.
Расчетные значения t-статистик Стьюдента приведены в таблице:
По таблице критических точек распределения Стьюдента (или с помощью функции СТЬЮДРАСПОБР в Excel) при уровне значимости б=5% и числе степеней свободы k=n-2=40-2=38 определим критическое значение: tкр = 2.024
Таким образом, >tкр (8,228>2.024), следовательно свободный член в уравнении регрессии значим; <tкр (-0.069<2.024), следовательно фактор Х1 в уравнении регрессии не значим, т.е. фактор город области не играет решающую роль в формировании цены на квартиру.
Входной фактор X2:
Регрессионная статистика |
||
Множественный R |
0,75106074 |
|
R-квадрат |
0,564092234 |
|
Нормированный R-квадрат |
0,552620977 |
|
Стандартная ошибка |
38,32002171 |
|
Наблюдения |
40 |
Таким образом, уравнение модели (2) имеете вид:
Коэффициент регрессии в=36.037, следовательно при увеличении числа комнат в квартире на 1 , в среднем на 36.037 тыс. долл. увеличивается цена квартиры. Свободный член б=7.539 не имеет реального смысла, но показывает, что вначале изменяется фактор X2, а потом результат Y, т.е. относительное изменение результата происходит медленнее, чем изменение фактора.
Оценим значимость каждого коэффициента регрессии:
Таким образом, <tкр (0,514<2.024), следовательно свободный член в уравнении регрессии не значим; > tкр (7.012>2.024), следовательно фактор Х2 в уравнении регрессии значим, т.е. число комнат в квартире значительно влияет на стоимость квартиры.
Входной фактор X4:
Регрессионная статистика |
||
Множественный R |
0,874012079 |
|
R-квадрат |
0,763897114 |
|
Нормированный R-квадрат |
0,75768388 |
|
Стандартная ошибка |
28,20194696 |
|
Наблюдения |
40 |
Таким образом, уравнение модели (3) имеете вид:
Коэффициент регрессии в=2.476, следовательно при увеличении жилой площади квартиры на 1 кв. м, в среднем на 2.476 тыс. долл. увеличивается цена квартиры. Свободный член б=-2.865 не имеет экономического смысла, но показывает, что сначала изменяется результат Y, а потом, фактор X4 т.е. относительное изменение фактора происходит медленнее, чем изменение результата.
Оценим значимость каждого коэффициента регрессии:
Таким образом, <tкр (-0,275<2.024), следовательно свободный член в уравнении регрессии не значим; >tкр (11.088>2.024), следовательно фактор Х4 в уравнении регрессии значим, т.е. фактор жилая площадь квартиры влияет на формирование стоимости квартиры.
Оценка качества моделей
4. Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F - критерий Фишера. Выберите лучшую модель.
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициентом детерминации характеризует долю вариации результативного признака Y, учтенную в модели, и обусловленную влиянием фактора X.
Коэффициент детерминации определяется по формуле:
где - сумма квадратов отклонений, объясненная регрессией, и общая сумма квадратов отклонений соответственно.
Коэффициенты детерминации R-квадрат определены для каждой модели инструментом «Регрессия» пакета «Анализ данных» в Excel (таблица «Регрессионная статистика»):
Модель (1): 0,0001
Модель (2): 0,564
Модель (3): 0,764
Таким образом, вариация цены квартиры Y на 76,4% объясняется по уравнению (3) изменением жилой площади квартиры Х4; на 56,4% по уравнению (2) изменением общей площади квартиры Х2; на 0,01% по уравнению (1) вариацией города области Х1, т.е. наиболее адекватной моделью уравнения регрессии является зависимость цены квартиры от жилой площади квартиры Y = f(Х4).
Для вычисления средней относительной ошибки аппроксимации рассмотрим остатки модели , содержащиеся в столбце «Остатки» таблицы «Вывод остатка». Дополним таблицу столбцом относительных погрешностей, которые вычислим по формуле с помощью функции ABS в Excel.
Выполнение расчетов для модели (1):
Наблюдение |
Y |
Предсказанное Y |
Остатки |
Отн. погрешность |
|
41 |
38 |
100,5333333 |
-62,53333333 |
164,5614035 |
|
42 |
62,2 |
100,5333333 |
-38,33333333 |
61,62915327 |
|
43 |
125 |
101,8136364 |
23,18636364 |
18,54909091 |
|
44 |
61,1 |
100,5333333 |
-39,43333333 |
64,53900709 |
|
45 |
67 |
101,8136364 |
-34,81363636 |
51,96065129 |
|
46 |
93 |
101,8136364 |
-8,813636364 |
9,477028348 |
|
47 |
118 |
100,5333333 |
17,46666667 |
14,80225989 |
|
48 |
132 |
101,8136364 |
30,18636364 |
22,8684573 |
|
49 |
92,5 |
101,8136364 |
-9,313636364 |
10,06879607 |
|
50 |
105 |
100,5333333 |
4,466666667 |
4,253968254 |
|
51 |
42 |
100,5333333 |
-58,53333333 |
139,3650794 |
|
52 |
125 |
100,5333333 |
24,46666667 |
19,57333333 |
|
53 |
170 |
101,8136364 |
68,18636364 |
40,10962567 |
|
54 |
38 |
101,8136364 |
-63,81363636 |
167,930622 |
|
55 |
130,5 |
101,8136364 |
28,68636364 |
21,98188784 |
|
56 |
85 |
101,8136364 |
-16,81363636 |
19,78074866 |
|
57 |
98 |
101,8136364 |
-3,813636364 |
3,891465677 |
|
58 |
128 |
101,8136364 |
26,18636364 |
20,45809659 |
|
59 |
85 |
101,8136364 |
-16,81363636 |
19,78074866 |
|
60 |
160 |
100,5333333 |
59,46666667 |
37,16666667 |
|
61 |
60 |
101,8136364 |
-41,81363636 |
69,68939394 |
|
62 |
41 |
100,5333333 |
-59,53333333 |
145,203252 |
|
63 |
90 |
100,5333333 |
-10,53333333 |
11,7037037 |
|
64 |
83 |
101,8136364 |
-18,81363636 |
22,66703176 |
|
65 |
45 |
101,8136364 |
-56,81363636 |
126,2525253 |
|
66 |
39 |
101,8136364 |
-62,81363636 |
161,0606061 |
|
67 |
86,9 |
101,8136364 |
-14,91363636 |
17,16183701 |
|
68 |
40 |
101,8136364 |
-61,81363636 |
154,5340909 |
|
69 |
80 |
101,8136364 |
-21,81363636 |
27,26704545 |
|
70 |
227 |
101,8136364 |
125,1863636 |
55,14817781 |
|
71 |
235 |
101,8136364 |
133,1863636 |
56,67504836 |
|
72 |
40 |
100,5333333 |
-60,53333333 |
151,3333333 |
|
73 |
67 |
100,5333333 |
-33,53333333 |
50,04975124 |
|
74 |
123 |
100,5333333 |
22,46666667 |
18,26558266 |
|
75 |
100 |
101,8136364 |
-1,813636364 |
1,813636364 |
|
76 |
105 |
100,5333333 |
4,466666667 |
4,253968254 |
|
77 |
70,3 |
100,5333333 |
-30,23333333 |
43,00616406 |
|
78 |
82 |
100,5333333 |
-18,53333333 |
22,60162602 |
|
79 |
280 |
100,5333333 |
179,4666667 |
64,0952381 |
|
80 |
200 |
100,5333333 |
99,46666667 |
49,73333333 |
|
Среднее |
101,2375 |
101,2375 |
54,1315859 |
По столбцу относительных погрешностей найдем среднее значение (с помощью функции СРЗНАЧ Excel).
Выполнение расчетов для модели (2):
Наблюдение |
Y |
Предсказанное Y |
Остатки |
Отн. погрешность |
|
41 |
38 |
43,57706835 |
-5,577068345 |
14,67649565 |
|
42 |
62,2 |
79,61483813 |
-17,41483813 |
27,99813204 |
|
43 |
125 |
115,6526079 |
9,347392086 |
7,477913669 |
|
44 |
61,1 |
79,61483813 |
-18,51483813 |
30,3025174 |
|
45 |
67 |
43,57706835 |
23,42293165 |
34,95959948 |
|
46 |
93 |
79,61483813 |
13,38516187 |
14,39264717 |
|
47 |
118 |
115,6526079 |
2,347392086 |
1,989315327 |
|
48 |
132 |
115,6526079 |
16,34739209 |
12,38438794 |
|
49 |
92,5 |
115,6526079 |
-23,15260791 |
25,02984639 |
|
50 |
105 |
151,6903777 |
-46,6903777 |
44,46702638 |
|
51 |
42 |
43,57706835 |
-1,577068345 |
3,754924632 |
|
52 |
125 |
115,6526079 |
9,347392086 |
7,477913669 |
|
53 |
170 |
151,6903777 |
18,3096223 |
10,77036606 |
|
54 |
38 |
43,57706835 |
-5,577068345 |
14,67649565 |
|
55 |
130,5 |
151,6903777 |
-21,1903777 |
16,23783732 |
|
56 |
85 |
79,61483813 |
5,385161871 |
6,335484554 |
|
57 |
98 |
151,6903777 |
-53,6903777 |
54,78609969 |
|
58 |
128 |
151,6903777 |
-23,6903777 |
18,50810758 |
|
59 |
85 |
115,6526079 |
-30,65260791 |
36,06189166 |
|
60 |
160 |
115,6526079 |
44,34739209 |
27,71712005 |
|
61 |
60 |
43,57706835 |
16,42293165 |
27,37155276 |
|
62 |
41 |
43,57706835 |
-2,577068345 |
6,28553255 |
|
63 |
90 |
151,6903777 |
-61,6903777 |
68,54486411 |
|
64 |
83 |
151,6903777 |
-68,6903777 |
82,7594912 |
|
65 |
45 |
43,57706835 |
1,422931655 |
3,162070344 |
|
66 |
39 |
43,57706835 |
-4,577068345 |
11,73607268 |
|
67 |
86,9 |
115,6526079 |
-28,75260791 |
33,08700565 |
|
68 |
40 |
43,57706835 |
-3,577068345 |
8,942670863 |
|
69 |
80 |
79,61483813 |
0,385161871 |
0,481452338 |
|
70 |
227 |
151,6903777 |
75,3096223 |
33,17604507 |
|
71 |
235 |
151,6903777 |
83,3096223 |
35,45090311 |
|
72 |
40 |
43,57706835 |
-3,577068345 |
8,942670863 |
|
73 |
67 |
43,57706835 |
23,42293165 |
34,95959948 |
|
74 |
123 |
151,6903777 |
-28,6903777 |
23,32551032 |
|
75 |
100 |
115,6526079 |
-15,65260791 |
15,65260791 |
|
76 |
105 |
115,6526079 |
-10,65260791 |
10,14534087 |
|
77 |
70,3 |
79,61483813 |
-9,314838129 |
13,25012536 |
|
78 |
82 |
115,6526079 |
-33,65260791 |
41,03976575 |
|
79 |
280 |
151,6903777 |
128,3096223 |
45,82486511 |
|
80 |
200 |
151,6903777 |
48,3096223 |
24,15481115 |
|
Среднее |
101,2375 |
101,2375 |
23,457427 |
По столбцу относительных погрешностей найдем среднее значение (с помощью функции СРЗНАЧ Excel).
Выполнение расчетов для модели (3):
Наблюдение |
Y |
Предсказанное Y |
Остатки |
Отн. погрешность |
|
41 |
38 |
44,17866562 |
-6,178665622 |
16,25964637 |
|
42 |
62,2 |
86,27023362 |
-24,07023362 |
38,69812478 |
|
43 |
125 |
98,65010656 |
26,34989344 |
21,07991476 |
|
44 |
61,1 |
83,29906411 |
-22,19906411 |
36,33234715 |
|
45 |
67 |
43,43587325 |
23,56412675 |
35,17033844 |
|
46 |
93 |
65,71964454 |
27,28035546 |
29,33371555 |
|
47 |
118 |
143,2176491 |
-25,21764914 |
21,3708891 |
|
48 |
132 |
106,0780303 |
25,92196968 |
19,63785582 |
|
49 |
92,5 |
135,7897254 |
-43,28972537 |
46,79970311 |
|
50 |
105 |
113,5059541 |
-8,505954083 |
8,10090865 |
|
51 |
42 |
41,70269103 |
0,297308966 |
0,70787849 |
|
52 |
125 |
106,0780303 |
18,92196968 |
15,13757574 |
|
53 |
170 |
135,7897254 |
34,21027463 |
20,12369096 |
|
54 |
38 |
36,75074186 |
1,249258142 |
3,287521425 |
|
55 |
130,5 |
160,5494713 |
-30,04947125 |
23,02641475 |
|
56 |
85 |
81,31828444 |
3,68171556 |
4,33143007 |
|
57 |
98 |
103,6020557 |
-5,602055731 |
5,716383399 |
|
58 |
128 |
143,7128441 |
-15,71284406 |
12,27565942 |
|
59 |
85 |
120,9338778 |
-35,93387785 |
42,27515041 |
|
60 |
160 |
101,1260811 |
58,87391886 |
36,79619929 |
|
61 |
60 |
46,65464021 |
13,34535979 |
22,24226632 |
|
62 |
41 |
31,79879268 |
9,201207317 |
22,44196907 |
|
63 |
90 |
113,5059541 |
-23,50595408 |
26,11772676 |
|
64 |
83 |
119,6958906 |
-36,69589055 |
44,21191633 |
|
65 |
45 |
43,93106816 |
1,068931837 |
2,375404081 |
|
66 |
39 |
41,70269103 |
-2,702691034 |
6,929977011 |
|
67 |
86,9 |
142,4748568 |
-55,57485676 |
63,9526545 |
|
68 |
40 |
51,60658939 |
-11,60658939 |
29,01647346 |
|
69 |
80 |
96,17413197 |
-16,17413197 |
20,21766496 |
|
70 |
227 |
222,448836 |
4,55116405 |
2,004918084 |
|
71 |
235 |
219,9728614 |
15,02713864 |
6,39452708 |
|
72 |
40 |
34,27476727 |
5,725232729 |
14,31308182 |
|
73 |
67 |
42,94067833 |
24,05932167 |
35,90943533 |
|
74 |
123 |
133,3137508 |
-10,31375079 |
8,385163241 |
|
75 |
100 |
88,7462082 |
11,2537918 |
11,2537918 |
|
76 |
105 |
115,9819287 |
-10,98192867 |
10,45897969 |
|
77 |
70,3 |
83,29906411 |
-12,99906411 |
18,49084511 |
|
78 |
82 |
115,9819287 |
-33,98192867 |
41,44137643 |
|
79 |
280 |
207,5929884 |
72,40701158 |
25,85964699 |
|
80 |
200 |
145,6936237 |
54,30637627 |
27,15318814 |
|
Среднее |
101,2375 |
101,2375 |
21,89080885 |
По столбцу относительных погрешностей найдем среднее значение (с помощью функции СРЗНАЧ Excel).
, это свидетельствует о том, что качество модели не удовлетворительное. Ближе всех к 7% значение .
Ни одну из моделей по данному критерию оценки считать приемлемой нельзя. Лучшей моделью является зависимость цены квартиры от жилой площади квартиры Y = f(Х4).
Проверим значимость полученных уравнений с помощью F - критерия Фишера.
,
k - количество факторов, включенных в модель.
F - статистики определены инструментом «Регрессия» пакета «Анализ данных» в Excel (таблицы «Дисперсионный анализ»):
F1 = 0,0048179F2 = 49,17440478 F3 = 122,9467831
С помощью функции РАСПОБР Excel или по таблице найдем значение Fкр=4.098 для уровня значимости б=5%, и чисел степеней свободы k1=1, k2=38.
F2>Fкр, F3>Fкр следовательно, уравнения модели (2) и (3) являются значимыми, их использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модели (2) и (3) факторными переменными Х2 и Х4.
F1<Fкр, следовательно уравнение модели (1) не является значимым и использование этой модели нецелесообразно.
На основании оценки качества моделей по коэффициенту детерминации, средней ошибке аппроксимации и критерию Фишера наилучшей является модель (3) зависимости цены квартиры от ее жилой площади: .
Прогнозирование среднего значения
5. Для выбранной модели осуществите прогнозирование среднего значения показателя Y при уровне значимости б=0.1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представьте графически: фактические и модельные значения Y, точки прогноза прогнозирования.
Согласно условию задачи прогнозное значение фактора Х4 составляет 80% от его максимального значения. Максимальное значение Х4=91 найдем с помощью функции МАКС в Excel. Тогда прогнозное значение Х4*=72.8. Рассчитаем по уравнению модели (1): прогнозное значение Y: корреляция регрессия детерминация фишер
Таким образом, если жилая площадь квартиры составит 80% от ее максимального значения и составит 72.8 кв. м, то ожидаемая цена квартиры будет составлять около 177,3878 тыс. долл.
Зададим доверительную вероятность p=1-б=1-0.1=0.9 и построим доверительный прогнозный интервал для среднего значения Y.
Предварительно подготовим:
· стандартная ошибка (таблица «Регрессионная статистика» итогов применения инструмента «Регрессия» пакета «Анализ данных»);
· по столбцу данных Х4 найдем среднее значение (функция СРЗНАЧ) и определим (функция КВАДРОТКЛ);
· tб - коэффициент Стьюдента для уровня значимости б=10% и числа степеней свободы k=38. tб=1.686 (функция СТЬЮДРАСПОБР).
Тогда, предельная ошибка прогноза:
Следовательно, доверительный интервал имеет вид:
, т.е.
Таким образом, с надежностью 90% можно утверждать, что если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая средняя цена квартиры будет от 127.8758 тыс. долл. до 226.8998 тыс. долл.
Выполненный прогноз стоимости квартиры оказался надежным
(p=1-б=1-0.1=0.9), но не точным, так как диапазон верхней и нижней границ доверительного интервала отличаются в 1,77 раза:
DY = 226.8998 / 127.8758 = 1.77.
Для построения графика используем «Мастер диаграмм» - покажем фактические исходные данные (поле корреляции). Затем с помощью опции «Добавить линию тренда», построим линию модели и покажем на графике результаты прогнозирования.
Пошаговая множественная регрессия. Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель формирования цены квартиры за счет значимых факторов. Дайте экономическую интерпретацию коэффициентов модели регрессии.
Методом включения построим двухфакторные модели, сохраняя в них наиболее информативный фактор - жилую площадь квартиры (Х4).
В качестве «входного интервала Х» укажем значения факторов Х4 и Х1, с помощью инструмента «Регрессия» получим:
Регрессионная статистика |
||
Множественный R |
0,875979141 |
|
R-квадрат |
0,767339455 |
|
Нормированный R-квадрат |
0,754763209 |
|
Стандартная ошибка |
28,37139894 |
|
Наблюдения |
40 |
Таким образом, модель (4) зависимости цены квартиры Y от жилой площади квартиры Х4 и города области Х1 построена, ее уравнение имеет вид:
Используем в качестве «входного интервала Х» значения факторов Х4 и Х2, с помощью «Регрессии» найдем:
Регрессионная статистика |
||
Множественный R |
0,874162592 |
|
R-квадрат |
0,764160238 |
|
Нормированный R-квадрат |
0,751412142 |
|
Стандартная ошибка |
28,56458338 |
|
Наблюдения |
40 |
Таким образом, модель (5) зависимости цены квартиры Y от жилой площади квартиры Х4 и от числа комнат в квартире Х2 построена, ее уравнение имеет вид:
Построим множественную модель регрессии, учитывая все факторы (Х4, Х1, и Х2):
Регрессионная статистика |
||
Множественный R |
0,876217908 |
|
R-квадрат |
0,767757822 |
|
Нормированный R-квадрат |
0,748404307 |
|
Стандартная ошибка |
28,73687504 |
|
Наблюдения |
40 |
Таким образом, трехфакторная модель (6) зависимости цены квартиры Y от жилой площади Х4, города области Х1 и числа комнат в квартире Х2 построена, ее уравнение имеет вид:
Выберем лучшую из построенных моделей.
Для сравнения моделей с различным количеством учтенных в них факторов используем нормированные коэффициенты детерминации, которые содержатся в строке «нормированный R-квадрат» итогов инструмента «Регрессия». Чем больше величина нормированного коэффициента детерминации, тем лучше модель.
,
где - коэффициент детерминации, n - число наблюдений, k - число независимых переменных.
Модель (4): 0,767339455
Модель (5): 0,764160237
Модель (6): 0,767757821
Таким образом, лучшей является модель (6) зависимости цены квартиры Y от жилой площади Х4, города области Х1 и числа комнат в квартире Х2:
Коэффициент регрессии в1=6.859, следовательно, при изменении города области (Х1), при одном и том же числе комнат в квартире (Х2) и одной и той же жилой площади, цена квартиры (Y) увеличится в среднем на 6,859 тыс. долл.
Коэффициент регрессии в2=-1.985, следовательно, при изменении числа комнат в квартире (Х2) при одной и той же жилой площади (Х4) и одном и том же городе области (Х1), цена квартиры (Y) уменьшится в среднем на 1.985 тыс. долл.
Коэффициент регрессии в3=2.591, следовательно, при увеличении жилой площади квартиры на 1 кв. м. (Х4) при одном и том же городе области (Х1) и одном и том же кол-ве комнат (Х2), цена квартиры (Y) увеличится в среднем на 2.591 тыс. долл.
Свободный коэффициент не имеет экономического смысла, но говорит о том, что сначала меняется результат Y, а потом факторы X1, X2, X4..
Оценка качества многофакторной модели
6. Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, - и -коэффициентов.
Для оценки качества выбранной множественной модели (6) , аналогично п.1.4 данной задачи, используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F-критерий Фишера.
Коэффициент детерминации R-квадрат возьмем из итогов «Регрессии» (таблица «Регрессионная статистика» для модели (6)).
, следовательно, вариация (изменение) цены квартиры Y на 76,77% объясняется по данному уравнению вариацией города области Х1, числа комнат в квартире Х2 и жилой площади Х4.
Используем исходные данные Yi и найденные инструментом «Регрессия» остатки (таблица «Вывод остатка» для модели (6)). Рассчитаем относительные погрешности и найдем среднее значение .
Вывод остатка
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погрешность |
|
1 |
45,95089273 |
-7,95089273 |
20,92340192 |
|
2 |
86,10296493 |
-23,90296493 |
38,42920407 |
|
3 |
94,84442678 |
30,15557322 |
24,12445858 |
|
4 |
84,17648426 |
-23,07648426 |
37,76838667 |
|
5 |
40,2537216 |
26,7462784 |
39,91981851 |
|
6 |
68,70572376 |
24,29427624 |
26,12287768 |
|
7 |
143,7464899 |
-25,7464899 |
21,81905923 |
|
8 |
106,0907598 |
25,90924022 |
19,62821228 |
|
9 |
135,357993 |
-42,85799303 |
46,33296544 |
|
10 |
114,4792566 |
-9,47925665 |
9,027863476 |
|
11 |
41,48765602 |
0,512343975 |
1,219866607 |
|
12 |
103,2329236 |
21,76707636 |
17,41366109 |
|
13 |
130,3567798 |
39,64322022 |
23,3195413 |
|
14 |
35,41901876 |
2,580981242 |
6,7920559 |
|
15 |
155,4129693 |
-24,91296925 |
19,0903979 |
|
16 |
84,32108188 |
0,678918123 |
0,798727204 |
|
17 |
98,0552279 |
-0,055227902 |
0,056355002 |
|
18 |
144,2104618 |
-16,21046182 |
12,66442329 |
|
19 |
122,8677535 |
-37,86775351 |
44,55029825 |
|
20 |
100,0221225 |
59,97787748 |
37,48617343 |
|
21 |
53,27196558 |
6,728034423 |
11,21339071 |
|
22 |
35,06605378 |
5,933946225 |
14,47303957 |
|
23 |
114,4792566 |
-24,47925665 |
27,19917406 |
|
24 |
113,1343153 |
-30,13431529 |
36,30640396 |
|
25 |
40,43190991 |
4,568090093 |
10,15131132 |
|
26 |
39,34427892 |
-0,344278918 |
0,882766457 |
|
27 |
144,4794501 |
-57,57945009 |
66,25943623 |
|
28 |
56,4827667 |
-16,4827667 |
41,20691675 |
|
29 |
95,38240332 |
-15,38240332 |
19,22800415 |
|
30 |
228,6988826 |
-1,698882564 |
0,748406416 |
|
31 |
222,8067278 |
12,19327221 |
5,188626473 |
|
32 |
38,81483144 |
1,185168555 |
2,962921389 |
|
33 |
48,36325811 |
18,63674189 |
27,81603267 |
|
34 |
126,6080021 |
-3,608002113 |
2,933335051 |
|
35 |
84,85052935 |
15,14947065 |
15,14947065 |
|
36 |
116,7991162 |
-11,79911625 |
11,23725357 |
|
37 |
84,17648426 |
-13,87648426 |
19,73895342 |
|
38 |
113,9412801 |
-31,94128011 |
38,95278062 |
|
39 |
215,494184 |
64,50581599 |
23,03779142 |
|
40 |
141,7795953 |
58,22040472 |
29,11020236 |
|
Среднее |
101,2375 |
22,51770962 |
По столбцу относительных погрешностей найдем среднее значение =22.51% (с помощью функции СРЗНАЧ).
Сравнение показывает, что 22.51%>7%. Следовательно, точность модели неудовлетворительная.
С помощью F - критерия Фишера проверим значимость модели в целом. Для этого выпишем из итогов применения инструмента «Регрессия» (таблица «дисперсионный анализ» для модели (6)) F=39,6702.
С помощью функции FРАСПОБР найдем значение Fкр=3.252 для уровня значимости б = 5%, и чисел степеней свободы k1 = 2, k2 = 37.
F>Fкр, следовательно, уравнение модели (6) является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель (6) факторными переменными Х1, Х2. и Х4.
Дополнительно с помощью t-критерия Стьюдента проверим значимость отдельных коэффициентов модели.
t-статистики для коэффициентов уравнения регрессии приведены в итогах инструмента «Регрессия». Получены следующие значения для выбранной модели (6) .
Критическое значение tкр найдено для уровня значимости б=5% и числа степеней свободы k=40-2-1=37. tкр=2.026 (функция СТЬЮДРАСПОБР).
Для свободного коэффициента б=-5.643 определена статистика , <tкр, следовательно, свободный коэффициент не является значимым, его можно исключить из модели.
Для коэффициента регрессии в1=6.859 определена статистика , <tкр, следовательно, коэффициент регрессии в1 не является значимым, его и фактор города области можно удалить из модели.
Для коэффициента регрессии в2=-1,985 определена статистика , <tкр, следовательно, коэффициент регрессии в2 не является значимым, его и фактор числа комнат в квартире можно исключить из модели.
Для коэффициента регрессии в4=2.591 определена статистика , >tкр, следовательно, коэффициент регрессии в4 является значимым, его и фактор жилой площади квартиры можно сохранить в модели.
Выводы о значимости коэффициентов модели сделаны на уровне значимости б=5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент б можно считать значимым на уровне 0.64 = 64%; коэффициент регрессии в1 - на уровне 0,46 = 46%; коэффициент регрессии в2 - на уровне 0,8 = 80%; а коэффициент регрессии в4 - на уровне 2,27E-06= 2,26691790951854E-06 = 0,0000002%.
При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества модели (3) и выбранной множественной модели (6) используем нормированные коэффициенты детерминации.
Модель |
Нормированный R-квадрат |
|
(3) |
0,757683880132941 |
|
(6) |
0,748404306989435 |
Таким образом, при добавлении в уравнение регрессии фактора «город области» Х1 и фактора «число комнат в квартире» Х2 качество модели ухудшилось, что говорит в пользу удаления факторов Х1 и Х2 из модели.
Проведем дальнейшие расчеты.
Средние коэффициенты эластичности в случае линейной модели определяются формулами .
С помощью функции СРЗНАЧ найдем: =0.45, =2.6, =42.05, =101.24.
Тогда , ,
Следовательно, увеличение жилой площади Х4 при том же кол-ве комнат и городе области на 1% приводит к увеличению цены квартиры в среднем на 1,076%.
При изменении города области (Х1) и неизменной жилой площади и числе комнат в квартире цена квартиры увеличится в среднем на 0,03%.
При изменении числа комнат в квартире (Х2) и неизменной жилой площади и городе области цена уменьшается в среднем на 0,05%.
Бета-коэффициенты определяются по формулам: ,
где среднее квадратическое отклонение j - го фактора - .
,
С помощью функции СТАНДОТКЛОН найдем SX1= 0,504, SX2= 1,194, SX4=20.223; SY= 57,291.
Тогда ; ;
Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0.06 своего стандартного отклонения SY, при увеличении только фактора Х2 на одно его стандартное отклонение - уменьшается на 0,041 SY, при увеличении только фактора Х4 на одно его стандартное отклонение - увеличивается на 0,914 SY
Дельта-коэффициенты определяются формулами .
Найдем коэффициенты парной корреляции с использованием инструмента «Корреляция» пакета «Анализ данных» в Excel.
Y |
X1 |
X2 |
X4 |
||
Y |
1 |
||||
X1 |
-0,01126 |
1 |
|||
X2 |
0,751061 |
-0,0341 |
1 |
||
X4 |
0,874012 |
-0,0798 |
0,868524 |
1 |
Коэффициент детерминации был определен ранее и равен 0.7677.
Вычислим дельта-коэффициенты:
;
Поскольку Д1<0 и Д2<0, то факторные переменные Х1 и Х2 выбрана неудачно, и их нужно удалить из модели. Значит, по уравнению полученной линейной трехфакторной модели изменение результирующего фактора Y (цены квартиры) на 104% объясняется воздействием фактора Х4 (жилой площадью квартиры), на 4% воздействием фактора Х2 (число комнат), на 0,0859% воздействием фактора Х1 (город области).
Проверка наличия аномальных наблюдений
1. Проверить наличие аномальных наблюдений.
Используем метод Ирвина, основанный на определении лt-статистик по формуле:
лt=,
где , .
Найдем Sy=7.293 (функция СТАНДОТКЛОН) и рассчитаем лt-статистики. Результат расчетов приведем в таблице:
t |
yt |
|yt-yt-1| |
t |
|
1 |
43 |
- |
- |
|
2 |
47 |
4 |
0,548 |
|
3 |
50 |
3 |
0,411 |
|
4 |
48 |
2 |
0,274 |
|
5 |
54 |
6 |
0,823 |
|
6 |
57 |
3 |
0,411 |
|
Подобные документы
Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.
лабораторная работа [30,9 K], добавлен 05.12.2010Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.
контрольная работа [681,9 K], добавлен 03.08.2010Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.
контрольная работа [173,8 K], добавлен 22.11.2010Оценка корреляционной матрицы факторных признаков. Оценки собственных чисел матрицы парных коэффициентов корреляции. Анализ полученного уравнения регрессии, определение значимости уравнения и коэффициентов регрессии, их экономическая интерпретация.
контрольная работа [994,1 K], добавлен 29.06.2013Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [58,3 K], добавлен 17.10.2009Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.
курсовая работа [233,1 K], добавлен 21.03.2015Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [914,4 K], добавлен 01.12.2013Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.
контрольная работа [817,3 K], добавлен 01.04.2010Этапы и проблемы эконометрических исследований. Параметры парной линейной регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициентов автокорреляции второго порядка для временного ряда расходов на потребление.
контрольная работа [60,3 K], добавлен 05.01.2011Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.
контрольная работа [108,5 K], добавлен 28.03.2018Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.
контрольная работа [298,2 K], добавлен 19.01.2011Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [3,6 M], добавлен 29.05.2010Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.
контрольная работа [155,8 K], добавлен 11.12.2010Параметры уравнений линейной парной регрессии. Показатели корреляции и детерминации. Изменение средней заработной платы и выплат социального характера. Средняя ошибка аппроксимации. Коэффициент эластичности и стоимость активных производственных фондов.
контрольная работа [1,1 M], добавлен 23.06.2011Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.
лабораторная работа [214,2 K], добавлен 17.10.2009Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.
лабораторная работа [890,1 K], добавлен 06.12.2014