Основы эконометрики

Определение особенностей матрицы парных коэффициентов корреляции. Расчет и характеристика параметров линейной парной регрессии. Изучение формулы коэффициента детерминации. Рассмотрение и анализ значимости полученных уравнений с помощью критерия Фишера.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 07.04.2016
Размер файла 643,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Федеральное государственное образовательное бюджетное учреждение

высшего профессионального образования

«Финансовый университет при Правительстве Российской Федерации»

Кировский филиал

Контрольная работа

Студентка

Вохмянина Юлия Алексеевна

Специальность: Бакалавр экономики

Курс 3

Киров 2012

Матрица парных коэффициентов корреляции

1. Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.

Парные коэффициенты корреляции рассчитываются по формуле:

,

где n - объем выборки, - значение факторного признака, - значение результативного признака, - среднее значение факторного признака, - среднее значение результативного признака.

Используя инструмент «Корреляция» пакета «Анализ данных» в Excel получим матрицу парных коэффициентов корреляции.

Y

X1

X2

X4

Y

1

X1

-0,01126

1

X2

0,751061

-0,0341

1

X4

0,874012

-0,0798

0,868524

1

Качественно оценим взаимосвязь между результирующим признаком Y и каждым из факторов Хj, j=1,2,4 (силу зависимости определим по шкале Чеддока):

· , значит, между переменными Y и Х1 наблюдается обратная корреляционная зависимость. Однако зависимость между этими показателями очень слабая.

· , значит, между переменными Y и Х2 наблюдается прямая корреляционная зависимость: чем больше число комнат в квартире, тем выше ее цена.

· , значит, между переменными Y и X4 наблюдается прямая корреляционная зависимость: чем больше жилая площадь квартиры, тем выше ее цена.

- эта зависимость высокая, ближе к весьма высокой.

Это означает, что на 87,4 зависимая переменная Y (цена квартиры) зависит от показателя Х4 жилая площадь квартиры.

Оценим теперь статистическую значимость каждого коэффициента. Для этого рассчитаем значения t-критерия Стьюдента для каждого коэффициента

,

где - парный коэффициент корреляции результативного признака Y и факторного Xj, j=1,2,4, n - объем выборки.

ty,x1 = 0,069ty,x2 = 7,012ty,x4 = 11,088tкр. = (0,05; 38) = 2,024

По таблице критических точек распределения Стьюдента (или с помощью функции СТЬЮДРАСПОБР в Excel) при уровне значимости б=5% и числе степеней свободы k=n-2=40-2=38 определим критическое значение: tкр = 2.024

Т.к. (0,069<2.024), то коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой квартиры Y и городом области Х1 существует.

Т.к. (7,012>2.024), то коэффициент является значимым. На основании выборочных данных есть основания утверждать, что зависимость между ценой квартиры Y и числом комнат в квартире Х2 существует.

Т.к. (11,088>2.024), то коэффициент является значимым (значимо отличается от нуля). На уровне значимости 5% выборочные данные позволяют сделать вывод о наличии тесной линейной корреляционной зависимости между признаками Y и Х4. Зависимость между ценой квартиры Y и жилой площадью квартиры Х4 является достоверной.

Таким образом, наиболее тесная и значимая зависимость наблюдается между ценой квартиры Y и жилой площадью квартиры Х4.

Поле корреляции результативного признака

2. Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.

Для построения поля корреляции воспользуемся инструментом «Мастер диаграмм» в Excel. Выберем «Точечную» диаграмму. По оси абсцисс отложим значения фактора, наиболее тесно связанного с результативным фактором (X4), а по оси ординат - сам результативный фактор (Y).

Параметры линейной парной регрессии

3. Рассчитайте параметры линейной парной регрессии для каждого фактора Х.

Для построения линейной парной модели , j=4,5,6 используем инструмент «Регрессия» пакета «Анализ данных» в Excel.

Входной фактор Х1:

Регрессионная статистика

Множественный R

0,011259267

R-квадрат

0,000126771

Нормированный R-квадрат

-0,026185682

Стандартная ошибка

58,03645994

Наблюдения

40

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

16,22784091

16,22784091

0,004817913

0,945026312

Остаток

38

127992,7659

3368,230682

Итого

39

128008,9938

Таким образом, уравнение модели (1) имеете вид:

Коэффициент регрессии -1.28, следовательно при изменении города области, в среднем на 1.28 тыс. долл. уменьшается цена квартиры. Свободный член 101.813 не имеет экономического смысла, но говорит о том, что сначала меняется фактор X1, а потом результат Y.

Оценим значимость каждого коэффициента регрессии:

- стандартная ошибка, - расчетное значение.

Расчетные значения t-статистик Стьюдента приведены в таблице:

По таблице критических точек распределения Стьюдента (или с помощью функции СТЬЮДРАСПОБР в Excel) при уровне значимости б=5% и числе степеней свободы k=n-2=40-2=38 определим критическое значение: tкр = 2.024

Таким образом, >tкр (8,228>2.024), следовательно свободный член в уравнении регрессии значим; <tкр (-0.069<2.024), следовательно фактор Х1 в уравнении регрессии не значим, т.е. фактор город области не играет решающую роль в формировании цены на квартиру.

Входной фактор X2:

Регрессионная статистика

Множественный R

0,75106074

R-квадрат

0,564092234

Нормированный R-квадрат

0,552620977

Стандартная ошибка

38,32002171

Наблюдения

40

Таким образом, уравнение модели (2) имеете вид:

Коэффициент регрессии в=36.037, следовательно при увеличении числа комнат в квартире на 1 , в среднем на 36.037 тыс. долл. увеличивается цена квартиры. Свободный член б=7.539 не имеет реального смысла, но показывает, что вначале изменяется фактор X2, а потом результат Y, т.е. относительное изменение результата происходит медленнее, чем изменение фактора.

Оценим значимость каждого коэффициента регрессии:

Таким образом, <tкр (0,514<2.024), следовательно свободный член в уравнении регрессии не значим; > tкр (7.012>2.024), следовательно фактор Х2 в уравнении регрессии значим, т.е. число комнат в квартире значительно влияет на стоимость квартиры.

Входной фактор X4:

Регрессионная статистика

Множественный R

0,874012079

R-квадрат

0,763897114

Нормированный R-квадрат

0,75768388

Стандартная ошибка

28,20194696

Наблюдения

40

Таким образом, уравнение модели (3) имеете вид:

Коэффициент регрессии в=2.476, следовательно при увеличении жилой площади квартиры на 1 кв. м, в среднем на 2.476 тыс. долл. увеличивается цена квартиры. Свободный член б=-2.865 не имеет экономического смысла, но показывает, что сначала изменяется результат Y, а потом, фактор X4 т.е. относительное изменение фактора происходит медленнее, чем изменение результата.

Оценим значимость каждого коэффициента регрессии:

Таким образом, <tкр (-0,275<2.024), следовательно свободный член в уравнении регрессии не значим; >tкр (11.088>2.024), следовательно фактор Х4 в уравнении регрессии значим, т.е. фактор жилая площадь квартиры влияет на формирование стоимости квартиры.

Оценка качества моделей

4. Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F - критерий Фишера. Выберите лучшую модель.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициентом детерминации характеризует долю вариации результативного признака Y, учтенную в модели, и обусловленную влиянием фактора X.

Коэффициент детерминации определяется по формуле:

где - сумма квадратов отклонений, объясненная регрессией, и общая сумма квадратов отклонений соответственно.

Коэффициенты детерминации R-квадрат определены для каждой модели инструментом «Регрессия» пакета «Анализ данных» в Excel (таблица «Регрессионная статистика»):

Модель (1): 0,0001

Модель (2): 0,564

Модель (3): 0,764

Таким образом, вариация цены квартиры Y на 76,4% объясняется по уравнению (3) изменением жилой площади квартиры Х4; на 56,4% по уравнению (2) изменением общей площади квартиры Х2; на 0,01% по уравнению (1) вариацией города области Х1, т.е. наиболее адекватной моделью уравнения регрессии является зависимость цены квартиры от жилой площади квартиры Y = f(Х4).

Для вычисления средней относительной ошибки аппроксимации рассмотрим остатки модели , содержащиеся в столбце «Остатки» таблицы «Вывод остатка». Дополним таблицу столбцом относительных погрешностей, которые вычислим по формуле с помощью функции ABS в Excel.

Выполнение расчетов для модели (1):

Наблюдение

Y

Предсказанное Y

Остатки

Отн. погрешность

41

38

100,5333333

-62,53333333

164,5614035

42

62,2

100,5333333

-38,33333333

61,62915327

43

125

101,8136364

23,18636364

18,54909091

44

61,1

100,5333333

-39,43333333

64,53900709

45

67

101,8136364

-34,81363636

51,96065129

46

93

101,8136364

-8,813636364

9,477028348

47

118

100,5333333

17,46666667

14,80225989

48

132

101,8136364

30,18636364

22,8684573

49

92,5

101,8136364

-9,313636364

10,06879607

50

105

100,5333333

4,466666667

4,253968254

51

42

100,5333333

-58,53333333

139,3650794

52

125

100,5333333

24,46666667

19,57333333

53

170

101,8136364

68,18636364

40,10962567

54

38

101,8136364

-63,81363636

167,930622

55

130,5

101,8136364

28,68636364

21,98188784

56

85

101,8136364

-16,81363636

19,78074866

57

98

101,8136364

-3,813636364

3,891465677

58

128

101,8136364

26,18636364

20,45809659

59

85

101,8136364

-16,81363636

19,78074866

60

160

100,5333333

59,46666667

37,16666667

61

60

101,8136364

-41,81363636

69,68939394

62

41

100,5333333

-59,53333333

145,203252

63

90

100,5333333

-10,53333333

11,7037037

64

83

101,8136364

-18,81363636

22,66703176

65

45

101,8136364

-56,81363636

126,2525253

66

39

101,8136364

-62,81363636

161,0606061

67

86,9

101,8136364

-14,91363636

17,16183701

68

40

101,8136364

-61,81363636

154,5340909

69

80

101,8136364

-21,81363636

27,26704545

70

227

101,8136364

125,1863636

55,14817781

71

235

101,8136364

133,1863636

56,67504836

72

40

100,5333333

-60,53333333

151,3333333

73

67

100,5333333

-33,53333333

50,04975124

74

123

100,5333333

22,46666667

18,26558266

75

100

101,8136364

-1,813636364

1,813636364

76

105

100,5333333

4,466666667

4,253968254

77

70,3

100,5333333

-30,23333333

43,00616406

78

82

100,5333333

-18,53333333

22,60162602

79

280

100,5333333

179,4666667

64,0952381

80

200

100,5333333

99,46666667

49,73333333

Среднее

101,2375

101,2375

54,1315859

По столбцу относительных погрешностей найдем среднее значение (с помощью функции СРЗНАЧ Excel).

Выполнение расчетов для модели (2):

Наблюдение

Y

Предсказанное Y

Остатки

Отн. погрешность

41

38

43,57706835

-5,577068345

14,67649565

42

62,2

79,61483813

-17,41483813

27,99813204

43

125

115,6526079

9,347392086

7,477913669

44

61,1

79,61483813

-18,51483813

30,3025174

45

67

43,57706835

23,42293165

34,95959948

46

93

79,61483813

13,38516187

14,39264717

47

118

115,6526079

2,347392086

1,989315327

48

132

115,6526079

16,34739209

12,38438794

49

92,5

115,6526079

-23,15260791

25,02984639

50

105

151,6903777

-46,6903777

44,46702638

51

42

43,57706835

-1,577068345

3,754924632

52

125

115,6526079

9,347392086

7,477913669

53

170

151,6903777

18,3096223

10,77036606

54

38

43,57706835

-5,577068345

14,67649565

55

130,5

151,6903777

-21,1903777

16,23783732

56

85

79,61483813

5,385161871

6,335484554

57

98

151,6903777

-53,6903777

54,78609969

58

128

151,6903777

-23,6903777

18,50810758

59

85

115,6526079

-30,65260791

36,06189166

60

160

115,6526079

44,34739209

27,71712005

61

60

43,57706835

16,42293165

27,37155276

62

41

43,57706835

-2,577068345

6,28553255

63

90

151,6903777

-61,6903777

68,54486411

64

83

151,6903777

-68,6903777

82,7594912

65

45

43,57706835

1,422931655

3,162070344

66

39

43,57706835

-4,577068345

11,73607268

67

86,9

115,6526079

-28,75260791

33,08700565

68

40

43,57706835

-3,577068345

8,942670863

69

80

79,61483813

0,385161871

0,481452338

70

227

151,6903777

75,3096223

33,17604507

71

235

151,6903777

83,3096223

35,45090311

72

40

43,57706835

-3,577068345

8,942670863

73

67

43,57706835

23,42293165

34,95959948

74

123

151,6903777

-28,6903777

23,32551032

75

100

115,6526079

-15,65260791

15,65260791

76

105

115,6526079

-10,65260791

10,14534087

77

70,3

79,61483813

-9,314838129

13,25012536

78

82

115,6526079

-33,65260791

41,03976575

79

280

151,6903777

128,3096223

45,82486511

80

200

151,6903777

48,3096223

24,15481115

Среднее

101,2375

101,2375

23,457427

По столбцу относительных погрешностей найдем среднее значение (с помощью функции СРЗНАЧ Excel).

Выполнение расчетов для модели (3):

Наблюдение

Y

Предсказанное Y

Остатки

Отн. погрешность

41

38

44,17866562

-6,178665622

16,25964637

42

62,2

86,27023362

-24,07023362

38,69812478

43

125

98,65010656

26,34989344

21,07991476

44

61,1

83,29906411

-22,19906411

36,33234715

45

67

43,43587325

23,56412675

35,17033844

46

93

65,71964454

27,28035546

29,33371555

47

118

143,2176491

-25,21764914

21,3708891

48

132

106,0780303

25,92196968

19,63785582

49

92,5

135,7897254

-43,28972537

46,79970311

50

105

113,5059541

-8,505954083

8,10090865

51

42

41,70269103

0,297308966

0,70787849

52

125

106,0780303

18,92196968

15,13757574

53

170

135,7897254

34,21027463

20,12369096

54

38

36,75074186

1,249258142

3,287521425

55

130,5

160,5494713

-30,04947125

23,02641475

56

85

81,31828444

3,68171556

4,33143007

57

98

103,6020557

-5,602055731

5,716383399

58

128

143,7128441

-15,71284406

12,27565942

59

85

120,9338778

-35,93387785

42,27515041

60

160

101,1260811

58,87391886

36,79619929

61

60

46,65464021

13,34535979

22,24226632

62

41

31,79879268

9,201207317

22,44196907

63

90

113,5059541

-23,50595408

26,11772676

64

83

119,6958906

-36,69589055

44,21191633

65

45

43,93106816

1,068931837

2,375404081

66

39

41,70269103

-2,702691034

6,929977011

67

86,9

142,4748568

-55,57485676

63,9526545

68

40

51,60658939

-11,60658939

29,01647346

69

80

96,17413197

-16,17413197

20,21766496

70

227

222,448836

4,55116405

2,004918084

71

235

219,9728614

15,02713864

6,39452708

72

40

34,27476727

5,725232729

14,31308182

73

67

42,94067833

24,05932167

35,90943533

74

123

133,3137508

-10,31375079

8,385163241

75

100

88,7462082

11,2537918

11,2537918

76

105

115,9819287

-10,98192867

10,45897969

77

70,3

83,29906411

-12,99906411

18,49084511

78

82

115,9819287

-33,98192867

41,44137643

79

280

207,5929884

72,40701158

25,85964699

80

200

145,6936237

54,30637627

27,15318814

Среднее

101,2375

101,2375

21,89080885

По столбцу относительных погрешностей найдем среднее значение (с помощью функции СРЗНАЧ Excel).

, это свидетельствует о том, что качество модели не удовлетворительное. Ближе всех к 7% значение .

Ни одну из моделей по данному критерию оценки считать приемлемой нельзя. Лучшей моделью является зависимость цены квартиры от жилой площади квартиры Y = f(Х4).

Проверим значимость полученных уравнений с помощью F - критерия Фишера.

,

k - количество факторов, включенных в модель.

F - статистики определены инструментом «Регрессия» пакета «Анализ данных» в Excel (таблицы «Дисперсионный анализ»):

F1 = 0,0048179F2 = 49,17440478 F3 = 122,9467831

С помощью функции РАСПОБР Excel или по таблице найдем значение Fкр=4.098 для уровня значимости б=5%, и чисел степеней свободы k1=1, k2=38.

F2>Fкр, F3>Fкр следовательно, уравнения модели (2) и (3) являются значимыми, их использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модели (2) и (3) факторными переменными Х2 и Х4.

F1<Fкр, следовательно уравнение модели (1) не является значимым и использование этой модели нецелесообразно.

На основании оценки качества моделей по коэффициенту детерминации, средней ошибке аппроксимации и критерию Фишера наилучшей является модель (3) зависимости цены квартиры от ее жилой площади: .

Прогнозирование среднего значения

5. Для выбранной модели осуществите прогнозирование среднего значения показателя Y при уровне значимости б=0.1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представьте графически: фактические и модельные значения Y, точки прогноза прогнозирования.

Согласно условию задачи прогнозное значение фактора Х4 составляет 80% от его максимального значения. Максимальное значение Х4=91 найдем с помощью функции МАКС в Excel. Тогда прогнозное значение Х4*=72.8. Рассчитаем по уравнению модели (1): прогнозное значение Y: корреляция регрессия детерминация фишер

Таким образом, если жилая площадь квартиры составит 80% от ее максимального значения и составит 72.8 кв. м, то ожидаемая цена квартиры будет составлять около 177,3878 тыс. долл.

Зададим доверительную вероятность p=1-б=1-0.1=0.9 и построим доверительный прогнозный интервал для среднего значения Y.

Предварительно подготовим:

· стандартная ошибка (таблица «Регрессионная статистика» итогов применения инструмента «Регрессия» пакета «Анализ данных»);

· по столбцу данных Х4 найдем среднее значение (функция СРЗНАЧ) и определим (функция КВАДРОТКЛ);

· tб - коэффициент Стьюдента для уровня значимости б=10% и числа степеней свободы k=38. tб=1.686 (функция СТЬЮДРАСПОБР).

Тогда, предельная ошибка прогноза:

Следовательно, доверительный интервал имеет вид:

, т.е.

Таким образом, с надежностью 90% можно утверждать, что если жилая площадь квартиры составит 80% от ее максимального значения и составит 72,8 кв. м, то ожидаемая средняя цена квартиры будет от 127.8758 тыс. долл. до 226.8998 тыс. долл.

Выполненный прогноз стоимости квартиры оказался надежным
(p=1-б=1-0.1=0.9), но не точным, так как диапазон верхней и нижней границ доверительного интервала отличаются в 1,77 раза:

DY = 226.8998 / 127.8758 = 1.77.

Для построения графика используем «Мастер диаграмм» - покажем фактические исходные данные (поле корреляции). Затем с помощью опции «Добавить линию тренда», построим линию модели и покажем на графике результаты прогнозирования.

Пошаговая множественная регрессия. Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель формирования цены квартиры за счет значимых факторов. Дайте экономическую интерпретацию коэффициентов модели регрессии.

Методом включения построим двухфакторные модели, сохраняя в них наиболее информативный фактор - жилую площадь квартиры (Х4).

В качестве «входного интервала Х» укажем значения факторов Х4 и Х1, с помощью инструмента «Регрессия» получим:

Регрессионная статистика

Множественный R

0,875979141

R-квадрат

0,767339455

Нормированный R-квадрат

0,754763209

Стандартная ошибка

28,37139894

Наблюдения

40

Таким образом, модель (4) зависимости цены квартиры Y от жилой площади квартиры Х4 и города области Х1 построена, ее уравнение имеет вид:

Используем в качестве «входного интервала Х» значения факторов Х4 и Х2, с помощью «Регрессии» найдем:

Регрессионная статистика

Множественный R

0,874162592

R-квадрат

0,764160238

Нормированный R-квадрат

0,751412142

Стандартная ошибка

28,56458338

Наблюдения

40

Таким образом, модель (5) зависимости цены квартиры Y от жилой площади квартиры Х4 и от числа комнат в квартире Х2 построена, ее уравнение имеет вид:

Построим множественную модель регрессии, учитывая все факторы (Х4, Х1, и Х2):

Регрессионная статистика

Множественный R

0,876217908

R-квадрат

0,767757822

Нормированный R-квадрат

0,748404307

Стандартная ошибка

28,73687504

Наблюдения

40

Таким образом, трехфакторная модель (6) зависимости цены квартиры Y от жилой площади Х4, города области Х1 и числа комнат в квартире Х2 построена, ее уравнение имеет вид:

Выберем лучшую из построенных моделей.

Для сравнения моделей с различным количеством учтенных в них факторов используем нормированные коэффициенты детерминации, которые содержатся в строке «нормированный R-квадрат» итогов инструмента «Регрессия». Чем больше величина нормированного коэффициента детерминации, тем лучше модель.

,

где - коэффициент детерминации, n - число наблюдений, k - число независимых переменных.

Модель (4): 0,767339455

Модель (5): 0,764160237

Модель (6): 0,767757821

Таким образом, лучшей является модель (6) зависимости цены квартиры Y от жилой площади Х4, города области Х1 и числа комнат в квартире Х2:

Коэффициент регрессии в1=6.859, следовательно, при изменении города области (Х1), при одном и том же числе комнат в квартире (Х2) и одной и той же жилой площади, цена квартиры (Y) увеличится в среднем на 6,859 тыс. долл.

Коэффициент регрессии в2=-1.985, следовательно, при изменении числа комнат в квартире (Х2) при одной и той же жилой площади (Х4) и одном и том же городе области (Х1), цена квартиры (Y) уменьшится в среднем на 1.985 тыс. долл.

Коэффициент регрессии в3=2.591, следовательно, при увеличении жилой площади квартиры на 1 кв. м. (Х4) при одном и том же городе области (Х1) и одном и том же кол-ве комнат (Х2), цена квартиры (Y) увеличится в среднем на 2.591 тыс. долл.

Свободный коэффициент не имеет экономического смысла, но говорит о том, что сначала меняется результат Y, а потом факторы X1, X2, X4..

Оценка качества многофакторной модели

6. Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, - и -коэффициентов.

Для оценки качества выбранной множественной модели (6) , аналогично п.1.4 данной задачи, используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F-критерий Фишера.

Коэффициент детерминации R-квадрат возьмем из итогов «Регрессии» (таблица «Регрессионная статистика» для модели (6)).

, следовательно, вариация (изменение) цены квартиры Y на 76,77% объясняется по данному уравнению вариацией города области Х1, числа комнат в квартире Х2 и жилой площади Х4.

Используем исходные данные Yi и найденные инструментом «Регрессия» остатки (таблица «Вывод остатка» для модели (6)). Рассчитаем относительные погрешности и найдем среднее значение .

Вывод остатка

Наблюдение

Предсказанное Y

Остатки

Отн. погрешность

1

45,95089273

-7,95089273

20,92340192

2

86,10296493

-23,90296493

38,42920407

3

94,84442678

30,15557322

24,12445858

4

84,17648426

-23,07648426

37,76838667

5

40,2537216

26,7462784

39,91981851

6

68,70572376

24,29427624

26,12287768

7

143,7464899

-25,7464899

21,81905923

8

106,0907598

25,90924022

19,62821228

9

135,357993

-42,85799303

46,33296544

10

114,4792566

-9,47925665

9,027863476

11

41,48765602

0,512343975

1,219866607

12

103,2329236

21,76707636

17,41366109

13

130,3567798

39,64322022

23,3195413

14

35,41901876

2,580981242

6,7920559

15

155,4129693

-24,91296925

19,0903979

16

84,32108188

0,678918123

0,798727204

17

98,0552279

-0,055227902

0,056355002

18

144,2104618

-16,21046182

12,66442329

19

122,8677535

-37,86775351

44,55029825

20

100,0221225

59,97787748

37,48617343

21

53,27196558

6,728034423

11,21339071

22

35,06605378

5,933946225

14,47303957

23

114,4792566

-24,47925665

27,19917406

24

113,1343153

-30,13431529

36,30640396

25

40,43190991

4,568090093

10,15131132

26

39,34427892

-0,344278918

0,882766457

27

144,4794501

-57,57945009

66,25943623

28

56,4827667

-16,4827667

41,20691675

29

95,38240332

-15,38240332

19,22800415

30

228,6988826

-1,698882564

0,748406416

31

222,8067278

12,19327221

5,188626473

32

38,81483144

1,185168555

2,962921389

33

48,36325811

18,63674189

27,81603267

34

126,6080021

-3,608002113

2,933335051

35

84,85052935

15,14947065

15,14947065

36

116,7991162

-11,79911625

11,23725357

37

84,17648426

-13,87648426

19,73895342

38

113,9412801

-31,94128011

38,95278062

39

215,494184

64,50581599

23,03779142

40

141,7795953

58,22040472

29,11020236

Среднее

101,2375

22,51770962

По столбцу относительных погрешностей найдем среднее значение =22.51% (с помощью функции СРЗНАЧ).

Сравнение показывает, что 22.51%>7%. Следовательно, точность модели неудовлетворительная.

С помощью F - критерия Фишера проверим значимость модели в целом. Для этого выпишем из итогов применения инструмента «Регрессия» (таблица «дисперсионный анализ» для модели (6)) F=39,6702.

С помощью функции FРАСПОБР найдем значение Fкр=3.252 для уровня значимости б = 5%, и чисел степеней свободы k1 = 2, k2 = 37.

F>Fкр, следовательно, уравнение модели (6) является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель (6) факторными переменными Х1, Х2. и Х4.

Дополнительно с помощью t-критерия Стьюдента проверим значимость отдельных коэффициентов модели.

t-статистики для коэффициентов уравнения регрессии приведены в итогах инструмента «Регрессия». Получены следующие значения для выбранной модели (6) .

Критическое значение tкр найдено для уровня значимости б=5% и числа степеней свободы k=40-2-1=37. tкр=2.026 (функция СТЬЮДРАСПОБР).

Для свободного коэффициента б=-5.643 определена статистика , <tкр, следовательно, свободный коэффициент не является значимым, его можно исключить из модели.

Для коэффициента регрессии в1=6.859 определена статистика , <tкр, следовательно, коэффициент регрессии в1 не является значимым, его и фактор города области можно удалить из модели.

Для коэффициента регрессии в2=-1,985 определена статистика , <tкр, следовательно, коэффициент регрессии в2 не является значимым, его и фактор числа комнат в квартире можно исключить из модели.

Для коэффициента регрессии в4=2.591 определена статистика , >tкр, следовательно, коэффициент регрессии в4 является значимым, его и фактор жилой площади квартиры можно сохранить в модели.

Выводы о значимости коэффициентов модели сделаны на уровне значимости б=5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент б можно считать значимым на уровне 0.64 = 64%; коэффициент регрессии в1 - на уровне 0,46 = 46%; коэффициент регрессии в2 - на уровне 0,8 = 80%; а коэффициент регрессии в4 - на уровне 2,27E-06= 2,26691790951854E-06 = 0,0000002%.

При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества модели (3) и выбранной множественной модели (6) используем нормированные коэффициенты детерминации.

Модель

Нормированный R-квадрат

(3)

0,757683880132941

(6)

0,748404306989435

Таким образом, при добавлении в уравнение регрессии фактора «город области» Х1 и фактора «число комнат в квартире» Х2 качество модели ухудшилось, что говорит в пользу удаления факторов Х1 и Х2 из модели.

Проведем дальнейшие расчеты.

Средние коэффициенты эластичности в случае линейной модели определяются формулами .

С помощью функции СРЗНАЧ найдем: =0.45, =2.6, =42.05, =101.24.

Тогда , ,

Следовательно, увеличение жилой площади Х4 при том же кол-ве комнат и городе области на 1% приводит к увеличению цены квартиры в среднем на 1,076%.

При изменении города области (Х1) и неизменной жилой площади и числе комнат в квартире цена квартиры увеличится в среднем на 0,03%.

При изменении числа комнат в квартире (Х2) и неизменной жилой площади и городе области цена уменьшается в среднем на 0,05%.

Бета-коэффициенты определяются по формулам: ,

где среднее квадратическое отклонение j - го фактора - .

,

С помощью функции СТАНДОТКЛОН найдем SX1= 0,504, SX2= 1,194, SX4=20.223; SY= 57,291.

Тогда ; ;

Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0.06 своего стандартного отклонения SY, при увеличении только фактора Х2 на одно его стандартное отклонение - уменьшается на 0,041 SY, при увеличении только фактора Х4 на одно его стандартное отклонение - увеличивается на 0,914 SY

Дельта-коэффициенты определяются формулами .

Найдем коэффициенты парной корреляции с использованием инструмента «Корреляция» пакета «Анализ данных» в Excel.

Y

X1

X2

X4

Y

1

X1

-0,01126

1

X2

0,751061

-0,0341

1

X4

0,874012

-0,0798

0,868524

1

Коэффициент детерминации был определен ранее и равен 0.7677.

Вычислим дельта-коэффициенты:

;

Поскольку Д1<0 и Д2<0, то факторные переменные Х1 и Х2 выбрана неудачно, и их нужно удалить из модели. Значит, по уравнению полученной линейной трехфакторной модели изменение результирующего фактора Y (цены квартиры) на 104% объясняется воздействием фактора Х4 (жилой площадью квартиры), на 4% воздействием фактора Х2 (число комнат), на 0,0859% воздействием фактора Х1 (город области).

Проверка наличия аномальных наблюдений

1. Проверить наличие аномальных наблюдений.

Используем метод Ирвина, основанный на определении лt-статистик по формуле:

лt=,

где , .

Найдем Sy=7.293 (функция СТАНДОТКЛОН) и рассчитаем лt-статистики. Результат расчетов приведем в таблице:

t

yt

|yt-yt-1|

t

1

43

-

-

2

47

4

0,548

3

50

3

0,411

4

48

2

0,274

5

54

6

0,823

6

57

3

0,411


Подобные документы

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.

    лабораторная работа [30,9 K], добавлен 05.12.2010

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.

    контрольная работа [173,8 K], добавлен 22.11.2010

  • Оценка корреляционной матрицы факторных признаков. Оценки собственных чисел матрицы парных коэффициентов корреляции. Анализ полученного уравнения регрессии, определение значимости уравнения и коэффициентов регрессии, их экономическая интерпретация.

    контрольная работа [994,1 K], добавлен 29.06.2013

  • Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

    контрольная работа [141,3 K], добавлен 05.05.2010

  • Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [58,3 K], добавлен 17.10.2009

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.

    курсовая работа [233,1 K], добавлен 21.03.2015

  • Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.

    контрольная работа [110,4 K], добавлен 28.07.2012

  • Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [914,4 K], добавлен 01.12.2013

  • Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.

    контрольная работа [817,3 K], добавлен 01.04.2010

  • Этапы и проблемы эконометрических исследований. Параметры парной линейной регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициентов автокорреляции второго порядка для временного ряда расходов на потребление.

    контрольная работа [60,3 K], добавлен 05.01.2011

  • Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.

    контрольная работа [108,5 K], добавлен 28.03.2018

  • Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.

    контрольная работа [298,2 K], добавлен 19.01.2011

  • Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [3,6 M], добавлен 29.05.2010

  • Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.

    контрольная работа [155,8 K], добавлен 11.12.2010

  • Параметры уравнений линейной парной регрессии. Показатели корреляции и детерминации. Изменение средней заработной платы и выплат социального характера. Средняя ошибка аппроксимации. Коэффициент эластичности и стоимость активных производственных фондов.

    контрольная работа [1,1 M], добавлен 23.06.2011

  • Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.

    лабораторная работа [214,2 K], добавлен 17.10.2009

  • Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.

    лабораторная работа [890,1 K], добавлен 06.12.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.