Расчет моделей парной линейной и нелинейной регрессии

Расчет линейного коэффициента парной корреляции и его статистической значимости. Вычисление качества уравнения регрессии при помощи коэффициента детерминации. Оценка статистической надежности результатов регрессионного моделирования критерием Фишера.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 26.03.2014
Размер файла 104,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

1. Модель парной линейной регрессии

Имеются данные о цене x некоторого блага и количеству y данного блага, приобретаемому домохозяйством ежемесячно в течение года

Таблица 1.1

Месяц

x

y

1

10

110

2

20

75

3

15

100

4

25

80

5

30

60

6

35

55

7

40

40

8

35

80

9

25

60

10

40

30

11

45

40

12

40

30

Задания:

1. Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный интервал с уровнем значимости =0,05. Сделать выводы

2. Построить линейное уравнение парной регрессии y на x и оценить статистическую значимость параметров регрессии. Сделать рисунок.

3. Оценить качество уравнения регрессии при помощи коэффициента детерминации. Сделать выводы. Проверить качество уравнения регрессии при помощи F критерия Фишера.

4. Выполнить прогноз приобретаемого блага y при прогнозном значении цены блага x, составляющем 112 % от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал для уровня значимости =0,05. Сделать выводы.

Решение.

1. Для определения степени тесноты связи обычно используют линейный коэффициент корреляции:

, (1.1)

где , - выборочные дисперсии переменных x и y, - ковариация признаков. Соответствующие средние определяются по формулам:

, (1.2)

, (1.3)

, (1.4)

. (1.5)

Для расчета коэффициента корреляции (1.1) строим расчетную таблицу (табл. 1.2):

Таблица 1.2

x

y

xy

x2

y2

e2

1

10

110

1100

100

12100

105,93

4,07

16,60

2

20

75

1500

400

5625

84,63

-9,63

92,73

3

15

100

1500

225

10000

95,28

4,72

22,30

4

25

80

2000

625

6400

73,98

6,02

36,22

5

30

60

1800

900

3600

63,33

-3,33

11,11

6

35

55

1925

1225

3025

52,69

2,31

5,36

7

40

40

1600

1600

1600

42,04

-2,04

4,15

8

35

80

2800

1225

6400

52,69

27,31

746,10

9

25

60

1500

625

3600

73,98

-13,98

195,48

10

40

30

1200

1600

900

42,04

-12,04

144,89

11

45

40

1800

2025

1600

31,39

8,61

74,15

12

40

30

1200

1600

900

42,04

-12,04

144,89

Итого

360

760

19925

12150

55750

760

1493,98

Среднее значение

30,00

63,33

1660,42

1012,50

4645,83

s

10,61

25,19

s2

112,5

634,72

По данным таблицы находим:

, . .

Таким образом, между количеством некоторого блага, приобретаемого домохозяйством ежемесячно (y) и его ценой (x) существует обратная сильная корреляционная зависимость.

Для оценки статистической значимости коэффициента корреляции рассчитывают двухсторонний t-критерий Стьюдента:

, (1.6)

который имеет распределение Стьюдента с k = n - 2 и уровнем значимости = 0,05.

В нашем случае

и .

Поскольку , то коэффициент корреляции существенно отличается от нуля.

Для значимого коэффициента можно построить доверительный интервал, который с заданной вероятностью содержит неизвестный генеральный коэффициент корреляции. Для построения интервальной оценки (для малых выборок n<30), используют z-преобразование Фишера:

(1.7)

Распределение z уже при небольших n является приближенным нормальным распределением с математическим ожиданием и дисперсией . Поэтому вначале строят доверительный интервал для M[z], а затем делают обратное
z-преобразование.

Применяя z-преобразование для найденного коэффициента корреляции, получим:

.

Доверительный интервал для M(z) будет иметь вид:

, (1.8)

где tг находится с помощью функции Лапласа Ф(tг)= г/2. Для г =0,95 имеем tг=1,96. Тогда:

,

или:

.

Обратное z-преобразование осуществляется по формуле:

(1.9)

В результате находим:

.

В указанных границах на уровне значимости 0,05 (с надежностью 0,95) заключен генеральный коэффициент корреляции с.

2. Таким образом, между переменными x и y имеет место существенная корреляционная зависимость. Будем считать, что эта зависимость является линейной. Модель парной линейной регрессии имеет вид:

, (1.10)

где y - зависимая переменная (результативный признак), x - независимая (объясняющая) переменная, е - случайные отклонения, 0 и 1 - параметры регрессии. По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:

, (1.11)

где b0 и b1 - эмпирические коэффициенты регрессии. Для оценки параметров регрессии обычно используют метод наименьших квадратов (МНК). В соответствие с МНК, сумма квадратов отклонений фактических значений зависимой переменной y от теоретических была минимальной:

, (1.12)

где - отклонения yi от оцененной линии регрессии. Необходимым условием существования минимума функции двух переменных (1.12) является равенство нулю ее частных производных по неизвестным параметрам b0 и b1. В результате получаем систему нормальных уравнений:

(1.13)

где соответствующие средние определяются по формулам:

Решая систему (1.13), найдем:

, (1.14)

. (1.15)

По данным таблицы находим:

Получено уравнение регрессии:

(1.16)

Параметр b1 называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. В рассматриваемом случае, с увеличением цены блага на 1 ден.ед. домохозяйства покупают его на 2,13 ед. меньше.

Рис. 1.1

Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки статистической значимости каждого коэффициента регрессии. Для этого вычислим сначала стандартную ошибку регрессии:

. (1.17)

В нашем случае:

.

Значимость коэффициентов регрессии осуществляется с помощью t-критерия Стьюдента:

, (1.18)

где - стандартная ошибка коэффициента регрессии.

Для коэффициента b1 оценку дисперсии можно получить по формуле:

. (1.19)

В нашем случае:

Следовательно,

.

Отметим, что для парной линейной регрессии t-критерий для коэффициента корреляции rxy и коэффициента регрессии b1 совпадают.

Для коэффициента b0 оценку дисперсии можно получить по формуле:

. (1.20)

Тогда:

Критическое значение критерия было уже найдено . Поскольку и , то коэффициенты регрессии значимо отличаются от нуля. Следовательно, для них можно построить доверительные интервалы.

Определим предельные ошибки для каждого показателя:

, ,

где . В нашем случае:

.

В результате, получаем следующие доверительные интервалы для коэффициентов регрессии:

,

или:

.

3. Оценку качества построенной модели дает коэффициент детерминации.

Коэффициент детерминации для линейной модели равен квадрата коэффициента корреляции:

.

Это означает, что 80,4 % вариации количества покупаемого блага (y) объясняется вариацией цены (x).

Значимость уравнения регрессии проверяется при помощи F-критерия Фишера, для линейной парной регрессии он будет иметь вид:

, (1.21)

где F подчиняется распределению Фишера с уровнем значимости и степенями свободы k1=1 и k2= n-2.

В нашем случае:

.

Поскольку критическое значение критерия равно:

и , то признается статистическая значимость построенного уравнения регрессии. Отметим, что для линейной модели F- и t-критерии связаны равенством .

4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Прогнозное значение yp определяется путем подстановки в уравнение регрессии (1.16) соответствующего (прогнозного) значения xp. В нашем случае прогнозное значение цены составит: , тогда прогнозное значение количества блага, купленного домохозяйствами составит:

Средняя стандартная ошибка прогноза вычисляется по формуле:

. (1.22)

В нашем случае:

Предельная ошибка прогноза, которая в 95 % случаях не будет превышена, составит:

.

Доверительный интервал прогноза:

,

Выполненный прогноз покупки некоторого блага оказался надежным (г=0,95) и неточным, т.к. относительная точность прогноза составила 28,5/55,01100 %=51,2 %.

2. Модель парной нелинейной регрессии

По территориям Центрального и Волго-Вятского районов известны данные за ноябрь 1997 г.

Таблица 2.1

Район

Прожиточный минимум в среднем на душу населения, тыс. руб., x

Средняя заработная плата и выплаты социального характера, тыс. руб., y

Брянская обл.

289

615

Владимирская обл.

338

727

Ивановская обл.

287

584

Калужская обл.

324

753

Костромская обл.

307

707

Орловская обл.

304

657

Рязанская обл.

307

654

Смоленская обл.

290

693

Тверская обл.

314

704

Тульская обл.

304

780

Ярославская обл.

341

830

Задания

1. Построить поле корреляции и сформулировать гипотезу о форме связи. Рассчитать параметры уравнений степенной () и гиперболической ()парной регрессии. Сделать рисунки.

2. Дать с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом для каждой модели. Сделать выводы. Оценить качество уравнений регрессии с помощью средней ошибки аппроксимации и коэффициента детерминации. Сделать выводы.

3. Оценить с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям рассчитанных характеристик выбрать лучшее уравнение регрессии. Дать экономический смысл коэффициентов выбранного уравнения регрессии

4. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 10 % от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости =0,05.

Сделать выводы.

Решение.

1. Построим поле корреляции (рис.2.1).

Рис. 2.1

По виду расположения точек нельзя сделать вывод о форме связи.

1а. Построению гиперболической модели

, (2.1)

предшествует процедура линеаризации путем преобразования u = u = 1/x. В результате получается линейное уравнение регрессии:

. (2.2)

В соответствии с формулой (1.15) вычисляем:

.

В результате, получим уравнение обратной регрессии:

. (2.3)

Подставляя в данное уравнение фактические значения x, получаем теоретические значения результата .

Таблица 2.2

u

y

uy

u2

y2

A

1

0,0035

615

2,128

0,000012

378225

636,95

-21,95

3,57

481,89

4021,03

7286,95

2

0,0030

727

2,151

0,000009

528529

781,92

-54,92

7,55

3016,35

6651,65

709,50

3

0,0035

584

2,035

0,000012

341056

629,98

-45,98

7,87

2114,48

4953,37

13540,50

4

0,0031

753

2,324

0,000010

567009

744,98

8,02

1,07

64,39

1990,25

2770,59

5

0,0033

707

2,303

0,000011

499849

695,58

11,42

1,61

130,34

22,85

44,04

6

0,0033

657

2,161

0,000011

431649

686,29

-29,29

4,46

858,12

197,96

1880,40

7

0,0033

654

2,130

0,000011

427716

695,58

-41,58

6,36

1729,19

22,85

2149,59

8

0,0034

693

2,390

0,000012

480249

640,40

52,60

7,59

2766,73

3595,61

54,22

9

0,0032

704

2,242

0,000010

495616

716,57

-12,57

1,79

157,99

262,62

13,22

10

0,0033

780

2,566

0,000011

608400

686,29

93,71

12,01

8780,86

197,96

6341,95

11

0,0029

830

2,434

0,000009

688900

789,44

40,56

4,89

1644,83

7935,22

16805,59

Итого

0,04

7704

24,86

0,000116

5447198

58,77

21745,16

29851,39

51596,55

Среднее значение

0,0032

700,36

2,26

0,000011

495199,82

5,34

2416,13

2713,76

4690,60

s

0,0002

68,49

49,15

s2

0,00000003

4690,60

Рис. 2.2

2б. Построению степенной модели:

, (2.4)

предшествует процедура линеаризации. В данном случае линеаризация производится путем логарифмирования обеих частей уравнения:

.

По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:

, (2.5)

где Таким образом, степенная модель свелась к линейной модели с ее методами оценивания параметров и проверки гипотез.

Таблица 2.3

u=lnx

v=lny

uv

u2

v2

A

1

5,67

6,42

36,388

32,108

41,237

637,85

-22,85

3,72

522,02

3908,24

7286,95

2

5,82

6,59

38,368

33,908

43,414

784,62

-57,62

7,93

3320,40

7099,63

709,50

3

5,66

6,37

36,050

32,030

40,576

632,02

-48,02

8,22

2305,65

4671,24

13540,50

4

5,78

6,62

38,292

33,417

43,878

741,94

11,06

1,47

122,38

1728,40

2770,59

5

5,73

6,56

37,574

32,797

43,047

690,90

16,10

2,28

259,17

89,54

44,04

6

5,72

6,49

37,090

32,684

42,090

681,99

-24,99

3,80

624,37

337,68

1880,40

7

5,73

6,48

37,128

32,797

42,031

690,90

-36,90

5,64

1361,69

89,54

2149,59

8

5,67

6,54

37,087

32,148

42,785

640,77

52,23

7,54

2728,20

3551,66

54,22

9

5,75

6,56

37,697

33,056

42,991

711,81

-7,81

1,11

60,98

130,99

13,22

10

5,72

6,66

38,071

32,684

44,346

681,99

98,01

12,57

9606,46

337,68

6341,95

11

5,83

6,72

39,199

34,011

45,178

793,85

36,15

4,36

1307,18

8738,77

16805,59

Итого

63,07

72,01

412,94

361,64

471,57

58,62

22218,50

30683,37

51596,55

Среднее значение

5,73

6,55

37,54

32,88

42,87

5,33

2019,86

2789,40

4690,60

s

0,06

0,10

s2

0,003

0,01

В соответствии с формулой (1.15) вычисляем:

В результате, получим линейное уравнение:

.

Выполнив его потенцирование, находим искомое уравнение степенной регрессии:

.

Подставляя в данное уравнение фактические значения x, получаем теоретические значения результата .

Рис. 2.3

2. Средний коэффициент эластичности

(2.6)

Показывает, насколько процентов в среднем по совокупности изменится результат y от своей средней величины при изменении фактора x на 1 % от своего среднего значения.

Для гиперболической функции :

. (2.7)

В нашем случае

Для степенной функции :

. (2.8)

В нашем случае .

Таким образом, при возрастании темпов роста прожиточного минимума в среднем на одного пенсионера в месяц на 1 % средний размер ежемесячной заработной платы увеличивается на 1,327 % (для гиперболической модели).

Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

. (2.9)

В нашем случае по данным таблиц 2.2 и 2.3 находим:

- для гиперболической регрессии .

- для степенной регрессии ,

Качество построенной модели оценивается как хорошее, так как не превышает 8-10 %.

Индекс детерминации:

, (2.10)

характеризует долю дисперсии результативного признака, объясняемую регрессией, в общей дисперсии результативного признака. По данным таблиц 2.2 и 2.3 получаем:

- для гиперболической регрессии ,

- для степенной регрессии .

Наибольшее значение индекс детерминации имеет для степенной модели (R2=0,595). Однако он показывает, что уравнение регрессии только на 59,5 % объясняет вариацию значений признака y.

3. На основании статистических данных вычисляются наблюдаемые значения F-критерия:

. (2.11)

По данным таблиц 2.2 и 2.3 получаем:

- для гиперболической регрессии ,

- для степенной регрессии .

Критическое значение критерия Fкрит - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы k1 и k2 и уровня значимости. В нашем случае:

.

Если Fнабл>Fкрит, то гипотеза о случайной природе оцениваемых параметров отклоняется и признается их статистическая значимость и надежность. Если Fнабл<Fкрит, то гипотеза о случайной природе оцениваемых параметров не отклоняется и признается статистическая ненадежность полученного уравнения регрессии. В нашем случае для полученных уравнений регрессии Fнабл>Fкрит, т.е. признается их статистическая надежность.

Так как обе построенные модели хорошо описывают зависимость заданных факторов, причем их статистические характеристики незначительно отличаются, то проведем прогнозирование по модели гиперболической регрессии:

4. Рассчитаем прогнозное значение результата, если прогнозное значение фактора увеличится на 10 % от его среднего уровня.

В нашем случае прогнозное значение прожиточного минимума составит: , тогда прогнозное значение заработной платы составит:

Средняя стандартная ошибка прогноза вычисляется по формуле (1.22). Для построения доверительного интервала прогноза воспользуемся линеаризированным уравнением:

,

где u=1/х. Тогда прогнозное значение для переменной u составят . Вычислим среднюю стандартную ошибку прогноза для переменной v в соответствии с данными таблица 2.2:

Предельная ошибка прогноза, которая в 95% случаях не будет превышена, составит:

.

Доверительный интервал прогноза:

,

Выполненный прогноз среднемесячной заработной платы оказался надежным (г=0,95) и недостаточно точным, т.к. относительная точность прогноза составила 129,04/788,2100 %=16,4 %.

статистический линейный регрессия детерминация

Список литературы

1. Бородич С.А. Эконометрика: Учеб. пособие. - Мн.: Новое знание, 2001.

2. Ежеманская С.Н. Эконометрика. - Ростов н/Д.: Феникс, 2003.

3. Елисеева И.И., Юзбашев М.М. Общая теория статистики - М.: Финансы и статистика, 2001.

4. Практикум по эконометрике: Учеб. пособие / Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2001.

5. Теория статистики: Учебник / Под ред Р.А. Шмойловой - М.: Финансы и статистика, 2000.

6. Эконометрика: Учебник / Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2001.

Размещено на Allbest.ru

...

Подобные документы

  • Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.

    курсовая работа [233,1 K], добавлен 21.03.2015

  • Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.

    контрольная работа [71,7 K], добавлен 17.09.2016

  • Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.

    контрольная работа [155,8 K], добавлен 11.12.2010

  • Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.

    лабораторная работа [100,5 K], добавлен 02.06.2014

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

    контрольная работа [141,3 K], добавлен 05.05.2010

  • Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.

    контрольная работа [110,4 K], добавлен 28.07.2012

  • Связь между случайными переменными и оценка её тесноты как основная задача корреляционного анализа. Регрессионный анализ, расчет параметров уравнения линейной парной регрессии. Оценка статистической надежности результатов регрессионного моделирования.

    контрольная работа [50,4 K], добавлен 07.06.2011

  • Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.

    лабораторная работа [2,1 M], добавлен 25.05.2009

  • Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.

    контрольная работа [817,3 K], добавлен 01.04.2010

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.

    контрольная работа [108,5 K], добавлен 28.03.2018

  • Исследование зависимости часового заработка одного рабочего от общего стажа работы после окончания учебы с помощью построения уравнения парной линейной регрессии. Вычисление описательных статистик. Построение поля корреляции и гипотезы о форме связи.

    контрольная работа [226,6 K], добавлен 11.08.2015

  • Выполнение кластерного анализа предприятий с помощью программы Statgraphics Plus. Построение линейного уравнения регрессии. Расчет коэффициентов эластичности по регрессионным моделям. Оценка статистической значимости уравнения и коэффициента детерминации.

    задача [1,7 M], добавлен 16.03.2014

  • Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.

    лабораторная работа [30,9 K], добавлен 05.12.2010

  • Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации; определение средней ошибки аппроксимации. Статистическая надежность регрессионного моделирования с помощью критериев Фишера и Стьюдента.

    контрольная работа [34,7 K], добавлен 14.11.2010

  • Построение уравнения множественной регрессии в линейной форме с полным набором факторов, отбор информативных факторов. Проверка значимости уравнения регрессии по критерию Фишера и статистической значимости параметров регрессии по критерию Стьюдента.

    лабораторная работа [217,9 K], добавлен 17.10.2009

  • Расчет уравнений линейной и нелинейной парной регрессии. Оценка тесноты связи расходов на перевозки и грузооборота с помощью показателей корреляции и детерминации. Оценка ошибки аппроксимации уравнений регрессии. Расчет прогнозного значения расходов.

    курсовая работа [2,5 M], добавлен 26.12.2014

  • Ковариация и коэффициент корреляции, пары случайных переменных. Вычисление их выборочных значений и оценка статистической значимости в Excel. Математическая мера корреляции двух случайных величин. Построение моделей парной и множественной регрессии.

    контрольная работа [2,2 M], добавлен 24.12.2014

  • Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.

    лабораторная работа [67,8 K], добавлен 26.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.