Методика выполнения регрессионного анализа в программной среде Microsoft Excel

Порядок построения диаграммы рассеивания. Расчет таблицы однофакторного дисперсионного анализа. Определение критического значения распределения Фишера. Вычисление несмещенной оценки остаточной дисперсии и стандартных ошибок коэффициентов регрессии.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 25.02.2015
Размер файла 1,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

1. На основании данных о динамике прироста курса акций у за 10 месяцев, приведенных в таблице и предположения, что генеральное уравнение регрессии имеет вид у = 0+ 1х + , требуется:

а) Найти оценку и проверить на 5% уровне значимости уравнения регрессии, то есть гипотезу Н0:1=0;

б) Построить таблицу дисперсионного анализа для расчета F-критерия Фишера;

в) Найти коэффициент детерминации R2;

г) Найти интервальную оценку для прогноза при x=11;

Таблица 1

х

Задача 2у

1

3

2

5

3

8

4

9

5

7

6

4

7

2

8

1

9

2

10

5

Решение.

Расчеты проведем в программе Excel на листе 1 рабочей книги.

В столбец А занесем данные задачи по переменной х (месяц). В столбец В - данные переменной у (прирост курса акций) (см. рис. 1.1).

Исходные данные будут записываться по столбцам. В частности, значения х будут располагаться в ячейках А2:А11, значения у - в ячейках В2:В11.

Рис. 1.1. Данные задачи

Для того чтобы проверить, существует ли зависимость между признаками, построим диаграмму рассеивания с помощью Мастера диаграмм (см. рис. 1.2).

Рис. 1.2. Поле корреляции

По рисунку видно, что между признаками существует нелинейная взаимосвязь.

Проведем линеаризацию модели, прологарифмируем и получим:

lny = ln0 + 1 x+ln.

Таблица 2. Исходные данные

x

y

ln(y)

1

3

1,099

2

5

1,609

3

8

2,079

4

9

2,197

5

7

1,946

6

4

1,386

7

2

0,693

8

1

0,000

9

2

0,693

10

5

1,609

Построим уравнение регрессии по табл. 2, используя Анализ данных. Для этого необходимо провести преобразование переменной у на lny, используя Мастер функции fx.

Построим регрессию Сервис>Анализ данных >Регрессия. В качестве зависимой переменной следует указать переменную lny.

Таблица 3. Итоги регрессии

Регрессионная статистика

Множественный R

0,449261

R-квадрат

0,201835

Нормированный R-квадрат

0,102065

Стандартная ошибка

0,669008

Наблюдения

10

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

0,905437

0,905437

2,022996

0,19273

Остаток

8

3,580577

0,447572

Итого

9

4,486014

Коэффиц.

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

1,907454

0,45702

4,17368

0,003106

0,853565

2,961343

x

-0,10476

0,073655

-1,42232

0,19273

-0,27461

0,065088

Получили уравнение регрессии:

lgy = 1,907-0,105 x

.

Само уравнение и коэффициенты регрессии значимо отличаются от нуля. Коэффициент при переменной x означает, что с каждым месяцем снижение курса акций составляет 0,105 д.ед.

Найдем прогнозные значения yпр. Для этого в уравнение регрессии вместо х подставляем значения месяцев. Сумма фактических и прогнозных значений у почти полностью совпала (разница за счет округления коэффициентов регрессии) (см. табл. 4).

Таблица 4. Нахождение прогнозных значений у

x

y

ln(y)

упр

1

3

1,099

6,733

2

5

1,609

6,260

3

8

2,079

5,999

4

9

2,197

5,821

5

7

1,946

5,686

6

4

1,386

5,578

7

2

0,693

5,489

8

1

0,000

5,412

9

2

0,693

5,346

10

5

1,609

5,287

Проведем анализ полученного уравнения. Найдем остатки , оценку остаточной дисперсии , стандартных ошибок коэффициентов.

Для оценки значимости уравнения регрессии и для нахождения значения F критерия, рассчитаем Qобщ,Qост и Qрегр, то есть рассчитаем таблицу дисперсионного анализа (табл. 5).

Таблица 5. Расчет таблицы однофакторного дисперсионного анализа

x

y

ln(y)

упр

(у-упр)2

(у-уср)2

(уср-упр)2

1

3

1,099

6,733

13,934

2,560

4,549

2

5

1,609

6,260

1,588

0,160

2,756

3

8

2,079

5,999

4,003

11,560

1,958

4

9

2,197

5,821

10,107

19,360

1,490

5

7

1,946

5,686

1,727

5,760

1,179

6

4

1,386

5,578

2,491

0,360

0,957

7

2

0,693

5,489

12,171

6,760

0,790

8

1

0,000

5,412

19,468

12,960

0,660

9

2

0,693

5,346

11,194

6,760

0,556

10

5

1,609

5,287

0,082

0,160

0,472

55

46

13,313

57,611

76,764

66,400

15,367

Qост

Qобщ

Qрегр

Для оценки значимости уравнения регрессии проверим гипотезу H0: в1=0.

По таблице F-распределения находят Fкр с числом степеней свободы н1=1, н2=n-2=10-2=8. Найдем его с помощью математических функций: определим критическое значение распределения Фишера:

Fкрит=FРАСПОБР(0,05;1;8) = 5,318.

Так как Fнабл = 2,023 < Fкр=5,318, то гипотеза не принимается и уравнение считается значимым (см. табл. 3).

Проверим значимость каждого коэффициента регрессии.

Для проверки гипотезы H0: в0=0 рассчитали t-статистику. Находим критическое значение распределения Стьюдента с помощью статистической функции СТЮДРАСПОБР(0,05;8) = 2,306, где вероятность (уровень значимости) равна 0,05 и число степеней свободы n-2=10-2=8. В таблице 1.2 t-статистика параметра регрессии b1 меньше критического значения, следовательно, параметр регрессии статистически не значим, а поправочный коэффициент регрессии b0 значим, поскольку его P-вероятность меньше 0,05.

Рассчитаем несмещенную оценку остаточной дисперсии и стандартные ошибки коэффициентов регрессии:

Стандартные ошибки коэффициентов b0 и b1 вычисляют по формулам:

дисперсионный однофакторный регрессия

Найдем коэффициент детерминации:

Множественный коэффициент корреляции равен 0,449, что говорит о слабой обратной зависимости между признаками. Коэффициент детерминации показывает, что прирост курса акций на 15,6% обусловлен временем.

Найдем 95% доверительные интервалы для каждого коэффициента регрессии, а затем для прогнозного значения х=11.

Интервальная оценка для параметра в0:

Следовательно, коэффициент b0 изменяется в интервале от -2,972 до 6,786 (табл. 6).

Аналогично интервальная оценка для коэффициента в1:

в1=[-0,105±2,306*0,341]

В ячейках D22 - D25 Листа 1 рабочей книги приведены расчеты для нижней и верхней границ коэффициентов регрессии.

Таблица 6. Расчет доверительных интервалов

Доверительный интервал

b0

Верхняя граница

6,786

Нижняя граница

-2,972

b1

Верхняя граница

0,681

Нижняя граница

-0,891

для х=11

Верхняя граница

10,114

Нижняя граница

0,354

Интервальная оценка для прогноза yпрогноз при x=x0 находится следующим образом:

Интервальная оценка для уравнения регрессии у при х=11:

Получено, что доверительный интервал для прогноза прироста курсовой стоимости акций при приросте фондового индекса х=11 находится в пределах от 0,354 до 10,114 с 95% уровнем надежности.

Таким образом, по полученному уравнению регрессии:

,

можно сформулировать следующие выводы:

- с каждым месяцем снижение курса акций составляет 0,105 д.ед.;

- коэффициент детерминации показывает, что полученная модель слабо отражает зависимость между признаками;

- уравнение регрессии не значимо, а, соответственно, его не следует применять при прогнозировании;

- поправочный коэффициент регрессии статистически значим, а коэффициент b1 - не значим;

- в 11 месяце прирост курса акций составит 5,234 д.ед.;

- доверительный интервал для прогноза прироста курсовой стоимости акций при х=11 находится в пределах 0,354 до 10,114 с 95% уровнем надежности.

Построим в поле корреляции уравнение линейной регрессии (рис. 1.3).

Рис. 1.3. Полулогарифмическая регрессия

Таким образом, полученное уравнение регрессии неточно описывает реальные данные.

2. Обозначения и наименование показателей: У - производительность труда (тыс.руб./чел.); Х1 - коэффициент платежеспособности предприятия; Х2 - удельный вес рабочих в составе промышленно-производственного персонала (%); Х6 - удельный вес потерь от брака (%); Х7 - фондоотдача (тыс.р. на 1 р.); Х9 - коэффициент ликвидности.

Таблица 7. Исходные данные

пп

У1

X1

X2

Х6

Х7

Х9

1

9,26

204,2

13,26

1,37

1,23

1,45

2

9,38

209,6

10,16

1,49

1,04

1,30

3

12,11

222,6

13,72

1,44

1,80

1,37

4

10,81

236,7

12,85

1,42

0,43

1,65

5

9,35

62,0

10,63

1,35

0,88

1,91

6

9,87

53,1

9,12

1,39

0,57

1,68

7

8,17

172,1

25,83

1,16

1,72

1,94

8

9,12

56,5

23,39

1,27

1,70

1,89

9

5,88

52,6

14,68

1,16

0,84

1,94

10

6,30

46,6

10,05

1,25

0,60

2,06

11

6,22

53,2

13,99

1,13

0,82

1,96

12

5,49

30,1

9,68

1,10

0,84

1,02

13

6,50

146,4

10,03

1,15

0,67

1,85

14

6,61

18,1

9,13

1,23

1,04

0,88

15

4,32

13,6

5,37

1,39

0,66

0,62

16

7,37

89,8

9,86

1,38

0,86

1,09

17

7,02

62,5

12,62

1,35

0,79

1,60

18

8,25

46,3

5,02

1,42

0,34

1,53

19

8,15

103,5

21,18

1,37

1,60

1,40

20

8,72

73,3

25,17

1,41

1,46

2,22

21

6,64

76,6

19,10

1,35

1,27

1,32

22

8,10

73,01

21,01

1,48

1,58

1,48

23

5,52

32,3

6,57

1,24

0,68

0,68

24

9,37

199,6

14,19

1,40

0,86

2,30

25

13,17

598,1

15,81

1,45

1,98

1,37

26

6,67

71,2

5,23

1,40

0,33

1,51

27

5,68

90,8

7,99

1,28

0,45

1,43

28

5,22

82,1

17,50

1,33

0,74

1,82

29

10,02

76,2

17,16

1,22

1,03

2,62

30

8,16

119,5

14,54

1,28

0,99

1,75

31

3,78

21,9

6,24

1,47

0,24

1,54

32

6,48

48,4

12,08

1,27

0,57

2,25

33

10,44

173,5

9,49

1,51

1,22

1,07

34

7,65

74,1

9,28

1,46

0,68

1,44

35

8,77

68,6

11,42

1,27

1,00

1,40

36

7,00

60,8

10,31

1,43

0,81

1,31

37

11,06

355,6

8,65

1,50

1,27

1,12

38

9,02

264,8

10,94

1,35

1,14

1,16

39

13,28

526,6

9,87

1,41

1,89

0,88

40

9,27

118,6

6,14

1,47

0,67

1,07

41

6,70

37,1

12,93

1,35

0,96

1,24

42

6,69

57,7

9,78

1,40

0,67

1,49

43

9,42

51,6

13,22

1,20

0,98

2,03

44

7,24

64,7

17,29

1,15

1,16

1,84

45

5,39

48,3

7,11

1,09

0,54

1,22

46

5,61

15,0

22,49

1,26

1,23

1,72

47

5,59

87,5

12,14

1,36

0,78

1,75

48

6,57

108,4

15,25

1,15

1,16

1,46

49

6,54

267,3

31,34

1,87

4,44

1,60

50

4,23

34,2

11,56

2,17

1,06

1,47

51

5,22

26,8

30,14

1,61

2,13

1,38

52

18,00

43,6

19,71

1,34

1,21

1,41

53

11,03

72,0

23,56

1,22

2,20

1,39

Решение

Задачу построения модели множественной регрессии решим с помощью пакета «Анализ данных» в Excel (Рис. 2.1).

Рис. 2.1 Диалоговое окно «Регрессия»

При использовании инструмента «Регрессия» входным интервалом для Y будут ячейки B2:B54, для X - ячейки C2:G54. Результат регрессионного анализа представим в табл. 8

Таблица 8. Вывод итогов регрессионного анализа

Регрессионная статистика

Множественный R

0,571621

R-квадрат

0,326751

Нормированный R-квадрат

0,255129

Стандартная ошибка

2,252779

Наблюдения

53

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

5

115,7646

23,15293

4,562143

0,001793

Остаток

47

238,5256

5,075012

Итого

52

354,2902

Коэффиц.

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

7,796727

2,913582

2,675993

0,010224

1,935356

13,6581

X1

0,013452

0,003359

4,004703

0,00022

0,006694

0,020209

X2

0,077412

0,108381

0,714256

0,478601

-0,14062

0,295446

Х6

-1,51268

1,922485

-0,78683

0,435329

-5,38022

2,354865

Х7

-0,38708

1,088867

-0,35549

0,723813

-2,5776

1,803437

Х9

0,044043

0,969469

0,04543

0,963957

-1,90628

1,994363

В столбце «Коэффициенты» получены коэффициенты уравнения регрессии.

Таким образом, получили уравнение регрессии:

Параметры регрессии показывают, что при изменении коэффициент платежеспособности предприятия на 1 единицу производительность труда увеличивается на 13 руб./чел., при увеличении удельного веса рабочих в составе ППП на 1% производительность труда увеличивается на 0,077 тыс. руб./чел., при увеличении удельного веса потерь от брака на 1% производительность труда снижается на 1,513 тыс. руб./чел., при увеличении фондоотдачи на 1 тыс. руб./чел. производительность труда снижается на 0,387 тыс. руб./чел., а при увеличении коэффициента ликвидности на 1 единицу производительность труда увеличивается на 0,044 тыс. руб./чел.

Стандартные ошибки коэффициентов составляют соответствующую графу в таблице 9.

Для проверки значимости коэффициентов регрессии рассчитаны t -статистики. Находим критическое значение распределения Стьюдента для вероятности (уровня значимости) 0,05 и число степеней свободы:

н = n-k-1=53-5-1=47.

Критическое значение находим из таблиц распределения Стьюдента или с помощью статистической функции:

СТЮДРАСПОБР(0,05;47) = 2,012.

Для проверки гипотезы H0: вj=0 сравниваем полученные значения для всех коэффициентов tнабл с tкр=2,012. Получим, что все коэффициенты не значимы, кроме b0 и b1. То есть на производительность труда значимо оказывает влияние параметр «Коэффициент платежеспособности предприятия».

Для проверки значимости коэффициентов также можно использовать Р-значения.

По величине Р-значения возможно определять значимость коэффициентов, не находя критическое значение t-статистики. Если значение t-статистики велико, то соответствующее значение вероятности значимости мало - меньше 0,05, и можно считать, что коэффициент регрессии значим. И наоборот, если значение t-статистики мало, соответственно вероятность значимости больше 0,05 - коэффициент считается незначимым. Результат проверки коэффициентов на значимость будет одинаковым.

Далее представлены доверительные интервалы (нижняя и верхняя границы), которые показывают, в каких пределах лежат коэффициенты полученного уравнения регрессии с 95%-ой надежностью.

В разделе Регрессионная статистика получили:

- множественный коэффициент корреляции (множественный R) равен 0,572, что говорит о заметной (по шкале Чеддока) степени связи между результативным и факторными признаками;

- коэффициент детерминации R2=0,327 показывает, что модель достаточно описывает данные, то есть 32,7% вариации производительности труда описывается факторами, входящими в полученную модель;

- скорректированный коэффициент детерминации имеет тот же смысл, что и R2, но считается, что он точнее отражает степень адекватности модели (его значение довольно низкое).

В Дисперсионном анализе вычисляются:

- df - число степеней свободы;

- SS - суммы квадратов разностей;

- МS - оценки дисперсий;

- F - вычисленное значение критерия Фишера;

- Значимость F.

Сумма квадратов регрессии вычисляется по формуле:

Qрегр = SS1;

сумма квадратов остатков:

Qост = SS2;

общая сумма квадратов:

Qобщ=SS.

Выполняется условие:

SS1+SS2=SS.

То есть 115,7646+238,5256=354,2902. Число степеней свободы df для SS1 равно df1=5 (k - число независимых переменных или факторов), для SS2: df2 = n - k - 1= 53-5-1 =47, для SS: df = n - 1= 53 - 1 =52.

Получены оценки средних квадратов:

наблюдаемое значение F-критерия:

Fнабл=4,562.

Сравним полученное значение Fнабл с критическим. Так как Fкрит=2,413<Fнабл=4,562, то гипотеза Н0: в1=в2=0 отвергается и уравнение считается значимым.

Значимость F - это вероятность значимости для F критерия. В нашем случае она равна 0,002, то есть гипотеза H0: в1=в2=0 отвергается и уравнение считается значимым.

Таким образом, можно сделать вывод, что полученное уравнение множественной регрессии значимо, но степень связи и его адекватность достаточно низкие, следовательно, рекомендацией является удаление статистически незначимых факторов с целью обеспечения точности и качества модели.

Размещено на Allbest.ru

...

Подобные документы

  • Методика нахождения основных числовых характеристик с помощью эконометрического анализа. Вычисление среднего значения, дисперсии. Построение корреляционного поля (диаграммы рассеивания), расчет общего разброса данных. Нахождение значения критерия Фишера.

    контрольная работа [38,2 K], добавлен 16.07.2009

  • Общая характеристика однофакторного дисперсионного анализа. Сущность двухфакторного дисперсионного анализа при перекрестной классификации факторов. Особенности дисперсионного анализа в системе MINITAB и формы выполнения работы в программе MS Excel.

    методичка [440,7 K], добавлен 15.12.2008

  • Проведение регрессионного анализа опытных данных в среде Excel. Построение графиков полиномиальной зависимости и обобщенной функции желательности Харрингтона. Определение дисперсии коэффициентов регрессии. Оценка частных откликов по шкале желательности.

    контрольная работа [375,6 K], добавлен 21.01.2014

  • Определение параметров уравнения линейной регрессии. Экономическая интерпретация коэффициента регрессии. Вычисление остатков, расчет остаточной суммы квадратов. Оценка дисперсии остатков и построение графика остатков. Проверка выполнения предпосылок МНК.

    контрольная работа [1,4 M], добавлен 25.06.2010

  • Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.

    контрольная работа [248,4 K], добавлен 26.12.2010

  • Определение методом регрессионного и корреляционного анализа линейных и нелинейных связей между показателями макроэкономического развития. Расчет среднего арифметического по столбцам таблицы. Определение коэффициента корреляции и уравнения регрессии.

    контрольная работа [4,2 M], добавлен 14.06.2014

  • Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.

    контрольная работа [110,4 K], добавлен 28.07.2012

  • Построение регрессионных моделей. Смысл регрессионного анализа. Выборочная дисперсия. Характеристики генеральной совокупности. Проверка статистической значимости уравнения регрессии. Оценка коэффициентов уравнения регрессии. Дисперсии случайных остатков.

    реферат [57,4 K], добавлен 25.01.2009

  • Сущность и основные этапы проведения регрессионного анализа. Виды ошибок и возможности их прогнозирования. Построение поля корреляции и гипотеза о форме связи. Порядок произведения расчета прогнозного значения результата по линейному уравнению регрессии.

    контрольная работа [372,7 K], добавлен 29.04.2010

  • Порядок построения линейного регрессионного уравнения, вычисление его основных параметров и дисперсии переменных, средней ошибки аппроксимации и стандартной ошибки остаточной компоненты. Построение линии показательной зависимости на поле корреляции.

    контрольная работа [75,1 K], добавлен 29.01.2010

  • Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.

    курсовая работа [233,1 K], добавлен 21.03.2015

  • Расчет коэффициентов уравнения регрессии и оценка их значимости. Определение среднеквадратичного отклонения и среднеквадратичной ошибки, вычисление коэффициентов регрессии. Определение критериев Стьюдента. Расчет статистических характеристик модели.

    контрольная работа [137,2 K], добавлен 14.09.2009

  • Статистический анализ по выборке. Проведение регрессионного анализа исходных данных и выбор аналитической формы записи производственной функции. Выполнение экономического анализа в выбранной регрессионной модели на основе коэффициентов эластичности.

    курсовая работа [2,2 M], добавлен 22.07.2015

  • Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

    контрольная работа [1,6 M], добавлен 14.05.2008

  • Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.

    лабораторная работа [67,8 K], добавлен 26.12.2010

  • Дисперсионный анализ - исследование причин отклонений фактических затрат от нормативных. Схемы организации исходных данных с двумя и более факторами. Формулы расчета межгрупповой и внутригрупповой дисперсии. Задачи двухфакторного дисперсионного анализа.

    курсовая работа [1,0 M], добавлен 16.01.2013

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Теоретические основы прикладного регрессионного анализа. Проверка предпосылок и предположений регрессионного анализа. Обнаружение выбросов в выборке. Рекомендации по устранению мультиколлинеарности. Пример практического применения регрессионного анализа.

    курсовая работа [1,2 M], добавлен 04.02.2011

  • Ковариационная матрица оценок коэффициентов регрессии. Оценка дисперсии ошибок. Сущность теоремы Гаусса-Маркова. Проверка статистических гипотез, доверительные интервалы. Расчет коэффициента детерминации, скорректированного коэффициента детерминации.

    контрольная работа [1,4 M], добавлен 28.07.2013

  • Равенство нулю математического ожидания случайной компоненты. Знакомство со статистическим методом однофакторного дисперсионного анализа, а также с реализацией его на ПК в различных программах. Сравнение IBM SPSS Statistics 20 и Microsoft Office 2013.

    курсовая работа [1,3 M], добавлен 29.11.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.