Построение и анализ модели множественной регрессии

Построение классической линейной модели множественной регрессии. Анализ матриц коэффициентов корреляции на наличие мультиколлинеарности. Анализ линейной модели парной регрессии с наиболее значимым фактором. Влиянием значимых факторов на результат.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 23.05.2015
Размер файла 182,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Задание №1. Построение и анализ модель множественной регрессии

Вариант 15

По исходным данным требуется:

1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).

2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.

3. Построить линейную модель регрессии только со значимыми факторами (на основании выводов, сделанных в п.п. 1 и 2). Дать экономическую интерпретацию коэффициентов модели. Оценить качество построенной модели (индексы корреляции и детерминации, F-критерий Фишера, средняя относительная ошибка аппроксимации). Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, в- и Д- коэффициентов.

4. Построить и проанализировать линейную модель парной регрессии с наиболее значимым фактором. Сравнить качество моделей, построенных в п.п. 3 и 4.

5. Осуществить прогнозирование (точечный прогноз и доверительный интервал прогноза) среднего значения показателя Y при уровне значимости = 0,1 при условии, что прогнозное значения фактора X составит 80% от его максимального значения (для однофакторной модели).

6. Представить графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).

Изучите зависимость стоимости квартиры от ряда основных факторов.

Таблица 1 - Исходные данные

№ п/п

Х1 - общая площадь квартиры (м2)

X2 - жилая площадь квартиры (м2)

X3 - тип дома (1 - кирпичный, 0 - другой)

X4 - наличие балкона (1 - есть, 0 - нет)

Y - цена квартиры, тыс. долл.

1

39,0

20,0

0

1

15,9

2

68,4

40,5

0

1

27,0

3

34,8

16,0

0

1

13,5

4

39,0

20,0

0

1

15,1

5

54,7

28,0

0

1

21,1

6

74,7

46,3

0

1

28,7

7

71,1

45,9

0

0

27,2

8

74,5

47,5

0

0

28,3

9

137,7

87,2

0

1

52,3

10

40,0

17,7

1

1

22,0

11

53,0

31,1

1

1

28,0

12

86,0

48,7

1

1

45,0

13

98,0

65,8

1

1

51,0

14

62,6

21,4

1

1

34,4

15

45,3

20,6

1

1

24,7

16

56,4

29,7

1

1

30,8

17

37,0

17,8

0

1

15,9

18

67,5

43,5

0

1

29,0

19

37,0

17,8

0

1

15,4

20

69,0

42,4

0

1

28,6

21

40,0

20,0

0

0

15,6

22

69,1

41,3

0

1

27,7

23

68,1

35,4

1

1

34,1

24

75,3

41,4

1

1

37,7

25

83,7

48,5

1

1

41,9

26

48,7

22,3

1

1

24,4

27

39,9

18,0

1

0

21,3

28

68,6

35,5

1

1

36,7

29

39,0

20,0

1

0

21,5

30

48,6

31,0

1

0

26,4

Решение

Линейная модель множественной регрессии имеет вид:

,

где - расчётные значения исследуемой переменной,

- факторные переменные.

- коэффициенты уравнения, каждый из которых показывает, насколько изменится значение исследуемого признака при изменении соответствующего фактора на 1 при неизменных прочих факторных переменных.

Рассмотрим факторные признаки для построения регрессионной модели. множественный регрессия корреляция мультиколлинеарность

Цена квартиры - это зависимая переменная Y;

Независимые объясняющие переменные:

- общая площадь квартиры Х1;

- жилая площадь квартиры Х2;

- тип дома Х3;

- наличие балкона Х4

1. Построим классическую модель множественной регрессии

Классическая линейная модель множественной регрессии можно представить в виде:

Проведем регрессивный анализ, используя инструмент Excel «Регрессия» (Сервис - Анализ данных - Регрессия).

Таблица 2 - Протокол выполнения регрессивного анализа многофакторной модели

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,9899

R-квадрат

0,9800

Нормированный R-квадрат

0,9768

Стандартная ошибка

1,5612

Наблюдения

30

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

4

2979,3358

744,8339

305,5792

7,88E-21

Остаток

25

60,9362

2,4374

Итого

29

3040,2720

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-1,4274

1,0985

-1,2994

0,2057

-3,6897

0,8350

-3,6897

0,8350

Переменная X 1

0,3541

0,0663

5,3387

0,0000

0,2175

0,4907

0,2175

0,4907

Переменная X 2

0,0743

0,0905

0,8207

0,4196

-0,1121

0,2607

-0,1121

0,2607

Переменная X 3

8,1470

0,6364

12,8010

0,0000

6,8363

9,4578

6,8363

9,4578

Переменная X 4

1,6286

0,7845

2,0759

0,0483

0,0129

3,2443

0,0129

3,2443

Из анализа получаем коэффициенты уравнения.

Уравнение регрессии зависимости цены квартиры от независимых объясняющих переменных принимает вид:

y = -1,4274 + 0,3541 x1 + 0,0743 x2 + 8,1470 x3 + 1,6286 x4

Оценим качество модели.

Определим коэффициент детерминации.

R2 =

Коэффициент детерминации показывает, что около 98% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Коэффициент множественной корреляции R = 0,9899

Он показывает высокую тесноту связи зависимой переменной Y с двумя включенными в модель объясняющими факторами.

Оценим значимость модели в целом на основе вычисления F-критерия Фишера.

По данным дисперсионного анализа F = 305,5792

Табличное значение F-критерия со степенями свободы х 1= k и х2 = (n - k - 1), где n = 30 (количество наблюдений), k = 4 (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()

F табл = 2,7587

Поскольку F > Fтабл , уравнение регрессии следует признать адекватным.

С помощью t-статистики Стьюдента оценим статистическую значимость отдельных параметров.

По данным дисперсионного анализа:

tb0 = -1,2994, tb1 = 5,3387, tb2 = 0,8207, tb3 = 12,8010, tb4 = 2,0759

Табличное значение t-статистики Стьюдента найдем с помощью функции СТЬЮДРАСПОБР()

t табл = 2,0595

Среди всех коэффициентов значимыми (tb > tтабл) являются коэффициенты b1, b3 и b4.

По такой модели прогноз сделать не представляется возможным, поскольку большинство коэффициентов регрессии при переменных не значимы.

2. Проведем корреляционный анализ для исключения незначимых факторов и устранения мультиколлинеарности.

Используем инструмент Excel «Корреляция» (Сервис - Анализ данных - Корреляция).

Таблица 3 - Матрица коэффициентов парной корреляции

y - цена квартиры, тыс. долл.

x1 - общая площадь квартиры (м2)

x2 - жилая площадь квартиры (м2)

x3 - тип дома (1- кирпичный, 0 - другой)

x4 - наличие балкона (1- есть, 0 - нет)

y - цена квартиры, тыс. долл.

1

x1 - общая площадь квартиры (м2)

0,9066

1

x2 - жилая площадь квартиры (м2)

0,8438

0,9725

1

x3 - тип дома (1- кирпичный, 0 - другой)

0,3927

-0,0005

-0,0976

1

x4 -наличие балкона (1- есть, 0 - нет)

0,2313

0,1967

0,1133

0

1

Анализ матрицы показывает, что цена квартиры имеет тесную связь с индексами:

x1 - общая площадь квартиры (0,9066)

x2 - жилая площадь квартиры (0,8438)

Факторы х1 и х2 тесно связаны между собой (0,9725 > 0,8438), т. е. наблюдается мультиколлинеарность, поэтому оставляем в модели фактор х1.

После исключения незначимых факторов n = 30, k = 1

3. Построим линейную модель регрессии только со значимыми факторами.

Таблица 3 - Протокол выполнения регрессионного анализа только со значимыми факторами

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,9066

R-квадрат

0,8220

Нормированный R-квадрат

0,8156

Стандартная ошибка

4,3968

Наблюдения

30

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

2498,9831

2498,9831

129,2684

5,26E-12

Остаток

28

541,2889

19,3317

Итого

29

3040,2720

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

2,9342

2,3495

1,2488

0,2221

-1,8786

7,7470

-1,8786

7,7470

Переменная X 1

0,4123

0,0363

11,3696

0,0000

0,3380

0,4866

0,3380

0,4866

Из анализа получаем коэффициенты уравнения регрессии а0, а1.

Уравнение регрессии зависимости цены квартиры только от общей площади квартиры принимает вид:

y = 2,9342 + 0,4123x1

Это означает, что величина стоимости квартиры в среднем по совокупности возрастала на 412,3 долларов при увеличении общей площади квартиры на 1 м2.

Оценим качество построенной модели, определив коэффициент детерминации.

R2 = 1 -

Коэффициент детерминации показывает, что около 82,2% вариации зависимой переменной учтено в модели и обусловлено влиянием наиболее значимого фактора.

Коэффициент множественной корреляции R = 0,9066

Он показывает высокую тесноту связи зависимой переменной у с объясняющим фактором.

Оценим значимость модели в целом на основе вычисления F-критерия Фишера.

По данным дисперсионного анализа F = 129,2684

Табличное значение F-критерия со степенями свободы х1= k и х2 = (n - k - 1), где n = 30 (количество наблюдений), k = 1 (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()

Fтабл = 4,19597

Поскольку F > Fтабл, уравнение регрессии следует признать адекватным.

Определим среднюю относительную ошибку аппроксимации:

Еотн.ср. 14,85

Поскольку Eотн.ср. меньше 15%, следовательно точность считается удовлетворительной.

4. Осуществим прогнозирование среднего значения показателя Y при условии, что прогнозное значения фактора X составит 80% от его максимального значения.

Точечный прогноз вычисляем путём подстановки в уравнение прогнозного значения факторной переменной:

Для однофакторной модели максимальное значение Х = 137,7 Ч 80% = 110,16

= 48,3547

Доверительный интервал прогноза зависит от стандартной ошибки, удаления xпрогн от своего среднего значения в ряде наблюдений xср, количества наблюдений n и уровня значимости прогноза б :

Стандартная ошибка Sст = 4,3968 (по данным таблицы 3).

t0,1 = СТЬЮДРАСПОБР(0,1; 28) = 1,7011

Доверительный интервал L = 1,3204

Фактические значения исследуемого признака с вероятностью (1 - б) попадут в интервал

.

5. Представим графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).

Таблица 4 - Прогнозирование цены

№ п/п

Фактическое y - цена квартиры, тыс. долл.

x1 - общая площадь квартиры, (м2)

Предсказанное y - цена квартиры, тыс. долл.

1

15,9

39

19,0144

2

27

68,4

31,1365

3

13,5

34,8

17,2827

4

15,1

39

19,0144

5

21,1

54,7

25,4878

6

28,7

74,7

33,7341

7

27,2

71,1

32,2497

8

28,3

74,5

33,6516

9

52,3

137,7

59,7098

10

22

40

19,4268

11

28

53

24,7868

12

45

86

38,3932

13

51

98

43,3410

14

34,4

62,6

28,7451

15

24,7

45,3

21,6120

16

30,8

56,4

26,1887

17

15,9

37

18,1898

18

29

67,5

30,7654

19

15,4

37

18,1898

20

28,6

69

31,3839

21

15,6

40

19,4268

22

27,7

69,1

31,4251

23

34,1

68,1

31,0128

24

37,7

75,3

33,9814

25

41,9

83,7

37,4449

26

24,4

48,7

23,0139

27

21,3

39,9

19,3855

28

36,7

68,6

31,2189

29

21,5

39

19,0144

30

26,4

48,6

22,9727

31

110,16

48,3547

Таблица 5 - Результаты прогнозных оценок

Прогнозируемое значение

48,3547

Уровень значимости

0,1

Стандартная ошибка

4,3968

Размер выборки

30

Число степеней свободы

28

Табличное t-статистики Стьюдента

1,7011

Доверительный интервал

1,3204

Нижняя граница Y

47,0343

Верхняя граница Y

49,6751

Размещено на Allbest.ru

...

Подобные документы

  • Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.

    курсовая работа [352,9 K], добавлен 26.01.2010

  • Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.

    контрольная работа [68,7 K], добавлен 21.09.2009

  • Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.

    контрольная работа [380,9 K], добавлен 05.04.2015

  • Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.

    презентация [387,8 K], добавлен 25.05.2015

  • Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.

    лабораторная работа [22,3 K], добавлен 15.04.2014

  • Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.

    контрольная работа [1,2 M], добавлен 05.08.2010

  • Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.

    контрольная работа [814,0 K], добавлен 19.12.2013

  • Составление математической модели для предприятия, характеризующей выручку предприятия "АВС" в зависимости от капиталовложений (млн. руб.) за последние 10 лет. Расчет поля корреляции, параметров линейной регрессии. Сводная таблица расчетов и вычислений.

    курсовая работа [862,4 K], добавлен 06.05.2009

  • Определение наличия зависимости показателя Заработная плата от Возраста и Стажа с использованием корреляционной матрицы. Нормальность распределения остатков по: гистограмме остатков, числовым характеристикам асимметрии и эксцессу, критерию Пирсона.

    курсовая работа [1,1 M], добавлен 05.12.2013

  • Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.

    задача [133,0 K], добавлен 21.12.2008

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.

    контрольная работа [242,1 K], добавлен 05.11.2011

  • Построение многофакторной корреляционно-регрессионной модели доходности предприятия: оценка параметров функции регрессии, анализ факторов на управляемость, экономическая интерпретация модели. Прогнозирование доходности на основе временных рядов.

    дипломная работа [5,1 M], добавлен 28.06.2011

  • Определения оптимизации схемы планирования эксперимента при работе со швейной машиной. Расчёт коэффициентов уравнения регрессии и выделение значимых коэффициентов прочности ткани и растяжения между лапкой и иглой. Проверка гипотезы адекватности модели.

    курсовая работа [1,2 M], добавлен 30.12.2014

  • Метод планирования второго порядка на примере В3-плана. Получение и исследование математической модели объекта в виде полинома второго порядка. Статистический анализ полученного уравнения и построение поверхностей отклика. Расчет коэффициентов регрессии.

    курсовая работа [128,4 K], добавлен 18.11.2010

  • Построение математической модели технологического процесса напыления резисторов методами полного и дробного факторного эксперимента. Составление матрицы планирования. Рандомизация и проверка воспроизводимости. Оценка коэффициентов уравнения регрессии.

    курсовая работа [694,5 K], добавлен 27.12.2021

  • Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.

    курсовая работа [593,2 K], добавлен 28.06.2009

  • Cтатистический анализ зависимости давления. Построение диаграммы рассеивания и корреляционной таблицы. Вычисление параметров для уравнений линейной и параболической регрессии, выборочных параметров. Проверка гипотезы о нормальном распределении признака.

    курсовая работа [613,3 K], добавлен 24.10.2012

  • Построение теоретико-вероятностной модели исследуемого явления случайной величины математическими выводами. Реализация выборки статистической моделью, описывающей серию опытов. Точечная (выборочная) оценка неизвестного параметра и кривая регрессии.

    курсовая работа [311,7 K], добавлен 10.04.2011

  • Определение частных производных первого и второго порядков заданной функции, эластичности спроса, основываясь на свойствах функции спроса. Выравнивание данных по прямой методом наименьших квадратов. Расчет параметров уравнения линейной парной регрессии.

    контрольная работа [99,4 K], добавлен 22.07.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.