Построение и анализ модели множественной регрессии
Построение классической линейной модели множественной регрессии. Анализ матриц коэффициентов корреляции на наличие мультиколлинеарности. Анализ линейной модели парной регрессии с наиболее значимым фактором. Влиянием значимых факторов на результат.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 23.05.2015 |
Размер файла | 182,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Задание №1. Построение и анализ модель множественной регрессии
Вариант 15
По исходным данным требуется:
1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).
2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.
3. Построить линейную модель регрессии только со значимыми факторами (на основании выводов, сделанных в п.п. 1 и 2). Дать экономическую интерпретацию коэффициентов модели. Оценить качество построенной модели (индексы корреляции и детерминации, F-критерий Фишера, средняя относительная ошибка аппроксимации). Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, в- и Д- коэффициентов.
4. Построить и проанализировать линейную модель парной регрессии с наиболее значимым фактором. Сравнить качество моделей, построенных в п.п. 3 и 4.
5. Осуществить прогнозирование (точечный прогноз и доверительный интервал прогноза) среднего значения показателя Y при уровне значимости = 0,1 при условии, что прогнозное значения фактора X составит 80% от его максимального значения (для однофакторной модели).
6. Представить графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).
Изучите зависимость стоимости квартиры от ряда основных факторов.
Таблица 1 - Исходные данные
№ п/п |
Х1 - общая площадь квартиры (м2) |
X2 - жилая площадь квартиры (м2) |
X3 - тип дома (1 - кирпичный, 0 - другой) |
X4 - наличие балкона (1 - есть, 0 - нет) |
Y - цена квартиры, тыс. долл. |
|
1 |
39,0 |
20,0 |
0 |
1 |
15,9 |
|
2 |
68,4 |
40,5 |
0 |
1 |
27,0 |
|
3 |
34,8 |
16,0 |
0 |
1 |
13,5 |
|
4 |
39,0 |
20,0 |
0 |
1 |
15,1 |
|
5 |
54,7 |
28,0 |
0 |
1 |
21,1 |
|
6 |
74,7 |
46,3 |
0 |
1 |
28,7 |
|
7 |
71,1 |
45,9 |
0 |
0 |
27,2 |
|
8 |
74,5 |
47,5 |
0 |
0 |
28,3 |
|
9 |
137,7 |
87,2 |
0 |
1 |
52,3 |
|
10 |
40,0 |
17,7 |
1 |
1 |
22,0 |
|
11 |
53,0 |
31,1 |
1 |
1 |
28,0 |
|
12 |
86,0 |
48,7 |
1 |
1 |
45,0 |
|
13 |
98,0 |
65,8 |
1 |
1 |
51,0 |
|
14 |
62,6 |
21,4 |
1 |
1 |
34,4 |
|
15 |
45,3 |
20,6 |
1 |
1 |
24,7 |
|
16 |
56,4 |
29,7 |
1 |
1 |
30,8 |
|
17 |
37,0 |
17,8 |
0 |
1 |
15,9 |
|
18 |
67,5 |
43,5 |
0 |
1 |
29,0 |
|
19 |
37,0 |
17,8 |
0 |
1 |
15,4 |
|
20 |
69,0 |
42,4 |
0 |
1 |
28,6 |
|
21 |
40,0 |
20,0 |
0 |
0 |
15,6 |
|
22 |
69,1 |
41,3 |
0 |
1 |
27,7 |
|
23 |
68,1 |
35,4 |
1 |
1 |
34,1 |
|
24 |
75,3 |
41,4 |
1 |
1 |
37,7 |
|
25 |
83,7 |
48,5 |
1 |
1 |
41,9 |
|
26 |
48,7 |
22,3 |
1 |
1 |
24,4 |
|
27 |
39,9 |
18,0 |
1 |
0 |
21,3 |
|
28 |
68,6 |
35,5 |
1 |
1 |
36,7 |
|
29 |
39,0 |
20,0 |
1 |
0 |
21,5 |
|
30 |
48,6 |
31,0 |
1 |
0 |
26,4 |
Решение
Линейная модель множественной регрессии имеет вид:
,
где - расчётные значения исследуемой переменной,
- факторные переменные.
- коэффициенты уравнения, каждый из которых показывает, насколько изменится значение исследуемого признака при изменении соответствующего фактора на 1 при неизменных прочих факторных переменных.
Рассмотрим факторные признаки для построения регрессионной модели. множественный регрессия корреляция мультиколлинеарность
Цена квартиры - это зависимая переменная Y;
Независимые объясняющие переменные:
- общая площадь квартиры Х1;
- жилая площадь квартиры Х2;
- тип дома Х3;
- наличие балкона Х4
1. Построим классическую модель множественной регрессии
Классическая линейная модель множественной регрессии можно представить в виде:
Проведем регрессивный анализ, используя инструмент Excel «Регрессия» (Сервис - Анализ данных - Регрессия).
Таблица 2 - Протокол выполнения регрессивного анализа многофакторной модели
ВЫВОД ИТОГОВ |
|||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,9899 |
||||||||
R-квадрат |
0,9800 |
||||||||
Нормированный R-квадрат |
0,9768 |
||||||||
Стандартная ошибка |
1,5612 |
||||||||
Наблюдения |
30 |
||||||||
Дисперсионный анализ |
|||||||||
|
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
4 |
2979,3358 |
744,8339 |
305,5792 |
7,88E-21 |
||||
Остаток |
25 |
60,9362 |
2,4374 |
||||||
Итого |
29 |
3040,2720 |
|||||||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
|
Y-пересечение |
-1,4274 |
1,0985 |
-1,2994 |
0,2057 |
-3,6897 |
0,8350 |
-3,6897 |
0,8350 |
|
Переменная X 1 |
0,3541 |
0,0663 |
5,3387 |
0,0000 |
0,2175 |
0,4907 |
0,2175 |
0,4907 |
|
Переменная X 2 |
0,0743 |
0,0905 |
0,8207 |
0,4196 |
-0,1121 |
0,2607 |
-0,1121 |
0,2607 |
|
Переменная X 3 |
8,1470 |
0,6364 |
12,8010 |
0,0000 |
6,8363 |
9,4578 |
6,8363 |
9,4578 |
|
Переменная X 4 |
1,6286 |
0,7845 |
2,0759 |
0,0483 |
0,0129 |
3,2443 |
0,0129 |
3,2443 |
Из анализа получаем коэффициенты уравнения.
Уравнение регрессии зависимости цены квартиры от независимых объясняющих переменных принимает вид:
y = -1,4274 + 0,3541 x1 + 0,0743 x2 + 8,1470 x3 + 1,6286 x4
Оценим качество модели.
Определим коэффициент детерминации.
R2 =
Коэффициент детерминации показывает, что около 98% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Коэффициент множественной корреляции R = 0,9899
Он показывает высокую тесноту связи зависимой переменной Y с двумя включенными в модель объясняющими факторами.
Оценим значимость модели в целом на основе вычисления F-критерия Фишера.
По данным дисперсионного анализа F = 305,5792
Табличное значение F-критерия со степенями свободы х 1= k и х2 = (n - k - 1), где n = 30 (количество наблюдений), k = 4 (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()
F табл = 2,7587
Поскольку F > Fтабл , уравнение регрессии следует признать адекватным.
С помощью t-статистики Стьюдента оценим статистическую значимость отдельных параметров.
По данным дисперсионного анализа:
tb0 = -1,2994, tb1 = 5,3387, tb2 = 0,8207, tb3 = 12,8010, tb4 = 2,0759
Табличное значение t-статистики Стьюдента найдем с помощью функции СТЬЮДРАСПОБР()
t табл = 2,0595
Среди всех коэффициентов значимыми (tb > tтабл) являются коэффициенты b1, b3 и b4.
По такой модели прогноз сделать не представляется возможным, поскольку большинство коэффициентов регрессии при переменных не значимы.
2. Проведем корреляционный анализ для исключения незначимых факторов и устранения мультиколлинеарности.
Используем инструмент Excel «Корреляция» (Сервис - Анализ данных - Корреляция).
Таблица 3 - Матрица коэффициентов парной корреляции
|
y - цена квартиры, тыс. долл. |
x1 - общая площадь квартиры (м2) |
x2 - жилая площадь квартиры (м2) |
x3 - тип дома (1- кирпичный, 0 - другой) |
x4 - наличие балкона (1- есть, 0 - нет) |
|
y - цена квартиры, тыс. долл. |
1 |
|||||
x1 - общая площадь квартиры (м2) |
0,9066 |
1 |
||||
x2 - жилая площадь квартиры (м2) |
0,8438 |
0,9725 |
1 |
|||
x3 - тип дома (1- кирпичный, 0 - другой) |
0,3927 |
-0,0005 |
-0,0976 |
1 |
||
x4 -наличие балкона (1- есть, 0 - нет) |
0,2313 |
0,1967 |
0,1133 |
0 |
1 |
Анализ матрицы показывает, что цена квартиры имеет тесную связь с индексами:
x1 - общая площадь квартиры (0,9066)
x2 - жилая площадь квартиры (0,8438)
Факторы х1 и х2 тесно связаны между собой (0,9725 > 0,8438), т. е. наблюдается мультиколлинеарность, поэтому оставляем в модели фактор х1.
После исключения незначимых факторов n = 30, k = 1
3. Построим линейную модель регрессии только со значимыми факторами.
Таблица 3 - Протокол выполнения регрессионного анализа только со значимыми факторами
ВЫВОД ИТОГОВ |
|||||||||
Регрессионная статистика |
|||||||||
Множественный R |
0,9066 |
||||||||
R-квадрат |
0,8220 |
||||||||
Нормированный R-квадрат |
0,8156 |
||||||||
Стандартная ошибка |
4,3968 |
||||||||
Наблюдения |
30 |
||||||||
Дисперсионный анализ |
|||||||||
|
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
1 |
2498,9831 |
2498,9831 |
129,2684 |
5,26E-12 |
||||
Остаток |
28 |
541,2889 |
19,3317 |
||||||
Итого |
29 |
3040,2720 |
|||||||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
|
Y-пересечение |
2,9342 |
2,3495 |
1,2488 |
0,2221 |
-1,8786 |
7,7470 |
-1,8786 |
7,7470 |
|
Переменная X 1 |
0,4123 |
0,0363 |
11,3696 |
0,0000 |
0,3380 |
0,4866 |
0,3380 |
0,4866 |
Из анализа получаем коэффициенты уравнения регрессии а0, а1.
Уравнение регрессии зависимости цены квартиры только от общей площади квартиры принимает вид:
y = 2,9342 + 0,4123x1
Это означает, что величина стоимости квартиры в среднем по совокупности возрастала на 412,3 долларов при увеличении общей площади квартиры на 1 м2.
Оценим качество построенной модели, определив коэффициент детерминации.
R2 = 1 -
Коэффициент детерминации показывает, что около 82,2% вариации зависимой переменной учтено в модели и обусловлено влиянием наиболее значимого фактора.
Коэффициент множественной корреляции R = 0,9066
Он показывает высокую тесноту связи зависимой переменной у с объясняющим фактором.
Оценим значимость модели в целом на основе вычисления F-критерия Фишера.
По данным дисперсионного анализа F = 129,2684
Табличное значение F-критерия со степенями свободы х1= k и х2 = (n - k - 1), где n = 30 (количество наблюдений), k = 1 (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()
Fтабл = 4,19597
Поскольку F > Fтабл, уравнение регрессии следует признать адекватным.
Определим среднюю относительную ошибку аппроксимации:
Еотн.ср. 14,85
Поскольку Eотн.ср. меньше 15%, следовательно точность считается удовлетворительной.
4. Осуществим прогнозирование среднего значения показателя Y при условии, что прогнозное значения фактора X составит 80% от его максимального значения.
Точечный прогноз вычисляем путём подстановки в уравнение прогнозного значения факторной переменной:
Для однофакторной модели максимальное значение Х = 137,7 Ч 80% = 110,16
= 48,3547
Доверительный интервал прогноза зависит от стандартной ошибки, удаления xпрогн от своего среднего значения в ряде наблюдений xср, количества наблюдений n и уровня значимости прогноза б :
Стандартная ошибка Sст = 4,3968 (по данным таблицы 3).
t0,1 = СТЬЮДРАСПОБР(0,1; 28) = 1,7011
Доверительный интервал L = 1,3204
Фактические значения исследуемого признака с вероятностью (1 - б) попадут в интервал
.
5. Представим графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).
Таблица 4 - Прогнозирование цены
№ п/п |
Фактическое y - цена квартиры, тыс. долл. |
x1 - общая площадь квартиры, (м2) |
Предсказанное y - цена квартиры, тыс. долл. |
|
1 |
15,9 |
39 |
19,0144 |
|
2 |
27 |
68,4 |
31,1365 |
|
3 |
13,5 |
34,8 |
17,2827 |
|
4 |
15,1 |
39 |
19,0144 |
|
5 |
21,1 |
54,7 |
25,4878 |
|
6 |
28,7 |
74,7 |
33,7341 |
|
7 |
27,2 |
71,1 |
32,2497 |
|
8 |
28,3 |
74,5 |
33,6516 |
|
9 |
52,3 |
137,7 |
59,7098 |
|
10 |
22 |
40 |
19,4268 |
|
11 |
28 |
53 |
24,7868 |
|
12 |
45 |
86 |
38,3932 |
|
13 |
51 |
98 |
43,3410 |
|
14 |
34,4 |
62,6 |
28,7451 |
|
15 |
24,7 |
45,3 |
21,6120 |
|
16 |
30,8 |
56,4 |
26,1887 |
|
17 |
15,9 |
37 |
18,1898 |
|
18 |
29 |
67,5 |
30,7654 |
|
19 |
15,4 |
37 |
18,1898 |
|
20 |
28,6 |
69 |
31,3839 |
|
21 |
15,6 |
40 |
19,4268 |
|
22 |
27,7 |
69,1 |
31,4251 |
|
23 |
34,1 |
68,1 |
31,0128 |
|
24 |
37,7 |
75,3 |
33,9814 |
|
25 |
41,9 |
83,7 |
37,4449 |
|
26 |
24,4 |
48,7 |
23,0139 |
|
27 |
21,3 |
39,9 |
19,3855 |
|
28 |
36,7 |
68,6 |
31,2189 |
|
29 |
21,5 |
39 |
19,0144 |
|
30 |
26,4 |
48,6 |
22,9727 |
|
31 |
110,16 |
48,3547 |
Таблица 5 - Результаты прогнозных оценок
Прогнозируемое значение |
48,3547 |
|
Уровень значимости |
0,1 |
|
Стандартная ошибка |
4,3968 |
|
Размер выборки |
30 |
|
Число степеней свободы |
28 |
|
Табличное t-статистики Стьюдента |
1,7011 |
|
Доверительный интервал |
1,3204 |
|
Нижняя граница Y |
47,0343 |
|
Верхняя граница Y |
49,6751 |
Размещено на Allbest.ru
...Подобные документы
Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.
курсовая работа [352,9 K], добавлен 26.01.2010Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.
контрольная работа [68,7 K], добавлен 21.09.2009Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.
контрольная работа [380,9 K], добавлен 05.04.2015Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.
презентация [387,8 K], добавлен 25.05.2015Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
лабораторная работа [22,3 K], добавлен 15.04.2014Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.
контрольная работа [1,2 M], добавлен 05.08.2010Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.
контрольная работа [814,0 K], добавлен 19.12.2013Составление математической модели для предприятия, характеризующей выручку предприятия "АВС" в зависимости от капиталовложений (млн. руб.) за последние 10 лет. Расчет поля корреляции, параметров линейной регрессии. Сводная таблица расчетов и вычислений.
курсовая работа [862,4 K], добавлен 06.05.2009Определение наличия зависимости показателя Заработная плата от Возраста и Стажа с использованием корреляционной матрицы. Нормальность распределения остатков по: гистограмме остатков, числовым характеристикам асимметрии и эксцессу, критерию Пирсона.
курсовая работа [1,1 M], добавлен 05.12.2013Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.
задача [133,0 K], добавлен 21.12.2008Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.
контрольная работа [242,1 K], добавлен 05.11.2011Построение многофакторной корреляционно-регрессионной модели доходности предприятия: оценка параметров функции регрессии, анализ факторов на управляемость, экономическая интерпретация модели. Прогнозирование доходности на основе временных рядов.
дипломная работа [5,1 M], добавлен 28.06.2011Определения оптимизации схемы планирования эксперимента при работе со швейной машиной. Расчёт коэффициентов уравнения регрессии и выделение значимых коэффициентов прочности ткани и растяжения между лапкой и иглой. Проверка гипотезы адекватности модели.
курсовая работа [1,2 M], добавлен 30.12.2014Метод планирования второго порядка на примере В3-плана. Получение и исследование математической модели объекта в виде полинома второго порядка. Статистический анализ полученного уравнения и построение поверхностей отклика. Расчет коэффициентов регрессии.
курсовая работа [128,4 K], добавлен 18.11.2010Построение математической модели технологического процесса напыления резисторов методами полного и дробного факторного эксперимента. Составление матрицы планирования. Рандомизация и проверка воспроизводимости. Оценка коэффициентов уравнения регрессии.
курсовая работа [694,5 K], добавлен 27.12.2021Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.
курсовая работа [593,2 K], добавлен 28.06.2009Cтатистический анализ зависимости давления. Построение диаграммы рассеивания и корреляционной таблицы. Вычисление параметров для уравнений линейной и параболической регрессии, выборочных параметров. Проверка гипотезы о нормальном распределении признака.
курсовая работа [613,3 K], добавлен 24.10.2012Построение теоретико-вероятностной модели исследуемого явления случайной величины математическими выводами. Реализация выборки статистической моделью, описывающей серию опытов. Точечная (выборочная) оценка неизвестного параметра и кривая регрессии.
курсовая работа [311,7 K], добавлен 10.04.2011Определение частных производных первого и второго порядков заданной функции, эластичности спроса, основываясь на свойствах функции спроса. Выравнивание данных по прямой методом наименьших квадратов. Расчет параметров уравнения линейной парной регрессии.
контрольная работа [99,4 K], добавлен 22.07.2009