Множественная модель зависимости стоимости квартиры от ее характеристик и расположения
Построение средствами регрессионного анализа математической модели зависимости стоимости квартиры в городе Смоленске от характеристик квартиры и ее расположения в городе. Построение уравнения множественной регрессии. Матрица парных коэффициентов.
Рубрика | Экономико-математическое моделирование |
Вид | статья |
Язык | русский |
Дата добавления | 21.02.2018 |
Размер файла | 159,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МНОЖЕСТВЕННАЯ МОДЕЛЬ ЗАВИСИМОСТИ СТОИМОСТИ КВАРТИРЫ ОТ ЕЁ ХАРАКТЕРИСТИК И РАСПОЛОЖЕНИЯ
Кульков Алексей Владимирович, магистр, студент
Смоленский государственный университет, г. Смоленск
В статье предложена математическая модель зависимости стоимости квартиры в городе Смоленске от её характеристик и расположения в городе. Полученная модель пригодна для получения прогноза цены квартиры и является статистически значимой.
В данной работе в качестве предмета выбрана вторичная недвижимость города Смоленска, в качестве объекта -- влияние характеристик квартиры и её расположения в пределах города на цену квартиры. Цель работы -- построить средствами регрессионного анализа математическую модель зависимости стоимости квартиры в городе Смоленске от характеристик квартиры и её расположения в городе. В качестве инструмента выступает программный пакет для статистического анализа данных Statistica. Для анализа, используя сайт объявлений «Авито» [1] составлена база, содержащая 320 наблюдений по выбранным характеристикам.
В качестве зависимого признака выступает стоимость квартиры Y (цена квартиры, руб). В качестве независимых выбраны следующие: X1 -- количество комнат; X2 -- общая площадь, м2; X3 -- жилая площадь, м2; X4 -- площадь кухни, м2; X5 -- тип дома (1 -- панельный, 2 -- кирпичный); X6 -- наличие балкона/лоджии (1 -- нет, 2 есть); X7 -- расположение (1 -- угловая, 2 -- не угловая); X8 -- район города (1 -- Заднепровский, 2 -- Промышленный, 3 -- Ленинский);
Следует отметить, что переменные, Y, X2 -- X4 непрерывные, X1, X5, X8 -- категориальные переменные.
Задача работы состоит в построении уравнения множественной регрессии для предложенных данных в виде:
Y=f(X1, X2,..., X8). (1)
На первом этапе работы следует проверить нормальность непрерывных величин. Это можно сделать путём построения графиков «на нормальной бумаге» в пакете Statistica. На рисунке 1 «Нормальность непрерывных величин» представлены нормальные графики для переменных Y, X2 -- X4.
Рисунок 1. Нормальность непрерывных величин
В результате можно сделать вывод, что все непрерывные переменные имеют нормальное распределение. Для категориальных переменных нормальность не вызывает сомнения.
Рассмотрим уравнение линейной множественной регрессии, то есть функция в уравнении (1) -- линейная комбинация переменных X1 -- X8.
Перед построением уравнения регрессии необходимо убедиться в отсутствии мультиколлинеарности -- линейной зависимости между зависимыми переменными. Наличие мультиколлинеарности может привести к неустойчивости оценок коэффициентов линейной регрессии, завышению дисперсии этих коэффициентов и к завышению значения множественного коэффициента корреляции [2].
Информацию о мультиколлинеарности можно получить, если посмотреть на исходную матрицу корреляций. Если в данной матрице присутствуют высокие парные коэффициенты корреляции между какими-либо двумя переменными, то для избавления мультиколлинеарности достаточно убрать из анализа одну из этих переменных.
Исходя из рисунка 2 «Матрица парных коэффициентов» заключаем, что из анализа следует убрать переменные X1(количество комнат) и X2 (общая площадь).
Рисунок 2. Матрица парных коэффициентов
Таким образом, линейная регрессионная модель будет содержать переменные X3 -- X8.
Средствами пакета Statistica получена линейная модель зависимости цены квартиры в городе Смоленске от факторов X3-- X8 в виде:
Y=a0+a1·X3+a2·X4+a3·X5+a4·X6+a5·X7+a6·X8 (2)
В результате получены результаты, представленные в таблице 1 «Результаты линейной модели»
Таблица 1. Результаты линейной модели
Параметр |
Коэффициент a |
Стандартная ошибка a |
Значение t -- критерия |
Значение p |
|
Свободный член |
-1130512 |
150018 |
-7,536 |
0,000000 |
|
X3 |
30728 |
2122 |
14,478 |
0,000000 |
|
X4 |
119268 |
9266 |
12,870 |
0,000000 |
|
X5 |
145692 |
43109 |
3,380 |
0,000818 |
|
X6 |
198938 |
47676 |
4,173 |
0,000039 |
|
X7 |
142027 |
41547 |
3,418 |
0,000713 |
|
X8 |
161428 |
26481 |
6,096 |
0,000000 |
Таким образом, модель (2) принимает вид:
Y=-1130512+30728·X3+119268·X4+145692·X5+198938·X6+142027·X7+161428·X8 (3)
Коэффициент a, входящие в уравнение являются статистически значимыми, так как tтабл = 1,96< |tнабл | на уровне значимости 0,05.
Статистическая значимость модели (3) обусловлена высоким значением коэффициента множественной корреляции R=0,81 и тем, что значение критерия Фишера, равного в данной модели 100,933 больше табличного, равного 2,25 при соответствующем числе степеней свободы и уровне значимости 0,05. Так же следует отметить, что коэффициент детерминации R2=0,67, что означает описание уравнением (3) 67% изменения зависимой переменной Y.
При анализе остатков, полученных по модели (3) выявлена их нормальность. На рисунке 3 «Остатки» представлены график «на нормальной бумаге» и гистограмма нормального распределения.
Рисунок 3. Остатки
Для определения величины вклада каждой переменной в изменение результирующей переменой, необходимо определить коэффициенты уравнение (2) для стандартизированных переменных X3 -- X8 путём построения множественной линейной модели с этими переменными. В таблице 2 «Коэффициенты регрессионного уравнения» приведены значения коэффициентов регрессионной модели для стандартизированных переменных. Чем больше величина коэффициента, тем больше вклад соответствующей переменной на изменение результирующей.
математический стоимость квартира регрессия
Таблица 2. Коэффициенты регрессионного уравнения
Параметр |
Коэффициент a |
|
X3 |
0,482502 |
|
X4 |
0,466647 |
|
X5 |
0,116473 |
|
X6 |
0,149981 |
|
X7 |
0,114137 |
|
X8 |
0,206513 |
На зависимую переменную Y (стоимость квартиры в городе Смоленске) наибольшее влияние оказывают следующие переменные:
X3 -- жилая площадь, м2;X4 -- площадь кухни, м2;X8 -- район города.
Положительное значение данных коэффициентов говорит о росте Y (стоимость квартиры в городе Смоленске) с увеличением X3, X4, X8.
Таким образом, уравнение зависимости стоимости квартиры в городе Смоленске от параметров X3 -- X8 имеет вид:
Y=-1130512+30728·X3+119268·X4+145692·X5+198938·X6+142027·X7+161428·X8
Наибольшее влияние на стоимость квартиры оказывают показатели, характеризующие площадь и её местонахождении в городе. Наибольшую стоимость имеют квартиры, расположенные в Ленинском районе (это центральный исторический район города), а наименьшую -- в Заднепровским (данный район достаточно удалён от центра города, крупных торговых центров и основных производств).
Список литературы
1. Avito. Сайт объявлений №1 в России. [Электронный ресурс] URL: https://www.avito.ru Дата: 27.11.2011
2. Курс социально-экономической статистики. Под редакцией М. Г. Назарова. - 6-е издание, исправленное и дополненное. - Сер. Высшее экономическое образование / М. Г. Назаров, В. В. Елизаров, Н. М. Калмыкова, и. др. -- Омега-Л Москва, 2007. -- С. 987.
Размещено на Allbest.ru
...Подобные документы
Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.
лабораторная работа [1,8 M], добавлен 25.05.2009Построение математической модели выбранного экономического явления методами регрессионного анализа. Линейная регрессионная модель. Выборочный коэффициент корреляции. Метод наименьших квадратов для модели множественной регрессии, статистические гипотезы.
курсовая работа [1,1 M], добавлен 22.05.2015Факторы, формирующие цену квартир в строящихся домах в Санкт-Петербурге. Составление матрицы парных коэффициентов корреляции исходных переменных. Тестирование ошибок уравнения множественной регрессии на гетероскедастичность. Тест Гельфельда-Квандта.
контрольная работа [1,2 M], добавлен 14.05.2015Взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей. Матрица парных коэффициентов корреляции. Уравнение множественной регрессии. Расчет коэффициентов для проверки наличия автокорреляция. Вариации зависимой переменной.
контрольная работа [43,7 K], добавлен 03.09.2013Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.
курсовая работа [243,1 K], добавлен 17.01.2016Основы построения и тестирования адекватности экономических моделей множественной регрессии, проблема их спецификации и последствия ошибок. Методическое и информационное обеспечение множественной регрессии. Числовой пример модели множественной регрессии.
курсовая работа [3,4 M], добавлен 10.02.2014Параметры автомобиля, которые влияют на стоимость. Обозначение границ выборки. Использование множественной регрессии. Построение с помощью эконометрического программного пакета Eviews симметричной матрицы парных коэффициентов корреляции между факторами.
контрольная работа [348,7 K], добавлен 13.05.2015Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.
контрольная работа [179,4 K], добавлен 25.03.2014Сущность экономико-математической модели, ее идентификация и определение достаточной структуры для моделирования. Построение уравнения регрессии. Синтез и построение модели с учетом ее особенностей и математической спецификации. Верификация модели.
контрольная работа [73,9 K], добавлен 23.01.2009Построение уравнения регрессии, учитывающего взаимодействия факторов, проверка полученной модели на адекватность. Построение математической модели и нахождение численных значений параметров этой модели. Вычисление коэффициентов линейной модели.
курсовая работа [1005,0 K], добавлен 07.08.2013- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.
задача [83,2 K], добавлен 20.01.2010 Понятие модели множественной регрессии. Сущность метода наименьших квадратов, который используется для определения параметров уравнения множественной линейной регрессии. Оценка качества подгонки регрессионного уравнения к данным. Коэффициент детерминации.
курсовая работа [449,1 K], добавлен 22.01.2015Анализ влияния основных социально-экономических показателей на результативный признак. Особенности классической линейной модели множественной регрессии, ее анализ на наличие или отсутствие гетероскедастичности в регрессионных остатках и их автокорреляции.
лабораторная работа [573,8 K], добавлен 17.02.2014Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.
лабораторная работа [214,2 K], добавлен 17.10.2009Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010Построение регрессионных моделей. Смысл регрессионного анализа. Выборочная дисперсия. Характеристики генеральной совокупности. Проверка статистической значимости уравнения регрессии. Оценка коэффициентов уравнения регрессии. Дисперсии случайных остатков.
реферат [57,4 K], добавлен 25.01.2009Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [914,4 K], добавлен 01.12.2013Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.
лабораторная работа [30,9 K], добавлен 05.12.2010Использование метода оценки параметров в стандартных масштабах для определения неизвестных параметров линейной модели множественной регрессии. Специфика изучения взаимосвязей по временным рядам. Моделирование взаимосвязей и тенденций в финансовой сфере.
контрольная работа [326,7 K], добавлен 22.04.2016Статистический и корреляционный анализ активов, пассивов, прибыли, ВВП. Выбор формы моделей, отражающих зависимости между показателями. Построение и анализ регрессионной модели на основании реальных статистических данных, построение уравнения регрессии.
курсовая работа [494,7 K], добавлен 20.11.2013