Построение регрессионной модели в среде Gretl на примере рынка поддержанных автомобилей г. Биробиджана и г. Хабаровска
Описание методов интеллектуального анализа в среде Gretl. Регрессионный анализ на основе данных рынка поддержанных автомобилей г. Биробиджана и г. Хабаровска. Модель, позволяющая спрогнозировать стоимость покупки либо продажи поддержанного автомобиля.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 18.11.2016 |
Размер файла | 796,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ПОСТРОЕНИЕ РЕГРЕССИОННОЙ МОДЕЛИ В СРЕДЕ GRETL НА ПРИМЕРЕ РЫНКА ПОДДЕРЖАННЫХ АВТОМОБИЛЕЙ Г. БИРОБИДЖАНА И Г. ХАБАРОВСКА
Пивенко Кристина Александровна,
Баженов Руслан Иванович
В современном мире автомобиль перестал быть роскошью, он стал средством передвижения, доступным многим. Для большинства граждан предпочтительнее купить поддержанный автомобиль, а не новый, только что сошедший с конвейера. Какую сумму правильно будет заплатить за б/у автомобиль? За сколько можно продать свой автомобиль? С этими вопросами сталкиваются многие из нас. Чтобы правильно дать ответ, необходимо учесть определенные параметры: тип кузова, год выпуска, объем двигателя, тип коробки передач, пробег. Используя регрессионную модель в среде Gretl, можем найти зависимость стоимости автомобиля от данных параметров. Ряд ученых изучает проблемы и методы построения различных регрессионных моделей. Базовые принципы использования метода регрессионного анализа были разработаны С.И. Носковым и М.П. Базилевским [1]. Использовалась множественная регрессия О.В. Гусевым и А.В. Жуковым [2] для идентификации перегрузки сервера. А.А. Жарков и Н.А. Анисимова [3] метод множественной регрессии применили для определения рыночной стоимости квартиры с учетом сроков и условий реализации жилья. Расчет логистических издержек при помощи метода множественной регрессии разработан И.А. Семеновым и А.А. Носковым [4]. С использованием Gretl определяются причины трудового оппортунизма сотрудников Р.З. Мухаметзяновым [5]. Особенности использования среды Gretl в целях построения экономических моделей рассматриваются А.А.Тусковым [6]. Особенности применения программных продуктов Excel и Gretl в рамках эконометрического моделирования рассмотрела Ю.Г.Зарезина [7]. Р.И. Баженовым и др. [8-14] изучены проблемы использования регрессионных моделей для анализов различных видов. Изучением регрессионного анализа занимаются также зарубежные ученые [15-16]. По данным сайта www.avito.ru был осуществлен сбор экспериментальных наблюдений. Рассматривались объявления о продаже автомобилей в г.Биробиджан и в г.Хабаровск. Были выбраны следующие критерии: марка, тип кузова, год выпуска, объем двигателя, тип коробки передач, тип привода, пробег, стоимость. Тип кузова кодируется следующим образом: 1 - седан; 2 - хэтчбэк; 3 - универсал; 4 - кроссовер; 5 - минивэн; 6 - пикап; 7 - внедорожник; 8 - купе. Тип коробки передач обозначим: 1 - автоматическая; 2 - механическая. Привод определим: 1 - передний; 2 - задний; 3 - полный. Создадим таблицу данных в MS Excel. Используя данные 200 объявлений (рис.1).
Рисунок 1- Фрагмент данных в Excel
Введем обозначения переменных: тип кузова - х1, год выпуска - х2, объем двигателя - х3, коробка передач - х4, привод - х5, пробег - х6, стоимость - y (рис.2.).
автомобиль интеллектуальный стоимость регрессионный
Рисунок 2 - Обозначение переменных
Следующий шаг - открыть данные таблицы Excel в Gretl (рис.3).
Рисунок 3 - Среда Gretl
В окне программы появляются переменные, которые необходимы, чтобы построить регрессионную модель (рис.4).
Рисунок 4 - Рабочее окно программы
Необходимо просмотреть получившуюся таблицу (рис. 5-6).
Рисунок 5 - Контекстное меню выделенных переменных
Рисунок 6 - Просмотр таблицы данных
Так как у нас получилось больше шести столбцов данных, то оставшиеся 2 столбца найдем внизу таблицы (рис.7).
Рисунок 7 - Таблица данных (окончание)
Для решения нашей задачи найдем регрессионную модель, используя метод наименьших квадратов (рис.8).
Рисунок 8 - Меню Модель
Перейдем к построению уравнения модели (рис.9)
Рисунок 9 - Окно спецификации модели
Получившаяся модель и ее описательные статистики показаны на рисунке (рис.10).
Рисунок 10 - Регрессионная модель
По значению R-квадрата можно судить о доле вариации результативного признака с учетом воздействия изучаемых факторов. В данной модели 61, 8% вариации переменной Y зависит от влияния включенных факторов, 38, 2% обусловлены другими факторами. Если коэффициент выше 80%, то модель считается достаточно хорошей. А у нас слишком низкий R-квадрат. Использование линейной аналитической формы модели может стать вероятной причиной ее слабости. Поэтому найдем другую модель. При помощи теста на нелинейность можно проверить обоснованность применения степенной модели (рис.11).
Рисунок 11 - Выбор теста на нелинейность
Проверим модель на нелинейность (логарифмы) (рис. 12).
Рисунок 12 - Тест на нелинейность (логарифмы)
Тест нелинейности для логарифмов (значение p=0, 0000001) свидетельствует, что нулевую гипотезу (о линейности аналитической формы) следует отклонить, поскольку значение TR2 = 43, 7347 превышает критическое значение х2(1%; 5) = 15, 086; по этой причине существуют основания для принятия степенной формы модели (с логарифмированными переменными). Исследования параметров привели к выводу, что существует логарифмическая зависимость. Найдем зависимость lny от х1, х2, х3, х4, х5, lnx6 (рис.13).
Рисунок 13 - Новая регрессионная модель
В этой модели R-квадрат у нас уже 75, 1%. Значит, модель более точная, чем предыдущая. Перейдем к решению уравнения Введем в Excel данные const, х1, х2, х3, х4, х5, х6 (рис. 14). Коэффициенты: a - тип кузова, b - год выпуска, с - объем двигателя, d - коробка передач, e - привод, f - пробег.
Рисунок 14 - Данные в Excel
В ячейку, окрашенную в оранжевый цвет, вводим формулу расчета (рис.15). В таблицу Excel вводим необходимые параметры того автомобиля, который мы хотим купить или продать, в ячейки, окрашенные в синий цвет.
Рисунок 15 - Ввод данных
В ячейку, окрашенную в зеленый цвет, вводим формулу расчета стоимости автомобиля. После этого в ячейке, выделенной зеленым цветом, отобразится стоимость данного автомобиля (рис.16).
Рисунок 16 - Расчет стоимости автомобиля по заданным параметрам
Если мы хотим узнать стоимость другого автомобиля, то нужно просто в ячейки, окрашенные в синий цвет ввести другие параметры. Полученную регрессионную модель можно использовать в работе агентств, занимающихся продажей поддержанных автомобилей. Описание принципов построения регрессионной модели может пригодиться в преподавании студентам различных направлений [17-19].
Библиографический список
1. Базилевский М.П., Носков С.И. Методические и инструментальные средства построения некоторых типов регрессионных моделей // Системы. Методы. Технологии. 2012. №1. С. 80-87.
2. Гусев О.В., Жуков А.В. Способ идентификации перегрузки с использованием множественной регрессии // Информационная среда вуза XXI века. Материалы VII Международной научно-практической конференции. Петрозаводск, 2013. С. 57-61.
3. Жарков А.А., Анисимова Н.А. Механизм формирования стоимости квартир на региональном рынке жилья // Регион: системы, экономика, управление. 2009. № 4. С. 47-53.
4. Семенов И.А., Носков А.А. Модель расчета общих логистических издержек методом множественной регрессии // Вестник Саратовского государственного технического университета. 2011. Т. 4. № 2с. С. 397-400.
5. Мухаметзянов Р.З. Анализ трудового оппортунизма сотрудников // Science time. 2014. №6 (6). С. 132-147.
6. Тусков А.А. Применение Gretl для построения многофакторной модели // Модели, системы, сети в экономике, технике, природе и обществе. 2011. №1. С. 154-159.
7. Зарезина Ю.Г. Особенности применения программных продуктов Excel и Gretl в рамках эконометрического моделирования // Новое слово в науке и практике: гипотезы и апробация результатов исследований. 2015. № 15. С. 223-228.
8. Пронина О.Ю., Баженов Р.И. Исследование методов регрессионного анализа программной среды Eviews // Nauka-Rastudent.ru. 2015. № 1 (13). С. 45.
9. Лагунова А.А., Баженов Р.И. Разработка в среде Gretl регрессионной модели рынка вторичного жилья г. Биробиджана // Nauka-Rastudent.ru. 2015. № 1 (13). С. 40.
10. Муллинов Д.О., Баженов Р.И. Разработка в среде Eviews регрессионной модели рынка гаражных помещений г. Биробиджана // Nauka-Rastudent.ru. 2015. № 1 (13). С. 43.
11. Баженов Р.И. Информационная безопасность и защита информации: практикум. Биробиджан: Изд-во ГОУВПО «ДВГСГА», 2011. 140 с.
12. Vexler V.A., Bazhenov R.I., Bazhenova N.G. Entity-relationship model of adult education in regional extended education system // Asian Social Science. 2014. Т. 10. № 20. С. 1-14.
13. Векслер В.А., Баженов Р.И. Формирование модели обучения взрослых основам информационных технологий: региональный аспект: монография. -Биробиджан: Издательский центр ФГБОУ ВПО «ПГУ им. Шолом-Алейхема», 2014. 126 с.
14. Наумов А.А., Баженов Р.И. О неустойчивости метода нормализации критериев // Современные научные исследования и инновации. 2014. № 11-1 (43). С. 64-68.
15. Baiocchi G., Distaso W. GRETL: Econometric software for the GNU generation // Journal of Applied Econometrics. 2003. Т. 18. №. 1. С. 105-110.
16. Mixon Jr J. W., Smith R. J. Teaching undergraduate econometrics with GRETL // Journal of Applied Econometrics. 2006. Т. 21. №. 7. С. 1103-1107.
17. Баженов Р.И. Об организации научно-исследовательской практики магистрантов направления «Информационные системы и технологии» // Современные научные исследования и инновации. 2014. № 9-2 (41). С. 62-69.
18. Баженов Р.И. Проектирование методики обучения дисциплины «Интеллектуальные системы и технологии» // Современные научные исследования и инновации. 2014. № 5-2 (37). С. 48.
19. Баженов Р.И. Об организации деловых игр в курсе «Управление проектами информационных систем» // Научный аспект. 2014. Т. 1. № 1. С. 101-102.
Размещено на Allbest.ru
...Подобные документы
Описание предметной области, построение концептуальной и логической модели базы данных рынка металлопроката и метизов, реализация данных рынка в интерактивной среде Интернет. Расчёт экономической эффективности каталога продукции и капитальных вложений.
курсовая работа [3,5 M], добавлен 14.12.2011Основы проектирования информационных систем. Применение автоматизации составления актов купли-продажи, торговых чеков, накладных по продажи автомобилей. Определение подсистем и их взаимодействие, построение и тестирование, работа в среде Delphi.
курсовая работа [1,7 M], добавлен 30.11.2009Исследование производительности труда методом компонентного и кластерного анализов. Выбор значащих главных компонент. Формирование кластеров. Построение дендрограммы и диаграммы рассеивания. Правила кластеризации в пространстве исходных признаков.
лабораторная работа [998,9 K], добавлен 25.11.2014Проектирование базы данных "Магазин автомобилей" в среде СУБД Microsoft Office Access. Схема решения задачи. Архитектура программно-аппаратного комплекса. Логика работы программы. Минимальные системные требования, разработка руководства пользователя.
курсовая работа [2,1 M], добавлен 07.10.2015Разработка базы данных для учета автомобилей, когда-либо находящихся в автосервисе. Информация о каждом автомобиле (марка, регистрационный знак, цвет, серийные номера завода-изготовителя). Проектирование таблиц, запросов в DateModule, листинг программы.
лабораторная работа [2,3 M], добавлен 11.11.2010Проектирование процесса автоматизации оформления продаж автомобилей в автосалоне. Описание бизнес-процессов учета автомобилей. Исследование информационных потоков. Анализ входной и выходной информации. Алгоритмы решения задачи и их машинная реализация.
курсовая работа [2,9 M], добавлен 11.03.2014Проектирование модели базы данных станции технического обслуживания автомобилей в режиме диалога. Предусмотрена возможность ввода начальных данных (владельцы автомобилей, неисправности и пр.), внесения изменений и получения справок в отчете MS Access.
курсовая работа [2,8 M], добавлен 30.09.2010Анализ баз данных и систем управления ими. Проектирование и создание реляционной базы данных в среде MS Access для ресторана "Дельфин": построение информационно логической модели, разработка структур таблиц базы данных и схемы данных, создание Web-узла.
курсовая работа [3,7 M], добавлен 15.11.2010Описание предметной области, определение функциональных требований к системе и построение диаграммы потока данных. Построение модели "сущность-связь", описание сущностей и атрибутов модели. Построение реляционной базы данных и описание ее таблицы.
курсовая работа [624,5 K], добавлен 30.05.2019Разработка функциональной модели предметной области. Построение UML диаграмм в среде Pacestar UML Diagrammer. Выбор программных средств разработки. Разработка логической и физической модели данных. Разработка клиентского приложения ИС в среде Access.
курсовая работа [2,2 M], добавлен 09.03.2011Содержательное описание предметной области. Структурный анализ бизнес-процесса на основе IDEF0-модели. Построение информационно-логической модели данных. Структурная схема на основе IDEF0. Даталогическая модель данных. Реализация информационной системы.
курсовая работа [849,7 K], добавлен 10.07.2014Разработка прикладного программного обеспечения деятельности отдела кадров университета в среде Microsoft Access 2003. Характеристика этапов проектирования базы данных. Построение семантической модели. Нормализация данных, понятие нормальной формы.
курсовая работа [4,4 M], добавлен 14.11.2012Этап концептуального проектирования базы данных: описание и характеристика предметной области, ограничения и допуения, модель "сущность-связь" (ER-диаграмма). Выбор модели данных. Требования к интерфейсу пользователя, создание запросов в среде Delphi.
курсовая работа [2,2 M], добавлен 25.05.2010Системный анализ и оценка требований к базе данных. Концептуальная (инфологическая) модель предметной области. Построение ERD-диаграммы и физической модели в методологии IDEF1X. Составление форм, запросов и отчетов в среде СУБД Visual FoxPro 8.0.
курсовая работа [1,3 M], добавлен 24.06.2013Метод решения математической модели на примере решения задач аналитической геометрии. Описание согласно заданному варианту методов решения задачи. Разработка математической модели на основе описанных методов. Параметры окружности минимального радиуса.
лабораторная работа [310,6 K], добавлен 13.02.2009Оптимальное время для обслуживания пользователей как основная цель работы компьютерного зала библиотеки. Построение модели деятельности подписного отдела с помощью средства имитационного моделирования AnyLogic. Описание процессов и построение сценария.
курсовая работа [1,9 M], добавлен 19.06.2015Исследоввание деятельности магазина "Комплектация компьютерной техники". Анализ данных, обоснование проекта программы продажи/покупки товаров. Правила выбора языка программирования. Описание интерфейса программы. Составление руководства пользователя.
курсовая работа [512,4 K], добавлен 11.12.2014Описание основных математических методов обработки эмпирических данных. Регрессионный метод и анализ ковариаций Ancova. Организация операционной системы, среды программирования на Android. Программная реализация метода 1МНК в среде С++ под Android.
дипломная работа [4,2 M], добавлен 23.03.2017Разработка базы данных организации, которая занимается ремонтом автомобилей и реализована в виде программного продукта. Моделирование структуры баз данных с использованием CASE-средств средствами языка SQL. Разработка логической и физической модели базы.
курсовая работа [2,3 M], добавлен 21.03.2010Современная терминология, технологии получения и типы данных цифровых моделей рельефа, методы их интерполяции. Анализ норм и правил градостроительства; критерии для проведения оценки территории; создание цифровой модели местности в среде ArcGIS 9.3.
дипломная работа [2,3 M], добавлен 13.07.2011