Применение логистической регрессии в экономической деятельности
Обзор областей возможного применения логистической регрессии. Построение модели прогнозирования движения цены акций на бирже. Преобразование данных для улучшения качества модели. Анализ закономерностей и прогнозирование движения рынка, потока клиентов.
Рубрика | Экономика и экономическая теория |
Вид | статья |
Язык | русский |
Дата добавления | 17.08.2018 |
Размер файла | 26,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Электронный научно-практический журнал «МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК» АПРЕЛЬ 2018 |
|
ЭКОНОМИЧЕСКИЕ НАУКИ |
Размещено на http://www.allbest.ru/
Электронный научно-практический журнал «МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК» АПРЕЛЬ 2018 |
|
ЭКОНОМИЧЕСКИЕ НАУКИ |
УДК 332.133.4
ПРИМЕНЕНИЕ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ В ЭКОНОМИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ
APPLICATION OF LOGISTIC REGRESSION IN ECONOMIC
Афанасьева Е.О. Уральский федеральный университет им. первого Президента России Б.Н. Ельцина, г. Екатеринбург, РФ
Аннотация
На сегодняшний день ни одна область знаний не обходится без статистического анализа. Выявление закономерностей и прогнозирование движения рынка, потока клиентов и т.д. дает компаниям конкурентное преимущество. Логистическая регрессия является одним из инструментов, позволяющих прогнозировать вероятности возникновения событий. Цель данной статьи дать представление об области применения логистической регрессии. Результатом проведенной работы является построение модели прогнозирования движения цены акций на бирже, что показывает возможности применения модели.
Ключевые слова: Логистическая регрессия, моделирование, рынок акций, машинное обучение.
To date, no field of knowledge can not do without statistical analysis. Identification of patterns and forecasting the movement of the market, the flow of customers, etc. gives companies a competitive advantage. Logistic regression is one of the tools to predict the probability of occurrence of events. The purpose of this article is to give an idea of the scope of logistic regression. The result of this work is the construction of a model for predicting the movement of the stock price on the exchange, which shows the possibilities of applying the model.
Keywords: Logistic regression, modeling, stock market, machine learning.
Логистическая регрессия - это статистическая модель, используемая для предсказания вероятности возникновения некоторого события путём приведения данных к логистической кривой. Модель впервые была использована в 1944 Джозефом Берксоном [1].
С целью выявления областей возможного применения логистической регрессии была поставлена задача прогнозирования движения стоимости акций ПАО «ГМК «Норильский никель» (повышение или снижение цены) на Московской бирже относительно стоимости акций в предыдущий день.
Для построения прогноза была взята статистика стоимости обыкновенных акций на Московской бирже по дням с 01.01.2015 по 28.04.2017. Общее количество значений в выборке 598 с учетом праздничных и выходных дней.
В качестве объясняющий переменных были выбраны следующие показатели, статистика по которым использовалась за аналогичный период:
• Стоимость никеля на Лондонской бирже металлов (в долларах за тонну). Цена на Никель была выбрана одним из объясняющих показателей, поскольку «Норникель» является крупнейшим в мире производителем никеля (около 13% от всего производимого в мире никеля);
• Стоимость золота на Лондонской бирже металлов (в долларах за унцию). «ГМК «Норникель» имеет дочернюю компанию «Полюс Золото», которая занимается добычей и переработкой золота;
• Стоимость серебра на Лондонской бирже металлов (в долларах за унцию). Серебро является одним из металлов, добываемых «Норникелем»;
• Стоимость акций компании «Русал» на московской бирже. Компания «Русал» является одним из акционеров компании «Норникель».
• Стоимость барреля нефти;
• Курс доллара;
• Курс евро;
Последние три показателя были выбраны, поскольку являются основными индикаторами состояния экономики [2].
Единичные выбросы в выборках отсутствуют, следовательно, преобразование данных с целью избавления от выбросов проводиться не будет [3].
Для построения модели изменение стоимости акций компании Норникель было представлено в бинаром виде: 1 - рост цены, 0 - падение по отношению к предыдущему дню. Остальные данные использовались в первоначальном виде как абсолютные значения [4]. В результате применения функции logit к обучающей выборке (75% от общей выборки) была получена модель, характеристики которой приведены в таблице 1.
На обучающей выборке процент совпадения прогнозного значения с фактическим результатом составил 58,8%.
С целью улучшения качества модели были выполнены следующие преобразования данных: удаление не влияющих переменных, замена абсолютных данных на частоту роста стоимости акций на данном интервале, возведение в квадрат цен и курсов валют [5]. Однако данные преобразования либо несущественно улучшали модели, либо качество модели и достоверность прогнозирования оставались на начальном уровне.
Таблица 1 - характеристики модели после применения функции Logit
CONST |
Никель LME дол/т. |
Золото LME дол/унция |
Нефть |
Серебро дол/унцию |
Доллар |
Евро |
Русал |
||
b |
-10,2711 |
0,00009 |
-0,006 |
-0,000005 |
0,4740 |
-0,03364 |
0,12504 |
0,00722 |
|
SE(b) |
3,896678 |
0,00018 |
0,004 |
0,000034 |
0,2058 |
0,08473 |
0,06926 |
0,00381 |
|
t |
-2,63587 |
0,51725 |
-1,519 |
-0,149414 |
2,3031 |
-0,39707 |
1,80542 |
1,89816 |
|
p-value |
0,008392 |
0,60498 |
0,129 |
0,881227 |
0,0213 |
0,69132 |
0,07101 |
0,05767 |
|
PseudoRІ |
0,03483 |
5 |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
|
LR-test / p-value |
21,56543 |
0,00302 |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
|
lnL / lnL0 |
-298,802 |
-309,585 |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
Наилучший результат - 67,3% совпадений на обучающей выборке был достигнут при преобразовании всех 7 объясняющих переменных в бинарный тип: 1 - рост цены или курса валюты, 0 - снижение цены или курса валюты. Получившаяся модель представлена в таблице 2.
логистический регрессия рынок прогнозирование
Таблица 2 - характеристики модели после преобразования данных
CONST |
Никель LME дол/т. |
Золото LME дол/унция |
Нефть |
Серебро |
Доллар |
Евро |
русал |
||
b |
-1,3219564 |
0,79873 |
0,140 |
0,394465 |
0,2550 |
0,16424 |
0,10837 |
1,17351 |
|
SE(b) |
0,2451292 |
0,21111 |
0,216 |
0,208949 |
0,2190 |
0,30794 |
0,31231 |
0,20811 |
|
t |
-5,3928963 |
3,78341 |
0,648 |
1,887852 |
1,1648 |
0,53335 |
0,34698 |
5,63883 |
|
p-value |
0,0000001 |
0,00015 |
0,517 |
0,059046 |
0,2441 |
0,59379 |
0,72861 |
0,00000 |
|
PseudoRІ |
0,0960278 |
6 |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
|
LR-test / p-value |
59,4575282 |
0,00000 |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
|
lnL / lnL0 |
-279,8563 |
-309,585 |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
#N/A |
Значимость модели (R2) улучшилась с 3,5% до 9,6%.
При проверке модели, построенной на исходных данных процент совпадения прогнозных и фактических значений, составил 47%. При проверке модели после преобразований процент совпадения 57%.
Однако наилучший результат на тестовых данных был получен при удалении двух не влияющих переменных: доллара и евро. В данном случает при проверке модели на тестовых данных процент совпадения равен 63,6. Однако для обучающих данных процент совпадения всего 65,5% (наилучший результат 67,3%). Значимость модели (R2) также меньше (9,4%), чем в модели без исключения объясняющих переменных. Результаты приведены в таблице 3. Таким образом, исходя из полученной модели можно сделать вывод о возможности использовать логистическую регрессию для прогнозирования стоимости акций на бирже [6].
Таблица 3 - применение модели к исходным данным
CONST |
Никель LME дол/т. |
Золото LME дол/унция |
Нефть |
Серебро |
русал |
||
b |
-1,2217732 |
0,81572 |
0,139 |
0,395747 |
0,2467 |
1,16911 |
|
SE(b) |
0,2290105 |
0,21018 |
0,216 |
0,207067 |
0,2184 |
0,20768 |
|
t |
-5,3350101 |
3,88115 |
0,644 |
1,911208 |
1,1297 |
5,62932 |
|
p-value |
0,0000001 |
0,00010 |
0,520 |
0,055978 |
0,2586 |
0,00000 |
|
Pseudo RІ / # iter |
0,0936478 |
6 |
#N/A |
#N/A |
#N/A |
#N/A |
|
LR-test / p-value |
57,983935 |
0,00000 |
#N/A |
#N/A |
#N/A |
#N/A |
|
lnL / lnL0 |
-280,5931 |
-309,585 |
#N/A |
#N/A |
#N/A |
#N/A |
Список литературы
1. Andrew Gelman, John B. Carlin, Hal S. Stern, Donald B. Rubin. Bayesian Data Analysis, Second Edition. Chapman & Hall CRC Texts in Statistical Science, 2nd Edition, 2003
2. John K. Kruschke. Doing Bayesian Data Analysis, Second Edition: A Tutorial with R, JAGS, and Stan. Academic Press, Elsevier, 2015.
3. Max Kuhn, Kjell Johnson. Applied Predictive Modeling. Springer, 2013.
4. Gilbert Strang. Computational Science and Engineering. // Wellesley-Cambridge Press, 2007.
5. Kingsland S. E. Modeling nature. MathWorld, 2008
6. J.S. Cramer. The origins and development of the logit model, 2003
Размещено на Allbest.ru
...Подобные документы
Основные общепринятые стратегии. Факторы комбинированной модели. Формула и коэффициент прогнозирования. Регрессии комбинированной модели. Итоговый вид комбинированной торговой модели. Проверка коэффициентов прогнозирования, стратегии минимизации рисков.
курсовая работа [2,0 M], добавлен 27.04.2016Проверка статистической гипотезы о значимости коэффициента функции регрессии. Практическое применение интерполирования. Применение процедуры линеаризации в решении нелинейной задачи регрессии. Построение квадратичной модели полулогарифмической функции.
курсовая работа [291,1 K], добавлен 23.03.2015Составление матрицы парных коэффициентов корреляции. Построение уравнения регрессии, характеризующего зависимость цены от всех факторов. Проведение регрессионного анализа с помощью пакета SPSS. Экономическая интерпретация коэффициентов модели регрессии.
лабораторная работа [2,5 M], добавлен 27.09.2012Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.
лабораторная работа [1,6 M], добавлен 13.04.2010Теоретичские основы работы фондовой биржи. Общетеоретические основы множественного корреляционно-регрессионного метода анализа. Оценка качества модели множественной регрессии. Апробирование модели для прогнозирования фондового индекса РТС на 2014 год.
курсовая работа [1,8 M], добавлен 10.05.2015Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.
курсовая работа [367,5 K], добавлен 21.08.2008Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.
контрольная работа [132,1 K], добавлен 10.03.2013Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.
контрольная работа [47,3 K], добавлен 15.06.2009Статистика розничного и оптового товарооборота: показательная регрессия, построение регрессии. Дисперсионный анализ для линейной регрессии, изучение ее качества. Доверительные интервалы для оцененных параметров и критерий Фишера значимости регрессии.
контрольная работа [300,4 K], добавлен 21.08.2008Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.
контрольная работа [150,5 K], добавлен 14.12.2010Место и значение управления заказами клиентов в логистической деятельности. Краткая организационно-экономическая характеристика ООО "Транзит". Анализ деятельности по управлению заказами клиентов, пути совершенствования. Договор на организацию перевозки.
курсовая работа [437,6 K], добавлен 31.05.2015Обзор математических моделей финансовых пирамид. Анализ модели динамики финансовых пузырей Чернавского. Обзор модели долгосрочного социально-экономического прогнозирования. Оценка приоритета простых моделей. Вывод математической модели макроэкономики.
курсовая работа [1,7 M], добавлен 27.11.2017Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.
курсовая работа [131,7 K], добавлен 03.10.2014Связь логистики с функциями управления промышленным предприятием. Основные признаки промышленных (производственных) логистических систем. Преобразование матрицы исходных данных для описания модели гибкой логистической системы. Условия доставки грузов.
контрольная работа [58,7 K], добавлен 06.08.2008Выявление определенной зависимости между выбранными экономическими показателями на основе построения эконометрической регрессионной модели. Построение адекватной модели линейной регрессии.. Способы выявления мультиколлинеарности и её коррекции.
курсовая работа [912,1 K], добавлен 22.03.2016Исследование экономической сущности логистической системы. Критерии и методы оценки рентабельности функционирования логистической системы и её отдельных элементов. Характеристика влияния логистических процессов на формирование рентабельности предприятия.
курсовая работа [398,8 K], добавлен 20.03.2015Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.
контрольная работа [253,4 K], добавлен 17.03.2011Основные подходы к прогнозированию состояния фондового рынка. Обоснование метода прогнозирования состояния фондового рынка в РФ: его ретроспективный анализ, сценарии развития его в долгосрочной перспективе. Описание прогнозной модели и ее верификация.
курсовая работа [241,1 K], добавлен 25.01.2014Временные ряды и прогнозирование. Сетевой анализ и планирование проектов. Модели кривых роста. Статистические критерии сезонности: дисперсионный, автокорреляционный, гармонический. Модели, которые используются для прогнозирования сезонных процессов.
контрольная работа [285,1 K], добавлен 15.07.2010Понятие, сущность, значение, основные виды, показатели доходности акций и способы их расчета. Методика корреляционного и регрессионного анализа. Методы прогнозирования в рядах динамики. Прогнозирование стоимости акций ОАО ГМК "Норильский никель".
курсовая работа [648,8 K], добавлен 27.11.2012