Применение логистической регрессии в экономической деятельности

Обзор областей возможного применения логистической регрессии. Построение модели прогнозирования движения цены акций на бирже. Преобразование данных для улучшения качества модели. Анализ закономерностей и прогнозирование движения рынка, потока клиентов.

Рубрика Экономика и экономическая теория
Вид статья
Язык русский
Дата добавления 17.08.2018
Размер файла 26,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Электронный научно-практический журнал «МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК» АПРЕЛЬ 2018

ЭКОНОМИЧЕСКИЕ НАУКИ

Размещено на http://www.allbest.ru/

Электронный научно-практический журнал «МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК» АПРЕЛЬ 2018

ЭКОНОМИЧЕСКИЕ НАУКИ

УДК 332.133.4

ПРИМЕНЕНИЕ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ В ЭКОНОМИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ

APPLICATION OF LOGISTIC REGRESSION IN ECONOMIC

Афанасьева Е.О. Уральский федеральный университет им. первого Президента России Б.Н. Ельцина, г. Екатеринбург, РФ

Аннотация

На сегодняшний день ни одна область знаний не обходится без статистического анализа. Выявление закономерностей и прогнозирование движения рынка, потока клиентов и т.д. дает компаниям конкурентное преимущество. Логистическая регрессия является одним из инструментов, позволяющих прогнозировать вероятности возникновения событий. Цель данной статьи дать представление об области применения логистической регрессии. Результатом проведенной работы является построение модели прогнозирования движения цены акций на бирже, что показывает возможности применения модели.

Ключевые слова: Логистическая регрессия, моделирование, рынок акций, машинное обучение.

To date, no field of knowledge can not do without statistical analysis. Identification of patterns and forecasting the movement of the market, the flow of customers, etc. gives companies a competitive advantage. Logistic regression is one of the tools to predict the probability of occurrence of events. The purpose of this article is to give an idea of the scope of logistic regression. The result of this work is the construction of a model for predicting the movement of the stock price on the exchange, which shows the possibilities of applying the model.

Keywords: Logistic regression, modeling, stock market, machine learning.

Логистическая регрессия - это статистическая модель, используемая для предсказания вероятности возникновения некоторого события путём приведения данных к логистической кривой. Модель впервые была использована в 1944 Джозефом Берксоном [1].

С целью выявления областей возможного применения логистической регрессии была поставлена задача прогнозирования движения стоимости акций ПАО «ГМК «Норильский никель» (повышение или снижение цены) на Московской бирже относительно стоимости акций в предыдущий день.

Для построения прогноза была взята статистика стоимости обыкновенных акций на Московской бирже по дням с 01.01.2015 по 28.04.2017. Общее количество значений в выборке 598 с учетом праздничных и выходных дней.

В качестве объясняющий переменных были выбраны следующие показатели, статистика по которым использовалась за аналогичный период:

• Стоимость никеля на Лондонской бирже металлов (в долларах за тонну). Цена на Никель была выбрана одним из объясняющих показателей, поскольку «Норникель» является крупнейшим в мире производителем никеля (около 13% от всего производимого в мире никеля);

• Стоимость золота на Лондонской бирже металлов (в долларах за унцию). «ГМК «Норникель» имеет дочернюю компанию «Полюс Золото», которая занимается добычей и переработкой золота;

• Стоимость серебра на Лондонской бирже металлов (в долларах за унцию). Серебро является одним из металлов, добываемых «Норникелем»;

• Стоимость акций компании «Русал» на московской бирже. Компания «Русал» является одним из акционеров компании «Норникель».

• Стоимость барреля нефти;

• Курс доллара;

• Курс евро;

Последние три показателя были выбраны, поскольку являются основными индикаторами состояния экономики [2].

Единичные выбросы в выборках отсутствуют, следовательно, преобразование данных с целью избавления от выбросов проводиться не будет [3].

Для построения модели изменение стоимости акций компании Норникель было представлено в бинаром виде: 1 - рост цены, 0 - падение по отношению к предыдущему дню. Остальные данные использовались в первоначальном виде как абсолютные значения [4]. В результате применения функции logit к обучающей выборке (75% от общей выборки) была получена модель, характеристики которой приведены в таблице 1.

На обучающей выборке процент совпадения прогнозного значения с фактическим результатом составил 58,8%.

С целью улучшения качества модели были выполнены следующие преобразования данных: удаление не влияющих переменных, замена абсолютных данных на частоту роста стоимости акций на данном интервале, возведение в квадрат цен и курсов валют [5]. Однако данные преобразования либо несущественно улучшали модели, либо качество модели и достоверность прогнозирования оставались на начальном уровне.

Таблица 1 - характеристики модели после применения функции Logit

CONST

Никель LME дол/т.

Золото LME дол/унция

Нефть

Серебро дол/унцию

Доллар

Евро

Русал

b

-10,2711

0,00009

-0,006

-0,000005

0,4740

-0,03364

0,12504

0,00722

SE(b)

3,896678

0,00018

0,004

0,000034

0,2058

0,08473

0,06926

0,00381

t

-2,63587

0,51725

-1,519

-0,149414

2,3031

-0,39707

1,80542

1,89816

p-value

0,008392

0,60498

0,129

0,881227

0,0213

0,69132

0,07101

0,05767

PseudoRІ

0,03483

5

#N/A

#N/A

#N/A

#N/A

#N/A

#N/A

LR-test / p-value

21,56543

0,00302

#N/A

#N/A

#N/A

#N/A

#N/A

#N/A

lnL / lnL0

-298,802

-309,585

#N/A

#N/A

#N/A

#N/A

#N/A

#N/A

Наилучший результат - 67,3% совпадений на обучающей выборке был достигнут при преобразовании всех 7 объясняющих переменных в бинарный тип: 1 - рост цены или курса валюты, 0 - снижение цены или курса валюты. Получившаяся модель представлена в таблице 2.

логистический регрессия рынок прогнозирование

Таблица 2 - характеристики модели после преобразования данных

CONST

Никель LME дол/т.

Золото LME дол/унция

Нефть

Серебро

Доллар

Евро

русал

b

-1,3219564

0,79873

0,140

0,394465

0,2550

0,16424

0,10837

1,17351

SE(b)

0,2451292

0,21111

0,216

0,208949

0,2190

0,30794

0,31231

0,20811

t

-5,3928963

3,78341

0,648

1,887852

1,1648

0,53335

0,34698

5,63883

p-value

0,0000001

0,00015

0,517

0,059046

0,2441

0,59379

0,72861

0,00000

PseudoRІ

0,0960278

6

#N/A

#N/A

#N/A

#N/A

#N/A

#N/A

LR-test / p-value

59,4575282

0,00000

#N/A

#N/A

#N/A

#N/A

#N/A

#N/A

lnL / lnL0

-279,8563

-309,585

#N/A

#N/A

#N/A

#N/A

#N/A

#N/A

Значимость модели (R2) улучшилась с 3,5% до 9,6%.

При проверке модели, построенной на исходных данных процент совпадения прогнозных и фактических значений, составил 47%. При проверке модели после преобразований процент совпадения 57%.

Однако наилучший результат на тестовых данных был получен при удалении двух не влияющих переменных: доллара и евро. В данном случает при проверке модели на тестовых данных процент совпадения равен 63,6. Однако для обучающих данных процент совпадения всего 65,5% (наилучший результат 67,3%). Значимость модели (R2) также меньше (9,4%), чем в модели без исключения объясняющих переменных. Результаты приведены в таблице 3. Таким образом, исходя из полученной модели можно сделать вывод о возможности использовать логистическую регрессию для прогнозирования стоимости акций на бирже [6].

Таблица 3 - применение модели к исходным данным

CONST

Никель LME дол/т.

Золото LME дол/унция

Нефть

Серебро

русал

b

-1,2217732

0,81572

0,139

0,395747

0,2467

1,16911

SE(b)

0,2290105

0,21018

0,216

0,207067

0,2184

0,20768

t

-5,3350101

3,88115

0,644

1,911208

1,1297

5,62932

p-value

0,0000001

0,00010

0,520

0,055978

0,2586

0,00000

Pseudo RІ / # iter

0,0936478

6

#N/A

#N/A

#N/A

#N/A

LR-test / p-value

57,983935

0,00000

#N/A

#N/A

#N/A

#N/A

lnL / lnL0

-280,5931

-309,585

#N/A

#N/A

#N/A

#N/A

Список литературы

1. Andrew Gelman, John B. Carlin, Hal S. Stern, Donald B. Rubin. Bayesian Data Analysis, Second Edition. Chapman & Hall CRC Texts in Statistical Science, 2nd Edition, 2003

2. John K. Kruschke. Doing Bayesian Data Analysis, Second Edition: A Tutorial with R, JAGS, and Stan. Academic Press, Elsevier, 2015.

3. Max Kuhn, Kjell Johnson. Applied Predictive Modeling. Springer, 2013.

4. Gilbert Strang. Computational Science and Engineering. // Wellesley-Cambridge Press, 2007.

5. Kingsland S. E. Modeling nature. MathWorld, 2008

6. J.S. Cramer. The origins and development of the logit model, 2003

Размещено на Allbest.ru

...

Подобные документы

  • Основные общепринятые стратегии. Факторы комбинированной модели. Формула и коэффициент прогнозирования. Регрессии комбинированной модели. Итоговый вид комбинированной торговой модели. Проверка коэффициентов прогнозирования, стратегии минимизации рисков.

    курсовая работа [2,0 M], добавлен 27.04.2016

  • Проверка статистической гипотезы о значимости коэффициента функции регрессии. Практическое применение интерполирования. Применение процедуры линеаризации в решении нелинейной задачи регрессии. Построение квадратичной модели полулогарифмической функции.

    курсовая работа [291,1 K], добавлен 23.03.2015

  • Составление матрицы парных коэффициентов корреляции. Построение уравнения регрессии, характеризующего зависимость цены от всех факторов. Проведение регрессионного анализа с помощью пакета SPSS. Экономическая интерпретация коэффициентов модели регрессии.

    лабораторная работа [2,5 M], добавлен 27.09.2012

  • Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.

    лабораторная работа [1,6 M], добавлен 13.04.2010

  • Теоретичские основы работы фондовой биржи. Общетеоретические основы множественного корреляционно-регрессионного метода анализа. Оценка качества модели множественной регрессии. Апробирование модели для прогнозирования фондового индекса РТС на 2014 год.

    курсовая работа [1,8 M], добавлен 10.05.2015

  • Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.

    курсовая работа [367,5 K], добавлен 21.08.2008

  • Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.

    контрольная работа [132,1 K], добавлен 10.03.2013

  • Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.

    контрольная работа [47,3 K], добавлен 15.06.2009

  • Статистика розничного и оптового товарооборота: показательная регрессия, построение регрессии. Дисперсионный анализ для линейной регрессии, изучение ее качества. Доверительные интервалы для оцененных параметров и критерий Фишера значимости регрессии.

    контрольная работа [300,4 K], добавлен 21.08.2008

  • Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.

    контрольная работа [150,5 K], добавлен 14.12.2010

  • Место и значение управления заказами клиентов в логистической деятельности. Краткая организационно-экономическая характеристика ООО "Транзит". Анализ деятельности по управлению заказами клиентов, пути совершенствования. Договор на организацию перевозки.

    курсовая работа [437,6 K], добавлен 31.05.2015

  • Обзор математических моделей финансовых пирамид. Анализ модели динамики финансовых пузырей Чернавского. Обзор модели долгосрочного социально-экономического прогнозирования. Оценка приоритета простых моделей. Вывод математической модели макроэкономики.

    курсовая работа [1,7 M], добавлен 27.11.2017

  • Виды корреляции и регрессии, применяемые в статистическом анализе социально-экономических явлений и процессов. Построение корреляционной модели (уравнения регрессии). Построение корреляционной таблицы, выполнение интервальной группировки по признакам.

    курсовая работа [131,7 K], добавлен 03.10.2014

  • Связь логистики с функциями управления промышленным предприятием. Основные признаки промышленных (производственных) логистических систем. Преобразование матрицы исходных данных для описания модели гибкой логистической системы. Условия доставки грузов.

    контрольная работа [58,7 K], добавлен 06.08.2008

  • Выявление определенной зависимости между выбранными экономическими показателями на основе построения эконометрической регрессионной модели. Построение адекватной модели линейной регрессии.. Способы выявления мультиколлинеарности и её коррекции.

    курсовая работа [912,1 K], добавлен 22.03.2016

  • Исследование экономической сущности логистической системы. Критерии и методы оценки рентабельности функционирования логистической системы и её отдельных элементов. Характеристика влияния логистических процессов на формирование рентабельности предприятия.

    курсовая работа [398,8 K], добавлен 20.03.2015

  • Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.

    контрольная работа [253,4 K], добавлен 17.03.2011

  • Основные подходы к прогнозированию состояния фондового рынка. Обоснование метода прогнозирования состояния фондового рынка в РФ: его ретроспективный анализ, сценарии развития его в долгосрочной перспективе. Описание прогнозной модели и ее верификация.

    курсовая работа [241,1 K], добавлен 25.01.2014

  • Временные ряды и прогнозирование. Сетевой анализ и планирование проектов. Модели кривых роста. Статистические критерии сезонности: дисперсионный, автокорреляционный, гармонический. Модели, которые используются для прогнозирования сезонных процессов.

    контрольная работа [285,1 K], добавлен 15.07.2010

  • Понятие, сущность, значение, основные виды, показатели доходности акций и способы их расчета. Методика корреляционного и регрессионного анализа. Методы прогнозирования в рядах динамики. Прогнозирование стоимости акций ОАО ГМК "Норильский никель".

    курсовая работа [648,8 K], добавлен 27.11.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.