Выявление недооцененности и переоцененности акций методами машинного обучения

Акции компаний - один из наиболее важных финансовых инструментов. Минимизация эмпирического риска, возникающего в период машинного обучения - процесс, который заключается в уменьшении средней ошибки используемого алгоритма на статистической выборке.

Рубрика Экономико-математическое моделирование
Вид дипломная работа
Язык русский
Дата добавления 04.12.2019
Размер файла 576,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Табл. 4. Метрии качества используемых в исследовании моделей

Метод:

Метод опорных векторов

Наивный Байесовский классификатор

К-ближайших соседей

Random Forest

Решающее дерево

Точность:

0.64

0.56

0.62

0.63

0.66

Полнота:

0.62

0.54

0.61

0.61

0.56

F1-мера:

0.62

0.54

0.61

0.61

0.57

AUC:

0.6219

0.5205

0.6159

0.6071

0.5845

Таким образом, наилучший алгоритм, случайный лес с порогом дисперсии, определяет 67% от тестовой выборки правильно. Как видно из результатов прочих моделей, все модели имеют точность больше 0.5, что свидетельствует о лучшей предсказательной силе в сравнении с подбрасыванием монеты, где точность ровно 0.5. Это больше, чем точность в 58% полученная в модели Даи и Джанга (Y. Dai, Y. Zhang, 2016), где для классификации цены использовались мультипликаторы. Так, модель подтверждает гипотезу 3 о том, что составная модель должна показывать лучшую точность относительно моделей по-отдельности.

Гипотеза 2 о том, что методами машинного обучения можно извлекать прибыль подтвердить не удалось, так как точность предсказания любой из моделей меньше 1. Безусловно, модели показывают высокую точность, однако с точностью меньше 1 существует существенный риск убытков, что делает модели рискованными, то есть малопригодными для извлечения прибыли. Несмотря на риски, модель может быть полезна для профессиональных инвесторов, так как она позволяет получить рекомендацию о направленности финансовой отчетности с высокой точностью, то есть модель информативна. Следовательно, гипотеза 1 о том, что модели машинного обучения могут составить конкуренцию аналитикам, подтверждается.

Гипотеза 4 о том, что рынок США и Канады не обладает сильной эффективностью, подтверждается - в данной работе были созданы модели, основанные на обработке финансовых показателей компании, которые обладают силой предсказания, которая лучше случайного. Следовательно, в ценах на акцию отражена не вся информация - рынок не обладает сильной эффективностью.

Заключение

В современном мире непрофессиональному инвестору становится сложно извлекать прибыль на торговле акциями. Большинство профессионалов использую определенный набор аналитических инструментов и техник, которые позволяют получать ценную информацию о трендах и событиях на рынке. На сегодняшний день существует тенденция использования методов машинного обучения как инструмента для торговли. Однако может ли искусственный интеллект показывать результаты, превосходящие результаты профессионалов в сфере финансов, где часто происходят неожиданные и контринтуитивные события.

В данном исследовании был проведен анализ классификации реакции рынка на финансовую отчетность наиболее подходящими методами машинного обучения, выполнен анализ влияния финансовых признаков на качество предсказания и выявлены подходящие для решение данной задачи методы с описанием сильных и слабых сторон используемых методов. Одним из результатов исследования является вывод о том, что комбинация предобработки данных на основе информативности признаков вместе с методами машинного обучения имеют более эффективное предсказание, чем методы машинного обучения по отдельности. Вышеописанный результат подтверждает гипотезу 3 и соотносится с задачей 5 и 6 данной работы.

После анализа научной литературы и выбора гипотетически пригодных для решения задачи методов были загружены ключевые показатели ежеквартальной финансовой отчетности 13 компаний США и Канады с 2010 по 2019 год. Все 13 компаний работают в сфере оффлайн ритейла, то есть имеют супермаркеты с продуктами. Выбор данной сферы обусловлен зрелостью отрасли и слабой зависимостью перед ресурсными рынками. Одной из потенциальных тем для развития данной темы является построение классификатора на всех компаниях индекса S&P 500 с учетом специфики индустрий.

Для повышения точности прогноза были введены показатели роста как относительной предыдущего квартала, так и относительно соответствующего квартала год назад для исключения фактора сезонности бизнеса. В результате обучения моделей были достигнуты высокий результаты, которые значительно превосходят случайное предсказание. Так, задачи, которые были обозначены в работе были выполнены, а гипотезы, кроме гипотезы о возможности извлекать прибыль на рекомендациях модели, подтверждены.

Несмотря на достаточно высокую точность предсказания, модели имеют определенный процент ошибки. Таким образом, использование моделей машинного обучения для извлечения прибыли пока невозможно из-за высоких рисков. Для подготовки алгоритмов к извлечению прибыли стоит в дальнейших исследованиях рассмотреть, какие именно данные приводят к большей доле ошибок, и научиться учитывать рыночные аномалии. Стоит отметить, что финансовая отчетность не может нести в себе всю известную рынку информацию о компании, поэтому для более полного анализа стоит учитывать анализ оттенков новостей о компании в медиапространстве.

Список литературы

1. Abu-Mostafa, Y. S., Atiya, A. F., 1996. Introduction to ?nancial forecasting. Applied Intelligence 6 (3), 205-213.

2. Adya, M., Collopy, F., 1998. How effective are neural networks at forecasting and prediction? A review and evaluation. Journal of Forecasting 17 (1), 481-495

3. Barak, S., Arjmand, A., Ortobelli, S., 2017. Fusion of multiple diverse predictors in stock market. Information Fusion 36 (1), 90-102

4. Bollerslev, T., 1986. Generalized autoregressive conditional heteroskedasticity. Journal of Econometrics 31 (3), 307-327

5. Breiman, L., 2001. Random Forests. Machine Learning 45 (1), 5-32

6. Bruno Miranda Henrique, Vinicius Amorim Sobreiro, Herbert Kimura, Literature Review: Machine Learning Techniques Applied to Financial Market Prediction, Expert Systems With Applications (2019)

7. Chambers A., Penman S., 1984, Timeliness of Reporting and the Stock Price Reaction to Earnings Announcements, Journal of Accounting Research Vol. 22, No. 1, pp. 21-47

8. Dai, Y., Zhang, Y. Machine Learning in Stock Price Trend Forecasting. Stanford University, 2013

9. Elman , J. L., 1990. Finding structure in time. Cognitive Science 14 (2), 179-211

10. Engle, R. F., 1982. Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom in?ation. Econometrica: Journal of the Econometric Society 50 (4), 987-1007

11. Gцзken, M., Цzзalэcэ, M., Boru, A., Dosdogўru, A. T., 2016. Integrating metaheuristics and Arti?cial Neural Networks for improved stock price prediction. Expert Systems with Applications 44 (1), 320-331.

12. Hбjek, P., Olej, V., Myskova, R., 2013. Forecasting stock prices using sentiment information in annual reports-a neural network and support vector regression approach. WSEAS Transactions on Business and Economics 10 (4), 293-305

13. Hornik, K., 1991. Approximation capabilities of multilayer feedforward networks. Neural Networks 4 (2), 251-257.

14. Huang, C.-L., Tsai, C.-Y., 2009. A hybrid SOFM-SVR with a ?lter-based feature selection for stock market forecasting. Expert Systems with Applications 36 (2), 1529-1539

15. Huang, W., Nakamori, Y., Wang, S.-Y., 2005. Forecasting stock market movement direction with support vector machine. Computers &1116 Operations Research 32 (10), 2513-2522

16. Kara, Y., Boyacioglu, M. A., Baykan, Ц. K., 2011. Predicting direction of stock price index movement using arti?cial neural networks

17. Kim, K., 2003. Financial time series forecasting using support vector machines. Neurocomputing 55 (1-2), 307-319

18. Kumar M., Thenmozhi, M., 2014. Forecasting stock index returns using ARIMA-SVM, ARIMA-ANN, and ARIMA-random forest

19. Laboissiere, L. A., Fernandes, R. A., Lage, G. G., 2015. Maximum and minimum stock price forecasting of Brazilian power distribution companies based on arti?cial neural networks. Applied Soft Computing 35 (1), 66-74

20. Lahmiri, S., 2014a. Improving forecasting accuracy of the S&P500 intra-day price direction using both wavelet low and high frequency coef?cients. Fluctuation and Noise Letters 13 (01), 1450008

21. Lahmiri, S., Boukadoum, M., 2015. An Ensemble System Based on Hybrid EGARCH-ANN with Different Distributional Assumptions to Predict S&P 500 Intraday Volatility. Fluctuation and Noise Letters 14 (01), 1550001.

22. Malkiel, Fama, 1970. Ef?cient Capital Markets: A Review of Theory and Empirical Work. The Journal of Finance 25 (2),1156 383-417.

23. Menike M., Wang M., Stock Market Reactions to the Release of Annual Financial Statements Case of the Banking Industry in Sri Lanka,European Journal of Business and Management ISSN 2222-1905 Vol.5, No.31, 2013

24. Mitchell T. Machine Learning. -- McGraw-Hill Science/Engineering/Math, 1997

25. Pai, P.-F., Lin, C.-S., 2005. A hybrid ARIMA and support vector machines model in stock price forecasting. Omega 33 (6), 497-505

26. Pearce D., Roley V., 1985, Stock Prices and Economic News, Journal of Business Vol. 58, No. 11985, pp. 49-67

27. Timmermann , A., Granger, C. W., 2004. Ef?cient market hypothesis and forecasting. International Journal of Forecasting 20 (1), 15-27

28. Tversky, A., & Kahneman, D., 1974, “Judgement under uncertainty: Heuristics and biases”. Sciences. 185: 1124--1131

29. Xiao, Y., Xiao, J., Lu, F., Wang, S., 2013. Ensemble ANNs-PSO-GA Approach for Day-ahead Stock E-exchange Prices Forecasting.International Journal of Computational Intelligence Systems 6 (1), 96-114

30. Yoon, Y., Swales Jr, G., Margavio, T. M., 1993. A comparison of discriminant analysis versus arti?cial neural networks. Journal of the Operational Research Society 44 (1), 51-60

31. Хлюпина Н.А., Берзон, 2016, Н.И. Информационная Значимость рекомендаций аналитиков на российском рынке акций // Финансы и кредит. №11 (683).

Приложение 1

Код в Python, на котором обучались и оценивались модели.

Рис. 6. Код, на котором происходит обучение метода случайного леса

Рис. 7. Код, на котором происходит выгрузка данных из Excel и создание подмножеств: объект - ответ

Размещено на Allbest.ru

...

Подобные документы

  • Классические подходы к анализу финансовых рынков, алгоритмы машинного обучения. Модель ансамблей классификационных деревьев для прогнозирования динамики финансовых временных рядов. Выбор алгоритма для анализа данных. Практическая реализация модели.

    дипломная работа [1,5 M], добавлен 21.09.2016

  • Значения переменных, важных в процессе принятия решений. Разработка методов прогнозирования. Основной принцип работы нейросимулятора. Зависимость погрешностей обучения и обобщения от числа нейронов внутренних слоев персептрона. Определение ошибки сети.

    презентация [108,5 K], добавлен 14.08.2013

  • Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.

    контрольная работа [179,4 K], добавлен 25.03.2014

  • Описание алгоритма культурного обмена и проведение экспериментального исследования средней трудоемкости алгоритма случайного поиска. Основные идеи алгоритма и эффективность итерационных методов решения. Зависимость функции качества от длины генотипа.

    курсовая работа [373,3 K], добавлен 24.06.2012

  • Анализ рентабельности активов как отношения чистой прибыли к среднему значению совокупных активов. Вертикальный анализ актива бухгалтерского баланса ПАО "ВЕРОФАРМ". Тестирование существующих моделей ROA на выборке российских фармацевтических компаний.

    дипломная работа [728,1 K], добавлен 09.09.2016

  • Порядок построения линейного регрессионного уравнения, вычисление его основных параметров и дисперсии переменных, средней ошибки аппроксимации и стандартной ошибки остаточной компоненты. Построение линии показательной зависимости на поле корреляции.

    контрольная работа [75,1 K], добавлен 29.01.2010

  • Планирование выплаты кредита "постнуменрандо" (равными долями). Разработка финансовых решений по срокам и объемам выплат денежных средств. Выполнение двух лабораторных работ с помощью электронных таблиц Excel. Подбор самого экономичного варианта обучения.

    контрольная работа [18,1 K], добавлен 04.11.2009

  • Исследование изменения во времени курса акций British Petroleum средствами эконометрического моделирования с целью дальнейшего прогноза с использованием компьютерных программ MS Excel и Econometric Views. Выбор оптимальной модели дисперсии ошибки.

    курсовая работа [1,2 M], добавлен 14.06.2011

  • Общие понятия статистической проверки гипотез. Проверка гипотез на основе выборочной информации, понятие нулевая и альтернативная гипотезы. Формулировка общего алгоритма проверки. Проведение проверки статистической гипотезы в системе "Minitab" и MS Excel.

    методичка [741,9 K], добавлен 28.12.2008

  • Решения, связанные с рисками. Снижение риска с помощью статистической теории принятия решений. Применение модели платежной матрицы и различных ее вариантов. Направленность изменений соотношений темпов роста показателей, формирующих динамические модели.

    контрольная работа [41,2 K], добавлен 28.03.2013

  • Построение эмпирической модели, оценивающей связи между акциями, ценой сырой нефти, курсом рубля к доллару и фондовыми индексами США и РФ. Исследование временных рядов на наличие коинтеграции. Анализ взаимного влияния котировок акций нефтяных компаний.

    дипломная работа [11,1 M], добавлен 26.10.2016

  • Построение адаптивной мультипликативной модели Хольта-Уинтерса, оценка ее точности и адекватности с использованием средней относительной ошибки аппроксимации. Построение точечного прогноза. Отражение на графике фактических, расчетных и прогнозных данных.

    контрольная работа [816,2 K], добавлен 23.03.2013

  • Розробка структури інформаційної системи. Характеристика економічних задач і функцій. Розробка математичного і машинного алгоритмів рішення задач. Інформаційне і організаційне забезпечення. Технічне і програмне забезпечення. Контрольний приклад.

    курсовая работа [293,2 K], добавлен 08.11.2008

  • Метод развертки вслепую. Понятия и построение модели для простейшего случая. Подгонка параметров: целевая функция, подбор независимых компонент и функции нелинейности. Настройка процесса обучения. Адаптация алгоритма под реалии рынка обмена валюты.

    курсовая работа [1,1 M], добавлен 17.10.2016

  • Динамические, стохастические, дискретные модели имитационного моделирования. Предпосылки, технологические этапы машинного моделирования сложной системы. Разработка имитационной модели автоматизированного участка обработки деталей, ее верификация.

    дипломная работа [224,3 K], добавлен 05.09.2009

  • Составление оптимального плана загрузки оборудования на основании данных о фонде машинного времени и производственной программе по видам изделий. План транспортных связей пунктов производства с перевалочными пунктами и потребителями готовой продукции.

    задача [211,6 K], добавлен 08.06.2010

  • Алгоритм минимизации функции нескольких переменных методами сопряженных градиентов и покоординатного спуска. Проведение сравнения их скорости работы, выделение основных достоинств и недостатков. Программа для проведения исследований градиентным методом.

    курсовая работа [427,4 K], добавлен 09.02.2013

  • Методика и особенности вычисления показателей качества, а также графическое изображение его различных звеньев. Анализ и оценка динамики коэффициента передачи, времени нарастания, перерегулирования, количества колебаний, статистической точности и ошибки.

    лабораторная работа [2,1 M], добавлен 01.12.2009

  • Построение математической модели и решение задачи математического программирования в средах MathCad и MS Excel. Решение систем с произвольными векторами свободных коэффициентов. Определение вектора невязки. Минимизация и максимизация целевой функции.

    отчет по практике [323,5 K], добавлен 01.10.2013

  • Характеристики и свойства условно-гауссовской модели ARCH для прогнозирования волатильности стоимости ценных бумаг. Акции предприятия на рынке ЦБ. Оценка параметров модели ARCH для прогнозирования их доходности методом максимального правдоподобия.

    курсовая работа [161,5 K], добавлен 19.07.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.