Выявление недооцененности и переоцененности акций методами машинного обучения
Акции компаний - один из наиболее важных финансовых инструментов. Минимизация эмпирического риска, возникающего в период машинного обучения - процесс, который заключается в уменьшении средней ошибки используемого алгоритма на статистической выборке.
Рубрика | Экономико-математическое моделирование |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 04.12.2019 |
Размер файла | 576,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru
Введение
В современном мире постоянно происходят непрогнозируемые события, которые могут сильно повлиять на состоянии как экономики в целом, так и на состояние определенной компании. Для того, чтобы ориентироваться на финансовом рынке, инвестор должен постоянно обращаться к финансовой отчетности компании, предсказывать реакцию рынка на медиа события и ориентироваться в факторах, которые могут повлиять на стоимость обращаемых на бирже финансовых инструментов.
Одним из ключевых финансовых инструментов являются акции компаний. Выпуск акций позволяет компании привлечь финансирование под важные проекты, что позволяет в будущем упрочить свои позиции в индустрии и стать более прибыльной. Во избежание рисков, инвестор должен знать, как именно финансовые показатели компании влияют на стоимость акций и какие показатели позволяют дать точный прогноз будущей стоимости компании.
Актуальность исследования.
Наличие переоцененности или недооцененности акций компании является важной и актуальной проблемой как с точки зрения практики, так и теории. Наличие пере- или недооцененности может дать с точки зрения теории предпосылки для сомнений в сильной или полусильной гипотезе эффективного рынка, так как переоцененность подразумевает предстоящее снижение стоимости акции, а недооцененность даёт основания ожидать повышении стоимости акций, что противоречит идеи о том, что стоимость акции уже отражает в себе всю информацию, находящуюся в публичном доступе при условии, что каждый участник рынка получает данную информацию одновременно с другими участниками рынка.
Рассмотрим практическую актуальность предсказаний на основе машинного обучения. Во-первых, методы машинного обучения являются очень эффективными для автоматизации многих рутинных задач, что даёт человеку большую свободу и позволяет заниматься сложными интеллектуальными задачами. Автоматизацию процессов методы машинного обучения можно рассматривать не только как инструмент, выполняющий простые, однообразные задачи, но и как инструмент, который сильно снижает роль человеческого фактора в принятии решений. Во-вторых, данная особенность таких методов позволяет, как минимум, снизить количество когнитивных искажений, с которыми люди встречаются каждый день, что отмечает в своих исследованиях Нобелевский лауреат по экономике, Даниэль Канеман (Tversky, A., & Kahneman, D. (1974)). В-третьих, методы машинного обучения могут работать с большими объемами данных. Они могут не только обрабатывать Большие Данные, но и улучшать качество модели при увеличении количества данных, что повышает конечную точность модели. В-четвертых, метод позволяет получить точные прогнозы, так как идея данных методов заключается в минимизации ошибки при предсказании.
Существует несколько способов, как можно выявить некорректную оценку стоимости. Один из способов заключается в том, что можно сравнить оценку стоимости компании на основе фундаментальных показателей и рыночную оценку компании в настоящий момент. К примеру, существуют ситуации, когда компания входит в стадию взрывного роста, что может сформировать у инвестора нереалистично высокие ожидания относительно будущих темпов роста. Данная ситуация может привести к существенной переоценке стоимости акций относительно фундаментальных показателей. Безусловно, на рынке может существовать и обратная ситуация: компания может иметь низкие относительно конкурентов в индустрии темпы роста и готовить к запуску инновацию, которая должна увеличить темпы роста. В данной ситуации рынок недооценивает стоимость акций компании, основываясь на финансовой отчетности.
У фундаментальной оценки, основанной на финансовой отчетности, есть определенные недостатки. Одним из них является то, что финансовая отчетность не может учитывать все факторы, которые могут повлиять на стоимость акций. К примеру, неожиданная негативная новость о компании через месяц после публикации отчетности, которая превзошла ожидания аналитиков, может обрушить котировки компании.
Другой способ выявления недо- или переоцененности акций заключается в прогнозировании следующей отчетности и определения того, как изменится стоимость акции в зависимости от финансовых результатов компании в следующем квартале.
Вывить неоцененность недо- или переоцененность акций можно при помощи методов ситуационного анализа в сфере медиа публикаций. Данный метод заключается в разработке алгоритма, который на основе информации в новостных источниках определяет эмоциональную окраску и возможное влияние новости на стоимость акций компании. Для разработки вышеописанного метода требуется модель распознавания текста и алгоритм, который на основе семантических оттенков (Hбjek et al. (2013)) определяет возможный эффект от данной новости. Например, новости о компании, в которой содержится яркая лексика, будет дан больший вес в модели семантических оттенков.
Стоит отметить, что цены на финансовые активы очень динамичны и связь между ценами и финансовыми показателями активов не линейна, из чего можно сделать вывод, что финансовые временные ряды сложно прогнозировать.
Цель данной работы заключается в изучении и разработке алгоритмов для определения недо- или переоцененности акций методами машинного обучения на основе ежеквартальной финансовой отчетности компаний. Идея данного метода состоит в том, что публикация новой финансовой отчетности предоставляет возможность спрогнозировать движение цен акций компании на коротком временном промежутке (10 дней в данной работе). Так, при публикации отчетности алгоритм предсказывает, вырастет или упадёт цена акции через 10 дней, другими словами, модель прогнозирует пере- или недооценку стоимости компании участниками рынка.
Задачи в данной работе следующие:
1. изучить релевантную литературу, где была отражена схожая проблематика
2. исследовать существующие методы решения вышеописанной проблемы
3. поиск, сбор и агрегация данных
4. определение подходящих методов машинного обучения для решения проблемы
5. разработка модели выявления недо- или переоценки на основе финансовой отчетности
6. сравнение точности модели с схожими моделями, которые были рассмотрены в обзоре литературы
7. формирование рекомендаций и планов по дальнейшему улучшению модели
В данной работе объектом исследования является прогноз цены на акции компаний на основе публикации финансовой отчетности в индустрии офлайн ритейла в США и Канаде для компаний, чьи акции размещены на бирже NYSE (New York Stock Exchange) и TSE (Toronto Stock Exchange).
Предметом исследования является алгоритм по выявлению взаимосвязи финансовых показателей в отчетности компании и направлением переоценки стоимости акций.
В данной работе по ходу решения исследовательской задачи и выполнения расчетов будут проверены нижеперечисленные гипотезы:
Гипотеза 1. Классические классификаторы в машинном обучении могут конкурировать с прогнозами финансовых аналитиков.
Цель данной гипотезы заключается в том, чтобы сравнить точность предсказаний между методами машинного обучения и сравнить полученные результаты с поведением рынка, чтобы проверить, насколько точнее предсказания, полученные классическими методами машинного обучения.
Гипотеза 2. Благодаря классификационным методам машинного обучения можно извлекать прибыль.
Данная гипотеза призвана проверить практическую применимость методов машинного обучения в сфере монетизации финансовых прогнозов. Подтверждение данной гипотезы будет свидетельствовать о наличии экономической целесообразности разработки моделей данного типа.
Гипотеза 3. Модель, состоящая из комбинации методов машинного обучения, покажет большую предсказательную точность, чем у моделей, обученных по отдельности.
Вышеописанная гипотеза свидетельствует о том, что комплексные модели должны показывать большую точность, чем простые модели. Данная гипотеза должна быть проверена по причине того, что в большинстве исследований ученые обходились только простыми, классическими методами. Проверка точности моделей разной сложности обладает исследовательской ценностью.
Гипотеза 4. В терминах гипотезы эффективности рынка Юджина Фамы (Malkiel and Fama (1970)) рынок США и Канады не обладает сильной эффективностью.
Данная гипотеза призвана показать, что рынок не используют всю публично доступную информацию при определении стоимости акции. Важность данной гипотезы обусловлена тем, что успешное прогнозирование возможно при отсутствии сильной эффективности на рынке.
Научная новизна работы, как можно заметить из гипотез, заключается в разработке классификатора ежеквартальной финансовой отчетности, оценке точности различными классификаторами предсказательной способности модели и в исследовании комплексных методов классификации.
1. Обзор литературы
На сегодняшний день существует большое количество исследований, цель которых заключается в определении причин, влияющих на рынок акций. В данной работе было проанализировано большое количество различных исследований, в большинстве из которых методами машинного обучения ученые предсказывают цену на акцию или классифицируют акции на предмет будущей переоценки.
Первой ключевой работы по выявлению факторов, влияющих на рынок акций, считается работа Ball & Brown (1968), в которой исследователи рассмотрели изменение стоимости акции компании в зависимости от годового отчета о финансовых результатах. Для определения влияния годового отчета о финансовых результатах ученые использовали 2 модели: регрессионная модель и наивная модель. В регрессии 2 переменных: чистый доход (net income) и доход на акцию (EPS). В наивной модели используется только доход на акцию. Наивная модель используется учеными как способ проверки статистической эффективности регрессионной модели: в наивной модели доход в текущем году ожидается равным доходу в прошлом году. Предсказанием в данной модели является изменение дохода с прошлого года. Данные в исследовании делятся на 3 типа: информация о финансовых результатах из отчетности, дата публикации отчетности, динамика цен акций около даты публикации отчетности. При выборе компаний для последующего анализа исследователи сформировали критерии: наличие отчетности за последние 20 лет, непрерывные данные о динамике акций за 8 лет, наличие публичной даты анонса финансовой отчетности.
Исследователи пришли к следующим выводам: во-первых, рынок, как правило, реагирует согласно следующим образом: если финансовые результаты компании превосходят ожидаемые, то акции дорожают, если же результаты не оправдывают ожиданий, тогда стоимость акций снижается. Во-вторых, исследователи подмечают, что рынок начинает реагировать на возможное расхождение реального результата и прогноза заранее. Первые корректировки цены начинаются за несколько месяцев до выпуска годового отчета и корректировки продолжаются еще месяц после выпуска отчета. Таким образом, информация о финансовой отчетности компании влияет на то, как участники рынка оценивают акции компании. Также ученые считают, что компании, у которых в наивной модели EPS отрицательный в период, когда у большинства компаний он положителен, стимулируют рынок отказываться от «неуспешных» компаний, что в последствии приводит к ситуации, когда от «неуспешных» компаний низкие финансовые ожидания.
Говоря о реакции рынка на новую финансовую информацию необходимо рассмотреть работы, затрагивающие эффективность финансового рынка. Данный аспект является очень важным в исследовательской работе, так как исследовательский вопрос может быть разрешен при условии отсутствия сильной эффективности, то есть при наличии исследований, которые доказывают, что в цена финансового актива содержит в себе всю доступную информацию не в каждый момент времени.
Классическая работа Малкиеля и Фамы в 1970ом году (Malkiel and Fama (1970)) заслуживает упоминания, так как в данной работе была предложена гипотеза эффективного рынка. Данная гипотеза заключается в том, что финансовые рынки реагируют и учитывают в ценах только что произошедшие события мгновенно, то есть, согласно гипотезе эффективного рынка, предсказывать движение цен на акции невозможно, так как в цене на активы в любой момент времени учтена вся доступная информация. Фама и Малкиель предлагают в своей исследовательской работе несколько видов данной гипотезы. Слабая форма гипотезы эффективного рынка заключается в том, что в ценах заключена информация только о предыдущей динамике цен. Полусильная гипотеза заключается в том, что в цене на актив содержится не только предыдущие цены, но и иная публично доступная информация, например, годовые финансовые отчетности и дополнительные эмиссии акций. Сильная гипотеза эффективного рынка гласит, согласно Фаме и Малкиэлю, что даже непубличная информация уже известна некоторым инвесторам, что уже, в свою очередь, повлияло на стоимость акций. Как упоминалось выше, данная теория является ключевой для предсказания движения на финансовых рынках, так как создание постоянно прибыльных систем, основанных на предсказаниях будущих финансовых изменений, может являться свидетельством о нарушении одной или более форм гипотезы эффективного рынка. (Timmermann and Granger, 2004, p. 16)
До того, как ученые начали вводить методы машинного обучения для решения исследовательских задач применялись эконометрические модели. В работах Энгля в 1982 (Engle (1982)) и Болерслев в 1986 (Bollerslev (1986)) были предложены эконометрические методы с условной авторегрессивной гетероскедаскичностью, модели ARCH. В моделях данного типа условная дисперсия зависит от предыдущих ошибок при условии удержания переменных без условий в роли констант. Болерслев в вышеупомянутой статье обобщил модель Энгля, так как учел собственную дисперсию модели в процессе авторегрессии, что привело к созданию обобщенной модели с условной авторегрессивной гетероскедаскичностью, модели GARCH. Данный инструмент является полезным для анализа и получения предсказаний из временных рядов, однако модели ARCH и GARCH не подходят для работы с финансовыми временными рядами, так как финансовые рынки изменяются нелинейно из-за различных политических и экономических событий (Gцзken et al.,334 2016, p. 320), что делает GARCH непригодной для прогнозирования на основе финансовых временных рядов. (Lahmiri and Boukadoum, 2015, p. 1550001-2). Таким образом, для прогнозирования на основе финансовых данных используются иные методы. Одним из них является метод Элмана (Elman (1990)), особенность которого заключается в предсказательной модели используется запоминающее устройство-предшественник, что, безусловно, имеет сильной сходство с нейронными сетями.
Согласно работе Бруно Генрико и Герберта Кимура (B. Henrique , H. Kimura, 2019) , где ученые провели анализ частоты упоминаний и цитирования работ с различными методами решения задачи прогнозирования финансовых временных рядов, в большинстве наиболее цитируемых статей используются нейронные сети или вариации методов машинного обучения. В статьях на данную тему прогнозирования и классификации на финансовых данных также часто используется метод опорных векторов (о принципе работы данного и иных методах детально будет рассказано в главе 3), о чем свидетельствует самая цитируемая в данной тематике работа от исследователя Ким в 2003, которая использует для классификации цены акций на следующий день именно метод опорных векторов (Kim 2003).
Предсказывать будущую стоимость акций с определенной точностью научились относительно недавно. Самая ранняя работа, в которой исследователям удалось исследовать тему предсказания цен является труд Юн, 1993его года (Yoon, 1993), в которой также было продемонстрировано, что нейронные сети показывают более высокие результаты относительно результатов анализа дискриминант. Также среди наиболее цитируемых исследований на данную тему находятся работы Хорника (Hornik, 1989 & Hornik, 1991), которые дали последующим ученым базу для использования нейронных сетей с учетом возможностей аппроксимации в модели. Так, работа Хорника позволила другим ученым (Abu-Mostafa and Atiya,1996) настроить нейронные сети для решения задачи прогнозирования на финансовом рынке. Так, далее при обучения нейронных сетей начали использоваться не только обучающие подмножества входных данных, но и исторические знания об активе, например, финансовые мультипликаторы.
Следующая рассматриваемая статья является очень ценной для разработки алгоритма в данной работе, так как в описываемой статье используются схожие методы при наличии похожей исследовательской цели. В статье из Стенфордского университета (Yuqing Dai, Yuning Zhang, 2016) исследователи пытаются предсказать цену на акцию на основе не только торговых данных с биржи, но и на основе финансовых показателей. Таким образом, можно считать, что данная работа является примером фундаментального анализа с методами машинного обучения. Данные в исследовании состоят из 16 признаков. Одними из них является коэффициент P/E, EBITDA, EPS, бета с учетом долга компании. Для классификации была введена дамми-переменная: «0» или «1» в зависимости от того, выросла ли цена акции на этот день. Если цена выросла, то «1», если нет, то «0». В исследовании рассматривается 500 компаний, которые включены в S&P 500 индекс в момент начала исследования, 1 сентября 2008. Также стоит отметить, что данные каждодневные с 2008 по 2013 год и взяты из терминала Bloomberg.
70% данных исследователи используют для обучения моделей, а оставшиеся 30% используют для тестирования.
Исследователи испытывают несколько моделей: логистическую регрессию, метод опорных векторов, анализ дискриминант Гаусса и квадратичный анализ дискриминант. К сожалению, исследователи пришли к выводу, что предсказание цены на следующий день показывает низкую точность
Табл. 1. Точность предсказания различными моделями в работе Даи и Жанга
Как можно заметить, наибольшая точность приходится на квадратичный анализ дискриминант, однако 58% точности значит, что это близко к точности от подбрасывания монетки. Таким образом, точность достаточно низкая.
Несмотря на низкую точность в краткосрочном предсказании, исследователи добились высокой точности в долгосрочных прогнозах. Одна из причин, почему более долгосрочное предсказание является подходящей задачей для фундаментального анализа с методами машинного обучения, заключается в том, что на некоторые изменения финансовых показателей рынок реагирует не сразу. Для проверки данной гипотезы исследователи рассмотрели, как будет меняться точность предсказания в зависимости от изменения событийного окна.
Как можно увидеть на графике с описанием точности, на большинстве тестов лучшие показатели у метода опорных векторов. Данный результат является очень ценным для данной работы, так как метод опорных векторов является единственным методов машинного обучения из рассматриваемых в исследовании. Таким образом, если метод опорных векторов стабильно показывает большую точность, то можно сделать вывод, что не только искусственные нейронные сети являются подходящими для финансовых прогнозов на основе временных рядов.
Рис. 1. Зависимость точности от размера событийного окна в исследовании Даи и Джанга
В исследовании также рассматривается поход по отбору переменных для лучшей модели, метода опорных векторов. Как можно заметить на графике, чем больше переменных в методе опорных векторов, тем выше точность, однако существует ситуация, когда большее количество переменных не приводит к увеличению точности. Таким образом, нельзя сказать, что каждая новая переменная увеличивает точность, однако, в среднем, чем больше переменных, тем лучше.
Рис. 2. Зависимость точности от количества параметров в модели в исследовании Даи и Джанга
После получения хорошей точности исследователи решили проверить, может ли такая стратегия приносить прибыль. Если данная стратегия прибыльна, то важно изменить, насколько она прибыльна, так как важна лишь та прибыльность, которая выше, чем доходность по долгосрочным долговым облигациям государства или доходность по одному из относительно безрисковых индексов на бирже.
Торговая стратегия у ученых основывается на следующем правиле: каждые 44 дня принимается решение, удерживать или продать акцию компании, основываясь на том, как будет классифицирована акция. Промежуток в 44 дня выбран по причине того, что на этом интервале метод опорных векторов показал наибольшую точность. Доходность торговой стратегии за 4 года составляет 19.3% годовых при том, что доходность набора акций компаний, на которых тестировалась стратегия, без торговли составляет 12.5%.
Работа Penman & Chambers (1984) рассматривает время публикации ежеквартальных отчетностей и их содержание как факторы, влияющие на цену акции. Первый фактор оценивался следующим образом: сначала анализировалось, выпущена ли отчетность раньше или позже ожидаемой даты публикации отчетности. Исследователи пришли к следующим выводам: во-первых, публикация отчетности часто происходит после ожидаемой даты публикации. Для квартальных отчетностей средним лагом в публикации считается 3-4 дня, для годовой отчетности лаг, в среднем, равен 7 дням. Во-вторых, чем больше компания, тем меньше лаг публикации. В-третьих, зависимость между лагом и размером компании неоднозначна: для маленьких компаний реакция на публикацию отчетности сильнее, если лаг публикации низкий в зависимости от направленности отчетности, то есть для «хороших» отчетностей, когда результаты превысили ожидания аналитиков, разница в реакции наблюдается, для «плохих» новостей сила реакции статистически не отличается.
Также ученые отметили, что при публикации отчетности раньше объявленного срока, реакция рынка была сильнее. Таким образом, согласно исследователям, неожиданно ранние публикации рассматриваются рынком как более положительные. В случае наличия лага публикации, рынок считает новости «плохими», так как доходность относительно других типов лагов ниже.
В публикации Ман и Менике (Man & Menike, 2013) рассматривают влияние публикации ежеквартальной финансовой отчетности на аномальную доходность во даты публикации отчетностей. Данные представляют делятся на финансовые отчетности за 5 лет у компаний банковского сектора на Шри-Ланке и информацию о динамике стоимости акций. Результатом данного исследования является вывод о том, что даты, близкие к публикации финансовой отчетности, обладают аномальной доходностью. Исследователи также обнаружили, что данный значим только на 10% уровне значимости. Таким образом, можно сделать вывод о том, что годовой отчет о прибылях и убытках обладает ценной информацией для инвесторов и несет в себе информацию, которая может приносить аномальную доходность.
В работе Roley & Pearce (1984) проводится анализ зависимости цены акций от изменений макроэкономических показателей. Данные в данном исследовании состоят из трех элементов. Первым элементом является цена акции в период t, где цена акции - это значение индекса S&P 500. Вторым элементом является дата, когда была опубликована информация о текущей ситуации с денежной базой первого уровня (М1), ключевая ставка от Федеральной Резервной Системы США, уровень промышленного производства и уровень безработицы, опубликованные Бюро Трудовой Статистики США. Стоит отметить, что данный показатель, по сути, выражает уровень инфляции, что, в свою очередь, влияет как на индекс потребительских цен, так и на индекс цен производителей. Третий элемент состоит из дат, когда, согласно 60 крупнейшим участникам финансового рынка, ожидания отличались от реальных новостей от государственных статистических органов.
Исследователи пришли к выводу, что информация о монетарной политике страны имеет статистически значимое влияние на динамику цен. Так, неожиданные для рынка объявления об изменении денежного предложения негативно влияют на цены акций. Также ученые пришли к выводу, что объявления на тему инфляции имеют ограниченный эффект - эффект значим лишь в первую неделю, после первой недели цены возвращаются к прежним уровням. Последним результатом в работе Ролей и Пирса является то, что ожидаемые рынком объявления не имеют статистически значимого влияния на цены, что соответствует гипотезе эффективного рынка.
Таким образом, цена на акцию зависит от многих признаков, которые нельзя спрогнозировать. Стоит отметить, что по данной причине предсказывать цены на акции проблематично, так как все признаки в определенный момент времени учитывать нельзя - точность не может быть равна 1.
В работе Н. Хлюпиной и Н. Берзона (Хлюпина, Берзон, 2016) рассматривается динамика акций при изменениях рекомендаций аналитиков. Данные в исследовании включают в себя как период восстановительного роста с 2009 по 2011, период последующего падения в 2012 и движения боком с 2012 по 2015 года, что дало возможность сделать точный тест на устойчивость. В результате исследования авторы пришли к выводу, что положительное изменение рекомендаций приводит к появлению аномально доходности, однако после 45 дней аномальная доходность обнуляется. Негативные изменения со стороны аналитиков приводят к постепенному понижению котировок без последующего выравнивания. Так, гипотеза о наличии «отката» после объявления пересмотренных рекомендаций выполняется только при позитивном пересмотре.
Одним из объяснений данной особенности рынка, по мнению Хлюпиной и Берзона, является наличие на рынке непрофессиональных инвесторов, которые не обладают ресурсами для проверки фундаментальных показателей, что подталкивает на торговлю на основе рекомендаций, тем самым влияя на цены в направлении рекомендации и спустя некоторое время завышенная стоимость падает благодаря профессиональным игрокам рынка. Отсутствие у большинства непрофессиональных или «шумовых» инвесторов коротких позиций по финансовым инструментам не приводит к «шумовому» искажению при понижении рекомендованной цены со стороны аналитика, поэтому цена начинает «дрифтовать» благодаря обоснованным опасениям профессиональных игроков.
Исследователи пришли к выводу, что российский рынок неэффективен, так как на рынке есть возможности создать прибыльную стратегию на основе рекомендаций аналитиков, что невозможно сделать на эффективном рынке из-за отсутствия силы у рекомендаций на цены акций, так как на момент пересмотра рекомендации вся информация уже отражена в цене на акцию.
2. Методология
Существует два принципиально разных подхода к определению стоимости акций. Технической анализ заключается в том, что об акции собирается информация о динамике на основе исторических данных. В техническом анализе входными данными являются данными с динамикой цен на акции в разное время. Фундаментальный анализ отличается от технического тем, что компания рассматривается как то, что обладает собственными финансовыми характеристиками, основанными на финансовых коэффициентах и финансовой отчетности компании. Так, финансовые показатели компании на прямую влияют на стоимость компании. Цель фундаментального анализа заключается в предсказании будущей цены на акцию на основе финансовых показателей. В данной работе будет взят за основу подход, основанный на элементах фундаментального анализа, так как классификация происходит на основе финансовых показателей компании в момент публикации ежеквартальной отчетности.
Ниже рассматриваются основные понятия и принципы машинного обучения. Данный шаг необходим, чтобы сформировать понимание принципов работы и выбрать подходящие методы.
Введем базовые термины из теоретических работ по машинному обучению, чтобы в дальнейшем описывать модель и особенности алгоритмов, используемых в данной работе с пониманием, как происходит обучение моделей.
Акция компании в момент времени t обладает определенным конечным множеством признаков.
В данной работе используются модели, где обучение происходит с учителем, поэтому далее будут описаны термины, относящиеся к этому типу обучения. Под обучением с учителем понимается процесс обучения модели, где уже есть ответ. Ответ в данной работе является бинарной переменной: «1», если через t дней после публикации отчетности цена компании выросла относительно даты публикации, «0», если цена через t дней снизилась.
Объектом в данной работе является акция компании в момент t. Объект имеет определяемым извне набором признаков. Множеством объектов является Х.
Признаком является элемент, который обладает информацией об объекте. В данной работе признаками могут являться такие элементы как чистая доход на акцию годовой рост выручки, соотношение долгосрочных обязательств к активам компании, соотношение долгосрочных обязательств к располагаемым наличным средствам. Стоит отметить, что далеко не все признаки являются полезными для обучения модели. К примеру, у акций компании могут быть признаки, которые являются опережающими или запаздывающими. Так, возможны ситуации, в которых признаки могут нести информацию противоположной направленности.
Ответом является параметр, который считается результатом модели. Как было сказано выше, ответ в данной работе бинарный. «1», если цена на акцию через t дней выросла, «0», если цена снизилась. Множеством допустимых ответов является Y.
Подмножество ответов состоит из двух переменных: {0, 1}
Выборка делится на 2 части: на обучающую и тестовую. В обучающей выборке ответы известны для модели, в тестовой выборке ответы должна предсказывать модель.
3. Описание данных
Для выполнения поставленной в работе задачи требуется выполнить следующие шаги:
Во-первых, должна быть определена отрасль исследований. Хорошей отраслью для решения этой исследовательской проблемы является отрасль, которая имеет следующие особенности: она относительно зрелая и стабильная (без значительного снижения рыночной стоимости в условиях экономического подъема) и имеющая слабую зависимость от товарных рынков. Поэтому отрасли, которые зависят, например, от цен на нефть, считаются неподходящими для данного исследования.
Во-вторых, должны быть собраны исчерпывающие финансовые данные, такие как квартальная финансовая отчетность, финансовые коэффициенты Bloomberg относительно отрасли и каждой компании в этой отрасли.
Информация не только о компаниях, но и об отрасли может дать дополнительную информацию об относительных позициях компаний в отрасли. Например, может потребоваться анализ взаимосвязи между долей рынка компании и ее финансовыми коэффициентами, поскольку данные по отрасли в целом могут быть полезны для понимания «силы» бизнеса компании. Например, высокие коэффициенты, связанные с рыночной оценкой, при меньшей долей рынке, чем у конкурентов, могут свидетельствовать о том, что компания является лидером в отрасли.
Финансовые данные состоят из 3 квартальных финансовых отчетов, ежедневных данных по ценам на акции.
Ежедневные торговые данные выбраны по следующей причине: недельные данные не позволяют отследить изменения в цене акций в день публикации отчетности, что является ключевой составляющей в обучении модели. Почасовые данные не увеличивают точность модели, так как, согласно методологии данной работы, для анализа используется цена акции во время закрытия биржи. Таким образом, дневные торговые данные являются подходящими для решения поставленных в работе задач.
После объединения всех данных рассчитываются общие финансовые коэффициенты. Если расчет коэффициента сталкивается с какой-либо проблемой, вместо этого используются коэффициенты Bloomberg Database. Это может быть необходимо на этапе подготовки данных, поскольку иногда невозможно правильно рассчитать коэффициент на основе финансовой отчетности. Например, долговые обязательства компании могут быть довольно сложными и требовать дополнительных данных для правильного расчета коэффициента задолженности.
Периодом исследования в рамках данной работы является 10 лет, но следует отметить, что некоторые данные могут быть отброшены из-за сроков, которые считаются оптимальными для алгоритма. Это может произойти, когда настройка временного периода показывает наилучшие результаты на сроках 3-5 лет. Например, циклические спады в экономике могут существенно изменить финансовые коэффициенты для конкретной отрасли, что снижает точность анализа. По данной причине алгоритм будет обучаться на разных сроках и будет выбран срок, на котором показана наивысшая точность.
Источником всех данных является терминал Bloomberg.
В процессе исследования были выгружены ключевые показатели ежеквартальных отчетностей 13 компаний США и Канады. А именно: Walmart Inc. (WMT), Target Corp (TGT), Costco Wholesale Corp. (COST), Alimentation Couche-Tard Inc (ATD.B), CVS (CVS), Dollar General Corp. (DG), Ingles Markets Inc. (IMKTA)The Kroger Co. (KR), Sprouts Farmers Market Inc. (SFM), Metro Inc (MRU), Loblaw Companies (L), SpartanNash (SPTN), Weis Markets Inc.(WMK).
Данные состоят из
А) Ответа Y, Y {0, 1},
где «0» - цена через 10 дней после публикации отчетности упала, «1» цена через 10 дней после публикации отчетности выросла
Б) Признаков:
1. P/E
2. P/Book
3. P/Sales
4. P/Cash Flow
5. EV/Sales
6. EV/EBITDA
7. EV/EBIT
8. Price/Share
9. Enterprise Value
10. Return on Common Equity
11. Return on Assets
12. Return on Invested Capital
13. Gross Margin
14. EBITDA Margin
15. Operating Margin
16. Pretax Margin
17. Income before XO Margin
18. Net Income Margin
19. Net Income to Common Margin
20. EPS
4. Теоретический аспект использования алгоритмов машинного обучения
финансовый алгоритм статистический
Рассмотрим функцию потерь L (y, y'), которая показывает, насколько ответ y = a(x) отличается от правильного ответа y' = y(x) на любом x принадлежащем X.
При решении задачи классификации используется пороговая функция потерь, где есть модель алгоритмов А = {a: X > Y}, в которой происходит отображение объекта в ответ.
Суть методов машинного обучения с учителем (только модели данного типа используются в исследовании) заключается в минимизации эмпирического риска, где эмпирический риск выглядит как:
,
Минимизация эмпирического риска заключается в уменьшении средней ошибки используемого алгоритма на выборке :
Конечной задачей является нахождение алгоритма А, который принимает наименьшее значение а.
В машинном обучении для определения, насколько качественно предсказание, используются различные метрики. Перед тем, как вводить сами метрики, рассмотрим матрицу ошибок. Из данной концепции в последствии определим метрики, используемые в работе.
Табл. 2
y= 1 |
y = 0 |
||
y' = 1 |
True Positive (TP) |
False Positive (FP) |
|
y' = 0 |
False Negative (FN) |
True Negative (TN) |
где у' является ответом предказывающего алгоритма a, y - реальный ответ для объекта
Accuracy - это доля правильных ответов алгоритмов. Недостаток данной метрики можно увидеть при наличии неравных классов.
Например, при наличии 110 объектов, где 100 в классе 0, а 10 в классе 1 и алгоритм 90 в классе 0 определил правильно, а в классе 1 определил 5 правильно, то accuracy будет равна 86.4% (TN = 90, FP = 10, TP = 5, FN = 5) алгоритм, который все объекты классифицирует как 0 будет иметь точность в 90.9%. Таким образом, данная метрика не всегда информативна и может не показывать истинную предсказательную силу.
Precision (точность) - метрика, показывающая долю элементов в классе, которые алгоритм предсказал правильно.
Recall (полнота) - это метрика, показывающая, как алгоритм может определять класс в целом.
Одним из способов соединения полноты и точности является F-measure.
Преимуществом сбалансированной F-меры является то, что как низкая точность, так и низкая полнота уменьшают меру и показывают предсказательную слабость модели.
При наличии неравномерно распределенных классов может быть полезна метрика ROC-AUC или Receiver Operation Characteristics curve - Area Under Curve, так как она отражает в себе площадь под кривой ошибок. Данная метрика выглядит как двумерное поле координат от (0,0) до (1, 1), где по оси абсцисс TPR, по оси ординат FPR
Как было описано выше, TPR соответствует полноте, False Positive Rate соответствует доли неверно предсказанных объектов «отрицательного» класса. Как можно заметить, чем больше площадь под кривой, тем лучше модель, то есть лучшая модель должна быть около точки (0 , 1), как можно заметить на графике ниже:
Рис. 3. Пример ROC кривой
Методы машинного обучения.
Для того, чтобы выбрать наиболее подходящие методы прогнозирования будущей стоимости акций стоит обратиться к исследованиям на схожие темы и определить лучшие способы решения данной исследовательской проблемы.
Суть машинного обучения в сфере финансовых предсказаний заключается в выявлении определенных зависимостей в исторических данных, последующего обучения модели на новых данных для получения точных прогнозов (Xiao, 2013, pp. 99-100).
Эмпирические статьи на тему машинного обучения состоят из двух этапов: на первом этапе исследователи фокусируются на определении подходящих переменных и моделей для предсказаний, определения обучающего массива данных и тестового массива данных для валидации результатов. Второй этап заключается в применении оптимизированных моделей на данных, предназначенных для тестирования, для оценивания результатов модели. (B. Henrique, V. Sobreiro, H. Kimura, 2019)
Исследователи B. Henrique, V. Sobreiro, H. Kimura в своей работе по выявлению рассматривают наиболее успешные методы машинного обучения в прогнозировании будущей стоимости акций. Они пришли к выводу, что наиболее часто в научных исследованиях на данную тему используются искусственные нейронные сети, метод опорных векторов и случайный лес. (B. Henrique, V. Sobreiro, H. Kimura, 2019)
Согласно исследованию Adya и Collopy (Adya and Collopy, 1998, p.481), нейронные сети моделируют биологические процессы человека, особенно в процессе обучения, восприятия информации и выявления закономерностей. Нейронные сети состоят из нейронов, которые эмулируют человеческие нейроны в мозгу. Нейроны пропускают через себя информацию в виде переменных и вносят определенные изменения в выходных данных, которые могут быть входными данными для других нейронов (Laboissiere et al., 2015, pp. 67-68). Все нейроны в нейронной сети взаимосвязаны и обладают уникальным весом для каждой отдельной связи с другими нейронами (Lahmiri, 2014, p. 1450008-5). Во время обучения веса в нейронных связях меняются для достижения большей точности модели (Kumar and Thenmozhi, 2014, p. 291). Стоит отметить, что в проанализированных научных статьях изменения весов происходят на первом этапе эмпирических исследований. На данном этапе происходит оптимизация не только взаимосвязей между слоями нейронов, но и параметры в функциях, передающих данные в следующие слои, что снижает ошибки. Последний слой в нейронной сети отвечает за суммирование всех сигналов из предыдущих слоев в единые выходные данные, которые являются ответов нейронной сети на входные данные.
В отличии от нейронных сетей, которые на каждом слое минимизируют ошибку в их эмпирической реакции на моменте обучения, метод опорных векторов заключается в минимизации верхний предел ошибок в классификации (Huang, 2005, p. 2514). Для того, чтобы выполнить данную задачу, в методы опорных векторов используется преобразование размерности исходных данных таким образом, что новая размерность данных позволяет провести линейное разделение данных на уровне большей размерности при помощи гиперплоскости. (Kara, 2011, p. 5314). Данный метод часто используется для того, чтобы классифицировать данные на основе вводных переменных при условии минимизации расстояния между классами данных и гиперплоскостью на неполном подмножестве данных во время обучения модели. Трансформация размерности данных в модели производится при помощи введения функции ядра с учетом ожидаемых параметров на обучающем подмножестве данных в модели. В работе Pai and Lin (2005, pp. 498-499) данная методика подвергается детальному рассмотрению.
Математически данный метод выглядит следующим образом:
Для выборки с функцией классификатором
,
где w - нормированный вектор, разделяющие гиперплоскость, х - подмножество объектов, b - константа. Идея алгоритма заключается в максимизации расстояние гиперплоскости до обоих классов, что происходит благодаря нахождению максимума, что можно увидеть на графике:
Рис. 4. Пример разделяющей плоскости в методе опорных векторов, где зеленые точки - класс 0, синие точки - класс 1.
Таким образом, задача оптимизации в данном случае выглядит следующим образом:
Как нейронные сети и метод опорных векторов, деревья решений также часто используются для решения исследовательской задачи по прогнозированию стоимости финансовых активов, как было отмечено в (Barak, 2017, p.91). Данный метод включает в себя деление данных на подмножества данных, которые разделяются по значениям входных переменных до момента, пока не будет достигнут однозначный класс в классификаторе на основе обучающего подмножества данных. Таким образом, модель подбирает условия классификации так, что входные переменные классифицируются заданным моделью образом на основе своих значений. Далее создается заданное пользователем количество вышеописанных деревьев с незначительными различиями в условиях классификации. После чего отбираются наиболее точные деревья решений и принимается решение на основе простого большинства классификационных ответов деревьев. (Breiman, 2001). Различные комбинации деревьев решений позволяют достичь высокой точности в сфере предсказаний на финансовом рынке, что можно увидеть в работе Кумара и Тхенмонзи, упомянутой выше. (Kumar and Thenmozhi ,2014)
В исследовательской работе используются решающие деревья, построенные по методу CART.
Алгоритм решающих деревьев для задачи классификации математически методом CART выглядит следующим образом:
Рассмотрим ситуацию, когда данные делятся на 2 класса, существует всего 100 объектов, истинные классы которых распределены как 50 объектов - класс 1, 50 объектов - класс 0, то есть 50:50, где каждые 50 объектов принадлежат к разным классам. Введение разбиений призвано снижать неопределенность. К примеру, при введении правил, которые определяют в класс 0 30:20 объектов и класс 1 20:30 объектов, неопределенность снижается. Гипотетически алгортим может полностью убрать неопределенность, если введет правила с классификацией в класс 0 0:50 и в класс 1 50:00 объектов. Для определения неопределенности вводится индекс Джини:
где n = 2 (в данной работе бинарная классификация), - это вероятность класса i в множестве X.
При разделении множества объектов Х на 2 подмножества: и с количеством объектов и , тогда индекс качества разбиения Gini split выглядит следующим образом:
Чем меньше значение разбиения Gini split, тем лучше. Обобщенная формула разбиения, по которой происходит классификации в дереве решений, выглядит так:
где L, R - количество объектов разных классов,- количество объектов класса i в потомке L, - количество объектов класса i в потомке R.
Таким образом, выбирается набор разбиений, у которых значения разбиения, то есть индекс Джини, является минимальным.
Среди исследовательских работ на тему предсказаний на финансовом рынке также можно встретить метод опорных векторов, который используется не как классификатор, а как регрессия, которая предсказывает значения на финансовых временных рядах. Данный тип методы опорных векторов называется регрессия опорных векторов (B. Henrique, V. Sobreiro, H. Kimura, 2019). Данная модель была использована в работе Хуанга и Тсай (Huang and Tsai (2009)). В статье авторы использовали метод регрессии опорных векторов для того, чтобы предсказать значения акции компании FITX тайваньской биржи (TAIEX) на основе различных показателей из сферы технического анализа. Данные были классифицированы при помощи самоорганизующийся карты параметров, которая кластеризует данные на основе схожих особенностей. SOFM-SVR модель в исследовании сократила время работы алгоритма без самоорганизующийся карты параметров (SOFM) в 3 раза. Важно отметить, что результаты, полученные с классификацией, превосходят результаты без самоорганизующейся карты параметров, что может свидетельствовать о возможности получить большую прибыль.
Описание процесса обработки данных, настройка моделей и процесса обучения.
После выбора моделей, загрузки данных и выбора подходящих признаков обязательно настроить модели и обучить их. Подготовка данных и обучение состоит из следующих пунктов:
1. Выбор параметров и выгрузка данных
2. Обработка данных
3. Вычисление производных признаков на выгруженных данных
4. Деление выборки на обучающее и тестовое подмножества
5. Преобразование и отбор информативных признаков
6. Обучение модели
7. Проверка точности модели
Выбор параметров и выгрузка данных
Выбор, описание и обоснование выбора данных было выполнено в главе 2. После выгрузки из терминала Bloomberg все данные объединялись в один .xlsx файл.
Обработка данных
Для корректной работы модели необходима обработка выгруженных из терминала Bloomberg данных. Например, столбец с датой публикации отчетности был преобразован из «yyyy/dd/mm» в формат «dd/mm/yyyy», с которым может работать Excel.
Вычисление производных признаков на выгруженных данных
Для выгруженных признаков дополнительно были посчитаны показатели прироста относительно предыдущей отчетности, и относительно отчетности в соответствующем квартале прошлого года .
Два типа прироста могут давать разную информацию. Например, в приросте относительно соответствующего квартала прошлого года по выручке отсутствует искажение из-за сезонности бизнеса.
Таким образом, модель на вход получила 60 признаков.
Деление выборки на обучающее и тестовое подмножества
Модели обучались на данных, разделенных тремя способами:
1. Случайное разделение на обучающую и тестовую выборку, где доля тестовой 15%.
2. Кросс-валидация данных на 3 разбиениях при помощи метода GridSearchCV из библиотеки sklearn.model_selection
3. Кросс-валидация данных с одинаковым соотношением классов на каждом разбиении. Для получения такой выборки использовался метод StratifiedKFold из библиотеки sklearn.model_selection
Идея метода кросс-валидации заключается в том, что данные делятся на К частей, где К-1 частей используются как обучающая выборка, а оставшийся части модель тестируется. Итеративно модель перебирает все К частей как тестовые, что увеличивает итоговую точность предсказания модели.
Преобразование и отбор информативных признаков
После отбора и вычисления дополнительных признаков были использованы методы по преобразованию данных для улучшения качества предсказания.
Данные были преобразованы методом главных компонент. Метод главных компонент был использован для того, чтобы уменьшить размерность данных при наименьшем уменьшении количества информации.
Также использовался рекурсивный отбор признаков. Данный метод в Python содержится в библиотеке sklearn.feature_selection как RFECV. Рекурсивные отбор признаков работает по принципу рекурсивного исключения признаков с запуском выбранного метода машинного обучения с кросс-валидацией данных. Результатом данного метода является число признаков, которые дают наибольшую точность.
Для того, чтобы оставить наиболее информативные с точки зрения дисперсии признаки в работе используется метод VarianceThreshold из библиотеки sklearn.feature_selection. Суть метода заключается в отборе признаков, дисперсия которых превышает порог (threshold), заданный как гиперпараметр. Как правило, при исключении признаков с низкой дисперсией, то есть слабо изменяющихся, точность моделей увеличивается.
Обучение модели
Непосредственное обучение модели в Python осуществляется в несколько строчек - из библиотек SkLearn выгружается необходимая модель, модель учится на обучающей выборке и тестируются.
Стоит отметить, что многие модели обладают гиперпараметрами - параметрами, которые пользователь может изменять. К примеру, в random forest возможно вручную изменять порог по похожим признакам для создания листа.
Для того, чтобы максимально полно проверить, насколько модель подходит для решения задачи и предсказывает финансовые данные, был использован метод GridSearchCV из библиотеки sklearn.model_selection. Помимо кросс-валидации данных, данный инструмент позволяет перебирать гиперпараметры и тестировать каждую комбинацию. С GridSearchCV можно значительно улучшить точность предсказания по сравнению с моделью, где параметры выбраны «по умолчанию». В каждой модели тестировалось более 200 комбинаций гиперпараметров для достижения лучших результатов.
Проверка точности модели
Для проверки качества предсказаний были использованы следующие метрики:
1. Accuracy
2. Полнота
3. Точность
4. F-мера
5. AUC-ROC кривая
Формулы, преимущества и недостатки метрик описаны в главе 3.1.
Метрики качества очень важны для обучения. Если показатели метрик низкие, то тестируются новые параметры, новые разбиения данных при различных методах обработки признаков. Благодаря итеративному изменению параметров моделей и признаков на основе показателей метрик качества происходит обучение моделей.
В параграфе с оценкой эффективности можно увидеть детальное описание результатов моделей с учетом разных метрик качества.
Оценка эффективности рассмотренных моделей.
Как было отмечено в параграфе с описанием данных и параграфе про вычисления производных признаков, в моделях используется много разнообразных финансовых показателей. Несмотря на большое количество признаков, далеко не все являются полезными для обучения модели, так как признаки в финансовых задачах могут быть как опережающими, так и запаздывающими. Чтобы исключить неоднозначные признаки и оставить только однозначно влияющие на обучение признаки, был использован метод RFECV, суть которого была описана в параграфе про отбор информативных признаков. Визуализация данного метода подтверждает гипотезу о запаздывающих и опережающих признаках, как видно на графике 5. Таким образом, для классификации финансовой отчетности оптимальны наборы из 7 параметров.
Рис. 5. F-1 мера для разного количества признаков в методе RFECV
Наилучшими результатами обладает случайный лес без метода главных компонент с наличием порога дисперсии. В таблице 2 представлены параметры случайного леса, полученные методом GridSearchCV (описан в параграфе про обучение модели) и метрики качества предсказания. Таким образом, в работе удалось добиться высокой точности классификации.
Табл. 3. Параметры Random Forest с порогом дисперсии и метрики качества
В таблице 3 можно увидеть метрики качества для используемых алгоритмов. Стоит заметить, что все модели показатели результаты лучше, чем случайное предсказание. Худшие результаты у GaussianNB (Наивный Байесовский классификатор) из библиотеки sklearn.naive_bayes. Данный алгоритм является наиболее простым из используемых, поэтому слабые результаты у Байесовского классификатора были ожидаемы.
...Подобные документы
Классические подходы к анализу финансовых рынков, алгоритмы машинного обучения. Модель ансамблей классификационных деревьев для прогнозирования динамики финансовых временных рядов. Выбор алгоритма для анализа данных. Практическая реализация модели.
дипломная работа [1,5 M], добавлен 21.09.2016Значения переменных, важных в процессе принятия решений. Разработка методов прогнозирования. Основной принцип работы нейросимулятора. Зависимость погрешностей обучения и обобщения от числа нейронов внутренних слоев персептрона. Определение ошибки сети.
презентация [108,5 K], добавлен 14.08.2013Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.
контрольная работа [179,4 K], добавлен 25.03.2014Описание алгоритма культурного обмена и проведение экспериментального исследования средней трудоемкости алгоритма случайного поиска. Основные идеи алгоритма и эффективность итерационных методов решения. Зависимость функции качества от длины генотипа.
курсовая работа [373,3 K], добавлен 24.06.2012Анализ рентабельности активов как отношения чистой прибыли к среднему значению совокупных активов. Вертикальный анализ актива бухгалтерского баланса ПАО "ВЕРОФАРМ". Тестирование существующих моделей ROA на выборке российских фармацевтических компаний.
дипломная работа [728,1 K], добавлен 09.09.2016Порядок построения линейного регрессионного уравнения, вычисление его основных параметров и дисперсии переменных, средней ошибки аппроксимации и стандартной ошибки остаточной компоненты. Построение линии показательной зависимости на поле корреляции.
контрольная работа [75,1 K], добавлен 29.01.2010Планирование выплаты кредита "постнуменрандо" (равными долями). Разработка финансовых решений по срокам и объемам выплат денежных средств. Выполнение двух лабораторных работ с помощью электронных таблиц Excel. Подбор самого экономичного варианта обучения.
контрольная работа [18,1 K], добавлен 04.11.2009Исследование изменения во времени курса акций British Petroleum средствами эконометрического моделирования с целью дальнейшего прогноза с использованием компьютерных программ MS Excel и Econometric Views. Выбор оптимальной модели дисперсии ошибки.
курсовая работа [1,2 M], добавлен 14.06.2011Общие понятия статистической проверки гипотез. Проверка гипотез на основе выборочной информации, понятие нулевая и альтернативная гипотезы. Формулировка общего алгоритма проверки. Проведение проверки статистической гипотезы в системе "Minitab" и MS Excel.
методичка [741,9 K], добавлен 28.12.2008Решения, связанные с рисками. Снижение риска с помощью статистической теории принятия решений. Применение модели платежной матрицы и различных ее вариантов. Направленность изменений соотношений темпов роста показателей, формирующих динамические модели.
контрольная работа [41,2 K], добавлен 28.03.2013Построение эмпирической модели, оценивающей связи между акциями, ценой сырой нефти, курсом рубля к доллару и фондовыми индексами США и РФ. Исследование временных рядов на наличие коинтеграции. Анализ взаимного влияния котировок акций нефтяных компаний.
дипломная работа [11,1 M], добавлен 26.10.2016Построение адаптивной мультипликативной модели Хольта-Уинтерса, оценка ее точности и адекватности с использованием средней относительной ошибки аппроксимации. Построение точечного прогноза. Отражение на графике фактических, расчетных и прогнозных данных.
контрольная работа [816,2 K], добавлен 23.03.2013Розробка структури інформаційної системи. Характеристика економічних задач і функцій. Розробка математичного і машинного алгоритмів рішення задач. Інформаційне і організаційне забезпечення. Технічне і програмне забезпечення. Контрольний приклад.
курсовая работа [293,2 K], добавлен 08.11.2008Метод развертки вслепую. Понятия и построение модели для простейшего случая. Подгонка параметров: целевая функция, подбор независимых компонент и функции нелинейности. Настройка процесса обучения. Адаптация алгоритма под реалии рынка обмена валюты.
курсовая работа [1,1 M], добавлен 17.10.2016Динамические, стохастические, дискретные модели имитационного моделирования. Предпосылки, технологические этапы машинного моделирования сложной системы. Разработка имитационной модели автоматизированного участка обработки деталей, ее верификация.
дипломная работа [224,3 K], добавлен 05.09.2009Составление оптимального плана загрузки оборудования на основании данных о фонде машинного времени и производственной программе по видам изделий. План транспортных связей пунктов производства с перевалочными пунктами и потребителями готовой продукции.
задача [211,6 K], добавлен 08.06.2010Алгоритм минимизации функции нескольких переменных методами сопряженных градиентов и покоординатного спуска. Проведение сравнения их скорости работы, выделение основных достоинств и недостатков. Программа для проведения исследований градиентным методом.
курсовая работа [427,4 K], добавлен 09.02.2013Методика и особенности вычисления показателей качества, а также графическое изображение его различных звеньев. Анализ и оценка динамики коэффициента передачи, времени нарастания, перерегулирования, количества колебаний, статистической точности и ошибки.
лабораторная работа [2,1 M], добавлен 01.12.2009Построение математической модели и решение задачи математического программирования в средах MathCad и MS Excel. Решение систем с произвольными векторами свободных коэффициентов. Определение вектора невязки. Минимизация и максимизация целевой функции.
отчет по практике [323,5 K], добавлен 01.10.2013Характеристики и свойства условно-гауссовской модели ARCH для прогнозирования волатильности стоимости ценных бумаг. Акции предприятия на рынке ЦБ. Оценка параметров модели ARCH для прогнозирования их доходности методом максимального правдоподобия.
курсовая работа [161,5 K], добавлен 19.07.2014