Разработка алгоритма и рекомендаций к автоматизации процесса прогнозирования курсов акций с использованием коэффициента Херста

Теоретические аспекты и анализ современных статистических методов прогнозирования курсов акций. Анализ методов прогнозирования курсов акций ведущих IT-компаний и сравнение точности прогнозных показателей. Практическое использование показателя Херста.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 07.12.2019
Размер файла 3,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ОБРАЗОВАНИЯ

НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»

Факультет бизнеса и менеджмента

Выпускная квалификационная работа

по направлению подготовки 38.03.05 бизнес-информатика

образовательная программа «Бизнес-информатика»

Разработка алгоритма и рекомендаций к автоматизации процесса прогнозирования курсов акций с использованием коэффициента Херста

Сагманова Элина Азатовна

Научный руководитель

к.т.н., доцент Н.В.Сизых

Москва 2019

Введение

Известно, что развитие глобализации в сфере рынка финансов стало причиной к повышению важностиалгоритмов прогнозирования динамики трендов для анализа и разработки инвестиционных стратегий трейдеров, использующих инструментарий технического анализа. Такие модели предлагаются большинством авторов, занимающихся проблемами применения технического анализа в работе трейдера. Однакообычно недостаточно уделяется внимание такому важному показателю в прогнозировании рыночных процессов, каким является коэффициент Херста.

Как известно, сегодня многие теоретики и практики, работающие в сфере фондового рынка, сходятся во мнении, что используемые методы и инструменты прогнозирования динамики курсовых стоимостей акции? фондового рынка не обладают приемлемой эффективностью.

Исходя из вышеизложенного, объектом исследования являются методы и алгоритмы прогнозирования курсов акций.

Предмет исследования: разработка алгоритма и рекомендаций к автоматизации процесса прогнозирования курсов акций с использованием коэффициента Херста. херст статистический акция автоматизация

Выдвигается гипотеза о том, что использования показателя Херста в алгоритме прогнозирования курсов акций способствует повышению точности прогноза.

Цель исследования: разработка алгоритма и рекомендаций к автоматизации процесса прогнозирования курсов акций с использованием коэффициента Херста.

Для достижения поставленной цели были сформированы следующие задачи исследования:

Проанализировать существующие методы, алгоритмы и подходы к автоматизации прогнозирования курсов акций;

Исследовать и подобрать наиболее точные методы прогнозирования курсов акций для ведущих IT-компаний;

Оценить коэффициент Херста для курсов акций ведущих IT компаний;

Исследовать возможность повышению точности прогноза курсов акций с использованием алгоритмов с показателем Херста

Разработать алгоритм и рекомендации к автоматизации процесса прогнозирования курсов акций ведущих IT компаний с использованием коэффициента Херста.

Методами исследования являются:

Сбор данных о ценах на акции с использованием сервиса investing.com;

Метод скользящего среднего со сглаживаниями Хольта-Уинтерса;

Расчет коэффициента Херста;

Моделирование прогнозов;

Моделирование бизнес-процессов путем использования комплексной методологии моделирования бизнес-процессов «ARIS-Toolset».

Проблема прогнозирования цен акций компании на фондовом рынке появилась достаточно давно и имеет разные способы решения. Так, проведенный анализ показал, что используемые на фондовом рынке прогностические инструменты не обладают приемлемым уровнем прогностической силы. Такая ситуация обусловлена достаточно слабой теоретической основой прогнозирования финансовых инструментов фондового рынка с неполным использованием известных подходов. Это делает проблему разработки нового подхода к прогнозированию динамики курсовых стоимостей акции? фондового рынка с использованием факторного анализаактуальной.

Поскольку большая часть общества пытается предсказать цены акций, рынок очень популярен в наши дни. Люди делают это для того, чтобы гарантировать финансово безопасный выход на пенсию, зарабатывать на жизнь или обыгрывать рынок. Сильный портфель акций поможет достичь этих целей. Так, в работе создается математическая модель, которая прогнозирует цену акций. Созданная модель может помочь любому выбрать потенциально успешные акции и создать сильный портфель. Даже если невозможно предсказать будущее со стопроцентной уверенностью, разработанная сложная математическая модель должна достичь уровня точности, приемлемого как для инвесторов, так и для брокеров.

В качестве исходных данных выбраны котировки акций 27 IT-компаний за последние три года за каждый месяц. Используется достаточно большой объем данных в рамках исследования для достижения высокой точности прогноза и возможности ликвидации значений, которые способны ухудшить модель. Информация по ценахакция были взяты с сервиса Investing.com[1], позволяющий получать как данные в настоящий момент времени, так и данные о прошлом.

В результате дипломной работы должен быть разработан алгоритм, который способен автоматизировать процесс прогнозирования ситуации на фондовом рынке. Моделирование бизнес-процесса планируется с использованием ARIS Toolset, комплексной методологии моделирования бизнес-процессов. Оценка, анализ и выбор наиболее точных методов оценки акций для ведущих ИТ-компаний так же должны быть получены, как и оценка индекса Херста для котировок акций ведущих IT-компаний. Кроме того, предполагается, что использование индекса Херста в модели прогнозирования цен на акции способствует повышению точности прогноза.

Работа состоит из трех глав и заключения.

В первой главе рассматриваются теоретические аспекты статистических методов прогнозирования, их сущность, сущность рынка акций, проведен анализ существующих методов по статьям, освещается показатель Херста: что это, зачем используется и анализ с критикой по статьям.

Во второй глазе рассматриваются инструментарий и методы исследования, используемые в данной работе, принцип их работы.

В третьей главе представлено практическое исследованиепоставленной гипотезы, разработан алгоритм прогнозирования акций исмоделирован бизнес-процесс путемиспользования комплексной методологии моделирования бизнес-процессов «ARIS-Toolset».

Работа содержит 56страниц, включает 3 приложения, 9 таблиц, 25 рисунков и 3 графика.

Глава 1. Теоретические аспекты и анализ современных статистических методов прогнозированиякурсов акций

1.1 Сущность и возможности прогнозирования курсов акций

Известно, что прогнозирование котировок акций всегда было актуальным и привлекательным среди исследователей. За всю историю существования прогнозирования курсов акций так и не был изобретен алгоритм, который бы мог максимально эффективно и безошибочно предсказывать изменения котировок несмотря на огромное стремление и количество попыток. Считается, что основной проблемой предсказания ценявляетсятрудностьсоздания модели динамики фондового рынка.Обычно выделяют такие подходы торговли как фундаментальный и технический.Согласно фундаментальному анализу, изменения котировокакций случаетсяпо относительным данным ценных бумаг. Приверженцы данного подхода применяют информацию в виде цифр, например,сюда можно отнести прибыль, показатели и эффективность управления в целях определения будущих прогнозов. Рассматривая техническийанализ следует сказать, что в нем время считается ключевым моментов. Специалисты по техническому методу применяют графические методы и методы моделирования, чтобыопределитьнаправление по объему и цене в будущем. Кроме этого, такие специалистыиспользуют в своих исследованиях исторические данные для прогнозирования результатов.Одной из причин, по которой успех в предсказании рынка ценных бумаг ограничен, являются текстовые данные. Так, различная информация из свежих новостей и плановых отчетов способназначительновлиять на котировки акций. Вообще, следует сказать, что значительнаядолянастоящей литературы, посвященнойисследованию текста по рынку базируется на определении заранее подготовленной подборки основных слов и методов машинного обучения, как правило, присваивающих веса определенным словам согласно движению котировок акций. Такие виды исследований показали определенную, однако,небольшую способность предсказаыватьдвижение цен акций.

Основной теорией, касающейся прогноза котировок акций, считается EMH (Гипотеза Эффективного Рынка), согласно которой цена акции отражает всю доступную информацию, и каждый имеет некоторый уровень доступа к ней. Именно в том, что рынок незамедлительно выдает реакции на новости и является смысл ЕМН. Также можно уточнить, что никто не способен превзойти рынок в плане долгосрочной перспективы. Все-таки степень эффективности рынка не совсем однозначна, большинство считает, что рынок вполне можно одолеть в короткий период времени.

Так как прогнозирование играет существенную роль для всех видов деятельности организации, ему необходимо находить свое применение особенно в части управления по принятию решений. Обычно компаниямважно иметь такие виды прогнозов, как краткосрочные, среднесрочные и долгосрочных, которые отличаютсяпо применению [2]:

Краткoсрочные прогнозы используютсяприопределении графика работы;

Среднесрoчные прогнозы используютсяприустановлении потребностей в ресурсах на будущее;

Долгосрoчные прогнозы находят свое отражение в планировании стратегий.

Компаниям необходимо создавать такуюмодель прогнозирования, которая учитывает множествометодов прогнозированиянеизвестных событий. Следует учитывать, что модели прогнозирования требуют развития практики в целях выявлениязадач прогнозирования, использованияподходов прогнозирования, подборусоответствующих методов для решениязадач и оценке с уточнениемподходов прогнозирования на протяжении определенного времени. Также важно иметь сильную организационную поддержку для использования формальных методов прогнозирования, если они должны использоваться успешно.

Говорят, что в современных условиях управленческие решения должны приниматься только основываясь на проведенном анализесобранной информации. К примеру, руководство банка или совет директоров корпорации примут решение о вложении средств в проект только после тщательных расчетов, связанных с рыночными прогнозами, определения прибыльности инвестиций и оценки возможных рисков [3]. В противном случае конкуренты, которые могут лучше оценивать и прогнозировать перспективы развития, могут опередить.Также известно, что прогнозирование цен приобретает особое значение на биржевых рынках. Важность развития этого направления трудно преувеличить, поскольку эффективность принимаемых на его основе управленческих решений зависит именно от соответствия полученного прогноза действительности.

В целях получения эффективных решений, которые связаны с анализом данных при присутствии случайных эффектов, предназначен мощный инструмент прикладной статистики, частью которого являются методы статистического прогнозирования[4]. Благодаря нимстановится возможнымвыявление закономерностейдаже при наличии фактора случайности, сделать разумные прогнозы и оценить вероятность их выполнения.

Именно прошлым, а также настоящим состоянием определено будущее состояние экономики. Это в свою очередь является основой экономического прогнозирования. Элементы неопределенности содержит будущее состояние экономики. Это связано именно следующими моментами:

Расположением совсем не одного, а целым множеством вариантов вполне возможного развития;

Не только от прошлого, а также настоящего зависит действие экономических процессов, но также и от решений управленческого аппарата, которые только вскоре будут приняты и реализованы

Неопределенность есть состояние, которое подразумевает под собой полную или частичную недостаточность информации, понимания или знания, касающегося события, а также последствий от этого события и вероятности их появления.

Понятие «прогнозирование» действительно многогранно, что обусловлено разнообразием факторов, которые могут охарактеризовать не только особенности конкретного вида деятельности, но и специфические черты неопределенности, в условиях которой данная деятельность происходит.

Трейдер должен уметь приблизительно предугадывать интервал, в котором будет торговаться акции на следующий день, чтобы покупать или продавать акции ещё до того, как цена пойдет вверх или вниз. Разработанные на сегодняшний день алгоритмы, предсказывающие цену акции в следующие периоды времени способны значительно повысить прибыль различных инвестиционных фондов и трейдеров. Однако, использования самого лишь алгоритма недостаточно для получения сверхприбыли, ведь алгоритм так же как и трейдер, не может улавливать различные слухи, которые известны только закрытой группе людей, но он способен увидеть изменение в спросе практически в начальный момент времени, что повлечет за собой необходимую реакцию и корректировку предсказанного значения на следующие периоды. Применение современных методов к задаче прогнозирования цены акции является одной из ключевых особенностей данной работы. Предполагается, что использование данного предиктора может значительно улучшить качество модели[5].

Более того, считается, что современный мир очень тесно связан с расщиряющимся объемом данных, которое берет свое начало с появлениемвремени цифровизации. Во многом это связано с ростом и появлением различных технологий, которые могут интегрировать данные. Однако сами данные не являются новым изобретением. Так как в статистике постоянно увеличивается объем данных, то начинает возникать проблема с их анализом и обработкой, именнопоэтомув настоящее время необходимо использовать современные методы для их исследования [6].

Известно, что прогнозирование цен приобретает особое значение на биржевых рынках. Важность развития этого направления трудно преувеличить, поскольку эффективность принимаемых на его основе управленческих решений зависит именно от соответствия полученного прогноза действительности.

1.2 Анализ различных методов прогнозирования

Следует отметить, что не существует единого, универсального метода прогнозирования. Его выбор обусловлен в первую очередь спецификой прогнозируемых ситуации? и изучаемых систем. Прогнозирование может быть осуществлено самыми разными способами - от чистой интуиции до математических моделей с уравнениями, которые предпочитают некоторые эконометрики. В этом диапазоне можно выделить четыре основные категории, на самом деле их может быть больше в зависимости от того, как категоризировать:

Поведенческое или причинное прогнозирование, при котором ищутся механизмы, вызывающие изменения в поведении событий. Хорошее понимание моделей, поведенческих отношений позволяет хорошо прогнозировать изменения. Следовательно, прогнозы так же хороши, как и модели, но главная цель - получить прогнозы, которые можно объяснить;

Подгонка кривой и экстраполяция, в которой используются различные формы подгонки кривой, например, линейные, полиномиальные, фурье и другие математические функции. В каждом случае исследуется схема изменения соответствующих переменных, и математическая функция устанавливается для систематического компонента этого изменения. Следовательно, цель этих прогнозов - хорошая математическая подгонка;

Методы исследования. В социально-экономических системах, где ход событий определяется действиями людей, очевидный способ выяснить, какие изменения могут произойти, - это спросить соответствующих людей. Хорошими примерами таких прогнозов являются опрос потребителей и опросы общественного мнения. Более изощренные методы используются в государственном прогнозировании экономики с консультациями с работодателями и профсоюзами;

Судебные методы. Там, где методы опроса не могут быть приняты, или в системах, где взаимодействие большого числа людей делает прогнозирование на основе опросов очень трудным, методы оценки дают альтернативу. Эти методы объединяют субъективные оценки групп экспертов, распространенным примером является метод Дельфи. Этот метод особенно эффективен в том смысле, что он позволяет включать субъективные элементы, которые могут никогда не включаться в математические модели;

Методы имитационного моделирования включают клеточное моделирование (моделирование отдельных однородных единиц (ячеек) во времени, таких как возрастные / половые ячейки, в прогнозировании пенсий, модель обычно является детерминированной, но может быть стохастической, полезна для моделирования больших систем), симуляцию системной динамики (моделирование системы в целом с течением времени, включая петли обратной связи, а также запасы и потоки) и мультиагентное моделирование (компьютерное представление, которое использует несколько взаимодействующих агентов и поведенческие правила, чтобы имитировать поведение реальной системы, метод особенно полезен для моделирования сложных адаптивных систем).

1.3 Анализ существующих подходов к автоматизации прогнозирования курсов акций

Торговля акциями на фондовом рынке является одним из основных видов инвестиционной деятельности. В прошлом инвесторы разработали ряд методов анализа акций, которые могли бы помочь им предсказать направление движения цены акций. Моделирование и прогнозирование будущей цены акций, основанное на текущей финансовой информации и новостях, имеет огромное значение для инвесторов. Инвесторы хотят знать, будут ли некоторые акции расти или падать в течение определенного периода времени. Чтобы предсказать, как какая-то компания, в которую инвестор хочет инвестировать, будет работать в будущем, они разработали ряд подходов[7].

В целом на сегодняшний день выделяютсячетыреглавных типов подхода к анализу курсов акций:

Математический;

Технический;

Анализ, основанный на использовании нейронных сетей;

Фундаментальный.

В ходе математического анализа в основном применяютсяследующие методы:

Сглаживания временных рядов;

Регрессионного анализа;

Фрактальные;

Хаотических временных рядов.

Технический анализ базируется на анализе «прошедших» временных рядов с использованием различных технических индикаторов. При анализепроводится исследование структуры процесса состояния показателя, основываясь наизменении этого показателя в прошлом. Этот метод не принимает во внимание какие-либо рыночные причиныв процессеисследования и в целом не требует понимания значения изучаемых данных. Поэтому, по мнению многих специалистов, эта отрасль исследования временных рядов акция ни к чему существенному не приводит.

Применение нейронных сетей при исследовании временных рядов котировок акций также считается современным подходом. Сложная структура этого инструмента позволяет проводить более подробный и глубокий анализ структуры временных рядов, что приводит к более точным прогнозам. Однако этот подход является улучшенной версией технического анализа и не учитывает семантическую структуру анализируемых данных и поэтому также не идеален[8].

Изучение факторов, которые влияют на экономику в целом, а не на определенные финансовые ряды, является неотъемлемой частью фундаментального анализа. В то же время за основу принимаются не только рыночные показатели, но также к ним можно отнести политические и природные, так какприродныекатаклизмытожеспособны оказывать значительныйэффект. К примеру, главныйсюжетпроизведения Драйзера «Финансист» основывается на провале рынка Филадельфии, который стал следствием чикагского пожара[9].

В рамках этой работы будет рассмотрена эффективность технического анализа и математического подхода.

Опытные аналитики могут применять некоторые математические модели, которые доказаны на основе прошлых данных, чтобы оценить внутреннюю ценность компании, такую ??как число Грэма. Число Грэма и критерии Грэма, вероятно, являются одной из самых известных моделей (Грэхем, 1949)[10]. Однако из-за возросшей волатильности на текущем рынке, вероятно, было бы невозможно найти компанию, которая бы соответствовала принципам Грэма на сегодняшних фондовых биржах. Из-за этих изменений возросла потребность в скорректированных моделях. Кроме того, фондовый рынок меняется со временем (Barsky,DeLong, 1992; Hendershott, Moulton, 2011) [11], [12]. Новые инвестиционные стратегии и новые технологии были введены, что сделало некоторые из моделей устаревшими. Поскольку финансовая грамотность стала выше, игроков на рынке стало больше, чем когда-либо. Тем не менее, для некоторых из старых моделей не могут быть легко приняты для изменения на фондовом рынке.

Введение в алгоритмы в торговле определенно изменило фондовый рынок. Алгоритмы позволили быстро реагировать на определенные события на фондовом рынке. Алгоритмы машинного обучения также позволили аналитикам создавать модели для прогнозирования цен акций гораздо проще. Введение машинного обучения привело к тому, что новые модели могут быть разработаны на основе прошлых данных. Основная гипотеза заключалась в том, что, применяя машинное обучение и обучая его на прошлых данных, можно прогнозировать движение цены акций, а также соотношение движения в течение определенного фиксированного промежутка времени.

Изучение свойств временных рядов цен на ценные бумаги было центральным в исследовании микроструктуры рынка в течение многих лет. Madhavan(2000) утверждает, что придерживаниеи отклонение от симметричной информации влияют на торговый процесс [13].

Согласно финансово-экономической теории, доходность активов не может быть легко предсказана с использованием статистических или других методов и включением общедоступной информации. Тем не менее, недавняя литература свидетельствует об успешном прогнозировании:Breenetal (1989),Leungetal (2000),White (2000),Pesaranand,Timmermann (2004) и Cheungetal (2005). Имея среднюю независимость, статистически вероятно иметь зависимость знака и волатильности (Christoffersen, Diebold 2006) [14].

Знание будущего направления движения цены акций дает ценное руководство в разработке прибыльных торговых стратегий. Тем не менее, нет единого мнения о стохастическом поведении цен или об основных факторах, определяющих изменение цен. В этом контексте важными предложениями стали теории информационной асимметрии, утверждающие, что частная информация, полученная из торговли, вызывает колебания рыночных цен (Kyle, 1985) [15]. Следовательно, многие атрибуты рынкаEmployedinformation были использованы в качестве заменителя информации при изучении поведения цены ценных бумаг. Ценовые изменения происходят дискретными приращениями, которые обозначаются кратными тиками. Сегодня общепризнанно, что неспособность рассматривать ценовой процесс как отдельный ряд может отрицательно повлиять на результаты прогнозирования. Первоначально моделирование цен дискретных транзакций было выполнено GottliebandKalay (1985). Обобщение и изменение такой основы моделирования можно найти уBall (1988),Glosten и Harris (1988),Harris (1990),Dravid (1991) и Husbrok (1999). Чаще всего в более ранних исследованиях изменение цены рассматривалось как непрерывная переменная, в которой основное внимание уделялось безусловному распределению, игнорируя время транзакций, которое является нерегулярным и случайным [16]. «Упорядоченная пробитная модель», которая была первоначально предложена Aitchison и Silvey (1957), является полезной моделью для дискретных зависимых переменных, которые могут принимать только несколько значений из-за естественного порядка. Gurlandetal. (1960) развился в дальнейшем, а позже он был введен в социальные науки МакКелви и Завойной (1975), которые стали аналитическим инструментом в динамике цен на рынке ценных бумаг для исследования микроструктуры. Это может быть использовано для количественной оценки влияния различных факторов на движение цен на акции, в то же время учитывая дискретность в изменении цен и нерегулярный интервал между сделками [17].

Hausmanetal (1972) признал важность учета дискретности, особенно при внутридневных ценовых движениях. В таких тонких выборках степень изменения цены ограничена несколькими различными значениями, которые не могут быть хорошо аппроксимированы непрерывным пространством состояний. Их документ исследовал влияние нескольких объяснительных переменных на фиксацию изменений цены сделки [18]. Важно отметить, что в этих рамках моделировался эффект часового времени, измеряемый с точки зрения продолжительности между двумя последовательными сделками, спрэда между спросом и предложением, размера сделки и рыночных или систематических изменений цен на основе рыночного индекса по условному распределению изменений цен. В более недавнем исследовании Yang, Parwada (2012) расширили существующую эмпирическую литературу о влиянии атрибутов рынка на динамику цен, используя упорядоченную пробитную модель [19]. В их исследовании изучалось влияние на цену таких переменных, как глубина рынка и торговый дисбаланс (также называемый дисбалансом ордеров на рынках, управляемых котировками), в дополнение к размеру сделки, торговому индикатору, спреду спроса и предложения и продолжительности, которые оказались значительными в аналогичные исследования. Таким образом, модель, оцененная Yang, Parwada (2012), смогла предсказать направление изменения цены в среднем примерно в 72% случаев.

Прогнозы в выборке и вне выборки, предоставленные авторами, основывались на наблюдаемых значениях регрессоров в горизонте прогноза. Однако при составлении прогнозов вне выборки, выходящих за рамки шага вперед, включение наблюдаемых значений для регрессоров имеет ограниченное практическое применение, поскольку они не наблюдаются априори. Разработка многоэтапных прогнозов, по крайней мере, на несколько будущих транзакций, намного эффективнее с практической точки зрения для эффективного принятия решений. Тем не менее, такие данные прогнозирования в этих рамкахпо-видимому, отсутствует в литературе. Поэтому, устраняя этот недостаток, в данной статье представлен механизм прогнозирования, позволяющий генерировать прогнозы за пределы уровня шага вперед. С этой целью сначала создаются дезагрегированные прогнозы для каждой из пояснительных переменных для соответствующего периода. Чтобы генерировать прогнозы для включенных регрессоров, исследуется структура последовательной зависимости каждой из переменных и подбираются соответствующие модели прогнозирования. Впоследствии генерируются знаковые прогнозы на основе этих предсказанных значений регрессора, а не на основе наблюдаемых значений и оценочных коэффициентов упорядоченной пробитной модели. Эти результаты прогноза сравниваются с данными существующей литературы. Благодаря введению динамических переменных в систему прогнозирования, прогнозирующая способность этого подхода исследуется посредством исследования, основанного на акциях семи крупных компаний, котирующихся на Австралийской бирже ценных бумаг (ASX).

За долгое время исследователями былосозданомногоизменения базовой модели ARIMA. Модификации включают кластеризацию временных рядов из моделей ARMA с урезанными данными, подход нечеткой нейронной сети и модель машин опорных векторов. Большинство исследований предполагают, что вспомогательные условия должны быть приняты во внимание поверх базовой или неизмененной модели. Наиболее распространенным и важным одним из таких факторов является новостная онлайн-информация, связанная с акциями.

Wilsonи Shardaизучали банкротство предсказывающей фирмы, используя нейронные сети и классический множественный дискриминантный анализ, где нейронные сети работали значительно лучше, чем множественный дискриминантный анализ (Wilson, Sharda, 1994) [20]. Minи Leeделали прогнозирование банкротства с помощью машинного обучения. Они оценили методы, основанные на SVM, множественном дискриминантном анализе, логистическом регрессионном анализе и трехслойных полностью связанных нейронных сетях обратного распространения. Их результаты показали, что опорные векторные машины превзошли внешние подходы (Min, Lee, 2005) [21]. Точно так же Tamпредсказывал банкротство банка, используя нейронные сети (Tam, 1991) [22].

Leeпытался предсказать кредитный рейтинг компании, используя машины опорных векторов. Они использовали различные финансовые показатели и коэффициенты, такие как коэффициент покрытия процентов, обычный доход к общей сумме активов, чистый доход к собственному капиталу, коэффициент текущих обязательств и т. Д., И достигли точности около 60% (Lee, 2007). Прогнозирование кредитного рейтинга компаний также изучалось с использованием нейронных сетей, обеспечивающих точность от 75% до 80% для рынков США и Тайваня (Huang, etal., 2004) [23].

Phuaetal. выполнил исследование, прогнозирующее движение основных пяти фондовых индексов: DAX, DJIA, FTSE-100,HSI и NASDAQ. Они использовали нейронные сети и смогли предсказать признак движения цены с точностью выше 60%, используя запасы компонентов в качестве входных данных для прогноза (Phua, etal., 2003).

SVM был применен для прогнозирования направления временных рядов. Kim(Kim, 2003) обучал SVM ежедневным временным рядам на корейском фондовом рынке. Он сообщил, что показатель попаданий составляет около 56%. Huangи др. пытались использовать машины опорных векторов для прогнозирования недельного движения японского индекса NIKKEI 225. Их подход достиг 73% успеха с SVM и 75% с комбинированной моделью. Также SVM превзошли по своему подходу обратное распространение нейронных сетей (Huang, etal., 2005). Schumakerи Chenосмотрелипрогноз, который может быть достигнут путем анализа текстовых статей с использованием SVM. Они пытались предсказать движение индекса S & P 500 через 20 минут после выхода новости. Они использовали несколько подходов, таких как пакет слов, имен существительных и названных сущностей, и достигли направленного попадания в 57% (Schumaker, Chen, 2009) [24]. Анализ текстовых новостей, однако, не входит в сферу данного исследования.

Tsaiи Wangпровели исследование, в котором они попытались предсказать цены акций, используя ансамблевое обучение, состоящее из деревьев решений и искусственных нейронных сетей. Они создали набор данных на основе данных фондового рынка Тайваня с учетом фундаментальных индексов, технических индексов и макроэкономических индексов. Показатели DT + ANN, прошедшие обучение по данным тайваньской фондовой биржи, показали эффективность F-показателя в 77%. Одиночные алгоритмы показали эффективность F-показателя до 67% (Tsai, Wang, 2009) [25].

1.4 ПоказательХерста

Комплексным решением многих проблем в области оценки рынка может быть фрактальный анализ. Этот инструмент часто незаслуженно игнорируется трейдерами и инвесторами, тем не менее, фрактальный анализ временных рядов помогает эффективно оценить наличие и стабильность тренда на рынке. Итак, коэффициент Херста является одним из основных значений фрактального анализа, это мера, используемая при анализе временных рядов. Тем меньше коэффициент Херста, чем больше будет задержка между двумя идентичными парами значений в ряду времени.

Этот важный показатель был представлен Гарольдом Эдвином Херстом, выдающимся британским гидрологом, который участвовал в проекте строительства Нильской плотины в Египте. Для строительства требуется оценить расход воды и, соответственно, необходимость оттока. Первоначально считалось, что поток воды является значением случайного, случайного процесса. Тем не менее, Херст изучил записи разливов Нила в течение девяти веков и нашел закономерности в этом процессе. Это была отправная точка в его исследовании. Таким образом, было обнаружено, что разливы, превышающие средние, менялись даже в большей степени. Позже процесс изменил свое направление, и разливы уровня ниже среднего были заменены еще более мелкими. Есть циклы с непериодической продолжительностью [26].

Выделяюь целых 2 возможных случая фрактальной размерности - A и D. Именно согласно следующей формуле формируется фрактальная размерность (D), а она в свою очередь и есть оценка степени по разрушению ряда:

Французский, а также американский математик Мандельборт обнаружил, что обратной величиной коэффициентаХерста есть фрактальная размерность. Так, еслипоказатель Херста равен 0.5, то фрактальная размерность будет равна 2.В случае равенства коэффициента Херста 0.8 фрактальная размерность имеет значение 1.25. Исходя из этого, можно сделать вывод, что фрактальная размерность Мандельброта имеет вид в виде буквы A и считается согласно данной формуле:

В зависимости от значения показателя Херста, можно судить о размерностях (Таблица 1).

Таблица 1Значения вариаций фрактальной размерности [27]

Вообще значение индексаХерстапринадлежитинтервалу от 0 до 1:

Если 0 < Н < 0.5 - имеем временной ряд, для которого более вероятна смена предыдущего направления, то есть имеем антиперсистентный ряд;

Если Н = 0.5 - имеем стохастический временной ряд, для которого вероятность смены направления сложно установить;

Если 0.5 < Н < 1 - имеем временной ряд, для которого присуща трендовость (направленность) и смена предыдущего направления наименее вероятна, то есть имеем персистентный временной ряд [28].

В исследовании показательХерстарассчитывает по данной формуле:

где

где

- является коэффициентом Херста;

- это и есть стандартное отклонение рядя наблюдений;

- является величиной накопленного отклонения;

- носит значение количества периодов;

- константа, которая имеет свое значение, эмпирическим путем была рассчитана для рядов на небольшой период времени и получилось равной 0.5.

При этом использование значения 0.5 для показателяХерста при малом числе наблюдений представляется возможным, однако, при малом небольшомчисле наблюдений данный коэффициент начинает оценивать случайные ряды как те, которым присущ тренд, тем самым происходит переоценка показателя. По этой причине представляется рациональным для дальнейших исследований финансовых данных использоватьпостоянное значение a = / 2:

где

- является средним арифметическим из серии наблюдений x за N периодов:

Значение размаха скопленного отклонения является самым необходимым элементом формулы для подсчета коэффициента Херста. Вообще его возможно рассчитать данным способом:

Где - является накопленным отклонением ряда x от среднего значения X:

Модернизированная формула для расчета показателя Херста подходит для данных с малым числом наблюдений и была предложена Э. Найманом:

Данной формулой и воспользуемся при оценке показателя Херста в проводимом в рамках ВКР исследовании.

Глава 2. Оценка, анализ и выбор наиболее точных методов прогнозирования курсов акций для ведущих IT-компаний

2.1 Анализ методов прогнозирования курсов акций ведущих IT-компаний и сравнение точности прогнозных показателей

В практической части проекта для прогнозирования используются различные методы. Соответственно, в работе можно выделить такие методики, как технический анализ, моделирование прогнозов и бизнес-процессов.

Технический анализ - это способ анализа тенденций в цене и объеме торговли ценными бумагами в прошлом с целью прогнозирования изменений цен в будущем. Этот подход не учитывает экономические факторы при анализе и не требует понимания значения изучаемых данных. Анализ практики показал, что цены на акции или другие инструменты фондового рынка движутся, как будто следуя определенным тенденциям, поэтому использование технического анализа представляется эффективным.

Моделированиемявляетсясоздание модели, которая базируется на предварительном анализе объекта и процессов, с определением его важных признаков и характеристик. Осуществление прогноза с применением моделирования включает в себя его «разработку, экспериментальный анализ, сравнение результатов предварительных прогнозных расчетов с фактическими данными о состоянии процесса или объекта, уточнение и корректировку модели» [29]. Применение моделей в проекте позволяет предварительно выбрать оптимальные или наиболее подходящие решения в соответствии с критериями, которые были установлены для задач статьи. Модель бизнес-процесса позволяет сосредоточиться на целевой и актуальной информации о взаимосвязях всех объектов процесса. Благодаря этому модель процесса облегчает понимание принципа разработанного действия. Внедрение прогностического моделирования в работу планируется с использованием Python, MSExcel и бизнес-процессов с использованием интегрированной методологии ARIS-Toolset.

Достаточно эффективным, а также вполне надежным считается метод экспоненциального сглаживания во время акционных прогнозов. Достоинством этого способа является возможность учета весов первичной информации в простоте вычислительных операций, а также гибкости описания различных динамик процессов. Рассматриваемый метод дает возможность получить оценку параметра тренда, который определяет не средний уровень процесса, а тренд, который сформировался к моменту последнего наблюдения. Можно подчеркнуть, что после появления работы Р. Брауна, экспоненциальное сглаживание начало гораздо чаще использоваться при краткосрочных, а также среднесрочных прогнозах. Так как экспоненциальное сглаживание - это обобщение МНК, то можно полагать, что данный метод в будущем вполне может стать более улучшенным как в теоретическом, так и в прикладном аспектах. Главным минусом метода экспоненциального сглаживания считается то, что он полагает временные ряды изолированными от других явлений.Помимо этого, точность прогноза существенно падает если необходим прогноз на долгосрочную перспективу. Метод экспоненциального сглаживания включает модели Хольта и Хольта-Уинтерса. Модель Хольта-Уинтерса чаще используется на практике. Это развитие модели Хольта, которое отличается от нее наличием сезонной составляющей. Преимущество этих моделей заключается в том, что они могут использоваться для учета тенденций в серии исходных данных. Однако у этих моделей также есть пара недостатков: они основаны на «предположении о наличии этих тенденций» и идее их слабой изменчивости, что редко достигается на практике. Таким образом, с течением времени наблюдаются расхождения, причем довольно большие, с реальными значениями.

Благодаря выбранным методам, видится логичным просчитать и сравнить точности прогноза, сопоставив полученные результаты с данными курсов акций за следующий год. На основе этого делается аналитическое заключение о стабильности динамики курсов акций по компаниям для прогнозирования курса акций ведущих IT компаний, при этом сравнив данные прогноза с данными динамики (темпы роста, волатильность).

2.2 Оценка показателя Херста для курсов акций ведущих IT-компаний

По данным последних исследований изучающих динамику рыночных цен было выявлено, что она относится к показателю Херста, тот в свою очередь, был больше 0.5 можно сделать вывод что такая динамика вызвана некоторыми причинами, главные из которых:

Данные по рынку оказывают влияние на ценовую политику только по прошествии определенного времени. Также инвесторы не могут получать одинаковые данные;

По прошествии «явного» временного отрезка, воздействие данных на стоимость денежных накоплений падает, проявляется оно присутствием в рыночной сфере одним общепризнанным психологичным явлением - памяти о рынке.

Ясно, что оценка показателя Херста для эмпирических цифр, способна оказать существенное значение в рассмотрении дел показывающих признак «самоподобия». Есть достаточное количество вариантов с помощью которых можно оценить показатель Херста для временных рядов. Описание разных вариантов и приемов есть у Willinger(1996) и Clegg (2005), нобольшая часть методов оценки применима толькок постоянным временным рядам [30],[31].Однако большинство естественных технических и информационных процессов нестационарные. Главный элемент нестационарности, если исходить из опыта и практики, есть присутствие трендовых и циклических компонентов. При этом на сегодняшний день нет разумной собранной информации, в которой результаты оценки показателя Херста с использованием стационарных и нестационарных фрактальных временных рядов различными методами были бы обобщены.

Исходя из полученных результатов проведенных исследований можно сделать следующие выводы:

1. Взаимозависимость константы Херста и приростов индекса.

Отвечая на изначальный вопрос, существует ли связь между константой Херста сегодня и будущими значениями индекса, следует ответить - да, существует, но не линейная, а скорее стохастическая. При выявлении зависимости на примере конкретного индекса было доказано, что при показателе Херста в интервале 0.1 ? H < 0.5, стандартное отклонение будущих приростов индекса существенно возрастает. Это означает, что рассчитывая константу Херста для индекса сегодня, при попадании результата в указанный интервал, логично предположить, что вероятность отклонения индекса становится выше. Однако невозможно сделать предположение о направлении (знаке) данного прироста. В случае же попадания рассчитанного показателя в интервал 0.5 < H < 0.9, можно предположить, что вероятность большого прироста индекса существенно меньше. Но при всём том невозможно выбрать «лучший» показатель константы Херста в данном интервале, так как нельзя утверждать, что, например, показатель Херста 0.6 более рискованный, нежели 0.8. Во всяком случае, это не следует из результатов эксперимента.

Также невозможно отдать предпочтение определённой константе Херста и по причине «толстых хвостов» распределения приростов индекса. Данное обстоятельство указывает на трудность моделирования приростов в заданном интервале константы Херста, особенно если этот интервал представлен реальными данными не густо. Также данное обстоятельство указывает на то, что константа Херста никак не решает проблему «толстых хвостов» - то есть при моделировании приростов индекса придётся считаться с необходимостью отразить в моделях «выбросы».

2. Длина горизонта прогнозирования.

Если предположить, что возможно прогнозировать будущие приросты индекса, логично определить максимальный горизонт прогнозирования. Учитывая результаты эксперимента, следует признать, что возможно прогнозировать поведение индекса на ближайшие дни - ориентировочно до 15 торговых дней. Не было доказано, что прогнозирование на более длинные горизонты давали бы лучшие результаты, но не было доказано и то, что прогнозирование на более короткие горизонты существенно обеспечило бы лучшие результаты. Однако надо понимать, что эти результаты трудно применить к другим индексам или временным рядам.

3. Практическое применение.

Исходя из вывода о невозможности предсказания направления (знака) прироста индекса на основе показателя Херста, следует заключение, о том, что константу Херста можно использовать только как меру риска, например при сдерживании риска выбирать показатель Херста в интервале 0.5 < H < 0.9 и/или наоборот - при усилении риска выбирать показатель Херста в интервале 0.1 < H < 0.5.

Стандартное отклонение обычнопоказывает изменчивость случайных рядов. В случае рассмотрения рынка как случайного процесса, то применение стандартного отклонения в качестве основной характеристики величины риска может быть эффективным. При этом если принять во внимание, что все рынки не являются случайными, а хаотичны, тогда фрактальное измерение намного лучше годится для измерений нелинейности движения котировок. Данный факт открывает перед ученымиобширное поле для использованияпоказателяХерста.ВообщекоэффициентХерста может использоваться в качествепоказателя изменчивости рядов данных. Так, Эдгар Петерс в книге «Хаос и порядок на рынках капитала» утверждает, что при анализе риска акцийпреимущественнее использовать не стандартное отклонение, а фрактальное измерение, к которому и относится показатель Херста[32].

Исследование возможности повышения точности прогноза курсов акций с использованием алгоритмов с показателем Херста

В работе Moody, Wu (1995) исследование было сосредоточено на поиске возможной взаимосвязи между значениями показателя Херста и точностью прогнозирования статистических моделей и моделей машинного обучения.В данном исследовании была обнаружена связь между точностью прогнозирования и спрэдами между запросами и ставками на тик-тиковых данных[33].

Исследование, проведенное Bayraktaret al (2003) показывает, что сезонность в внутридневных финансовых данных может повлиять на оценку коэффициента Херста [34]. Чтобы достичь устойчивости оценки Херста, авторы предлагают использовать вейвлеты как минимум с двумя исчезающими моментами.

В работе Кузнецова С.Б. «Фрактальный анализ котировок ВТБ» показано, что рынок акций имеет фрактальную природу, а это противоречит гипотезе эффективного рынка, в соответствии с которой «вся существенная информация немедленно и в полной мере отражается на рыночной курсовой стоимости ценных бумаг». Поэтому использовать классическое вероятностное исчисление и линейные модели для изучения трудовых ресурсов, не оправдано. В работе обоснована и предложена к внедрению на российском рынке система, учитывающая фрактальный характер этого рынка. Для акций ВТБ выявлены квартальный, полугодовой и годовые циклы, также получены два цикла 90 и 165 дней, учитывающие внешние и внутренние экономические и политические изменения. Из полученных результатов можно видеть, что R/S - анализ способен определять непериодические циклы, даже когда они накладываются друг на друга [35].

Следует отметить, что в целом движение цен акций контролируется достаточно слабо, спорадично (вверх - вниз) вокруг некоторого стабильного значения и более управляемо, с трендом, циклично, волнообразно, в случае более или менее трудоемких этапов из падающих (убывающих) котировок они заменяются этапами их относительно длительного роста. Все методы анализа движения котировок акций, которые используются в настоящем времени, учитывают только трансформацию котировок путем сравнения только с прошлым индикатором[36].Таким образом, строятся графики изменения котировок акций во времени. Рынок инерционен, то есть обладает памятью на коротком временном интервале. Для оценки такого явления логичным представляется использовать показатель Херста, который оценивает персистентность временного ряда, то есть наличие трендовости (направленности) и тенденции к продолжению данного направления изменений [37].

Таким образом, учет различных динамических характеристик изменений котировок акций на фондовой бирже может повысить качество инвестиционных решений, качество управления источниками финансирования деятельности компании и пр. Поэтому проведем анализ динамических характеристик котировок акций, одним из которых является показатель Херста, выделим ключевые показатели и оценим их влияние на доходность акций и риск доходности.

Определение метода прогнозирования

Для этого предварительно установим все необходимые библиотеки (Рисунок 1):

Рисунок1Код с JupyterNotebook для установки необходимых библиотек

Теперь приступим к выбору моделей прогнозирования. Ранее были определены четыре основных группы методов прогнозирования временных рядов: математический, фундаментальный, технический и анализ, основанный на применении нейронных сетей. Попробуем исследовать методы, которые относятся к группе математических.

Далееначнемприменятьвыявленные модели для выбранных ранее данных по котировкам акций ИТ-компаний. Применимданныеметоды для ряда динамики котировок акций компанииAmazon.

Для этого сначала необходимо загрузить данные из Excel файла (Рисунок 2), в котором хранятся значения по котировкам акций.

Рисунок2 Данные по ИТ-компаниям

Загрузка осуществляется следующим образом (Рисунок 3):

Рисунок3Код с JupyterNotebook для загрузки необходимых данных

Метод простого подвижного среднего

Для начала посмотрим, как данные выглядят графически (Рисунок 4).

Исходя из визуального анализа можноприйти к выводу о том, что рассматриваемый ряд стационарным не является и ему присущ восходящий тренд. Также видно, что сезонность явно не выражена. Посмотрим, насколько будут качественными типичные методы прогнозирования финансовых рядов.

Рисунок 4 Динамика котировок акций компании Amazon в период с 01.01.2015 по 01.12.2017 (данные ежемесячно)

Метод нормального сглаживания

Прежде всего, загрузим данные тестового образца (01.01.2018-01.12.2018) так же, как были загружены данные обучения (Рисунок 5):

Рисунок5Код с JupyterNotebook для загрузки необходимых данных

Далее мы будем обучать модель на тренировочном образце и строить прогноз на тесте (Рисунок 6):

Рисунок6Код с JupyterNotebook для загрузки необходимых данных

Теперь изобразим графическирезультат прогноза (Рисунок 7):

Рисунок7Код с JupyterNotebook для графического представления прогноза

Получим следующую интерпретацию прогноза (Рисунок 8):

Рисунок 8 Применение метода нормального сглаживания

В соответствии с полученным графиком, модель сформировала прогноз на основе последнего, ближайшего к прогнозируемым значениям, сегмента ряда. Этот сегмент ведет себя довольно стабильно, поэтому модель не может предсказать восходящее движение цены, наблюдаемое в тестовом образце (оранжевый на графике).

Посмотрим, чему равна среднеквадратическая ошибка для данной модели (Рисунок 9):

Рисунок9Код с JupyterNotebook для подсчета среднеквадратической ошибки

Метод экспоненциального сглаживания

Следует обучить модель для применения метода экспоненциального сглаживания (Рисунок 10):

Рисунок10Код с JupyterNotebook для применения метода экспоненциального сглаживания

Теперь посмотрим как выглядят результаты на графике (Рисунок 11):

Рисунок 11 Применение метода экспоненциального сглаживания

Видно, что прогноз стал выглядетьправдивее. Однако, модель все-таки не смогла выявитьрастущее движение цены.

Рассчитаем ошибку прогноза (Рисунок 12):

Рисунок12Код с JupyterNotebook для подсчета среднеквадратической ошибки

Среднеквадратическая ошибка также указывает, что данная модель обладает больше прогностической способностью.

Метод Хольта

Теперь необходимо обучить модель для методаХольта (Рисунок 13):

Рисунок13Код с JupyterNotebook для применения метода Хольта

Посмотрим как выглядят результаты на графике (Рисунок 14):

Рисунок 14 Применение метода Хольта

По полученному графикуясновидно, что методХольта уловил характер временного ряда.

Рассчитаем ошибку прогноза (Рисунок 15).

Рисунок15Код с JupyterNotebook для подсчета среднеквадратической ошибки

Согласно среднеквадратической ошибке, эта модель предсказывает показатели лучше, чем предыдущие две, и тем не менее мы видим, что прогноз все еще далек от идеального.

Метод Хольта-Уинтерса

Чтобы использовать сглаживание Хольта-Уинтерса, необходимо указать сезонность тренда. Однако в рассматриваемыхсериях сезонность явно не видна. Поэтому строится модель для всех периодов до 13 и выбирается лучшая, используя среднеквадратичную ошибку (Рисунок 16):

Рисунок16Код с JupyterNotebook для метода Хольта-Уинтерса

Посмотрим как выглядят результаты на графике (Рисунок 17)

Рисунок 17 Применение метода Хольта-Уинтерса

Из графика видно, что прогнозируемая сезонность не способная описатьдействительные данные. Невзирая на то, что финансовым даннымприсуща сезонность, в данном случае рассматриваемая модель оказалась неприменимой.

Рассчитаем ошибку прогноза (Рисунок 18):

Рисунок18Код с JupyterNotebook для подсчета среднеквадратической ошибки

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.