Разработка предложений по автоматизации процесса прогнозирования цен на нефть и мониторинга оценки их влияния на показатели дохода нефтегазового сектора и бюджета России

Характеристика методов оценки влияния цены на нефть на совокупные доходы бюджета, нефтегазовые доходы бюджета и прочие показатели бюджета. Разработка рекомендаций по автоматизации процесса прогнозирования цен на нефть. Исследование архитектуры системы.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 01.12.2019
Размер файла 2,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ОБРАЗОВАНИЯ

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»

Факультет Бизнеса и Менеджмента

Выпускная квалификационная работа

Разработка предложений по автоматизации процесса прогнозирования цен на нефть и мониторинга оценки их влияния на показатели дохода нефтегазового сектора и бюджета РФ

Иванова Мария Олеговна

Москва 2019

Содержание

Введение

1. Анализ современных методов и автоматизации процессов прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ

1.1 Анализ методов прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ

1.2 Анализ процессов автоматизации процессов прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ

1.3 Анализ методов оценки влияния цены на нефть на совокупные доходы бюджета, нефтегазовые доходы бюджета и прочие показатели бюджета

1.4 Анализ процессов автоматизации оценки взаимосвязи между ценой на нефть и показателями бюджета

2. Оценка, анализ и выбор наиболее точных методов прогнозирования цен на нефть и показателей доходности бюджета РФ

2.1 Обзор и выбор методов прогнозирования с учетом анализируемых данных

2.2 Анализ оценок качества прогноза

2.3 Метод оценки взаимосвязи показателей временных рядов

2.4 Выбор моделей прогнозирования

3. Практическая апробация моделей прогнозирования и оценки взаимосвязи цен на нефть и показателей доходности нефтегазового сектора

3.1 Получение и выбор данных

3.2 Построение прогноза по методу Хольта-Винтерса для следующих показателей

3.3 Оценка взаимосвязи между ценой на нефть, нефтегазовыми доходами и совокупными доходами

4. Разработка рекомендаций по автоматизации процесса прогнозирования цен на нефть и показателей доходности нефтегазового сектора

4.1 Требования

4.2 Архитектура системы

4.3 Объяснение и обоснование выбора компонент

Заключение

Список литературы

Приложение

Введение

Расчет бюджета в зависимости от цен на нефть и газ является одной из ключевых задач современной российской экономики с момента введения международных санкций против высоких цен на нефть и газ, потому что нефтегазовые доходы - крупная статья доходов бюджета современной Российской Федерации. Однако, поскольку другие страны активно изучают другие источники производства электроэнергии и активно вводят международные санкции против высоких цен на нефть [1], российский бюджет может очень быстро потерять этот источник дохода. В 2017 году российское правительство заявило, что бюджет будет рассчитываться на основе цены на нефть [2], а также постановило, что основной целью российской экономики является переход от экспорта нефти и газа к производству и экспорту товаров. Вот почему точное прогнозирование цен на газ и нефть и отслеживание тенденции замены нефти и газа на товары имеют большое значение. Более того, точные прогнозы как доходов российского бюджета, так и доходов в нефтегазовом секторе позволят Министерству финансов России сделать точные расчеты о том, как переключить российский экспорт с нефти и газа на несырьевые товары и услуги. Несмотря на то, что эти цели для Российской Федерации являются приоритетными, единого интерфейса, отображающего прогнозные данные по бюджетным показателям, курсу рубля и цене на нефть, а также коэффициенты взаимосвязи доходов бюджета и цены на нефть. В настоящей работе стоит вопрос исследования и создания наиболее точной модели для прогноза цены на нефть, показателей бюджета РФ, курса рубля, а также оценки взаимосвязи между показателями бюджета РФ и ценой на нефть.

Объектом исследования является прогнозирование цен на нефть и показателей доходности нефтегазового сектора и бюджета РФ.

Предметом исследования является разработка рекомендаций по автоматизации процесса прогнозирования цен на нефть и оценка их влияния на показатели дохода нефтегазового сектора и бюджета РФ

Целью работы является разработка предложений по автоматизации процесса прогнозирования цен на нефть и оценки их влияния на показатели дохода нефтегазового сектора и бюджета РФ для своевременного принятия решений по улучшению процесса управления макроэкономическими показателями.

В данном исследовании выдвигаются гипотеза, состоящая в том, что автоматизация процесса прогнозирования цен на нефть и показателей доходности нефтегазового сектора, а также оценка взаимосвязи показателей доходности нефтегазового сектора и бюджета РФ способствуют своевременному принятию решений различными бизнес-структурами с целью улучшения процесса управления.

В соответствии с поставленной целью в работе решались следующие задачи:

1. провести анализ современных методов прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ, а также используемых направлений автоматизации данных процессов;

2. выбрать наиболее точный метод прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ;

3. выбрать метод оценки взаимосвязи показателей доходности нефтегазового сектора и бюджета РФ;

4. разработать рекомендации по автоматизации и мониторингу прогнозирования цен на нефть и показателей доходности нефтегазового сектора, а также оценки взаимосвязи показателей доходности нефтегазового сектора и бюджета РФ, что способствует своевременному принятию решений по улучшению процесса управления макроэкономическими показателями.

Ограничения. В рамках данной работы использовались открытые данные цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ по базе Единого Портала Бюджетной Системы [3] за последние 7 лет. Для расчетов, однако, взяты последние 5 лет.

Актуальность. Актуальность разработки предложений по автоматизации построения прогноза по цене на нефть, показателям бюджета, а также по вычислению взаимосвязи цены на нефть с совокупными доходами заключается в том, что мониторинг этих показателей очень важен Российской Федерации, так как с 2017 года одна из приоритетных целей для страны - снижать собственную зависимость от нефтегазового сектора [4]. Эти показатели важны и для отдельных бизнес-структур России с целью учета при планировании, построении стратегий развития и пр. Несмотря на это, единого интерфейса, в который бы подгружались прогнозные данные по показателям и оценке взаимосвязи, создано еще не было, поскольку прогноз бюджета составляется каждым субъектом РФ отдельно. Мониторинг этих показателей, однако, мог бы повысить точность принимаемых управленческих решений. Кроме того, наличие таких показателей в открытом доступе делал бы деятельность Министерства Финансов более открытой как для бизнес-структур, так и для простых граждан. Открытость деятельности Минфина России - одна из приоритетных задач для них сейчас в числе многих прочих [5].

Исходные данные. Данные были взяты с Единого Портала Бюджетной Системы. На Едином Портале Бюджетной Системы данные хранятся в OLAP-кубах и доступны по API [6]. Рассмотрены такие показатели бюджета как нефтегазовые доходы, ненефтегазовые доходы, совокупные доходы бюджета Российской Федерации, НДПИ на нефть, НДПИ на газ, НДПИ по нефтегазовому сектору суммарно, НДПИ на добычу полезных ископаемых, вывозные таможенные пошлины на нефть, вывозные таможенные пошлины на газ, вывозные таможенные пошлины на продукты нефтепереработки, налоги и сборы за пользования природными ресурсами. Данные по курсу нефти и курсу рубля были взяты из электронного маркетплейса Quandl [7]. Они по API передаются в формате JSON.

Методы исследования.

В данной работе для достижения поставленных задач были использованы следующие методы:

· сбор данных по показателям бюджета, а также по курсу рубля и цене на нефть;

· расчет предсказания цены на нефть с использованием нескольких математических моделей средствами библиотек Numpy [8] и Pandas [9] для языка программирования Python [10];

· оценка точности предсказания и точности модели при помощи вычисления среднеквадратической ошибки [11];

· создание прогноза для бюджетных параметров, цены на нефть и курса рубля по модели Хольта-Винтерса [12] средствами MS Excel [13];

· оценка точности прогноза и точности моделей для каждого показателя, а также вычисления MAD [14], MAPE [15], MPE [16], MSE, RMSE [17] средствами MS Excel;

· оценка взаимосвязи между ценой на нефть и показателями бюджета при помощи вычисления коэффициента корреляции средствами MS Excel;

· использование Use-Case диаграмм [18] для иллюстрации пользовательского взаимодействия с системой;

· использование UML диаграмм [19] для объяснения архитектуры системы.

Работа содержит 60 страниц, включает 5 приложений, 1 таблицу, 22 рисунка.

1. Анализ современных методов и автоматизации процессов прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ

1.1 Анализ методов прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ

Методы прогнозирования цены на нефть. Тема прогнозирования цен на нефть и газ долгое время была актуальна для правительств и исследователей. Прогнозировать будущие цены на нефть очень сложно из-за трех основных характеристик цен на нефть, которые представляют собой временную задержку, нелинейность и взаимосвязь между различными рынками нефти, которые не могут обрабатываться одновременно большинством традиционных моделей. Помимо традиционных методов прогнозирования цен, недавно были представлены новые модели, такие как модели с использованием векторных моделей и машинного обучения. Поскольку нейронные сети стали популярными, и люди начали решать задачи прогнозирования с помощью машинного обучения, было проведено исследование по использованию машинного обучения для прогнозов.

Согласно недавнему исследованию [20], предлагается новая гибридная модель векторной коррекции ошибок в комбинации с нелинейной авторегрессионной нейронной сетью (VEC-NAR) для одновременной работы с запаздыванием, нелинейностью и взаимосвязью между рынками нефти. Векторная модель используется для оптимизации отставания цен на нефть и определения взаимосвязи, которая различает эндогенные и экзогенные переменные. Затем оптимальные результаты, полученные с использованием модели VEC, объединяются с моделью NAR, которая эффективно отображает нелинейный компонент для прогнозирования цен на сырую нефть. Данные о ценах на нефть марки Brent за период с 1 января 2003 года по 31 декабря 2014 года использовались в качестве эмпирической выборки для проверки эффективности предлагаемой нами модели, которая сравнивается с известными методами прогнозирования цен на сырую нефть. Результаты испытаний показали, что модель VEC-NAR обеспечивает превосходную точность прогнозирования по сравнению с традиционными моделями, такими как модели класса GARCH, модели VAR, VEC и NAR.

В последнее время интерес к нейронным сетям с глубоким обучением начал расти. Глубокие нейронные сети способны писать стихи и создавать музыку и искусство, и людям было любопытно, что эти нейронные сети могут делать в области прогнозирования цен на нефть и газ. Чен, He & Цо [21] разработали новый подход к прогнозированию цен на сырую нефть с использованием модели глубокого обучения для захвата неизвестных сложных нелинейных характеристик движения цен. Используя предложенную модель, анализируется и моделируется основное движение цен на сырую нефть. Эффективность предлагаемой модели оценивается с использованием данных о ценах на рынках сырой нефти. Эмпирические результаты показывают, что предлагаемая модель обеспечивает улучшенную точность прогнозирования.

Эффективность использования машинного обучения была еще раз доказана в недавнем исследовании, проведенном группой ученых [22], где был предложен новый гибридный метод для прогнозирования цен на сырую нефть. Сначала метод разложения по эмпирическим модовым ансамблям использовался для разложения международных цен на сырую нефть на ряд независимых внутренних функций и остаточный член. Затем метод опорных векторов был скомбинирован вместе с обобщенной моделью авторегрессионной условной гетероскедастичности для прогнозирования нелинейных и изменяющихся во времени компонентов цен на сырую нефть соответственно. Затем прогнозируемые цены на сырую нефть каждого компонента были суммированы как окончательные прогнозируемые результаты цен на сырую нефть. Исследования показывают, что недавно предложенный гибридный метод обладает хорошими возможностями прогнозирования цен на сырую нефть благодаря его превосходным характеристикам адаптации к случайному выбору образцов, частоте данных и структурным разрывам в образцах. Кроме того, результаты сравнения также показывают, что новый метод доказывает превосходство в точности прогнозирования по сравнению с теми хорошо известными методами прогнозирования цен на сырую нефть.

Анализ методов прогнозирования доходности бюджета РФ. Существует несколько наиболее часто применяемых методов для прогнозирования доходности бюджета [23]. Их можно сгруппировать и разделить на:

- методы экстраполяции сложившихся трендов;

- методы, основанные на структурных экономико-математических методах;

- методы, использующие экспертные оценки.

В настоящее время в мировой практике используются методы, основанные на микромоделировании, макроэкономических моделях и моделях экстраполяции, для получения краткосрочных прогнозов. Модели при микромоделировании, например, налоговых доходов основаны на большой выборке налоговых деклараций за определенный период времени, данные которых агрегированы со специально определенными весами, чтобы отразить поведение и структуру всех налогоплательщиков в соответствующей области.

Традиционно для прогнозирования социально-экономических показателей применяются экстраполяционные модели, такие как экспоненциальное сглаживание, модели авторегрессии и модели скользящего среднего. В частности, модели авторегрессионного скользящего среднего (ARIMA) основаны на комбинации процессов авторегрессии (моделей временных рядов, которые устанавливают текущее значение переменной как функцию от прошлых значений самой этой переменной) и процессов скользящих средних (моделей временных рядов, в которых установлена ??переменная как функция от ошибок в прошлом). В целом, процессы авторегрессии и процессы скользящего среднего с точки зрения макроэкономической стабильности позволяют достаточно хорошо описать динамику макроэкономических рядов. Основным недостатком, ограничивающим использование методов экстраполяции, является их «автономность»: прогнозы основаны на предположении, что выявленные тенденции останутся неизменными в будущем, хотя в реальности это не так. Так как статистической базы в России не хватает для того, чтобы применять модели микромоделирования, прогноз доходов бюджета Российской Федерации основывается на авторегрессионных и макроэкономических моделях [24].

1.2 Анализ процессов автоматизации процессов прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ

Задача автоматизации процессов прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ стоит перед правительством России с 2002 года, когда была создана и начала выполнение целевая программа “Электронная Россия 2002-2010” [25]. Цель программы - увеличение прозрачности деятельности государства для граждан и автоматизация работы Министерства Финансов. Согласно программе “Электронная Россия”, для Минфина РФ должен был быть разработан веб-сайт, на котором бы могла быть отображена информация как по текущему состоянию государственного бюджета, так и прогнозные данные и данные прошлых лет. Сейчас Министерство Финансов продолжает активно работать над автоматизацией своей работы во всех сферах. В рамках анализа автоматизации процессов прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ более значимо рассматривать программу действий “Электронный бюджет”[26], потому что она является работающим примером того, как Минфин автоматизирует процессы предсказания цен на нефть, показателей доходов нефтегазового сектора и доходов государственного бюджета.

Для анализа процесса автоматизации процессов прогнозирования цен на нефть, показателей доходности нефтегазового сектора и бюджета РФ следует рассмотреть, на какие периоды и как составляется прогноз. Бюджетный прогноз в Российской Федерации составляется на три года. Однако, помимо бюджетного прогноза на три года, составляются также прогнозы на год, а также ежемесячные и ежеквартальные прогнозы для более точного принятия управленческих решений по следующей схеме:

1) Ежегодно Министерство Финансов Российской Федерации составляет план бюджета;

2) Бюджет далее согласуется в трёх чтениях в госдуме и принимается Закон об исполнении бюджета на год;

3) Принятые суммы доводятся до главных администраторов. Те должны в установленные сроки по 117н предоставить ежемесячную разбивку;

4) Далее каждый месяц эти суммы уточняются главными администраторами и исполняются.

На текущий момент прогнозирование доходов, а также планирование бюджета происходит с помощью системы бюджетного планирования ГИИС “Электронный бюджет”, с помощью которого методологи Минфина России рассчитывают и корректируют бюджетный прогноз Российской Федерации. Перерасчет будущих значений с учетом новой информации в системе происходит автоматически. В момент, когда это происходит, заново рассчитанные данные загружаются в OLAP-кубы, и информация отображается на Едином Портале Бюджетной Системы. На рис.1 приведена иллюстрация того, как сейчас на Едином Портале Бюджетной Системы отображаются доходы бюджета.

Рис. 1 - Иллюстрация прогноза доходов бюджета на Едином Портале Бюджетной Системы, источник - сайт Единого Портала Бюджетной Системы

1.3 Анализ методов оценки влияния цены на нефть на совокупные доходы бюджета, нефтегазовые доходы бюджета и прочие показатели бюджета

Одна из ключевых задач для страны сейчас - снижать зависимость государственного бюджета от нефтегазового сектора. В связи с этим важно понимать, насколько сильно сейчас взаимосвязаны показатели бюджета с ценой на нефть. Кроме того, коэффициенты взаимосвязи могут применяться правительством для решения задач прогнозирования налоговых доходов в нефтегазовом секторе (НДПИ на нефть, НДПИ на газ, вывозные налоговые пошлины на нефть и газ и так далее). Расчет этого показателя и его мониторинг поможет как делать более точный прогноз доходов в нефтегазовом секторе, так и принимать более правильные управленческие решения. Кроме того, появление такой метрики - в интересах Минфина России, потому что так они делают расчет бюджета более открытым и понятным простым гражданам.

Группой Российских ученых [27] был предложен новый метод оценки взаимосвязи между ценой на нефть и показателями бюджета Российской Федерации. Взаимосвязь оценивалась по следующему алгоритму:

1) Был построен базовый прогноз макроэкономических показателей экономики России на 2014 год;

2) По той же самой модели были построены еще четыре дополнительных прогноза при модифицированных значениях параметров по четырем сценариям:

- сценарии «H+» и «H-» представляли собой сценарии роста и снижения цены на нефть на 1$ за баррель соответственно;

- сценарии «Д+» и «Д-» аналогично представляли собой сценарии роста и снижения курса доллара на 1 руб. за 1$.

Сценарии как снижения, так и роста были необходимы из-за того, что у исследователей не было уверенности в том, что влияние параметров на макроэкономические показатели могло быть несимметричным.

3) Для каждого варианта прогноза рассчитывались доходы бюджетной системы. Сопоставление каждого сценария с базовым вариантом показывает влияние соответствующего внешнего параметра на доходы.

Еще одна российская исследовательница [28] одной публикации связи между признаками оценивались с помощью корреляционного поля или диаграммы рассеяния, при котором на оси X откладывается значение x, на оси Y - значение y соответственно, а точки соответствуют сочетаниям первичных наблюдений x и y. По расположению точек, по их концентрации в определенном направлении можно судить о наличии связи. Этот метод хорош с точки зрения того, что с его помощью можно достаточно наглядно отобразить взаимосвязи, но плох тем, что это не выражено в какой-то конкретной метрике, которую потом можно было бы использовать в расчетах.

1.4 Анализ процессов автоматизации оценки взаимосвязи между ценой на нефть и показателями бюджета

После анализа публикаций и двух крупных сайтов, на которых размещается информация о деятельности Минфина России, стало очевидно, что на данный момент государством не была создана система, доступная простым гражданам, которая бы позволяла автоматически выводить коэффициенты взаимосвязи между ценой на нефть и показателями бюджета. Информация о коэффициентах взаимосвязи между этими показателями создается при помощи оценки экспертов, и никак не автоматизируется. Для работы внутренних систем (например, калькулятора доходов нефтегазового сектора) предположительно могут использоваться заранее просчитанные с экспертной помощью коэффициенты.

Разработка предложений по автоматизации построения прогноза по цене на нефть, показателям бюджета, а также по вычислению взаимосвязи цены на нефть с совокупными доходами - актуальная проблема. С 2017 года одна из приоритетных целей для страны - снижать собственную зависимость от нефтегазового сектора, однако, единого для всей страны интерфейса (дешборда) со всеми необходимыми показателями создано не было. Мониторинг этих показателей, однако, мог бы повысить точность принимаемых управленческих решений. Проработка и решение данной проблемы поможет, во-первых, менеджерам в Министерстве Финансов принимать более точные управленческие решения, во-вторых, сделает действия правительства и решения, принимаемые Минфином России более прозрачными и понятными для простых граждан.

Исходные данные были взяты мной с Единого Портала Бюджетной Системы. На Едином Портале Бюджетной Системы данные хранятся в OLAP-кубах и доступны по API. Рассмотрены такие показатели бюджета как нефтегазовые доходы, ненефтегазовые доходы, совокупные доходы бюджета Российской Федерации, НДПИ на нефть, НДПИ на газ, НДПИ по нефтегазовому сектору суммарно, НДПИ на добычу полезных ископаемых, вывозные таможенные пошлины на нефть, вывозные таможенные пошлины на газ, вывозные таможенные пошлины на продукты нефтепереработки, налоги и сборы за пользования природными ресурсами. Данные по курсу нефти и курсу рубля были взяты из электронного маркетплейса Quandl. Они по API передаются в формате JSON.

Несмотря на то, что наиболее современными методами прогнозирования временных рядов являются гибридные методы с использованием нейросетевых технологий, они не будут рассматриваться для прогнозирования в данной работе. Хотя сложное строение гибридных моделей с применением нейросетевых технологий позволяет детально разобрать структуру временного ряда и получить более точный прогноз, но данный подход представляет собой усовершенствованную версию технического анализа и не учитывает смысловую структуру анализируемых данных, поэтому также не является идеальным. Кроме того, внутренние механизмы работы систем, основанных на нейронных сетях, сложно объяснить людям без соответствующего образования. Одна из крупных частей целевой аудитории будущей системы - менеджеры, для которых важно знать, каким образом был построен прогноз. По этим причинам в рамках данной работы будет сделан фокус на математических моделях. Однако, стоит заметить, что одним из потенциальных направлений работы по усовершенствованию прогноза бюджетных показателей является создание и проектирование гибридных моделей прогнозирования с использованием нейросетевых технологий.

2. Оценка, анализ и выбор наиболее точных методов прогнозирования цен на нефть и показателей доходности бюджета РФ

2.1 Обзор и выбор методов прогнозирования с учетом анализируемых данных

Одна из наиболее интересных и, при этом, нетривиальных проблем анализа данных в настоящее время является прогнозирование временных рядов [29]. Нетривиальность этой задачи заключается в том, что данные зачастую непостоянны во времени.

Анализ временных рядов интересовал ученых с 50-х годов прошлого столетия. На сегодняшний день выделяют 4 основных типа подхода к анализу временных рядов:

· технический;

· математический;

· фундаментальный;

· анализ, основанный на использовании нейронных сетей.

Технический анализ - анализ, основывающийся на анализе временного ряда за предыдущие периоды с помощью технических показателей. В процессе технического анализа делается фокус на изучении структуры процесса движения показателя на основании его динамики в предыдущие периоды. Из-за того, что в процессе технического анализа не учитываются экономические факторы и не берется в расчет понимание смысла изучаемых данных, данная ветвь развития анализа временных рядов считается тупиковой.

В рамках математического анализа изучаются такие методы, как:

· метод регрессионного анализа;

· метод сглаживания временных рядов;

· методы хаотических временных рядов;

· фрактальные методы;

и др.

В фундаментальном анализе делается упор на исследование процессов и факторов, которые влияют не на конкретный временной ряд, а на экономику в целом. В этом случае помимо экономических показателей рассматриваются и политические, и многие другие показатели, оказывающие влияние на рынок.

Наиболее современным подходом в анализе временных рядов является применение нейронных сетей и машинного обучения. Из-за того, что модели, включающие в себя нейронные сети, сложны по внутреннему устройству, они могут анализировать временной ряд глубже. В связи с этим получается делать более точные предсказания. Стоит заметить, что нейронные сети также не являются универсальным решением, так как не учитывают смысловую структуру анализируемых данных.

В рамках данной работы будет рассмотрена результативность математического подхода.

Метод скользящего среднего - один из методов сглаживания временного ряда, отличающийся тем, что среднее значение рассчитывается не основываясь на всех значениях временного ряда, а на промежутке значений заданной длины.

Есть множество способов для сглаживания ряда. На практике чаще всего применяются нормальное сглаживание, экспоненциальное сглаживание, сглаживание Хольта, сглаживание Хольта-Уинтерса и др. Методы различаются формулой подсчета скользящего среднего, а также случаями их использования.

Нормальное сглаживание. Скользящее среднее для нормального сглаживания рассчитывается следующим образом [30]:

,

где - порядковый номер средней, а размер промежутка значений определяется аналитиком. Чем больше окно сглаживания , тем плавнее получается линия.

Метод скользящего среднего позволяет выделить тренд. При дальнейшем анализе из ряда убирают тренд при помощи вычитания из значений ряда значений скользящего среднего. Недостатком данного метода является отсутствие возможности учета сезонности временного ряда.

Экспоненциальное сглаживание. Этот метод, известный также как «метод Брауна», используется для того, чтобы делать прогноз нестационарных временных рядов со случайными изменениями уровня и угла наклона [31].

Скользящее среднее методом экспоненциального сглаживания рассчитывается следующим образом:

,

Где

- фактическое наблюдение в момент времени ,

- значение экспоненциального среднего в момент времени ,

- параметр сглаживания (.

Экспоненциальное среднее в момент является взвешенной суммой текущего наблюдения и экспоненциального среднего прошлого наблюдения с весами и соответственно. При последовательном использовании этого соотношения становится возможно выразить следующим образом:

,

Таким образом, величина - взвешенная сумма членов ряда, в которой значения весов экспоненциально становятся меньше в зависимости от того, насколько удалено наблюдения относительно момента . Недостаток этого метода - невозможность учета сезонности.

Сглаживание Хольта. Сглаживание Хольта -- расширенная версия экспоненциального сглаживания, которое применяется к временным рядам, св которых есть тренд [32]. Этот метод делится на 3 уравнения:

1. Уравнение для построения прогноза

,

2. Уравнение для расчета скользящего среднего ряда

,

3. Уравнение для расчета скользящего среднего тренда

,

где

- фактическое наблюдение в момент времени ,

- значение экспоненциального среднего в момент времени ,

- значение экспоненциального среднего тренда в момент времени ,

- параметр сглаживания (

- параметр сглаживания тренда (.

Недостаток этого метода - невозможность учета сезонности, достоинство - учет тренда.

Сглаживание Хольта-Уинтерса. В методе Хольта-Уинтерса учитываются и сезонность, и тренд [33].

Для аддитивной сезонности:

Данный метод подразделяется на 4 уравнения:

1. Уравнение для построения прогноза

,

2. Уравнение для расчета скользящего среднего ряда

,

3. Уравнение для расчета скользящего среднего тренда

,

4. Уравнение для расчета скользящего среднего сезонности

,

где

- фактическое наблюдение в момент времени ,

- значение экспоненциального среднего в момент времени ,

- значение экспоненциального среднего тренда в момент времени ,

- значение экспоненциального среднего сезонности в момент ,

- параметр сглаживания (

- параметр сглаживания тренда (,

- параметр сглаживания тренда (,

- длина сезонного цикла,

эта переменная дает гарантию того, что только последний цикл сезонности имеет значение при подсчете скользящего среднего.

Для мультипликативной сезонности:

Данный метод подразделяется на 4 уравнения:

1. Уравнение для построения прогноза

,

2. Уравнение для расчета скользящего среднего ряда

,

3. Уравнение для расчета скользящего среднего тренда

,

4. Уравнение для расчета скользящего среднего сезонности

,

Для нас важно учитывать и сезонность, и тренд, поэтому предпочтение в выборе модели отдается модели Хольта-Винтерса.

2.2 Анализ оценок качества прогноза

В процессе построения прогноза и выбора начальных значений возникает необходимость в метрике, отражающей то, насколько точно сделан прогноз. Эта метрика также понадобится для того, чтобы понять, какая модель делает прогноз лучше, а также чтобы понять, насколько состоятелен получившийся прогноз. Существует множество оценок, определяющих точность прогнозирования, но для того, чтобы их вычислить, на каждом шаге нужно знать ошибку прогнозирования.

Ошибка прогнозирования на один шаг вперед в момент времени t равна

где:

§ - значение входной последовательности в момент времени t;

§ - прогноз на момент времени t сделанный на предыдущем шаге.

Самой распространенной оценкой точности прогнозирования является среднее значение квадратов ошибок (Mean Squared Error):

где n - количество элементов последовательности.

В качестве недостатка оценки MSE указывают на ее чрезмерную чувствительность к редким одиночным ошибкам большой величины, так как если такая ошибка случается, то она возводится в квадрат и поэтому сильно влияет на прогноз. В этом случае существует альтернативный вариант - среднее значение абсолютной ошибки (Mean Absolute Error).

Здесь операция возведения значения ошибки в квадрат заменена на использование абсолютного ее значения, из-за этого оценка при использовании MAE должна быть более устойчивой.

И MSE, и MAE часто используются для определения точности прогноза одного и того же ряда при использовании одной и той же модели при разных ее параметрах или при использовании разных моделей. Кроме того, неочевидно, насколько хорош результат прогнозирования при определенном значении MSE или MAE (MAE=0,02 - это много или мало?). Кроме того, таким образом нельзя сравнивать между собой результаты прогнозирования, полученных на разных последовательностях.

Чтобы иметь возможность сравнивать между собой точность прогноза разных последовательностей, обычно используются RelMSE и RelMAE, в котором найденные оценки точности прогноза делятся на оценки, которые были выведены с испoльзованием тестового метода прогнозирования. В качестве такого тестового метода часто используется наивный метод, когда предполагается, что значение процесса в будущем будет равно его значению в данный момент времени.

Кроме того, для получения информации о точности модели, также смотрят на такие ошибки, как средняя процентная ошибка и средняя ошибка аппрокисмации. Средняя процентная ошибка (MPE) показывает, насколько прогноз смещен, то есть используется чтобы понять, является ли прогноз переоценивающим (MPE>0) или недооценивающим (MPE<0). Средняя ошибка аппроксимации (MAPE) описывает величину отклонения теоретических уровней от фактических. Если MAPE<10%, точность прогнозной модели очень высокая. Если 10%<MAPE<20%, точность высокая. При MAPE<50% точность модели удовлетворительная, более 50% точность удовлетворительной назвать нельзя.

2.3 Метод оценки взаимосвязи показателей временных рядов

Существует много вариантов оценки взаимосвязи между временными рядами.

Связанными временными рядами называют временные ряды, которые показывают зависимость результативного признака от факторных признаков [34].

Автокорреляция -- явление взаимосвязи между рядами: первоначальным и этим же рядом, сдвинутым относительно первоначального положения на h моментов времени.

Существует три метода коррелирования, которые позволяют решить задачу связи между уровнями связанных временных рядов:

· Коррелирование уровней динамики;

· Коррелирование отклонений фактических уровней от выровненных уровней;

· Коррелирование последовательных разностей.

Следует оговориться, что пользоваться этим методом можно только при отсутствии автокорреляции. Если автокорреляция есть, ее нужно предварительно убрать.

Рассмотрим методы коррелирования подробнее:

1. Коррелирование уровней динамики.

Если автокорреляция между рядами отсутствует, то показывает, насколько они связаны. Коррелирование уровней динамики определяется по формуле:

,

где X - уровни факторного ряда динамики, Y - уровни результативного ряда динамики.

1. Коррелирование отклонений фактических уровней от выровненных уровней (тренда).

Данный метод основан на том, что меряют корреляцию не самих уровней, а отклонения фактических уровней от выравненных, отражающих тренд.

При коррелировании отклонений фактических уровней от выровненных действуют по следующему алгоритму:

1) Сначала происходит выравнивание каждого ряда по подобранной специально для него формуле;

2) Из эмпирических уровней вычитают выверенные, получают отклонения;

3) Вычисляют, насколько тесна связь между отклонениями, по формуле:

,

2. Коррелирование последовательных разностей.

Убрать влияние автокорреляции можно с помощью нахождения разностей уровней (), потому что влияние, которое оказывается на колеблемость общей тенденции исключается при переходе от уровней к их разностям. При этом изменении уровней по прямой можно коррелировать первые разности, при изменении по параболе n - го порядка - n - е разности. Посчитать коэффициент можно по формуле:

,

3. Коинтеграция

Коинтеграция - это причинно-следственная связь в уровнях временных рядов, выражающаяся в том, что направленность их тенденций и случайной колеблемости может совпадать полностью или частичном совпадении или быть противоположно направленной.

2.4 Выбор моделей прогнозирования

Построим все описанные выше модели для цены на нефть (марка цены на нефть -- Brent).

Первым шагом стоит установить необходимые библиотеки. Это Numpy, Scipy и Pandas [35].

import pandas as pd

import matplotlib.pyplot as plt

import statsmodels.api as sm

from pandas_datareader import data

import statsmodels.tsa.api as smt

from sklearn.metrics import mean_squared_error

import numpy as np

from math import sqrt

from statsmodels.tsa.api import ExponentialSmoothing, SimpleExpSmoothing, Holt

from statsmodels.tsa.arima_model import ARIMA

from sklearn.model_selection import train_test_split

Рис.2. Считывание данных из Excel-файла средствами Python

Далее загрузим данные, по которым будем выбирать модель. Для построения прогноза используются данные по цене на нефть марки Brent с 2015 по 2018 год. Разделим данные на обучающую выборку и тестовую выборку: в обучающей выборке будут данные за 2015-2017 года, тестовая - 2018 год.

Считаем тренировочные данные из Excel файла, рис.2:

Данные для тестовой выборки аналогично импортируем из csv-файла, рис.3:

Рис.3. Считывание данных из csv-файла в Python

Рассмотрим, насколько точный прогноз будут выдавать стандартные методы прогнозирования временных рядов.

Нормальное сглаживание. После того, как данные и по тестовой, и по тренировочной выборке были импортированы, обучим модель на обучающей выборке, проведем прогнозирование и сравним с тестовой выборкой.

y_hat_avg = test.copy()

y_hat_avg['mov_avg_forecast'] = train['price'].rolling(12).mean().iloc[-1]

Построим график для отображения результатов:

plt.figure(figsize=(16,8))

plt.plot(train[x], label='Train')

plt.plot(test[x], label='Test')

plt.plot(y_hat_avg['mov_avg_forecast'], label='Moving Average Forecast')

plt.legend(loc='best')

plt.show()

Рис.4. График построения прогноза методом нормального сглаживания

Как видно из графика на рисунке 4, модель построила предсказание, усредняя информацию по значениям, которые были ближе к концу. Из-за того, что в них сначала происходит спад, а потом подъем, модель не смогла предсказать восходящее движение цены на нефть, которое есть в тестовой выборке. доход бюджет автоматизация цена

Посчитаем, чему равна среднеквадратическая ошибка для данной модели:

rmse = sqrt(mean_squared_error(test[x], y_hat_avg.mov_avg_forecast))

print(rmse)

Среднеквадратическая ошибка равна 18.33509635462364

Экспоненциальное сглаживание. Аналогично, обучим модель для экспоненциального сглаживания:

y_hat_avg = test.copy()

fit2 = SimpleExpSmoothing(np.asarray(train[x])).fit(smoothing_level=1,optimized=False)

y_hat_avg['SES_new'] = fit2.forecast(len(test))

Отобразим результаты на графике:

plt.figure(figsize=(16,8))

plt.plot(train[x], label='Train')

plt.plot(test[x], label='Test')

plt.plot(y_hat_avg['SES_new'], label='Moving Average Forecast')

plt.legend(loc='best')

plt.show()

Рис.5. График построения прогноза методом экспоненциального сглаживания

Судя по графику на рис.5, предсказание уже выглядит более похожим на правду, так как прогноз стал немного ближе к тестовой выборке. Несмотря на это, модели не удалось передать восходящий тренд в ценах на нефть, поэтому эта модель и предыдущая не являются для нас наилучшим выбором.

Посчитаем среднеквадратическую ошибку:

rmse = sqrt(mean_squared_error(test[x], y_hat_avg.SES_new))

print(rmse)

Среднеквадратическая ошибка для данной модели равна 10.10, что также говорит о том, что данная модель делает предсказания точнее.

Сглаживание Хольта. Аналогично, обучим модель для сглаживания Хольта:

_hat_avg = test.copy()

fit1 = Holt(np.asarray(train[x])).fit(smoothing_level = 0.3,smoothing_slope = 0.1)

y_hat_avg['Holt_linear_new'] = fit1.forecast(len(test))

Результаты рассмотрим на графике:

plt.figure(figsize=(16,8))

plt.plot(train[x], label='Train')

plt.plot(test[x], label='Test')

plt.plot(y_hat_avg['Holt_linear_new'], label='Moving Average Forecast')

plt.legend(loc='best')

plt.show()

Рис.6. График построения прогноза методом сглаживания Хольта

На графике на рисунке 6 видно, что модель уловила восходящий тренд роста цены. Следовательно, данная модель должна предсказывать точнее, чем предыдущие. Проверим это с помощью среднеквадратической ошибки:

rmse = sqrt(mean_squared_error(test[x], y_hat_avg.Holt_linear_new))

print(rmse)

Среднеквадратическая ошибка равна 9,49, следовательно данная модель действительно предсказывает лучше, чем две предыдущие.

Сглаживание Хольта-Винтерса. Для применения сглаживания Хольта-Винтерса необходимо указать период сезонности ряда, но исходя из данных нельзя точно сказать, какой период сезонности. Для того, чтобы предсказывать наиболее точно, нужно алгоритмически выявить период сезонности, для которого модель предсказывает лучше всего:

seasonal_period = 13

rms_ = 100

for t in range(13):

if t !=1 and t!=2 and t!=0:

test = pd.read_csv('test_2.csv', sep=';', header = None, names = ['month', 'year', 'price'])

y_hat_avg = test.copy()

fit1 = ExponentialSmoothing(np.asarray(train[x]) ,seasonal_periods=t ,trend='add', seasonal='add',).fit()

y_hat_avg['Holt_Winter'] = fit1.forecast(len(test))

rms = sqrt(mean_squared_error(test[x], y_hat_avg.Holt_Winter))

if rms<rms_ :

rms_ = rms

seasonal_period = t

print(rms_)

print(seasonal_period)

Отсюда:

RMSE = 3.1

seasonal_period = 3

Следовательно, данная модель предсказывает для периода в 3 месяца лучше всего.

Построим график:

fit1 = ExponentialSmoothing(np.asarray(train[x]) ,seasonal_periods=3 ,trend='add', seasonal='add',).fit()

y_hat_avg['Holt_Winter'] = fit1.forecast(len(test))

plt.figure(figsize=(16,8))

plt.plot(train[x], label='Train')

plt.plot(test[x], label='Test')

plt.plot(y_hat_avg['Holt_Winter'], label='Moving Average Forecast')

plt.legend(loc='best')

plt.show()

Рис.7. График построения прогноза методом сглаживания Хольта-Винтерса

Из графика на рисунке 7 видно, что данная модель дает наиболее точный прогноз.

Ошибка прогноза:

rmse = sqrt(mean_squared_error(test[x], y_hat_avg.Holt_Winter))

print(rmse)

Ошибка прогноза равна 3.1.

Согласно среднеквадратической ошибке, результаты данной модели оказались лучше, чем предсказания модели со сглаживанием Хольта, учитывающей только тренд.

Таким образом, сглаживание Хольта-Винтерса дало лучшие результаты для прогнозирования цен на нефть, соответственно, эту модель мы и будем использовать в дальнейшей работе.

3. Практическая апробация моделей прогнозирования и оценки взаимосвязи цен на нефть и показателей доходности нефтегазового сектора

3.1 Получение и выбор данных

Для того, чтобы построить прогноз для таких показателей бюджета, как суммарные доходы, нефтегазовые и ненефтегазовые доходы, НДПИ на нефть, нужно найти ежемесячные данные по этим показателям за предыдущие периоды. Вся информация по показателям бюджета опубликована на Едином Портале Бюджетной Системы и доступна по API. Данные хранятся в OLAP-кубах и предоставляются с помощью передачи по API MDX-запроса к конкретному кубу. Для автоматизированного получения информации по API нужно отправить запрос MDX-запрос по конце URL обязательно добавить техническое название куба, по которому берутся данные [36].

MDX-запросы для каждого показателя бюджета:

1) Нефтегазовые доходы

OLAP-куб: INMR05

MDX-запрос:

WITH

SET [ColumnAxisSet] as '{[Measures].[VALUE]}'

SET [RowAxisSet] as 'CROSSJOIN(HIERARCHIZE(Intersect({[Years], Descendants([Years].[2012]), Descendants([Years].[2013]), Descendants([Years].[2014]), Descendants([Years].[2015]), Descendants([Years].[2016]), Descendants([Years].[2017]), Descendants([Years].[2018])}, {Descendants([Years], 0), Descendants([Years], 1)})), HIERARCHIZE(Intersect({Descendants([Months])}, {Descendants([Months], 0), Descendants([Months], 1)})))'

SELECT

HEAD([ColumnAxisSet], 1000) ON COLUMNS

, SUBSET(NonEmptySubset([RowAxisSet], [Measures].[VALUE]), 0, 1000) DIMENSION PROPERTIES [Default], [Tab1], [Tab2], [Tab3] ON ROWS

FROM [INMR05.DB]

WHERE

([KDOilGroups].[20-2], [Marks].[03-2])

2) Ненефтегазовые доходы

OLAP-куб: INMR05

Запрос:

WITH

SET [ColumnAxisSet] as '{[Measures].[VALUE]}'

SET [RowAxisSet] as 'CROSSJOIN(HIERARCHIZE(Intersect({[Years], Descendants([Years].[2012]), Descendants([Years].[2013]), Descendants([Years].[2014]), Descendants([Years].[2015]), Descendants([Years].[2016]), Descendants([Years].[2017]), Descendants([Years].[2018])}, {Descendants([Years], 0), Descendants([Years], 1)})), HIERARCHIZE(Intersect({Descendants([Months])}, {Descendants([Months], 0), Descendants([Months], 1)})))'

SELECT

HEAD([ColumnAxisSet], 1000) ON COLUMNS

, SUBSET(NonEmptySubset([RowAxisSet], [Measures].[VALUE]), 0, 1000) DIMENSION PROPERTIES [Default], [Tab1], [Tab2], [Tab3] ON ROWS

FROM [INMR05.DB]

WHERE

([KDOilGroups].[20-3], [Marks].[03-2])

3) Суммарные доходы бюджета

OLAP-куб: INMR03

Запрос:

WITH

MEMBER [KDGroups].[KDGroups_slicer] AS 'AGGREGATE({{[KDGroups].[05--1], [KDGroups].[05-82], [KDGroups].[05-81], [KDGroups].[05-7]}})'

SET [ColumnAxisSet] as '{[Measures].[VALUE]}'

SET [RowAxisSet] as 'CROSSJOIN(HIERARCHIZE({Descendants([Years], 0), Descendants([Years], 1)}), HIERARCHIZE({Descendants([Months], 0), Descendants([Months], 1)}))'

SELECT

HEAD([ColumnAxisSet], 1000) ON COLUMNS

, SUBSET(NonEmptySubset([RowAxisSet], [Measures].[VALUE]), 0, 1000) DIMENSION PROPERTIES [Default], [Tab1], [Tab2], [Tab3], [Tab4], [Tab5], [Tab6], [Tab7], [CLSCode], [ShortName1] ON ROWS

FROM [INMR03.DB]

WHERE

([Territories], [BGLevels].[09-1], [Marks].[03-2], [KDGroups].[KDGroups_slicer])

4) НДПИ на нефть:

OLAP-куб: INMR05

Запрос:

WITH

SET [ColumnAxisSet] as '{[Measures].[VALUE]}'

SET [RowAxisSet] as 'CROSSJOIN(HIERARCHIZE(Intersect({[Years], Descendants([Years].[2012]), Descendants([Years].[2013]), Descendants([Years].[2014]), Descendants([Years].[2015]), Descendants([Years].[2016]), Descendants([Years].[2017]), Descendants([Years].[2018])}, {Descendants([Years], 0), Descendants([Years], 1)})), HIERARCHIZE(Intersect({Descendants([Months])}, {Descendants([Months], 0), Descendants([Months], 1)})))'

SELECT

HEAD([ColumnAxisSet], 1000) ON COLUMNS, SUBSET(NonEmptySubset([RowAxisSet], [Measures].[VALUE]), 0, 1000) DIMENSION PROPERTIES [Default], [Tab1], [Tab2], [Tab3] ON ROWS

FROM [INMR05.DB]

WHERE

([KDOilGroups].[20-4], [Marks].[03-2])

Отдельно стоит заметить, что ежемесячные данные, которые приходят по запросу, являются накопительными, то есть каждый следующий месяц равен сумме за предыдущие месяцы плюс текущий месяц. Очевидно, по таким данным прогноз строить не получится, поэтому значения нужно перевести в формат ежемесячных. Для этого с февраля каждого нового года из значения месяца нужно отнимать предыдущий период.

Для цены нефти по API данные были получены в формате JSON с электронного маркетплейса данных Quandl [37], предоставляющего доступ к финансовым данным. Аналогично были получены данные о курсе рубля [38] к доллару.

Для того, чтобы потом посчитать цену на нефть и курс рубля помесячно, были взяты все значения по цене на нефть за данный месяц и считаю среднее.

3.2 Построение прогноза по методу Хольта-Винтерса для следующих показателей

В п. 1 были выведены формулы для переменных для построения модели Хольта-Винтерса. Воспользуемся ими, и рассчитаем прогноз по модели Хольта-Винтерса на 1 год, 2 года, 3 года, 4 года и 5 лет для всех показателей.

Для скорости разработки модели работать будем в MS Excel по следующему алгоритму:

1. Расчет экспоненциально сглаженного ряда

2. Определение значения тренда

3. Оценка сезонности

4. Построение прогноза

5. Определение точности прогноза

По данному алгоритму построим прогноз для каждого из показателей за 1-5 лет, после чего составим сводную таблицу точностей прогнозов и выберем, за какой период прогноз получается наиболее точным.

Рассмотрим подробнее:

1. Расчет экспоненциально-сглаженного ряда производится по формуле:

Lt=k*Yt/St-s+(1-k)*(Lt-1+Tt-1) (1)

где

· Lt - сглаженная величина на текущий период; в начале данных экспоненциально-сглаженный ряд равен первому значению ряда.

· k - коэффициент сглаживания ряда;

· St-s -- коэффициент сезонности предыдущего периода; в первом периоде равен 1.

· Yt - текущее значение ряда;

· Lt-1 - сглаженная величина за предыдущий период;

· Tt-1 - значение тренда за предыдущий период;

2. Определение значения тренда производится по формуле:

Tt=b*(Lt - Lt-1)+(1-b)*Tt-1

где

· Tt - значение тренда на текущий период;

· b - коэффициент сглаживания тренда;

· Lt - экспоненциально сглаженная величина за текущий период;

· Lt-1 - экспоненциально сглаженная величина за предыдущий период;

· Tt-1 - значение тренда за предыдущий период.

Коэффициент сглаживания тренда b задается вами вручную и находится в диапазоне от 0 до 1

3. Оценка сезонности производится по формуле:

St=q*Yt/Lt+(1-q)*St-s

где

· St -- коэффициент сезонности для текущего периода;

· q -- коэффициент сглаживания сезонности;

· Yt -- текущее значение ряда (например, объём продаж));

· Lt -- сглаженная величина за текущий период;

· St-s -- коэффициент сезонности за этот же период в предыдущем сезоне;

Нужно помнить, что для первого года коэффициент сезонности равен 1.

4. Прогноз по методу Хольта-Винтерса:

Прогноз на p периодов вперед равен:

Yt+p =(Lt +p*Tt)*St-s+p.

где

· Yt+p -- прогноз по методу Хольта-Винтерса на p периодов вперед;

· Lt - экспоненциально сглаженная величина за последний период;

· p - порядковый номер периода, на который делаем прогноз;

· Tt - тренд за последний период;

· St-s+p -- коэффициент сезонности за этот же период в последнем сезоне.

Коэффициенты k, b и q были подобраны эмпирически так, чтобы точность прогноза была максимальной отдельно для каждого показателя.

После того, как расчет по данному алгоритму был произведен для всех показателей, следует оценить, за какой период точность прогноза оказалась наиболее высокой. Для этого была построена таблица точностей по показателям.

Табл.1. Таблица точности прогнозов по годам, ед.

Параметр

/год

Цена на нефть

Суммарные нефтегазовые доходы

НДПИ на нефть

Вывозные пошлины на нефть

Вывозные пошлины на нефтепродукты

Налоги за пользование природными ресурсами

для 1 года

0,85

-0,37

0,93

0,70

0,37

0,97

для 2 лет

0,98

0,03

0,96

0,91

0,03

0,96

для 3 лет

0,99

0,98

0,98

0,92

0,98

0,99

для 4 лет

0,99

0,16

0,96

0,93

0,18

0,96

для 5 лет

0,99

0,99

0,98

0,91

0,99

0,98

Очевидно, что высокая точность прогноза была достигнута для временного промежутка в 3 года и в 5 лет, следовательно, при построении автоматизированного прогноза будем использовать такие временные промежутки.

Рассмотрим расчет прогноза для цены на нефть.

1) По формулам (1,2,3) для данных по цене на нефть за 2015-2017 год были рассчитаны экспоненциально-сглаженный ряд, значение тренда и коэффициент сезонности предыдущего периода. Иллюстрация того, как это было сделано, на рис.8. Поскольку 2015 год - первый период, то коэффициент сезонности в первый период будет равен единице. Прогноз для оценки модели в 2015-2017 годах считается равным сумме экспоненциально-сглаженного ряда и значения тренда.

2) Далее была посчитана ошибка модели и отклонение ошибки модели от прогнозной модели.

Рис.8. Расчет экспоненциально-сглаженного ряда, значения тренда и коэффициента сезонности предыдущего периода для цены на нефть. Цена на нефть указана в рублях.

3) Было проведено прогнозирование по методу Хольта-Винтерса по формуле (4), аналогично посчитана ошибка модели и отклонение ошибки модели от прогнозной модели (рис.9).

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.