Получение прогноза по ценам на серебро путем комбинирования разных моделей прогнозирования

Неопределенность и современные методы прогнозирования экономических показателей. Комбинирование различных методов прогнозирования. Задания весов с помощью компьютерных программ. Построение прогнозов с помощью линейных и нелинейных методов исследования.

Рубрика Экономика и экономическая теория
Вид дипломная работа
Язык русский
Дата добавления 02.04.2016
Размер файла 2,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Что касается спроса, то здесь по всем пунктам кроме монет и медалей произошло снижение (хоть и небольшое, если рассматривать каждый пункт в отдельности). Нагляднее всего изменения в спросе видны на рис.3.3. Применение в промышленности сократилось в основном из-за проблем в Еврозоне (хотя 10-летний тренд использования серебра в промышленности остается возрастающим); сокращение спроса на серебро, требующееся для фотографий, продолжило падающий тренд для данного показателя (что, скорее всего, указывает на изменение видов фотоаппаратов); спрос в ювелирной среде понизился из-за высоких цен и общего слабого экономического состояния в мире; спрос на серебряные изделия также снизился из-за высоких цен и структурных трендов. Thomson Reuters GFMS for The Silver Institute/ World Silver Survey 2012 A Summary - [website]. URL: http://www.silverwheaton.com/files/docs_quick%20links/World%20Silver%20Survey%202012%20Summary.pdf

Рис. 3.3. Изменения в спросе на серебро у изготовителей, Klapwijk P. World Silver Survey 2012. [Electronic resource]// Thomson Reuters GFMS: [website]. URL: http://www.gfms.co.uk/media_advisories/TR%20GFMS%20World%20Silver%20Survey%202012%20Presentation.pdf (дата посещения 12.04.2012)

Таким образом, из сводной таблицы (рис.3.1.) мы можем видеть, что добыча серебра увеличивается, несмотря на небольшое сокращение спроса. Причем стоит отметить, что самыми крупными зонами роста добычи серебра стали такие страны, как Мексика, Россия, Польша и Китай (вместе увеличили вклад в добываемое серебро на 27,3 Moz (что эквивалентно 850 тоннам). Значительное сокращение в добыче наблюдалось в Австралии, Перу, США и Турции (составило 632 тонны).

Из всего вышеперечисленного можно сделать вывод, что в дальнейшем спрос и предложение серебра будут немного увеличиваться по мере выхода из слабой экономической ситуации и укрепления уверенности и доверия инвесторов к данному драгоценному металлу. В то же время по отдельным составляющим предложения и спроса продолжатся понижающиеся тренды (как, например, будет понижаться спрос на серебро для нужд фотоиндустрии и столового серебра и предложение, связанное с правительственными продажами и хеджированием).

3.2 Построение прогнозов с помощью линейных методов

Сначала было решено построить прогнозы по полученным данным с помощью линейных методов (CEWMA и метод Хольта). Для начала был рассмотрен сам ряд данных. Ниже приведен график цен на серебряные слитки, начиная с 03.01.12 по 28.03.13 гг. (см. рис.3.4., также сами данные доступны в приложении 1).

Рис. 3.4. Цена за 1 унцию серебра в USD

Из графика видно, что во второй половине данных наблюдается некая сезонность, поэтому было решено проверить эту часть ряда на данный факт, для чего была построена коррелограмма 1-ой разности ряда (см. приложение 2). Из приложения 2 видно, что коррелограмма улавливает некую техническую сезонность в 21-22 шага. Подобная сезонность могла возникнуть по ряду причин. Во-первых, цены на серебро очень сильно зависят от цен на золото (корреляция составляет порядка 0,8). В свою очередь сезонность золота объясняется сезонами праздников в Азии и Рождеством на Западе, а также переводом излишка наличности в данный драгоценный металл в конце финансового года. Трейдеры обычно склонны покупать серебро, когда они видят, что золото дорожает. Во-вторых, цены на серебро также сильно зависят от настроения инвесторов (было замечено, что период, начиная с апреля и до сентября, является худшим временем в году для белого металла). Однако низкие цены, образовавшиеся в конце лета, дают толчок к покупке серебра, поэтому в сентябре происходит резкий скачок цен на данный металл. В сентябре цены на золото идут вверх, ведя за собой и серебро. В октябре (как и в марте) происходит небольшое падение цен на золото (и серебро опять повторяет данную тенденцию), затем золото начинает расти в ноябре (серебро продолжает все повторять за золотом), в декабре же поведение этих двух металлов начинает расходиться - золото идет вверх, а цена на серебро корректируются. Однако стоит отметить, что у серебра и золота характер сезонности хоть и похож, он не является одинаковым. Хамильтон А. Сезонные колебания цена на серебро [Электронный ресурс]// Goldenfront.ru: [сайт]. URL: http://goldenfront.ru/articles/view/sezonnye-kolebaniya-ceny-na-serebro (дата обращения 17.05.2012)

Стоит отметить, что подобная сезонность не является постоянной, и скорее всего к началу апреля поменяет свой характер, будучи подвержена влиянию цен на золото.

3.2.1 Метод CEWMA

Исходя из того факта, что начиная с сентября в ряде данных цен на серебро наблюдается сезонность, было решено строить модель по данным, начиная с 03.09.12 по 28.02.13, в то время как данные за март и апрель будет предназначены для сравнения прогнозных значений с реальными данными и оценки точности модели. Мы отказались от идеи использовать все данные цен на серебро по причине сложности учета тенденций в ряде данных.

С помощью функции «поиск решения» в MS EXCEL были найдены коэффициенты, минимизирующие сумму квадратов остатков. Для подобной модели коэффициенты получились следующими: и . Общий вид модели выглядит следующим образом: При таких значениях параметров получились прогнозные значения, изображенные на рис. 3.5.

Рис.3.5. CEWMA с сезонностью

Как видно из данного рисунка, при построении модель не очень хорошо описывала ряд, о чем также свидетельствуют следующие посчитанные коэффициенты: MAPE1=2,9% и MAPE2=2,16%.

MAPE является средней процентной ошибкой и показывает точность метода прогнозирования. В данной работе мы посчитали данный коэффициент двумя способами:

1. , (3.1)

2.

где:

- действительные значения ряда,

- прогнозные.

Чем меньше данный показатель, тем лучше. В нашем случае средняя процентная ошибка не превысила 3%. Показатель средний, но он не помогает нам судить о том, насколько хорошо ряд в будущем будет соответствовать действительности - он лишь помогает судить об аппроксимационных свойствах модели.

Что касается прогнозных значений, то для расчета их точности было решено использовать показатель sMAPE (симметричный MAPE). Он был рассчитан уже не для всего ряда, а лишь для ретропрогноза по формуле:

(3.2)

Данный показатель оказался равен 3,44 %. Само по себе это значение тоже среднее, но указывает на расхождение прогнозных и реальных данных. Несмотря на то, что модель уловила сезонность, она была не в состоянии учесть внешнего шока, изменившего характер этой сезонности. Отсюда и вытекает такое расхождение предсказанных и действительных значений. Если бы в реальных данных не произошло изменение характера этой самой сезонности, вполне вероятно, что модель дала бы очень хорошие прогнозные значения.

Кроме того, чтобы понять, правильно ли выбрана модель, стоит посмотреть на распределение остатков (см. табл. 3.1.):

Таблица 3.1. Тесты на нормальное распределение остатков CEWMA

Method

Value

Adj. Value

Probability

Lilliefors (D)

0.082025

NA

0.0369

Cramer-von Mises (W2)

0.086492

0.086835

0.1691

Watson (U2)

0.083516

0.083848

0.1562

Anderson-Darling (A2)

0.512383

0.515506

0.1911

По результатам теста мы не можем отклонить гипотезу о нормальности распределения остатков на 5% уровне значимости (во всех случаях кроме Lilliefors), поэтому модель выбрана верно.

3.2.2 Метод Хольта-Уинтерса

Поскольку раньше при построении модели CEWMA было решено, что ряд содержит сезонность, то вместо модели Хольта, лучше строить ее модификацию, а именно метод Хольта-Уинтерса, которая в общем виде описывается следующей системой уравнений:

(3.3)

,

где s - шаг сезонности в модели, , и - параметры модели, - постоянные сглаживания. В данном случае при оценке модели в MS Excel при помощи все того же «Поиска решений» были получены следующие значения: , и . Таким образом, модель выглядит так:

Прогнозные значения и их соотношение с действительностью лучше всего смотреть на графике (см. рис.3.6.)

Рис.3.6. Метод Хольта-Уинтерса

Как видно из данного графика, модель ведет себя схожим образом с методом CEWMA, но поскольку она предназначена для прогнозирования данных с сезонностью, она не учла небольшое изменение этой самой сезонности. Однако, если посмотреть на коэффициенты MAPE для данного метода, то они получились достаточно хорошими (даже лучше, чем в случае использования метода CEWMA), что говорит о неплохих аппроксимационных свойствах модели: MAPE1=1,91 % и MAPE2=1,47%

Что касается соотношения реальных и прогнозных значений, то здесь наблюдается некое их расхождение (если смотреть на график). Кроме того посчитанный коэффициент sMAPE выдает средний результат (хуже, чем при построении модели CEWMA), а именно 4,23%.

Теперь следует посмотреть на распределение остатков модели (см. табл. 3.2.):

Таблица 3.2. Тесты на нормальное распределение остатков модели Хольта-Уинтерса

Method

Value

Adj. Value

Probability

Lilliefors (D)

0.084040

NA

> 0.1

Cramer-von Mises (W2)

0.082685

0.083171

0.1885

Watson (U2)

0.082200

0.082684

0.1622

Anderson-Darling (A2)

0.541873

0.546823

0.1596

Результаты тестов на нормальное распределение указывают, на тот факт, что мы не можем отклонить гипотезу о нормальности распределения остатков на 5% уровне значимости, а значит модель выбрана верно.

В первом случае CEWMA продемонстрировала средние аппроксимационные свойства, в то время как модель Хольта-Уинтерса хорошие. Кроме того, обе модели в той или иной степени улавливали тенденции изменения ряда данных. Судя по среднему значению коэффициента sMAPE для обеих моделей, нельзя сказать, что они выдают очень хорошие прогнозные значения. Это может объясняться, во-первых, тем, что методы не предназначены для прогнозирования волатильных данных (используется для линейных значений), а во-вторых, они дают хорошие результаты на небольшом горизонте прогнозирования.

В общем и целом, мы и не ожидали, что два вышеперечисленных метода дадут хорошие результаты, так как эти методы используются для линейных данных без высокой волатильности. Однако, они были построены для того, чтобы в дальнейшем учесть их при комбинировании, поскольку выше упоминалось, что рекомендуется использовать несколько различных методов прогнозирования для достижения лучших результатов при комбинировании.

3.2.3 Метод SARIMA

Одним из признаков того, что можно использовать методы, содержащие в себе «долгую память», является коррелограмма ряда, убывающая гиперболически. Однако, если посмотреть на коррелограмму ряда данных цен на серебро, то можно заметить, что она убывает скорее экспоненциально (см. приложение 3). Исходя из этого и из того, что в ряде обнаружилась небольшая сезонность, то вместо методов с «долгой памятью», было решено обратиться к классической модели SARIMA.

Для нашего случая s (лаг сезонности) брался, исходя из анализа коррелограммы, и составил 22 шага. Кроме того, ряд является нестационарным, поскольку согласно тесту на наличие единичного корня нулевая гипотеза о наличии единичного корня (то есть о том, что ряд является нестационарным) не отклоняется на 5 % уровне значимости.

Из коррелограмы самого ряда данных (см. приложение 2) видно, что мы имеем дело с процессом ARMA(1,0). Коррелограмма и тест на единичный корень по первой разности указывают на то, что вместо уровня ряда надо использовать первые разности. Коррелограмма по разности показывает, что существует некая сезонность в размере 22 шага. Исходя из всего вышеперечисленного, мы будем строить модель SARIMA вида: (1,1,0)(1,0,0)22 (результат ее оценки изображен в табл. 3.5.; для оценивания использовалась программа R):

Таблица 3.5. Результаты оценки SARIMA

AR1

SAR1

Коэффициенты

-0,1789

-0,2870

Стандартные ошибки

0,0894

0,0975

Общий вид:

После того, как мы оценили модель, необходимо построить прогнозные значения (см. рис.3.7.):

Рис.3.7. Прогноз цен на серебро по модели SARIMA

Из графика видно, что данный метод хорошо учитывает сезонность. Аппроксимация ряда почти идеальная, если посмотреть на коэффициенты MAPE, посчитанные для этой модели, то они также выдают очень хорошие значения: MAPE1=1,44 % и MAPE2=1,09 %, то есть процентная ошибка при построении самой модели весьма мала. Что касается прогнозных значений, то коэффициент sMAPE составил 1,4 %, что тоже хорошо. Кроме того из графика видно, что в реальных данных произошел какой-то внешний шок, который изменил поведение сезонности, и соответственно модель не смогла его уловить.

Теперь стоит посмотреть на остатки модели (см. табл. 3.6.):

Таблица 3.6. Тесты на нормальное распределение остатков SARIMA

Method

Value

Adj. Value

Probability

Lilliefors (D)

0.076185

NA

0.0697

Cramer-von Mises (W2)

0.099289

0.099683

0.1136

Watson (U2)

0.094130

0.094504

0.1101

Anderson-Darling (A2)

0.594490

0.598113

0.1182

Результаты тестов на нормальное распределение указывают на тот факт, что мы не можем отклонить гипотезу о нормальности распределения остатков на 5% уровне значимости, а значит модель выбрана верно.

3.3 Построение прогнозов с помощью нелинейных методов прогнозирования

3.3.1 Метод GARCH

Далее решено было посмотреть насколько изменится ситуация с прогнозными значениями, если вместо линейных методов прогнозирования использовать нелинейные. Для начала рассмотрим метод, основанный на наличии эффекта ARCH (т.е. рассмотрим метод GARCH). Прежде чем переходить к собственно построению модели, надо убедиться, что данные, с которыми мы имеем дело, являются стационарными. Для наших данных по ценам за унцию серебра тест на наличие единичного корня, построенный по уровню ряда, показал, что ряд является нестационарным на 5% уровне значимости (см. табл. 3.3.), следовательно, для дальнейшей работы с ним, его надо привести к стационарному виду путем взятия разностей (значение теста на наличие единичного корня для разностей приведено в табл. 3.4.). Из рис.12. видно, что если рассматривать не уровень ряда, а его первую разность, то ряд становится стационарным, поэтому далее будет рассматриваться именно эта переменная.

Далее если взглянуть на остатки ряда 1-ой разности (см. рис.3.8.), то можно заметить, что на протяжении всего рассматриваемого периода в ряде данных присутствует стабильная волатильность.

Рис.3.8. Остатки 1-ой разницы

Кроме того стоит проверить, есть ли в модели, где 1-ая разность цены на серебро зависит от некой константы и содержит в себе процесс AR(1), эффект ARCH (то есть присутствует ли в такой модели гетероскедастичность). Для этого стоит провести тест на гетероскедастичность остатков для ARCH. В результате теста получился следующий аутпут

В данном тесте нулевая гипотеза заключалась в том, что в модели отсутствует ARCH эффект, и эта гипотеза в данном случае не отвергается, поскольку значения вероятностей превышают 5%, а это означает, что не имеет смысла использовать модели из семейства ARCH (в том числе и GARCH), поскольку в остатках модели отсутствует сама гетероскедастичность.

3.3.2 Метод ANN

Следующим методом, который было решено использовать для прогнозирования цен на серебро, стали искусственные нейронные сети. С помощью пакета Matlab было произведено моделирование, а вследствие и прогнозирование ANN, основанное на методе обратного распределения ошибки. Было решено рассмотреть два вида сети: регрессионную и авторегрессионную. Ранее упоминалось, что между золотом и серебром существует сильная корреляция. Кроме того, выяснилось, что основным драйвером цен на серебро являются цены на золото, то есть цены на серебро зачастую повторяют тенденции, происходящие с золотом. Хамильтон А. Сезонные колебания цена на серебро [Электронный ресурс]// Goldenfront.ru: [сайт]. URL: http://goldenfront.ru/articles/view/sezonnye-kolebaniya-ceny-na-serebro (дата обращения 17.05.2012) Поэтому было решено рассмотреть регрессию цен серебра от цен золота, для выявления связей. Нейронные сети позволят не только построить зависимость цен серебра от золота, как это сделала бы обычная регрессия, но они также помогут учесть другие зависимости и тренды, не различимые в обычных условиях человеком или другими программами. Авторегрессионная же сеть будет использоваться нами при комбинировании.

Сначала рассмотрим поведение регрессионной сети. При моделировании использовался алгоритм создания нелинейной авторегрессионной сети с экзогенными внешними входящими данными (NARX), чья схема в общем виде выглядит как на рис. 3.9. Кроме того код к созданию подобной сети в программе MATLAB доступен в приложении 6.

Рис.3.9. Схема нейронной сети NARX

В модели использовался один ряд входных данных, а именно данные по золотому фиксингу (нормированные от 0 до 1) (оригинальные данные цен на золото доступны в приложении 5). В качестве исходных данных были взяты цены по серебряному фиксингу, также пронормированные к 1. После анализа коррелограммы цен на золото было принято предположение о том, что лаг равняется 9 (см. приложение 4).

Модель содержала 10 скрытых слоев (для повышения точности). Обучение проводилось по 75% данных, оценка по 15% и тестирование по 15% данных. В результате обучение и тренировка сети потребовали 8 итераций, после чего был достигнут минимальный градиент (аутпут оценки сети приведен на рис.3.10).

Рис.3.10. Результат тренировки сети NARX

После моделирования сети и для дальнейшей цели прогнозирования, был построен прогноз цен на золото по модели SARIMA(0,1,0)(1,0,0)9, поскольку ряд также содержал некую сезонность. В результате оценки уравнения модели (см. табл.3.8.) получились прогнозные значения, изображенные на рис.3.12.

Таблица 3.8. Результат оценки модели SARIMA(0,1,0)(1,0,0)9

Dependent Variable: D(USD)

Method: Least Squares

Included observations: 116 after adjustments

Convergence achieved after 2 iterations

Variable

Coefficient

Std. Error

t-Statistic

Prob.

SAR(9)

0.239215

0.086613

2.761876

0.0067

R-squared

0.047526

Mean dependent var

-1.612069

Adjusted R-squared

0.047526

S.D. dependent var

12.94148

S.E. of regression

12.63021

Akaike info criterion

7.918643

Sum squared resid

18345.05

Schwarz criterion

7.942381

Log likelihood

-458.2813

Hannan-Quinn criter.

7.928279

Durbin-Watson stat

2.110833

Inverted AR Roots

.85

.65+.55i

.65-.55i

.15+.84i

.15-.84i

-.43+.74i

-.43-.74i

-.80-.29i

-.80+.29i

Рис.3.12. Прогноз цен на золото по модели SARIMA

Полученные прогнозные значения цен на золото далее использовались в качестве новых входных данных для того, чтобы получить прогнозные значения цен на серебро. Поскольку сеть уже была настроена, то для получения прогнозов по методу ANN, требовалось добавить прогноз по золоту в сеть. В итоге получились следующие значения (см. рис.3.13.):

Рис.3.13. Прогноз по методу ANN (регрессионная модель)

Из приведенного рис.3.13. видно, что прогнозные значения совсем не повторяют реальные данные и не похожи на прогноз, полученный по золоту с помощью метода SARIMA. Зато в данном методе удалось учесть сезонность золота, которая отличается немного от сезонности серебра, поэтому и прогнозные значения цен на серебро скорее учитывают сезонность цен на золото. Однако данный метод обладает не самым лучшим показателем точности прогноза, sMAPE=2,78%. Что касается точности аппроксимации модели, то здесь получились следующие показатели: MAPE1=1,46% и MAPE2=1,18%, что приблизительно равно показателям точности SARIMA и превышает показатели точности линейных методов прогнозирования. Построение данного метода позволяет нам судить о том, что все-таки цены на серебро не полностью зависят от цен на золото, и если строить прогноз, основанный на подобной регрессии, то его результат, скорее всего, окажется некорректным.

По результатам тестов (см. табл. 3.9.), можно сделать вывод о принятии нулевой гипотезы о нормальности распределения остатков на 5 % уровне значимости, следовательно, модель выбрана верно.

Таблица 3.9. Тесты на нормальное распределение остатков модели NARX для регрессии цен серебра в зависимости от цены золота

Method

Value

Adj. Value

Probability

Lilliefors (D)

0.053025

NA

> 0.1

Cramer-von Mises (W2)

0.041196

0.041372

0.6565

Watson (U2)

0.040806

0.040981

0.6077

Anderson-Darling (A2)

0.300009

0.301982

0.5770

Далее необходимо смоделировать сеть и построить прогноз для авторегрессионной модели, в которой цены на серебро зависят не от внешних данных, а от прошлых значений. Для этого необходимо было построить нелинейную авторегрессионную сеть, чей общий вид изображен на рис. 3.14. (код к созданию сети в программе MATLAB см. в приложении 7):

Рис. 3.14. Нейронная сеть NAR

В данном случае в модели использовался только один вид данных, а именно цены на серебро. Как и в прошлом случае, модель содержала 10 скрытых слоев, а обучение проводилось по 75% данных, оценка по 15% и тестирование по 15% данных. Исходя из коррелограммы цен на серебро (см. приложение 2), был выбран лаг 22. В итоге обучение сети заняло 10 итераций (результат оценки сети приведен на рис. 3.15.).

Рис.3.15. Результат обучения сети NAR

Поскольку в данном случае сеть содержала лишь один ряд данных, то для получения прогноза на следующие 25 значений, нам было необходимо закрыть эту сеть и в качестве новых исходных данных нужно было подавать количество последних изначальных данных, равное числу лагов плюс неизвестные 25 значений, которые предстояло симулировать. В результате получились следующие прогнозные значения (см. рис. 3.17.):

Рис.3.17. Прогноз по ANN (NAR)

Данная модель обладает отличной аппроксимацией: коэффициенты MAPE1 и MAPE2 соответственно равняются 1,39% и 0,98%. Что касается показателя точности самого прогноза, то sMAPE в данном случае составил 2%, что является вторым лучшим результатом среди всех уже рассмотренных методов. Из рис. 3.17 видно, что прогнозные значения учитывают сезонность, но естественно модель не смогла предугадать изменение этой сезонности (такие события относятся к «черным лебедям»).

Что касается остатков модели, то они распределены следующим образом (см. табл. 3.10.):

Таблица 3.10. Тесты на нормальное распределение остатков модели NAR

Method

Value

Adj. Value

Probability

Lilliefors (D)

0.089546

NA

0.0391

Cramer-von Mises (W2)

0.209070

0.210075

0.0040

Watson (U2)

0.174189

0.175026

0.0069

Anderson-Darling (A2)

1.397346

1.407714

0.0012

Из табл. 3.10. видно, что нулевая гипотеза о нормальности остатков отклоняется на 5 % уровне значимости, а в самих данных присутствует асимметрия. Условие о нормальности остатков является желательным для выбора правильной модели прогнозирования (а необязательным), но поскольку распределение все-таки близко к нормальному, мы будем считать, что данную модель также можно использовать для наших дальнейших целей комбинирования.

Подытоживая результаты данного раздела 3-ей главы диплома, составим таблицу, в которой бы отражались показатели точности аппроксимации и прогнозных значений моделей (см. табл. 3.11.):

Таблица 3.11. Основные показатели точностей моделей

CEWMA

(сезонная)

Хольт-Уинтерс

ANN (NAR)

SARIMA

MAPE1

2,9%

1,9%

1,39%

1,44%

MAPE2

2,16%

1,5%

0,98%

1,09%

sMAPE

3,04 %

4,2%

2,00 %

1,4 %

Таким образом, лучшей аппроксимацией обладает метод, основанный на нейронных сетях, в то время как самая высокая точность прогноза замечена у метода SARIMA. Кроме того, достаточно большим показателем точности прогноза обладает и метод, основанный на использовании искусственных нейронных сетей.

3.4 Комбинирование прогнозов

При комбинировании прогнозов мы решили использовать наиболее простой метод, а именно критерий минимизации суммы отклонений. Мы решили назначать веса по двум способам минимизации квадратов остатков.

В результате минимизации RSS по аппроксимации получились следующие значения весов (подобранные с помощью «Поиска решений»): .

Как видно, наибольшие веса получили те модели, коэффициент MAPE у которых был самым низким (то есть самым лучшим). После получения подобных значений весов, прогнозные значения задавались по формуле:

(3.5)

где: ,

- прогноз по i-ой модели.

В итоге получились следующие прогнозные значения (см. рис. 3.18.):

Рис.3.18. Комбинированный прогноз (критерий: минимизация RSS по аппроксимированному ряду)

Для сравнения та же процедура назначения весов была осуществлена по критерию RSS, посчитанному уже для прогнозных значений. В этом случае веса равнялись следующим значениям: ; ; ; .

В данном случае, наибольшие веса получили те модели, которые обладали лучшим коэффициентом sMAPE. Прогнозные значения задавались по формуле (2.11.). В результате получился следующий прогноз (см. рис. 3.19.):

Рис.3.19. Комбинированный прогноз (критерий: минимизация RSS по прогнозным значениям)

Как и во всех предыдущих случаях, мы рассчитали коэффициенты точности аппроксимации и прогнозов (см. табл.3.12.):

Таблица 3.12. Показатели точности комбинированных моделей

Критерий: rss по аппроксимации

Критерий: rss по прогнозам

MAPE1

1,25%

1,31%

MAPE2

0,98%

1,01%

sMAPE

1,87%

1,47%

Как мы и ожидали, коэффициенты MAPE оказались лучше для комбинированной модели, построенной на основе минимизации RSS, полученного по аппроксимации, в то время как показатель sMAPE - лучше для комбинированной модели, где RSS считался для прогнозных значений.

Прежде чем выбирать какой-то определенный метод комбинирования стоит взглянуть на распределение остатков обоих методов. Для первого метода комбинирования распределение остатков выглядит следующим образом (см. табл.3.13):

Таблица 3.13. Тесты на нормальное распределение остатков первого метода комбинирования

Method

Value

Adj. Value

Probability

Lilliefors (D)

0.087685

NA

> 0.1

Cramer-von Mises (W2)

0.161878

0.162830

0.0162

Watson (U2)

0.125283

0.126020

0.0362

Anderson-Darling (A2)

1.082681

1.092572

0.0073

Как видно из табл. 3.13., по одному из 4 тестов на нормальность распределения, нулевая гипотеза принимается на % 5 уровне значимости (по Lilliefors), однако остальные тесты отклоняют гипотезу о нормальности распределения на данном уровне значимости.

Что касается распределения остатков второго метода комбинирования, то оно получилось следующим (см. табл. 3.14.):

Таблица 3.14. Тесты на нормальное распределение остатков второго метода

Method

Value

Adj. Value

Probability

Lilliefors (D)

0.087685

NA

0.0891

Cramer-von Mises (W2)

0.161878

0.162830

0.0244

Watson (U2)

0.125283

0.126020

0.0549

Anderson-Darling (A2)

1.082681

1.092572

0.0160

В данном случае гипотеза о нормальности распределения остатков принимается на 5 % уровне значимости по двум тестам (Lilliefors и Watson), в то время как по другим тестам она отклоняется.

Теперь для того, чтобы выбрать, какой из двух моделей отдать предпочтение нужно определиться с целями дальнейшего прогнозирования. Если мы больше заинтересованы в способности комбинированного метода аппроксимировать исходный ряд данных, то стоит выбрать первый способ комбинирования. Однако, если нас интересуют в первую очередь прогнозные значения на средний горизонт прогнозирования, то предпочтение следует отдать комбинированному методу, основанному на ретропрогнозе.

Поскольку нас скорее интересует второе, то мы в качестве весов в модели возьмем следующие: , , , .

Поэтому для получения комбинированного прогноза на будущее мы построим всего два метода: SARIMA и ANN.

В полученную ранее нейронную сеть NAR необходимо добавить новые данные (то есть, начиная с марта и заканчивая серединой апреля), перетренировать сеть и сделать прогноз на следующие 24 шага. В результате перетренировка сети заняла 9 итераций (результат перетренировки изображен на рис. 3.20.):

Рис. 3.20. Результат перетренировки сети

Таким образом, после перетренировки сети из-за добавления новых данных, получились прогнозные значения, изображенные на рис. 3.21.

Рис.3.21. Прогноз по ANN (обновленный)

Мы не можем судить о точности прогноза, поскольку на данный момент не обладаем данными, с которыми его можно сравнить. Однако, можно заметить, что аппроксимация у данного метода очень хорошая, посчитанные коэффициенты MAPE1 и MAPE2 соответственно равны 1,82% и 1,43%, что указывает на не сильную процентную ошибку.

Из рис. 3.21. видно, что изначально прогнозируется дальнейшее снижение цен на серебро, но начиная с 23.04.13 цены на серебро начнут согласно нашему прогнозу расти.

Теперь необходимо построить прогнозные значения по второму методу: по SARIMA(1,1,0)(1,0,0)22. После добавления новых данных и переоценки получились следующие прогнозные значения (см. рис. 3.22.):

Рис.3.22. Прогноз по SARIMA (обновленный)

Как видно из данного рисунка, модель обладает более высокой аппроксимацией, чем метод ANN, о чем также свидетельствуют следующие коэффициенты:

sMAPE

0,57%

mape1

1,49%

mape2

1,14%

Однако если взглянуть на прогнозные значения, то они остаются достаточно стабильными на протяжении всего прогнозируемого периода, указывая лишь на незначительные изменения цен на серебро в будущем.

Перед тем, как переходить к финальному построению прогноза, стоит взглянуть на распределение остатков по обоим методам. По методу SARIMA остатки оказались распределены следующим образом (см. табл. 3.15.):

Таблица 3.15. Тесты на нормальное распределение остатков обновленной SARIMA

Method

Value

Adj. Value

Probability

Lilliefors (D)

0.075258

NA

0.0360

Cramer-von Mises (W2)

0.125476

0.125891

0.0500

Watson (U2)

0.117213

0.117601

0.0486

Anderson-Darling (A2)

0.735274

0.738999

0.0542

Исходя из данных, отображенных в таблице 3.15. два теста (Anderson-Darling и Cramer-von Mises) не отклоняют нулевую гипотезу о нормальности распределения остатков на 5 % уровне значимости, поэтому мы можем сделать вывод о близости распределения остатков к нормальному.

Что касается остатков по ANN, то получились следующие результаты(см. табл.3.16.):

Таблица 3.16. Тесты на нормальное распределение остатков по ANN(обновленной)

Method

Value

Adj. Value

Probability

Lilliefors (D)

0.068146

NA

> 0.1

Cramer-von Mises (W2)

0.090345

0.090695

0.1507

Watson (U2)

0.075251

0.075543

0.2046

Anderson-Darling (A2)

0.546370

0.549621

0.1571

И опять, результаты тестов на нормальное распределение и вид гистограммы распределения ошибок указывает на принятие гипотезы о нормальности распределения на 5% уровне значимости и на правильность выбора и построения модели.

После получения прогнозов по вышеперечисленным двум методам и с использованием заранее заданных весов, мы построили комбинированную модель, состоящую из двух методов SARIMA и ANN и получили следующие результаты (см. рис. 3.23.):

Рис.3.23. Комбинированный прогноз на 24 шага вперед

Аппроксимация подобного метода очень хорошая: коэффициенты точности sMAPE, MAPE1 и MAPE2 соответственно равны 0,53%; 1,39% и 1,06%, что превышает аналогичные показатели, рассчитанные для каждого метода в отдельности. Что касается прогнозных значений, то поскольку прогнозам, полученным с помощью SARIMA, при комбинировании придавались большие веса, то и итоговый прогноз похож на прогноз по данному методу. Однако в то же время он учитывает и предсказанные значения по ANN, поэтому не является настолько же стабильным и не меняющимся относительно последнего реального значения, как прогноз по SARIMA. Исходя из проведенного нами ранее анализа, улучшенных коэффициентов точности аппроксимации модели и прогноза, учитывающего в себе два хорошо зарекомендовавших себя метода, мы делаем вывод о том, что полученные предсказанные значения будут несколько более точными, чем если бы мы рассматривали каждый прогноз по отдельности.

Таким образом, в результате комбинированного прогноза, получилось, что на следующие 24 рабочих дня цены на серебро изначально будут немного колебаться относительно последнего полученного значения, а затем будет наблюдаться снова небольшой рост. Данный прогноз будет возможен при условии сохранения предыдущих тенденций и отсутствия каких-то сильных внешних шоков. Исходя из проанализированной нами сезонности серебра, можно предположить, что цены если и будут увеличиваться, то незначительно (как и показал наш прогноз), а понижающийся тренд с небольшими колебаниями, скорее всего, сохранится до сентября. Также можно предположить, что в ценах на серебро произойдет большее общее снижение, чем получившийся у нас прогноз, который по большей части является относительно стабильным первые несколько значений.

ЗАКЛЮЧЕНИЕ

В данной работе рассматривался алгоритм комбинирования прогнозов, полученных с помощью разных моделей. В ходе проведенного анализа выяснилось, что для получения лучшего прогноза стоит комбинировать методы, основанные на различных предпосылках, и поэтому помимо нелинейных методов прогнозирования, таких как ARCH и ANN, в своей работе мы также рассмотрели и методы, предназначенные для прогнозирования линейных рядов данных, как то CEWMA, метод Хольта-Уинтерса и SARIMA. Подобный анализ был проведен из-за того, что изначально мы предположили, что если при комбинировании учесть эти методы, то они могут перекрыть возможные недостатки нелинейных методов прогнозирования, и наоборот.

При анализе цен на серебро, являющихся достаточно волатильными, было замечено, что одни методы вели себя ожидаемо лучше других. Так, например, лучшая аппроксимация ряда данных была замечена при использовании искусственных нейронных сетей, распространенного метода прогнозирования волатильных данных. Для того, чтобы определить, какой из методов покажет наилучшую способность к прогнозированию, была применена процедура ретропрогноза, то есть ряд данных делился на 2 части, по первой строилась модель и аппроксимировался ряд, а по второй рассчитывалась процентная ошибка прогнозных и реальных значений. В ходе подобной процедуры мы пришли к достаточно неожиданным результатам, поскольку лучшую способность прогнозирования показал метод SARIMA, не предназначенный для прогнозирования волатильных данных. Однако стоит отметить, что нейронные сети также показали небольшую процентную ошибку, что было ожидаемо. Что касается прочих методов прогнозирования, то CEWMA и метод Хольта-Уинтерса продемонстрировали не очень хорошие результаты относительно прогнозирования из-за изменения типа сезонности (здесь стоит отметить, что при сохранении того типа тенденции, который наблюдался изначально, модель CEWMA дала бы очень хороший прогнозный результат).

При комбинировании использовалась идея минимизации квадрата суммы отклонений (RSS) для назначения весов прогнозам, полученным с помощью CEWMA, Хольта-Уинтерса, SARIMA и ANN. Также сравнивалось два способа минимизации RSS по ряду данных и по ретропрогнозу. В ходе подбора параметров с помощью «Поиска решений» в MS Excel, у нас получилось два набора весов, отвечающих различным способам минимизации RSS. В первом случае, веса назначались следующим образом:

. Во втором случае веса равнялись:

В обоих случаях наибольшие веса получали методы ANN и SARIMA, поскольку обладали лучшей аппроксимаций и лучшей предсказательной способностью, чем другие рассматриваемые методы.

Поскольку нас интересовала больше способность моделей предсказывать будущие значения, а не аппроксимировать ряд данных, то для комбинирования был выбран второй набор весов. В итоге мы получили прогноз цен на серебро, начиная с 09.04.13 по 10.05.13. Данный прогноз показывал, что первые несколько значений цен на серебро будут колебаться вокруг последнего наблюдаемого значения, а затем произойдет небольшое увеличение цены серебра. Данный прогноз может выполниться при условии сохранения характера сезонности, типа тенденций и отсутствия значительных внешних шоков, не поддающихся прогнозированию. В общем и целом, прогноз, полученный с помощью комбинирования, показал лучшие коэффициенты аппроксимации, чем при оценке каждого метода прогнозирования по отдельности (относительно точности прогнозов судить мы не можем из-за отсутствия сравниваемых данных). Таким образом, подтвердилась изначально выдвинутая нами гипотеза об улучшении прогнозных и аппроксимационных свойств моделей при их объединении.

В данной работе были рассмотрены не все проблемы, которые возникают при прогнозировании подобным методом, поэтому было бы целесообразно в дальнейшем продолжить рассмотрение использования техники комбинирования в прогнозировании. Одним из направлений для дальнейших исследований может быть применение большего числа моделей разного вида для получения различных прогнозов ряда. Кроме того, в данной работе был рассмотрен метод комбинирования точечных прогнозов, а, например, задача комбинирования прогнозных интервалов выходит за рамки работы и требует самостоятельного серьёзного исследования.

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

1. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Модели Бокса-Дженкинса (ARIMA)// Эконометрика. Начальный курс: учебник. - 7-е изд., испр. - М.:Дело, 2005. - C.253-275.

2. Светуньков И.С. Самообучающаяся модель краткосрочного прогнозирования социально-экономической динамики// Модели оценки, анализа и прогнозирования социально-экономических систем. Харьков: Харьков ИД «ИНЖЕК». - 2010. - С. 11-32.

3. Ханк Д.Э., Уичерн Д.У., Райтс А. Дж. Метод Бокса-Дженкинса (ARIMA)// Бизнес-прогнозирование, 7-е издание.: Пер. с англ. - М.: Издательский дом «Вильямс». - 2003. - C.453-544.

4. Armstrong J.S. Combining forecasts// Principles of Forecasting: a handbook for researchers and practitioners, Kluwer Academic Publishing. - 2001. - P.417-439.

5. Engle R. GARCH 101: The use of ARCH/GARCH models in Applied Econometrics//Journal of Economic Perspectives. - 2001. - Vol.15. - P. 157-186.

6. Gardner S.E, Jr Exponential Smoothing: The state of the Art// Journal of Forecasting. - 1985. - Vol.4. - P.1-28.

7. Gooijer J., Hyndman R. 25 years of time series forecasting// International Journal of Forecasting. - 2006. - Vol. 22. - P. 443-473.

8. Hill T., Marquez L., O'Connor M., Remus W. Artificial neural network models for forecasting and decision making// International Journal of Forecasting. - 1994. - Vol.10. - P.5-15.

9. Makridakis S., Hogarth R., Gaba A. Forecasting and uncertainty in the economic and business world//International Journal of forecasting. - 2009. - Vol. 25. - P. 794-812.

10. Parzen E. ARARMA Models for Time Series Analysis and Forecasting//Journal of Forecasting. - 1982. - Vol.1. - P.67-82.

11. Yang Y. Combining Forecasting Procedures: Some Theoretical Results// Department of Statistics and Statistical Laboratory Iowa State University. - 2000. - P.1-20.

12. Zou H., Yang Y. Combining time series models for forecasting// International Journal of Forecasting. - 2004. - Vol.20. -P.69-84.

13. Дворкин В.И., Болдырев И.В. Понятие неопределенности и его использование в лабораторной практике [Электронный ресурс]// Неопределенность: [сайт]. URL : qcontrol.ru/documents/uncertainty_dv_bold_.doc (дата обращения: 17.05.2012)

14. Хамильтон А. Сезонные колебания цены на серебро [Электронный ресурс]// Goldenfront.ru: [сайт]. URL: http://goldenfront.ru/articles/view/sezonnye-kolebaniya-ceny-na-serebro (дата обращения 17.05.2012)

15. Шапкин А.С. Система неопределенностей [Электронный ресурc]// Экономические и финансовые риски: оценка, управление, портфель инвестиций: [сайт]. URL: http://yourforexschool.com/book/304-yekonomicheskie-i-finansovye-riski-ocenka-upravlenie-portfel-investicij/7-113-sistema-neopredelennostej.html (дата обращения: 17.05.2012)

16. Aladag C., Egrioglu E., Kadilar C. Improvement in Forecasting Accuracy Using the Hybrid Model of ARFIMA and Feed Forward Neural Network [Electronic resource] // Scientific and Academic Publishing: [website]. URL: http://article.sapub.org/10.5923.j.ajis.20120202.02.html#Sec2 (дата обращения17.05.2012)

17. Andersson M. On Testing and Forecasting in Fractionally Integrated Time Series Models [Electronic resource]// Academic Archive On-line: [website]. URL: http://www.diva-portal.org/smash/record.jsf?searchId=1&pid=diva2:221764 (дата обращения17.05.2012)

18. Hansen B. Multi-step Forecast Model Selection [Electronic resource]// University of Wisconsin: [website]. URL: http://www.ssc.wisc.edu/~bhansen/papers/hstep.pdf (дата обращения 17.05.2012)

19. Kalekar P.S. Time series forecasting using Holt-Winters exponential smoothing. [Electronic resource]// Kanwal Rekhi School of Information Technology: [website]. URL: http://www.it.iitb.ac.in/~praj/acads/seminar/04329008_ExponentialSmoothing.pdf (дата обращения17.05.2012)

20. Klapwijk P. World Silver Survey 2012. [Electronic resource]// Thomson Reuters GFMS: [website]. URL: http://www.gfms.co.uk/media_advisories/TR%20GFMS%20World%20Silver%20Survey%202012%20Presentation.pdf (дата посещения 12.04.2012)

21. Lildholdt P. Long memory and ARFIMA modeling [Electronic resource]// Aarhus University: [website]. URL: http://mit.econ.au.dk/vip_htm/plildholdt/Master%20thesis.pdf (дата обращения17.05.2012)

22. Perrelli R. Introduction to ARCH&GARCH models [Electronic resource]// Univeristy of Illinois: [website]. URL: http://www.econ.uiuc.edu/~econ472/ARCH.pdf (дата обращения17.05.2012)

23. Poom H. Long memory volatility models [Electronic resource]// Manchester Business School: [website]. URL: https://phps.portals.mbs.ac.uk/Portals/49/docs/spoon/LM.pdf (дата обращения17.05.2012)

24. Reider R. Volatility Forecasting I: GARCH Models [Electronic resource]// New York University Courant Institute of Mathematical Sciences: [website]. URL: http://cims.nyu.edu/~almgren/timeseries/Vol_Forecast1.pdf (дата обращения17.05.2012)

25. Ruppert D. GARCH Models// Statistics and Data Analysis for Financial Engeneering [Electronic resource]// University of Washington: [website]. URL: http://faculty.washington.edu/ezivot/econ589/ch18-garch.pdf (дата обращения17.05.2012)

26. Stergiou C., Siganos D. Neural Networks [Electronic resource]// Neural Networks: [website]. URL: http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html (дата обращения17.05.2012)

27. Thomson Reuters GFMS for The Silver Institute/ World Silver Survey 2012 A Summary [Electronic resource]// SilverWheaton: [website]. URL: http://www.silverwheaton.com/files/docs_quick%20links/World%20Silver%20Survey%202012%20Summary.pdf (дата обращения17.05.2012)

Приложение 1

Данные цен за унцию серебра в USD

...

DATE

Price

DATE

Price

DATE

Price

DATE

Price

DATE

Price


Подобные документы

  • Классификация методов прогнозирования. Характеристика поискового и нормативного прогнозов. Сущность и цель методов экстраполяции и методов информационного моделирования. Сущность интуитивных методов прогнозирования и особенности экспертных оценок.

    реферат [20,4 K], добавлен 10.01.2012

  • Задачи и принципы прогнозирования, характеристика экстраполяционных, статистических и экспертных методов. Классификация экономических прогнозов. Опыт организации систем прогнозирования в высшем учебном заведении. Форсайт как практика управления.

    курсовая работа [47,9 K], добавлен 13.03.2014

  • Необходимость применения достоверного прогноза на базе методов и моделей научного прогнозирования для эффективного регулирования экономики. Описание основных методов и моделей экономического прогнозирования, представляющих экономико-политический интерес.

    реферат [13,0 K], добавлен 11.04.2010

  • Рассмотрение прогноза показателей социально-экономического развития России. Обобщение методов планирования и прогнозирования в экономике. Изучение применения методов планирования и прогнозирования на макроуровне. Прогноз развития сектора экономики.

    курсовая работа [44,5 K], добавлен 26.08.2017

  • Теоретические аспекты прогнозирования и планирования на предприятии. Классификация прогнозов и планов на предприятии, основных методов осуществления прогнозирования и планирования. Практическая реализация выбранного метода планирования и прогнозирования.

    курсовая работа [234,6 K], добавлен 07.10.2014

  • Роль прогнозирования в США. Процесс разработки макроэкономических прогнозов в Соединенных Штатах. Антикризисная программа США. Основные методы прогнозирования, используемые на государственном уровне в США. Модель круговых потоков в закрытой экономике.

    реферат [42,7 K], добавлен 15.05.2010

  • Понятие и сущность методов прогнозирования. Описание трехуровневой и четырехуровневой классификационных схем методов социально-экономического прогнозирования. Рассмотрение индивидуальных и коллективных экспертных оценок. Анализ алгоритма выбора метода.

    презентация [293,2 K], добавлен 22.08.2015

  • Классификация основных видов и методов прогнозирования. Фактографические и статистические методы. Историческая и математическая аналогия. Практическое применение методов прогнозирования на примере группы компаний ООО "Аэроэкспресс", экстраполяция.

    курсовая работа [713,1 K], добавлен 16.04.2014

  • Задачи, классификация, этапы и принципы прогнозов, сущность системного подхода. Характеристика методов экономического прогнозирования, его информационное обеспечение. Методические приемы использования типовых прогнозов, суть регрессионного анализа.

    учебное пособие [2,5 M], добавлен 22.06.2012

  • Теоретико-методологические основы методов и принципов социально-экономического планирования и прогнозирования. Анализ и прогнозирование социально-экономических процессов МО Улан-Удэ. Прогноз основных показателей социально-экономических процессов.

    курсовая работа [180,6 K], добавлен 04.12.2013

  • Уровень жизни населения как объект прогнозирования, современные подходы и критерии его оценки, используемые методы и модели. Анализ динамики экономических показателей населения РФ и этапы их прогнозирования, экономическое обоснование и значение.

    контрольная работа [63,3 K], добавлен 15.04.2015

  • Разработка прогнозных моделей и критерии их качества; проработка спецификации. Классификация прогнозных моделей. Методы прогнозирования, основанные на сглаживании, экспоненциальном сглаживании и скользящем среднем. Способы Бокса-Дженкинса (ARIMA).

    курсовая работа [99,2 K], добавлен 12.09.2014

  • Основные понятия прогнозирования и нейронных сетей, описание принципов их работы. Общая характеристика методов прогнозирования. Анализ проблемы организации сбыта на предприятии ООО "Славянка". Прогноз экономических показателей сбыта различными методами.

    курсовая работа [1009,1 K], добавлен 18.10.2011

  • Роль прогнозирования в управлении предприятием. Прогнозирование первичных и вторичных показателей. Выбор метода прогнозирования. Применение аналитических показателей для количественной оценки динамики явлений. Варианты конкуренции товара на рынке.

    контрольная работа [110,8 K], добавлен 24.10.2009

  • Методы экстраполяции и моделирования как формализованные методы прогнозирования. Прогноз динамики изменения объема выпускаемой продукции предприятия за счет получения краткосрочного кредита под оборотные активы, финансовой устойчивости предприятия.

    контрольная работа [106,3 K], добавлен 24.02.2010

  • Роль, функции и система прогнозирования и программирования экономики. История использования методов стратегического планирования в России. Особенности административно-правового регулирования государственных прогнозов социально-экономического развития РФ.

    курсовая работа [429,1 K], добавлен 10.11.2014

  • Теоретические аспекты прогнозирования потребности в материальных ресурсах. Научные условия методологии, технология прогнозирования потребности в материальных ресурсах. Анализ обеспеченности материальными ресурсами ООО "Новые окна", методы прогнозирования.

    курсовая работа [265,8 K], добавлен 16.02.2014

  • Теория прогнозирования и планирования экономики. Классификация прогнозов и планов. Курса действий над управляемой системой как цель экономического планирования. Простые и комплексные методы прогнозирования. Методы экстраполяции и экспертных оценок.

    контрольная работа [86,7 K], добавлен 16.04.2009

  • Прогноз как форма научного предвидения и основные подходы к исследованию объекта прогнозирования. Наука о принципах, методах и средствах научного прогнозирования – прогностика. Методология прогнозирования развития социально-экономической системы страны.

    реферат [54,0 K], добавлен 26.02.2009

  • Рассмотрение форм (отчетность, регистр), методов организации сбора, обработки данных статистического наблюдения, их структурного и содержательного анализа с помощью обобщающих показателей, способов статистического моделирования и прогнозирования.

    методичка [3,0 M], добавлен 10.04.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.