Анализ временных рядов на примере курса доллара
Графическое представление одномерного ряда. Проведение теста Дики-Фуллера для поиска единичных корней. График первых разностей значений курса доллара. Проверка дисперсии на постоянство в независимости от интервала. Анализ коррелограмы временного ряда.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 17.02.2014 |
Размер файла | 543,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru
Введение
В данной работе нам необходимо подобрать одномерный временной ряд и попробовать осуществить прогнозирование будущих значений выбранной нами экономической переменной с помощью подобранной нами модели: AR, MA, ARMA или ARIMA соответствующего порядка.
Для этой работы в качестве исходных данных одномерного временного ряда был взят курс доллара по отношению к рублю с ежедневной периодичностью (исключаю выходные дни) с 21 июня 2010 года по 14 мая 2011 года. В качестве значения курса доллара мы значения курса доллара по отношению к рублю на закрытие торговой сессии.
Создание модели значений котировок доллара по отношению к рублю является довольно актуальным, так как многие инвесторы и другие люди хотели бы быть способны предсказать значения котировки с целью повышения прибыльности своих предприятий и увеличения своего благосостояния.
Данные о курсе доллара относительно рубля были взяты с сайта инвестиционной компании «Финам».
Мы предполагаем, что данные курса доллара по отношению к рублю следующего дня зависят от значения курса доллара предыдущих дней. Поэтому, мы можем представить эти данные в виде временного ряда и проанализировать полученный одномерный временной ряд в данной работе, а также попробовать осуществить прогноз значений курса доллара.
1. Анализ временного ряда
Начнем работу с экспорта наших данных о курсе доллара в программный пакет Eviews 7: создадим рабочий файл и импортируем в него данные из файла Excel.
Условие сопоставимости в наших данных выполняется, так как это ежедневные данные (5-дневная неделя), все данные представлены в одинаковых единицах измерения.
Проанализируем имеющийся у нас временной ряд значений курса доллара относительно рубля. Для этого, во-первых, построим график временного ряда (line):
Рис. 1. График временного ряда
Как мы можем увидеть из графика, значения курса доллара не подвержены общему тренду в течение анализируемого нами периода (1 год) и не имеют ярко выраженную сезонность. Так как в данном ряде не присутствует ярко выраженная случайная составляющая, то мы можем сделать вывод, что большая часть данных изменяется закономерно, а не случайно. Поэтому мы можем предположить соблюдение предпосылки устойчивости данных временного ряда.
Также у нас выполняется условие достаточности, так как в наше исследование первоначально около 300 наблюдений, что, несомненно, в 7-10 раз выше числа, включенных в модель параметров.
По графику первоначального ряда мы можем с уверенностью сказать, что ряд не является стационарным, так как математическое ожидание и дисперсия значений временного ряда изменяются в зависимости от интервала.
Теперь определим статистические характеристики временного ряда. Для этого воспользуемся функцией Descriptive Statistics во вкладке view рабочего окна временного ряда. Построим гистограмму и определим статистики временного ряда:
Рис. 2. Гистограмма и статистики временного ряда
Как мы видим по графику, представленный временной ряд не имеет выбросов, поэтому удалять некоторые значения ряда нам не потребуется, так как значения курса доллара распределены вполне равномерно. Это гарантирует нам соблюдение условия однородности данных.
Статистики ряда: среднее значение курса доллара за рассматриваемый период составляло 30,5 руб. за доллар, при этом медианное значение составляет 30,63 руб. за доллар.
За рассматриваемый нами период максимальная стоимость доллара составляла 31,67 руб., а минимальная - 29,21 руб. за доллар. Стандартное отклонение курса доллара составляет 55 копеек. Коэффициент ассиметрии = -0,53, коэффициент эксцесса =2,75. Также представлена статистика Жарка-Бера, которая свидетельствует о нормальности распределения курса доллара во времени.
Проверим исследуемый нами временной ряд на стационарность. По представленному ранее в работе графику временного ряда мы можем предположить, что ряд не является стационарным, так как имеет место неслучайная составляющая.
Чтобы более точно проверить стационарность ряда, проведем тест Дики-Фуллера на наличие единичных корней. При выполнении теста выдвигается 2 гипотезы:
Н0: есть единичные корни
Н1: единичные корни отсутствуют.
2. Расчетная часть
Для осуществления теста воспользуемся программой Eviews 7. Проведем тест Дики-Фулера на нашем исходном ряде значений. Так как в нашем временном ряде не наблюдается тренд, проводим тест Дики-Фулера с константой и без тренда:
Таблица 1. Тест Дики-Фулера на исходном ряде
Null Hypothesis: DOLLAR has a unit root |
|||||
Exogenous: Constant |
|||||
Lag Length: 0 (Automatic - based on SIC, maxlag=10) |
|||||
t-Statistic |
|||||
Elliott-Rothenberg-Stock DF-GLS test statistic |
-1.543769 |
||||
Test critical values: |
1 % level |
-2.573886 |
|||
5 % level |
-1.942050 |
||||
10 % level |
-1.615885 |
||||
*MacKinnon (1996) |
|||||
DF-GLS Test Equation on GLS Detrended Residuals |
|||||
Dependent Variable: D(GLSRESID) |
|||||
Method: Least Squares |
|||||
Date: 05/23/11 Time: 18:44 |
|||||
Sample (adjusted): 5/17/2010 5/13/2011 |
|||||
Included observations: 260 after adjustments |
|||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
GLSRESID(-1) |
-0.023485 |
0.015213 |
-1.543769 |
0.1239 |
|
R-squared |
0.008291 |
Mean dependent var |
-0.004287 |
||
Adjusted R-squared |
0.008291 |
S.D. dependent var |
0.148654 |
||
S.E. of regression |
0.148037 |
Akaike info criterion |
-0.978876 |
||
Sum squared resid |
5.675939 |
Schwarz criterion |
-0.965181 |
||
Log likelihood |
128.2539 |
Hannan-Quinn criter. |
-0.973371 |
||
Durbin-Watson stat |
1.966466 |
На 5 % уровне значимости мы получаем значение Квыч=-1,94. При данной спецификации вспомогательной модель для теста Дики-Фулера и данном количестве наблюдений (около 250) критическое значение Ктаб=-2,88.
Получаем соотношение Квыч>Ктаб, следовательно, мы не отклоняем нулевую гипотезу о наличие единичных корней. Теперь проведем расширенный тест Дики-Фулера на этом же ряде значений курса доллара:
Таблица 2. Расширенный тест Дики-Фулера на исходном ряде
Null Hypothesis: DOLLAR has a unit root |
|||||
Exogenous: Constant |
|||||
Lag Length: 0 (Automatic - based on SIC, maxlag=10) |
|||||
t-Statistic |
Prob.* |
||||
Augmented Dickey-Fuller test statistic |
-1.481607 |
0.5416 |
|||
Test critical values: |
1 % level |
-3.455387 |
|||
5 % level |
-2.872455 |
||||
10 % level |
-2.572660 |
||||
*MacKinnon (1996) one-sided p-values. |
|||||
Augmented Dickey-Fuller Test Equation |
|||||
Dependent Variable: D(DOLLAR) |
|||||
Method: Least Squares |
|||||
Date: 05/23/11 Time: 18:55 |
|||||
Sample (adjusted): 5/17/2010 5/13/2011 |
|||||
Included observations: 260 after adjustments |
|||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
DOLLAR(-1) |
-0.024850 |
0.016772 |
-1.481607 |
0.1397 |
|
C |
0.755952 |
0.513200 |
1.473017 |
0.1420 |
|
R-squared |
0.008437 |
Mean dependent var |
-0.004287 |
||
Adjusted R-squared |
0.004593 |
S.D. dependent var |
0.148654 |
||
S.E. of regression |
0.148312 |
Akaike info criterion |
-0.971331 |
||
Sum squared resid |
5.675103 |
Schwarz criterion |
-0.943941 |
||
Log likelihood |
128.2731 |
Hannan-Quinn criter. |
-0.960320 |
||
F-statistic |
2.195160 |
Durbin-Watson stat |
1.964077 |
||
Prob(F-statistic) |
0.139665 |
На 5 % уровне значимости Квыч=-2,87, в то время как Ктаб=-2,88. Так как Квыч>Ктаб, то мы не отклоняем гипотезу о наличии единичных корней в исходном временном ряде значений курса доллара. Теперь нам необходимо определить порядок единичного корня. Для этого мы опять проводим тест Дики-Фулера (обычный и расширенный), но уже в качестве переменной выступает не значение курса доллара, а разность значения курса доллара и его предыдущего значения:
Таблица 3. Тест Дики-Фулера для первых разностей
Null Hypothesis: D(DOLLAR) has a unit root |
|||||
Exogenous: Constant |
|||||
Lag Length: 2 (Automatic - based on SIC, maxlag=10) |
|||||
t-Statistic |
|||||
Elliott-Rothenberg-Stock DF-GLS test statistic |
-6.610769 |
||||
Test critical values: |
1 % level |
-2.573991 |
|||
5 % level |
-1.942064 |
||||
10 % level |
-1.615875 |
||||
*MacKinnon (1996) |
|||||
DF-GLS Test Equation on GLS Detrended Residuals |
|||||
Dependent Variable: D(GLSRESID) |
|||||
Method: Least Squares |
|||||
Date: 05/23/11 Time: 19:04 |
|||||
Sample (adjusted): 5/20/2010 5/13/2011 |
|||||
Included observations: 257 after adjustments |
|||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
GLSRESID(-1) |
-0.608063 |
0.091981 |
-6.610769 |
0.0000 |
|
D(GLSRESID(-1)) |
-0.240467 |
0.080118 |
-3.001425 |
0.0030 |
|
D(GLSRESID(-2)) |
-0.205927 |
0.061592 |
-3.343421 |
0.0010 |
|
R-squared |
0.437901 |
Mean dependent var |
-0.000772 |
||
Adjusted R-squared |
0.433475 |
S.D. dependent var |
0.211239 |
||
S.E. of regression |
0.158995 |
Akaike info criterion |
-0.828287 |
||
Sum squared resid |
6.420949 |
Schwarz criterion |
-0.786858 |
||
Log likelihood |
109.4349 |
Hannan-Quinn criter. |
-0.811626 |
||
Durbin-Watson stat |
2.036421 |
На 5 % уровне значимости Квыч=-1,94, а критическое значение статистики Ктаб=-2,88. Получается, что и при анализе первых разностей Квыч>Ктаб, то есть мы не отклоняем гипотезу о наличии единичных корней первого порядка. Проведем еще и расширенный тест Дики-Фулера:
Таблица 4. Расширенный тест Дики-Фулера для первых разностей
Null Hypothesis: D(DOLLAR) has a unit root |
|||||
Exogenous: Constant |
|||||
Lag Length: 0 (Automatic - based on SIC, maxlag=10) |
|||||
t-Statistic |
Prob.* |
||||
Augmented Dickey-Fuller test statistic |
-16.02396 |
0.0000 |
|||
Test critical values: |
1 % level |
-3.455486 |
|||
5 % level |
-2.872499 |
||||
10 % level |
-2.572684 |
||||
*MacKinnon (1996) one-sided p-values. |
|||||
Augmented Dickey-Fuller Test Equation |
|||||
Dependent Variable: D(DOLLAR,2) |
|||||
Method: Least Squares |
|||||
Date: 05/23/11 Time: 19:11 |
|||||
Sample (adjusted): 5/18/2010 5/13/2011 |
|||||
Included observations: 259 after adjustments |
|||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
D(DOLLAR(-1)) |
-0.999867 |
0.062398 |
-16.02396 |
0.0000 |
|
C |
-0.004621 |
0.009270 |
-0.498511 |
0.6186 |
|
R-squared |
0.499774 |
Mean dependent var |
-0.000743 |
||
Adjusted R-squared |
0.497827 |
S.D. dependent var |
0.210449 |
||
S.E. of regression |
0.149133 |
Akaike info criterion |
-0.960268 |
||
Sum squared resid |
5.715828 |
Schwarz criterion |
-0.932802 |
||
Log likelihood |
126.3547 |
Hannan-Quinn criter. |
-0.949225 |
||
F-statistic |
256.7673 |
Durbin-Watson stat |
1.999113 |
||
Prob(F-statistic) |
0.000000 |
На 5 % уровне значимости Квыч=-2,87, в то время как Ктаб=-2,88. Так как Квыч>Ктаб, то мы не отклоняем гипотезу о наличии единичных корней первого порядка. Это означает, что от стационарности мы, возможно, избавимся, если будем анализировать не ряд значений курса доллара, а ряд первых разностей. Но для начала проверим гипотезу о наличии единичных корней с помощью теста KPSS, где нулевая гипотеза соответствует гипотезе об отсутствии единичных корней. Мы будем принимать нулевую гипотезу (точнее не отклонять ее), если Кв<Ктаб.
Проверим исходный ряд на наличие единичных корней тестом KPSS:
Таблица 5. Тест KPSS для первоначального ряда
Null Hypothesis: DOLLAR is stationary |
||||
Exogenous: Constant |
||||
Bandwidth: 11 (Newey-West automatic) using Bartlett kernel |
||||
LM-Stat. |
||||
Kwiatkowski-Phillips-Schmidt-Shin test statistic |
0.500975 |
|||
Asymptotic critical values*: |
1 % level |
0.739000 |
||
5 % level |
0.463000 |
|||
10 % level |
0.347000 |
|||
*Kwiatkowski-Phillips-Schmidt-Shin (1992, Table 1) |
||||
Residual variance (no correction) |
0.296780 |
|||
HAC corrected variance (Bartlett kernel) |
2.906294 |
На 5 % уровне значимости мы не можем принять нулевую гипотезу, потому что Квыч>Ктаб. Проверим наличие единичного корня на ряде первых разностей:
Таблица 6. Тест KPSS на ряде первых разностей
Null Hypothesis: D(DOLLAR) is stationary |
||||
Exogenous: Constant |
||||
Bandwidth: 0 (Newey-West automatic) using Bartlett kernel |
||||
LM-Stat. |
||||
Kwiatkowski-Phillips-Schmidt-Shin test statistic |
0.117452 |
|||
Asymptotic critical values*: |
1 % level |
0.739000 |
||
5 % level |
0.463000 |
|||
10 % level |
0.347000 |
|||
*Kwiatkowski-Phillips-Schmidt-Shin (1992, Table 1) |
||||
Residual variance (no correction) |
0.017893 |
|||
HAC corrected variance (Bartlett kernel) |
0.017893 |
В данном случае при 5 % уровне значимости Квыч=0,117<0,46=Ктаб, поэтому, согласно результатам теста KPSS, мы делаем вывод об отсутствии единичных корней первого порядка в данной выборке. Поэтому, нам будет целесообразно использовать для последующего анализа ряд первых разностей значений курса доллара, который, вероятно, будет приближен к стационарному ряду.
Для этого создадим новую переменную:
Genr ddollar=dollar-dollar(-1).
Проверим полученный новый временной ряд на стационарность, используя графический метод:
Рис. 3. График первых разностей значений курса доллара
Как мы видим по графику, временному ряду первых разностей не присущ тренд. Поэтому мы можем сказать, что ряд приблизился к стационарному. Более того, согласно определению стационарности, ряд должен обладать постоянной дисперсией и математическим ожиданием на разных интервалах ряда. Вывод об этом мы сможем сделать по графику, однако для проверки точности наших предположений проведем тесты на проверку постоянства математического ожидания и дисперсии на различных интервалах временного ряда. Если наша гипотеза о постоянстве подтвердится, то мы сможем сделать вывод о том, что ряд первых разностей значений курса доллара относительно рубля является близким к стационарному ряду.
Проверим это с помощью статистического теста equality test by classification, где нулевой гипотезе соответствует гипотеза о постоянстве мат. Ожидания (или дисперсии). Нулевая гипотеза принимается, если значение probability>0,05. Сначала проверим на постоянство дисперсию:
Таблица 7. Проверка дисперсии на постоянство (в независимости от интервала)
Test for Equality of Variances of DDOLLAR |
|||||
Categorized by values of DDOLLAR |
|||||
Sample: 6/21/2010 5/13/2011 |
|||||
Included observations: 235 |
|||||
Method |
df |
Value |
Probability |
||
Bartlett |
5 |
10.85387 |
0.0544 |
||
Levene |
(5, 229) |
3.504731 |
0.0045 |
||
Brown-Forsythe |
(5, 229) |
2.506961 |
0.0311 |
||
Category Statistics |
|||||
Mean Abs. |
Mean Abs. |
||||
DDOLLAR |
Count |
Std. Dev. |
Mean Diff. |
Median Diff. |
|
[-0.6, -0.4) |
2 |
0.007071 |
0.005000 |
0.005000 |
|
[-0.4, -0.2) |
18 |
0.028198 |
0.023733 |
0.023733 |
|
[-0.2, 0) |
96 |
0.050785 |
0.043951 |
0.043778 |
|
[0, 0.2) |
106 |
0.053280 |
0.044919 |
0.043769 |
|
[0.2, 0.4) |
12 |
0.050061 |
0.036389 |
0.035000 |
|
[0.4, 0.6) |
1 |
NA |
0.000000 |
0.000000 |
|
All |
235 |
0.134049 |
0.041934 |
0.041274 |
|
Bartlett weighted standard deviation: 0.050509 |
Так как значение probability больше 0,05, то мы можем сделать вывод, что в данном временном ряде первых разностей дисперсия является одинаковой в независимости от начала отсчета.
Теперь проведем аналогичный тест для проверки постоянства среднего значения.
Таблица 8. Проверка среднего значения на постоянство (в независимости от интервала)
Test for Equality of Means of DDOLLAR |
|||||
Categorized by values of DDOLLAR |
|||||
Sample: 6/21/2010 5/13/2011 |
|||||
Included observations: 235 |
|||||
Method |
df |
Value |
Probability |
||
Anova F-test |
(5, 229) |
283.8360 |
0.0000 |
||
Analysis of Variance |
|||||
Source of Variation |
df |
Sum of Sq. |
Mean Sq. |
||
Between |
5 |
3.620585 |
0.724117 |
||
Within |
229 |
0.584220 |
0.002551 |
||
Total |
234 |
4.204805 |
0.017969 |
||
Category Statistics |
|||||
Std. Err. |
|||||
DDOLLAR |
Count |
Mean |
Std. Dev. |
of Mean |
|
[-0.6, -0.4) |
2 |
-0.425000 |
0.007071 |
0.005000 |
|
[-0.4, -0.2) |
18 |
-0.254844 |
0.028198 |
0.006646 |
|
[-0.2, 0) |
96 |
-0.078295 |
0.050785 |
0.005183 |
|
[0, 0.2) |
106 |
0.061995 |
0.053280 |
0.005175 |
|
[0.2, 0.4) |
12 |
0.278333 |
0.050061 |
0.014451 |
|
[0.4, 0.6) |
1 |
0.440000 |
NA |
NA |
|
All |
235 |
-0.011072 |
0.134049 |
0.008744 |
Согласно этому тесту мы не можем сделать вывод о постоянстве среднего значения временного ряда, однако мы можем предположить, что это вызвано произвольной разбивкой на интервалы. Попробуем сами разбить выборку на интервалы с помощью функции sample.
smpl 6/20/2010 11/14/2010:
Рис. 4. Описательные статистики 1-го интервала
smpl 11/14/2010 5/13/2011:
Рис. 5. Описательные статистики 2-го интервала
Мы разбили наш временной ряд на два интервала. Как видно из описательных статистик, среднее значение первого интервала = -0,01, а среднее значение второго интервала =-0,009, то есть приблизительно =-0,01. Следовательно, мы можем сделать вывод о постоянстве среднего значения временного ряда независимо от начала отсчета.
Аналогичные рассуждения можно провести относительно дисперсии (или среднего квадратичного отклонения, которое равно корню из дисперсии), чтобы убедиться в правильности принятой нами гипотезы. В первой выборке Sd=0,134, так же как и во второй выборке, где также Sd=0,134. Следовательно, дисперсии (как и среднее квадратичное отклонение) в данном временном ряде не зависит от начала отсчета. Поэтому мы сможем сделать вывод о том, что анализируемый нами временной ряд (первые разности значений курса доллара) является близким к стационарному ряду, и мы можем строить модель на основе анализа этого ряда, а также сможем прогнозировать по полученной нами далее модели.
Теперь нам необходимо определить вид нашей модели из предложенных AR, MA, ARMA. Для этого нам необходимо построить коррелограму временного ряда первых разностей курса доллара и по виду коррелограмы сделать вывод о виде модели:
Таблица 9. Коррелограма временного ряда
Так как наша коррелограма показывает, что и автокорреляционная функции, и частная автокорреляционная функция имеют убывающий и зубчатый характер (есть выпадения и у автокорреляционной функции и у частной автокорреляционной функции), то мы делаем вывод о том, что наша модель имеет вид ARMA (p,q). Теперь нам необходимо определить порядки p и q входящих в модель функций AR и MA. Порядок AR мы определяем по выпадениям автокорреляционной функции, а порядок MA - по частной автокорреляционной функции.
Так как в нашей ситуации ни одно из значений автокорреляционной функции и частной автокорреляционной функции не выпадает за границы 2±,то мы будем включать в модель наиболее близкие к границам порядки элементов AR и MA.
Руководствуясь такой логикой, мы включаем в модель элементы AR(2), AR(5), AR(7), AR(9), MA(1), MA(2), MA(5), MA(7), MA(9). При дальнейшем анализе мы исключим из модели незначимые элементы, но сначала включим все названные нами переменные.
Построим первую модель, включив в нее все выбранные нами элементы:
Ls ddollar c AR(2) AR(5) AR(7) AR(9) MA(1) MA(2) MA(5) MA(7) MA(9).
Таблица 10. Уравнение 1
Dependent Variable: DDOLLAR |
|||||
Method: Least Squares |
|||||
Date: 05/28/11 Time: 20:09 |
|||||
Sample: 6/21/2010 5/13/2011 |
|||||
Included observations: 235 |
|||||
Convergence achieved after 46 iterations |
|||||
MA Backcast: 6/08/2010 6/18/2010 |
|||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
C |
-0.009121 |
0.008033 |
-1.135404 |
0.2574 |
|
AR(2) |
0.257528 |
0.049813 |
5.169849 |
0.0000 |
|
AR(5) |
0.104436 |
0.094752 |
1.102206 |
0.2715 |
|
AR(7) |
0.080125 |
0.154924 |
0.517189 |
0.6055 |
|
AR(9) |
-0.611538 |
0.106772 |
-5.727505 |
0.0000 |
|
MA(1) |
0.032584 |
0.042713 |
0.762849 |
0.4464 |
|
MA(2) |
-0.493647 |
0.047324 |
-10.43111 |
0.0000 |
|
MA(5) |
-0.075704 |
0.108611 |
-0.697016 |
0.4865 |
|
MA(7) |
0.081179 |
0.192078 |
0.422634 |
0.6730 |
|
MA(9) |
0.606794 |
0.138645 |
4.376591 |
0.0000 |
|
R-squared |
0.154856 |
Mean dependent var |
-0.011072 |
||
Adjusted R-squared |
0.121050 |
S.D. dependent var |
0.134049 |
||
S.E. of regression |
0.125674 |
Akaike info criterion |
-1.268623 |
||
Sum squared resid |
3.553665 |
Schwarz criterion |
-1.121406 |
||
Log likelihood |
159.0632 |
Hannan-Quinn criter. |
-1.209272 |
||
F-statistic |
4.580765 |
Durbin-Watson stat |
1.918950 |
||
Prob(F-statistic) |
0.000015 |
||||
Inverted AR Roots |
.92+.28i |
.92-.28i |
.49+.81i |
.49-.81i |
|
-.16+.91i |
-.16-.91i |
-.77-.58i |
-.77+.58i |
||
-.95 |
|||||
Inverted MA Roots |
.95+.29i |
.95-.29i |
.47+.78i |
.47-.78i |
|
-.16+.87i |
-.16-.87i |
-.77-.57i |
-.77+.57i |
Как мы видим, многие из включенных нами в модель элементов являются незначимыми, так как значение probability>0,05. Это относится к элементам: AR(5), AR(7), MA(1), MA(5), MA(7). Однако, несмотря на это, модель в целом оказывается значима, так как коэффициент F-stat.<0,05. Данная модель будет работать 12,2 % случаев (коэффициент детерминации скорректированный=0,122).
Для повышения качества модели попробуем исключить из анализа некоторые незначимые элементы. Исключим из анализа AR(7):
Ls ddollar c AR(2) AR(5) AR(9) MA(1) MA(2) MA(5) MA(7) MA(9).
Таблица 11. Уравнение 2
Dependent Variable: DDOLLAR |
|||||
Method: Least Squares |
|||||
Date: 05/28/11 Time: 21:06 |
|||||
Sample: 6/21/2010 5/13/2011 |
|||||
Included observations: 235 |
|||||
Convergence achieved after 28 iterations |
|||||
MA Backcast: 6/08/2010 6/18/2010 |
|||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
C |
-0.008024 |
0.008129 |
-0.987132 |
0.3246 |
|
AR(2) |
0.226210 |
0.032208 |
7.023467 |
0.0000 |
|
AR(5) |
0.241278 |
0.034234 |
7.047976 |
0.0000 |
|
AR(9) |
-0.661015 |
0.033977 |
-19.45465 |
0.0000 |
|
MA(1) |
0.032839 |
0.016312 |
2.013128 |
0.0453 |
|
MA(2) |
-0.390025 |
0.026808 |
-14.54864 |
0.0000 |
|
MA(5) |
-0.254471 |
0.035176 |
-7.234275 |
0.0000 |
|
MA(7) |
0.168498 |
0.051493 |
3.272246 |
0.0012 |
|
MA(9) |
0.648206 |
0.042273 |
15.33382 |
0.0000 |
|
R-squared |
0.161100 |
Mean dependent var |
-0.011072 |
||
Adjusted R-squared |
0.131405 |
S.D. dependent var |
0.134049 |
||
S.E. of regression |
0.124932 |
Akaike info criterion |
-1.284549 |
||
Sum squared resid |
3.527410 |
Schwarz criterion |
-1.152054 |
||
Log likelihood |
159.9345 |
Hannan-Quinn criter. |
-1.231133 |
||
F-statistic |
5.425056 |
Durbin-Watson stat |
1.918610 |
||
Prob(F-statistic) |
0.000003 |
||||
Inverted AR Roots |
.93+.28i |
.93-.28i |
.48+.83i |
.48-.83i |
|
-.15-.90i |
-.15+.90i |
-.78+.60i |
-.78-.60i |
||
Inverted MA Roots |
.95-.29i |
.95+.29i |
.45+.82i |
.45-.82i |
|
-.14+.86i |
-.14-.86i |
-.79-.61i |
-.79+.61i |
Как мы видим, это положительно сказалось на качестве модели. Скорректированный коэффициент детерминации вырос, то есть эта модель работает в 13,2 % случаев, а значительных изменений в значении показателей Акайке, Шварц и Хан-Квин не произошло. Однако, попробуем усовершенствовать модель, руководствуясь «принципом экономии».
Проверим остатки данной модели на соответствие белому шуму, а также проанализируем коррелограму остатков, так как это может нам помочь в определении важных для включения и прогнозирования элементов регрессии.
Для начала создадим переменную остатков регрессии 2:
Genr resid02=ddollar-ddollarf.
Проверим, выполняется ли равенство среднего значения остатков нулю и постоянна ли дисперсия. Для этого построим график остатков и для начала определим это графически.
Рис. 6. График остатков уравнения 2
По графику мы можем сказать, что среднее значение ошибки приблизительно равно 0. Также мы сможем сделать вывод о приблизительном постоянстве дисперсии. Для более точных результатов воспользуемся функцией «описательные статистики»:
Рис. 7. Описательные статистики остатков уравнения 2
Как мы видим, среднее значение ошибки действительно близко к нулю, так как равно = -0,01. Поэтому гипотеза о равенстве среднего нулю подтверждается.
Проверку гипотезы о постоянстве дисперсии мы осуществим с помощью тесте White на гетероскедастичность. В этом тесте нулевая гипотеза соответствует гипотезе о гомоскедастичности (постоянстве дисперсии). Мы принимаем нулевую гипотезу в случае, если значение probability>0,05.:
Таблица 12. Тест Уайта
Heteroskedasticity Test: White |
||||
F-statistic |
1.189434 |
Prob. F(54,180) |
0.2004 |
|
Obs*R-squared |
61.80219 |
Prob. Chi-Square(54) |
0.2174 |
|
Scaled explained SS |
93.32930 |
Prob. Chi-Square(54) |
0.0007 |
Мы видим, что probability(F-stat)=0,2>0,05, поэтому мы принимаем гипотезу о гомоскедастичности, то есть о постоянстве дисперсии остатков регрессии номер 2.
Теперь построим коррелограму остатков:
Таблица 13. Коррелограма остатков уравнения
Значения частной автокорреляционной функции должны подчиняться нормальному закону распределения со средним значением 0 и дисперсией 1/N, где N-количество значений автокорреляционной функции. Проверим, выполняется ли это для остатков нашего уравнения номер 2.
Рис. 8. Описательные статистики частной автокорреляционной функции ошибок
Как мы видим, среднее значение автокорреляционной функции ошибок уравнения 1 приблизительно равно 0. Значение среднеквадратичного отклонения =0,046, то есть дисперсия значений автокорреляционной =0,002. Получается, что дисперсия не равна 1/200, поэтому выполняются не все условия соответствия остатков регрессии белому шуму.
Судя по графику, распределение значений частной автокорреляционной функции близко к нормальному, однако, судя по значению коэффициента ассиметрии, распределение смещено влево, а, согласно коэффициенту эксцесса, распределение является островершинным.
Также для проверки соответствия ошибок регрессии белому шуму, нам необходимо проверить на нормальность распределение ошибки. Условием этого является значения автокорреляционной функции, не выходящие за границы 2±, а также подтверждения нулевой гипотезы Q-stat, которая заключается в отсутствии автокорреляции. Это условие выполняется при значении probability>0,1.
Проверим эти условия по коррелограме ошибок уравнения 2 (см. таблица 13).
Как мы видим из коррелограмы, эти условия выполняются, поэтому мы можем сделать вывод о нормальности распределения ошибок уравнения регрессии 2.
Таким образом, остатки этого уравнения близки к белому шуму, поэтому мы можем использовать полученную модель (уравнение 2) для прогнозирования разницы значений (то есть абсолютного прироста) значений курса доллара по отношению к рублю. Однако, эта модель будет работать лишь в 13,2 % случаев. Попробуем улучшить качество модели, экспериментируя с включенными в модель параметрами разных порядков AR и MA.
Попробуем включить в модель параметр AR(10), так как значение автокорреляционной функции на этом лаге приближается к границе, а также исключим незначимые параметры (константа, MA(1)):
Ls ddollar AR(2) AR(5) AR(9) MA(2) MA(5) MA(7) MA(9) AR(10).
Таблица 14. Уравнение 3
Dependent Variable: DDOLLAR |
|||||
Method: Least Squares |
|||||
Date: 05/29/11 Time: 01:22 |
|||||
Sample: 6/21/2010 5/13/2011 |
|||||
Included observations: 235 |
|||||
Convergence achieved after 25 iterations |
|||||
MA Backcast: 6/08/2010 6/18/2010 |
|||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
AR(2) |
0.191249 |
0.035626 |
5.368269 |
0.0000 |
|
AR(5) |
0.196079 |
0.041703 |
4.701752 |
0.0000 |
|
AR(9) |
-0.653089 |
0.036135 |
-18.07380 |
0.0000 |
|
AR(10) |
0.048552 |
0.035826 |
1.355227 |
0.1767 |
|
MA(2) |
-0.323387 |
0.031589 |
-10.23747 |
0.0000 |
|
MA(5) |
-0.254608 |
0.036202 |
-7.032948 |
0.0000 |
|
MA(7) |
0.186527 |
0.050224 |
3.713921 |
0.0003 |
|
MA(9) |
0.657807 |
0.042662 |
15.41915 |
0.0000 |
|
R-squared |
0.160236 |
Mean dependent var |
-0.011072 |
||
Adjusted R-squared |
0.134340 |
S.D. dependent var |
0.134049 |
||
S.E. of regression |
0.124721 |
Akaike info criterion |
-1.292029 |
||
Sum squared resid |
3.531045 |
Schwarz criterion |
-1.174256 |
||
Log likelihood |
159.8135 |
Hannan-Quinn criter. |
-1.244549 |
||
Durbin-Watson stat |
1.874474 |
||||
Inverted AR Roots |
.91-.29i |
.91+.29i |
.47-.83i |
.47+.83i |
|
.07 |
-.16-.90i |
-.16+.90i |
-.78+.61i |
||
-.78-.61i |
-.96 |
||||
Inverted MA Roots |
.95-.30i |
.95+.30i |
.45+.83i |
.45-.83i |
|
-.13+.86i |
-.13-.86i |
-.78-.62i |
-.78+.62i |
||
-.99 |
Как мы видим, в модели все параметры являются значимыми, за исключением AR(10), значение probability=0.1. Однако при включении этого параметра в анализ общее качество модели возросло. Об этом свидетельствует скорректированный коэффициент детерминации, который показывает, что теперь модель работает в 13,5% случаев. Также мы видим, что значения критериев Akaike, Shwarz, Hannan-Quinn уменьшились, что также свидетельствует об улучшенном качестве последней модели (уравнение 3).
Качественная модель предполагает, что остатки регрессии будут иметь вид белого шума, поэтому проверим остатки регрессии 3 на предмет соответствия нашему предположению:
Для начала создадим переменную остатков регрессии 3:
Genr resid03=ddollar-ddollarf3.
Проверим, выполняется ли равенство среднего значения остатков нулю и постоянна ли дисперсия. Для этого построим график остатков и для начала определим это графически:
Рис. 9. График остатков уравнения 3
По графику мы можем сказать, что среднее значение ошибки приблизительно равно 0. Также мы сможем сделать вывод о приблизительном постоянстве дисперсии, но для более точных результатов нам необходимо воспользоваться функцией «описательные статистики», провести equality test by classification (для дисперсии) и проверить также постоянство дисперсии с помощью теста Уайта:
Рис. 10. Описательные статистики остатков уравнения 3
Как мы видим, среднее значение ошибки действительно близко к нулю, так как равно = -0,009. Поэтому гипотеза о равенстве среднего нулю подтверждается.
Теперь проведем equality test by classification (для дисперсии):
Таблица 14. Проверка дисперсии остатков регрессии 3 на независимость от времени
Test for Equality of Variances of RESID03 |
|||||
Categorized by values of RESID03 |
|||||
Date: 05/29/11 Time: 12:59 |
|||||
Sample: 6/21/2010 5/13/2011 |
|||||
Included observations: 235 |
|||||
Method |
df |
Value |
Probability |
||
Bartlett |
5 |
10.76499 |
0.0562 |
||
Levene |
(5, 229) |
2.722076 |
0.0207 |
||
Brown-Forsythe |
(5, 229) |
1.981415 |
0.0823 |
||
Category Statistics |
|||||
Mean Abs. |
Mean Abs. |
||||
RESID03 |
Count |
Std. Dev. |
Mean Diff. |
Median Diff. |
|
[-0.6, -0.4) |
2 |
0.013760 |
0.009730 |
0.009730 |
|
[-0.4, -0.2) |
16 |
0.025352 |
0.021709 |
0.021474 |
|
[-0.2, 0) |
104 |
0.052589 |
0.043538 |
0.042807 |
|
[0, 0.2) |
101 |
0.051866 |
0.043014 |
0.041672 |
|
[0.2, 0.4) |
11 |
0.050301 |
0.037477 |
0.035287 |
|
[0.4, 0.6) |
1 |
NA |
0.000000 |
0.000000 |
|
All |
235 |
0.128347 |
0.041070 |
0.040051 |
|
Bartlett weighted standard deviation: 0.050715 |
Так как значение probability>0,05, то мы делаем вывод о том, что дисперсия остатков регрессии 3 действительно не зависит от точки отсчета, то есть о времени.
Также, для более точных результатов, проверку гипотезы о постоянстве дисперсии мы осуществим с помощью теста White на гетероскедастичность. В этом тесте нулевая гипотеза соответствует гипотезе о гомоскедастичности (постоянстве дисперсии). Мы принимаем нулевую гипотезу в случае, если значение probability>0,05.:
Таблица 15. Тест Уайта
Heteroskedasticity Test: White |
||||
F-statistic |
1.134617 |
Prob. F(36,198) |
0.2885 |
|
Obs*R-squared |
40.18847 |
Prob. Chi-Square(36) |
0.2899 |
|
Scaled explained SS |
59.71830 |
Prob. Chi-Square(36) |
0.0078 |
Мы видим, что probability(F-stat)=0,2885>0,05, поэтому мы принимаем гипотезу о гомоскедастичности, то есть о постоянстве дисперсии остатков регрессии номер 3.
Теперь построим коррелограму остатков:
Таблица 16. Коррелограма остатков уравнения 3
Значения частной автокорреляционной функции должны подчиняться нормальному закону распределения со средним значением 0 и дисперсией 1/N, где N-количество значений автокорреляционной функции. Проверим, выполняется ли это для остатков нашего уравнения номер 3.
Рис. 11. Описательные статистики частной автокорреляционной функции ошибок
Как мы видим, среднее значение автокорреляционной функции ошибок уравнения 3 приблизительно равно 0. Значение среднеквадра...
Подобные документы
Анализ изменения курса доллара и проведение аналитического выравнивания. Вычисление точечного прогресса на начало 2018 года с помощью уравнения динамического ряда. Расчет среднеквадратического отклонения от тренда для определения интервального прогноза.
задача [85,6 K], добавлен 15.04.2014Составление модели для прогнозирования курса доллара. Создание оптимально работающей нейросети для прогнозирования курсов доллара. Использование метода скользящих окон. Определение количества нейронов на внутреннем слое, выполнение обучения сети.
презентация [78,1 K], добавлен 14.08.2013Теория и анализ временных рядов. Построение линии тренда и прогнозирование развития случайного процесса на основе временного ряда. Сглаживание временного ряда, задача выделения тренда, определение вида тенденции. Выделение тригонометрической составляющей.
курсовая работа [722,6 K], добавлен 09.07.2019Анализ временных рядов с помощью статистического пакета "Minitab". Механизм изменения уровней ряда. Trend Analysis – анализ линии тренда с аппроксимирующими кривыми (линейная, квадратическая, экспоненциальная, логистическая). Декомпозиция временного ряда.
методичка [1,2 M], добавлен 21.01.2011Основные элементы эконометрического анализа временных рядов. Задачи анализа и их первоначальная обработка. Решение задач кратко- и среднесрочного прогноза значений временного ряда. Методы нахождения параметров уравнения тренда. Метод наименьших квадратов.
контрольная работа [37,6 K], добавлен 03.06.2009Анализ упорядоченных данных, полученных последовательно (во времени). Модели компонентов детерминированной составляющей временного ряда. Свободные от закона распределения критерии проверки ряда на случайность. Теоретический анализ системы линейного вида.
учебное пособие [459,3 K], добавлен 19.03.2011Временные ряды и их характеристики. Факторы, влияющие на значения временного ряда. Тренд и сезонные составляющие. Декомпозиция временных рядов. Метод экспоненциального сглаживания. Построение регрессионной модели. Числовые характеристики переменных.
контрольная работа [1,6 M], добавлен 18.06.2012Теоретические выкладки в области теории хаоса. Методы, которые используются в математике, для прогнозирования стохастических рядов. Анализ финансовых рядов и рядов Twitter, связь между сентиметными графиками и поведением временного финансового ряда.
курсовая работа [388,9 K], добавлен 01.07.2017Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.
контрольная работа [298,2 K], добавлен 19.01.2011Графическое решение и оптимальный план задачи линейного программирования. Свойства двойственных оценок и теорем двойственности. Адаптивная модель Брауна. Свойства независимости остаточной компоненты, соответствия нормальному закону распределения.
контрольная работа [556,2 K], добавлен 17.02.2010Статистические методы анализа одномерных временных рядов, решение задач по анализу и прогнозированию, построение графика исследуемого показателя. Критерии выявления компонент рядов, проверка гипотезы о случайности ряда и значения стандартных ошибок.
контрольная работа [325,2 K], добавлен 13.08.2010Сглаживание с помощью метода скользящей средней. Анализ исходного ряда на наличие стационарности. Тест Дики-Фуллера. Выделение сезонной компоненты в аддитивной и мультипликативной модели. Составление уравнения тренда в виде полинома пятой степени.
лабораторная работа [2,6 M], добавлен 17.02.2014Изучение понятия имитационного моделирования. Имитационная модель временного ряда. Анализ показателей динамики развития экономических процессов. Аномальные уровни ряда. Автокорреляция и временной лаг. Оценка адекватности и точности трендовых моделей.
курсовая работа [148,3 K], добавлен 26.12.2014Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абсолютные характеристики вариации. Расчет дисперсии способом моментов. Теоретические кривые распределения.
курсовая работа [151,4 K], добавлен 11.09.2010Изучение особенностей стационарных временных рядов и их применения. Параметрические тесты стационарности. Тестирование математического ожидания, дисперсии и коэффициентов автокорреляции. Проведение тестов Манна-Уитни, Сиджела-Тьюки, Вальда-Вольфовитца.
курсовая работа [451,7 K], добавлен 06.12.2014Автокорреляционная функция временного ряда темпов роста производства древесноволокнистых плит в Российской Федерации. Расчет значений сезонной компоненты в аддитивной модели и коэффициента автокорреляции третьего порядка по логарифмам уровней ряда.
контрольная работа [300,6 K], добавлен 15.11.2014Определение и роль валютного курса. Конъюнктурные и структурные факторы, влияющие на его изменение. Понятие инфляции и ее темпы. Исследование изменения курса валют и инфляции с помощью графиков ряда динамики и трендов и уравнения множественной регрессии.
курсовая работа [927,8 K], добавлен 12.05.2015Решение задачи изучения изменения анализируемых показателей во времени при помощи построения и анализа рядов динамики. Элементы ряда динамики: уровни динамического ряда и период времени, за который они представлены. Понятие переменной и постоянной базы.
методичка [43,0 K], добавлен 15.11.2010Построение интервального вариационного ряда распределения предприятий по объему реализации. Графическое изображение ряда (гистограмма, кумулята, огива). Расчет средней арифметической; моды и медианы; коэффициента асимметрии; показателей вариации.
контрольная работа [91,1 K], добавлен 10.12.2013Аддитивная модель временного ряда. Мультипликативная модель временного ряда. Одномерный анализ Фурье. Регрессионная модель с переменной структурой. Сущность адаптивной сезонной модели Тейла – Вейджа. Прогнозирование естественного прироста населения.
курсовая работа [333,1 K], добавлен 19.07.2010