Анализ временных рядов на примере курса доллара

Графическое представление одномерного ряда. Проведение теста Дики-Фуллера для поиска единичных корней. График первых разностей значений курса доллара. Проверка дисперсии на постоянство в независимости от интервала. Анализ коррелограмы временного ряда.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 17.02.2014
Размер файла 543,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

Введение

В данной работе нам необходимо подобрать одномерный временной ряд и попробовать осуществить прогнозирование будущих значений выбранной нами экономической переменной с помощью подобранной нами модели: AR, MA, ARMA или ARIMA соответствующего порядка.

Для этой работы в качестве исходных данных одномерного временного ряда был взят курс доллара по отношению к рублю с ежедневной периодичностью (исключаю выходные дни) с 21 июня 2010 года по 14 мая 2011 года. В качестве значения курса доллара мы значения курса доллара по отношению к рублю на закрытие торговой сессии.

Создание модели значений котировок доллара по отношению к рублю является довольно актуальным, так как многие инвесторы и другие люди хотели бы быть способны предсказать значения котировки с целью повышения прибыльности своих предприятий и увеличения своего благосостояния.

Данные о курсе доллара относительно рубля были взяты с сайта инвестиционной компании «Финам».

Мы предполагаем, что данные курса доллара по отношению к рублю следующего дня зависят от значения курса доллара предыдущих дней. Поэтому, мы можем представить эти данные в виде временного ряда и проанализировать полученный одномерный временной ряд в данной работе, а также попробовать осуществить прогноз значений курса доллара.

1. Анализ временного ряда

Начнем работу с экспорта наших данных о курсе доллара в программный пакет Eviews 7: создадим рабочий файл и импортируем в него данные из файла Excel.

Условие сопоставимости в наших данных выполняется, так как это ежедневные данные (5-дневная неделя), все данные представлены в одинаковых единицах измерения.

Проанализируем имеющийся у нас временной ряд значений курса доллара относительно рубля. Для этого, во-первых, построим график временного ряда (line):

Рис. 1. График временного ряда

Как мы можем увидеть из графика, значения курса доллара не подвержены общему тренду в течение анализируемого нами периода (1 год) и не имеют ярко выраженную сезонность. Так как в данном ряде не присутствует ярко выраженная случайная составляющая, то мы можем сделать вывод, что большая часть данных изменяется закономерно, а не случайно. Поэтому мы можем предположить соблюдение предпосылки устойчивости данных временного ряда.

Также у нас выполняется условие достаточности, так как в наше исследование первоначально около 300 наблюдений, что, несомненно, в 7-10 раз выше числа, включенных в модель параметров.

По графику первоначального ряда мы можем с уверенностью сказать, что ряд не является стационарным, так как математическое ожидание и дисперсия значений временного ряда изменяются в зависимости от интервала.

Теперь определим статистические характеристики временного ряда. Для этого воспользуемся функцией Descriptive Statistics во вкладке view рабочего окна временного ряда. Построим гистограмму и определим статистики временного ряда:

Рис. 2. Гистограмма и статистики временного ряда

Как мы видим по графику, представленный временной ряд не имеет выбросов, поэтому удалять некоторые значения ряда нам не потребуется, так как значения курса доллара распределены вполне равномерно. Это гарантирует нам соблюдение условия однородности данных.

Статистики ряда: среднее значение курса доллара за рассматриваемый период составляло 30,5 руб. за доллар, при этом медианное значение составляет 30,63 руб. за доллар.

За рассматриваемый нами период максимальная стоимость доллара составляла 31,67 руб., а минимальная - 29,21 руб. за доллар. Стандартное отклонение курса доллара составляет 55 копеек. Коэффициент ассиметрии = -0,53, коэффициент эксцесса =2,75. Также представлена статистика Жарка-Бера, которая свидетельствует о нормальности распределения курса доллара во времени.

Проверим исследуемый нами временной ряд на стационарность. По представленному ранее в работе графику временного ряда мы можем предположить, что ряд не является стационарным, так как имеет место неслучайная составляющая.

Чтобы более точно проверить стационарность ряда, проведем тест Дики-Фуллера на наличие единичных корней. При выполнении теста выдвигается 2 гипотезы:

Н0: есть единичные корни

Н1: единичные корни отсутствуют.

2. Расчетная часть

Для осуществления теста воспользуемся программой Eviews 7. Проведем тест Дики-Фулера на нашем исходном ряде значений. Так как в нашем временном ряде не наблюдается тренд, проводим тест Дики-Фулера с константой и без тренда:

Таблица 1. Тест Дики-Фулера на исходном ряде

Null Hypothesis: DOLLAR has a unit root

Exogenous: Constant

Lag Length: 0 (Automatic - based on SIC, maxlag=10)

t-Statistic

Elliott-Rothenberg-Stock DF-GLS test statistic

-1.543769

Test critical values:

1 % level

-2.573886

5 % level

-1.942050

10 % level

-1.615885

*MacKinnon (1996)

DF-GLS Test Equation on GLS Detrended Residuals

Dependent Variable: D(GLSRESID)

Method: Least Squares

Date: 05/23/11 Time: 18:44

Sample (adjusted): 5/17/2010 5/13/2011

Included observations: 260 after adjustments

Variable

Coefficient

Std. Error

t-Statistic

Prob.

GLSRESID(-1)

-0.023485

0.015213

-1.543769

0.1239

R-squared

0.008291

Mean dependent var

-0.004287

Adjusted R-squared

0.008291

S.D. dependent var

0.148654

S.E. of regression

0.148037

Akaike info criterion

-0.978876

Sum squared resid

5.675939

Schwarz criterion

-0.965181

Log likelihood

128.2539

Hannan-Quinn criter.

-0.973371

Durbin-Watson stat

1.966466

На 5 % уровне значимости мы получаем значение Квыч=-1,94. При данной спецификации вспомогательной модель для теста Дики-Фулера и данном количестве наблюдений (около 250) критическое значение Ктаб=-2,88.

Получаем соотношение Квыч>Ктаб, следовательно, мы не отклоняем нулевую гипотезу о наличие единичных корней. Теперь проведем расширенный тест Дики-Фулера на этом же ряде значений курса доллара:

Таблица 2. Расширенный тест Дики-Фулера на исходном ряде

Null Hypothesis: DOLLAR has a unit root

Exogenous: Constant

Lag Length: 0 (Automatic - based on SIC, maxlag=10)

t-Statistic

Prob.*

Augmented Dickey-Fuller test statistic

-1.481607

0.5416

Test critical values:

1 % level

-3.455387

5 % level

-2.872455

10 % level

-2.572660

*MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation

Dependent Variable: D(DOLLAR)

Method: Least Squares

Date: 05/23/11 Time: 18:55

Sample (adjusted): 5/17/2010 5/13/2011

Included observations: 260 after adjustments

Variable

Coefficient

Std. Error

t-Statistic

Prob.

DOLLAR(-1)

-0.024850

0.016772

-1.481607

0.1397

C

0.755952

0.513200

1.473017

0.1420

R-squared

0.008437

Mean dependent var

-0.004287

Adjusted R-squared

0.004593

S.D. dependent var

0.148654

S.E. of regression

0.148312

Akaike info criterion

-0.971331

Sum squared resid

5.675103

Schwarz criterion

-0.943941

Log likelihood

128.2731

Hannan-Quinn criter.

-0.960320

F-statistic

2.195160

Durbin-Watson stat

1.964077

Prob(F-statistic)

0.139665

На 5 % уровне значимости Квыч=-2,87, в то время как Ктаб=-2,88. Так как Квыч>Ктаб, то мы не отклоняем гипотезу о наличии единичных корней в исходном временном ряде значений курса доллара. Теперь нам необходимо определить порядок единичного корня. Для этого мы опять проводим тест Дики-Фулера (обычный и расширенный), но уже в качестве переменной выступает не значение курса доллара, а разность значения курса доллара и его предыдущего значения:

Таблица 3. Тест Дики-Фулера для первых разностей

Null Hypothesis: D(DOLLAR) has a unit root

Exogenous: Constant

Lag Length: 2 (Automatic - based on SIC, maxlag=10)

t-Statistic

Elliott-Rothenberg-Stock DF-GLS test statistic

-6.610769

Test critical values:

1 % level

-2.573991

5 % level

-1.942064

10 % level

-1.615875

*MacKinnon (1996)

DF-GLS Test Equation on GLS Detrended Residuals

Dependent Variable: D(GLSRESID)

Method: Least Squares

Date: 05/23/11 Time: 19:04

Sample (adjusted): 5/20/2010 5/13/2011

Included observations: 257 after adjustments

Variable

Coefficient

Std. Error

t-Statistic

Prob.

GLSRESID(-1)

-0.608063

0.091981

-6.610769

0.0000

D(GLSRESID(-1))

-0.240467

0.080118

-3.001425

0.0030

D(GLSRESID(-2))

-0.205927

0.061592

-3.343421

0.0010

R-squared

0.437901

Mean dependent var

-0.000772

Adjusted R-squared

0.433475

S.D. dependent var

0.211239

S.E. of regression

0.158995

Akaike info criterion

-0.828287

Sum squared resid

6.420949

Schwarz criterion

-0.786858

Log likelihood

109.4349

Hannan-Quinn criter.

-0.811626

Durbin-Watson stat

2.036421

На 5 % уровне значимости Квыч=-1,94, а критическое значение статистики Ктаб=-2,88. Получается, что и при анализе первых разностей Квыч>Ктаб, то есть мы не отклоняем гипотезу о наличии единичных корней первого порядка. Проведем еще и расширенный тест Дики-Фулера:

Таблица 4. Расширенный тест Дики-Фулера для первых разностей

Null Hypothesis: D(DOLLAR) has a unit root

Exogenous: Constant

Lag Length: 0 (Automatic - based on SIC, maxlag=10)

t-Statistic

Prob.*

Augmented Dickey-Fuller test statistic

-16.02396

0.0000

Test critical values:

1 % level

-3.455486

5 % level

-2.872499

10 % level

-2.572684

*MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation

Dependent Variable: D(DOLLAR,2)

Method: Least Squares

Date: 05/23/11 Time: 19:11

Sample (adjusted): 5/18/2010 5/13/2011

Included observations: 259 after adjustments

Variable

Coefficient

Std. Error

t-Statistic

Prob.

D(DOLLAR(-1))

-0.999867

0.062398

-16.02396

0.0000

C

-0.004621

0.009270

-0.498511

0.6186

R-squared

0.499774

Mean dependent var

-0.000743

Adjusted R-squared

0.497827

S.D. dependent var

0.210449

S.E. of regression

0.149133

Akaike info criterion

-0.960268

Sum squared resid

5.715828

Schwarz criterion

-0.932802

Log likelihood

126.3547

Hannan-Quinn criter.

-0.949225

F-statistic

256.7673

Durbin-Watson stat

1.999113

Prob(F-statistic)

0.000000

На 5 % уровне значимости Квыч=-2,87, в то время как Ктаб=-2,88. Так как Квыч>Ктаб, то мы не отклоняем гипотезу о наличии единичных корней первого порядка. Это означает, что от стационарности мы, возможно, избавимся, если будем анализировать не ряд значений курса доллара, а ряд первых разностей. Но для начала проверим гипотезу о наличии единичных корней с помощью теста KPSS, где нулевая гипотеза соответствует гипотезе об отсутствии единичных корней. Мы будем принимать нулевую гипотезу (точнее не отклонять ее), если Кв<Ктаб.

Проверим исходный ряд на наличие единичных корней тестом KPSS:

Таблица 5. Тест KPSS для первоначального ряда

Null Hypothesis: DOLLAR is stationary

Exogenous: Constant

Bandwidth: 11 (Newey-West automatic) using Bartlett kernel

LM-Stat.

Kwiatkowski-Phillips-Schmidt-Shin test statistic

0.500975

Asymptotic critical values*:

1 % level

0.739000

5 % level

0.463000

10 % level

0.347000

*Kwiatkowski-Phillips-Schmidt-Shin (1992, Table 1)

Residual variance (no correction)

0.296780

HAC corrected variance (Bartlett kernel)

2.906294

На 5 % уровне значимости мы не можем принять нулевую гипотезу, потому что Квыч>Ктаб. Проверим наличие единичного корня на ряде первых разностей:

Таблица 6. Тест KPSS на ряде первых разностей

Null Hypothesis: D(DOLLAR) is stationary

Exogenous: Constant

Bandwidth: 0 (Newey-West automatic) using Bartlett kernel

LM-Stat.

Kwiatkowski-Phillips-Schmidt-Shin test statistic

0.117452

Asymptotic critical values*:

1 % level

0.739000

5 % level

0.463000

10 % level

0.347000

*Kwiatkowski-Phillips-Schmidt-Shin (1992, Table 1)

Residual variance (no correction)

0.017893

HAC corrected variance (Bartlett kernel)

0.017893

В данном случае при 5 % уровне значимости Квыч=0,117<0,46=Ктаб, поэтому, согласно результатам теста KPSS, мы делаем вывод об отсутствии единичных корней первого порядка в данной выборке. Поэтому, нам будет целесообразно использовать для последующего анализа ряд первых разностей значений курса доллара, который, вероятно, будет приближен к стационарному ряду.

Для этого создадим новую переменную:

Genr ddollar=dollar-dollar(-1).

Проверим полученный новый временной ряд на стационарность, используя графический метод:

Рис. 3. График первых разностей значений курса доллара

Как мы видим по графику, временному ряду первых разностей не присущ тренд. Поэтому мы можем сказать, что ряд приблизился к стационарному. Более того, согласно определению стационарности, ряд должен обладать постоянной дисперсией и математическим ожиданием на разных интервалах ряда. Вывод об этом мы сможем сделать по графику, однако для проверки точности наших предположений проведем тесты на проверку постоянства математического ожидания и дисперсии на различных интервалах временного ряда. Если наша гипотеза о постоянстве подтвердится, то мы сможем сделать вывод о том, что ряд первых разностей значений курса доллара относительно рубля является близким к стационарному ряду.

Проверим это с помощью статистического теста equality test by classification, где нулевой гипотезе соответствует гипотеза о постоянстве мат. Ожидания (или дисперсии). Нулевая гипотеза принимается, если значение probability>0,05. Сначала проверим на постоянство дисперсию:

Таблица 7. Проверка дисперсии на постоянство (в независимости от интервала)

Test for Equality of Variances of DDOLLAR

Categorized by values of DDOLLAR

Sample: 6/21/2010 5/13/2011

Included observations: 235

Method

df

Value

Probability

Bartlett

5

10.85387

0.0544

Levene

(5, 229)

3.504731

0.0045

Brown-Forsythe

(5, 229)

2.506961

0.0311

Category Statistics

Mean Abs.

Mean Abs.

DDOLLAR

Count

Std. Dev.

Mean Diff.

Median Diff.

[-0.6, -0.4)

2

0.007071

0.005000

0.005000

[-0.4, -0.2)

18

0.028198

0.023733

0.023733

[-0.2, 0)

96

0.050785

0.043951

0.043778

[0, 0.2)

106

0.053280

0.044919

0.043769

[0.2, 0.4)

12

0.050061

0.036389

0.035000

[0.4, 0.6)

1

NA

0.000000

0.000000

All

235

0.134049

0.041934

0.041274

Bartlett weighted standard deviation: 0.050509

Так как значение probability больше 0,05, то мы можем сделать вывод, что в данном временном ряде первых разностей дисперсия является одинаковой в независимости от начала отсчета.

Теперь проведем аналогичный тест для проверки постоянства среднего значения.

Таблица 8. Проверка среднего значения на постоянство (в независимости от интервала)

Test for Equality of Means of DDOLLAR

Categorized by values of DDOLLAR

Sample: 6/21/2010 5/13/2011

Included observations: 235

Method

df

Value

Probability

Anova F-test

(5, 229)

283.8360

0.0000

Analysis of Variance

Source of Variation

df

Sum of Sq.

Mean Sq.

Between

5

3.620585

0.724117

Within

229

0.584220

0.002551

Total

234

4.204805

0.017969

Category Statistics

Std. Err.

DDOLLAR

Count

Mean

Std. Dev.

of Mean

[-0.6, -0.4)

2

-0.425000

0.007071

0.005000

[-0.4, -0.2)

18

-0.254844

0.028198

0.006646

[-0.2, 0)

96

-0.078295

0.050785

0.005183

[0, 0.2)

106

0.061995

0.053280

0.005175

[0.2, 0.4)

12

0.278333

0.050061

0.014451

[0.4, 0.6)

1

0.440000

NA

NA

All

235

-0.011072

0.134049

0.008744

Согласно этому тесту мы не можем сделать вывод о постоянстве среднего значения временного ряда, однако мы можем предположить, что это вызвано произвольной разбивкой на интервалы. Попробуем сами разбить выборку на интервалы с помощью функции sample.

smpl 6/20/2010 11/14/2010:

Рис. 4. Описательные статистики 1-го интервала

smpl 11/14/2010 5/13/2011:

Рис. 5. Описательные статистики 2-го интервала

Мы разбили наш временной ряд на два интервала. Как видно из описательных статистик, среднее значение первого интервала = -0,01, а среднее значение второго интервала =-0,009, то есть приблизительно =-0,01. Следовательно, мы можем сделать вывод о постоянстве среднего значения временного ряда независимо от начала отсчета.

Аналогичные рассуждения можно провести относительно дисперсии (или среднего квадратичного отклонения, которое равно корню из дисперсии), чтобы убедиться в правильности принятой нами гипотезы. В первой выборке Sd=0,134, так же как и во второй выборке, где также Sd=0,134. Следовательно, дисперсии (как и среднее квадратичное отклонение) в данном временном ряде не зависит от начала отсчета. Поэтому мы сможем сделать вывод о том, что анализируемый нами временной ряд (первые разности значений курса доллара) является близким к стационарному ряду, и мы можем строить модель на основе анализа этого ряда, а также сможем прогнозировать по полученной нами далее модели.

Теперь нам необходимо определить вид нашей модели из предложенных AR, MA, ARMA. Для этого нам необходимо построить коррелограму временного ряда первых разностей курса доллара и по виду коррелограмы сделать вывод о виде модели:

Таблица 9. Коррелограма временного ряда

Так как наша коррелограма показывает, что и автокорреляционная функции, и частная автокорреляционная функция имеют убывающий и зубчатый характер (есть выпадения и у автокорреляционной функции и у частной автокорреляционной функции), то мы делаем вывод о том, что наша модель имеет вид ARMA (p,q). Теперь нам необходимо определить порядки p и q входящих в модель функций AR и MA. Порядок AR мы определяем по выпадениям автокорреляционной функции, а порядок MA - по частной автокорреляционной функции.

Так как в нашей ситуации ни одно из значений автокорреляционной функции и частной автокорреляционной функции не выпадает за границы 2±,то мы будем включать в модель наиболее близкие к границам порядки элементов AR и MA.

Руководствуясь такой логикой, мы включаем в модель элементы AR(2), AR(5), AR(7), AR(9), MA(1), MA(2), MA(5), MA(7), MA(9). При дальнейшем анализе мы исключим из модели незначимые элементы, но сначала включим все названные нами переменные.

Построим первую модель, включив в нее все выбранные нами элементы:

Ls ddollar c AR(2) AR(5) AR(7) AR(9) MA(1) MA(2) MA(5) MA(7) MA(9).

Таблица 10. Уравнение 1

Dependent Variable: DDOLLAR

Method: Least Squares

Date: 05/28/11 Time: 20:09

Sample: 6/21/2010 5/13/2011

Included observations: 235

Convergence achieved after 46 iterations

MA Backcast: 6/08/2010 6/18/2010

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-0.009121

0.008033

-1.135404

0.2574

AR(2)

0.257528

0.049813

5.169849

0.0000

AR(5)

0.104436

0.094752

1.102206

0.2715

AR(7)

0.080125

0.154924

0.517189

0.6055

AR(9)

-0.611538

0.106772

-5.727505

0.0000

MA(1)

0.032584

0.042713

0.762849

0.4464

MA(2)

-0.493647

0.047324

-10.43111

0.0000

MA(5)

-0.075704

0.108611

-0.697016

0.4865

MA(7)

0.081179

0.192078

0.422634

0.6730

MA(9)

0.606794

0.138645

4.376591

0.0000

R-squared

0.154856

Mean dependent var

-0.011072

Adjusted R-squared

0.121050

S.D. dependent var

0.134049

S.E. of regression

0.125674

Akaike info criterion

-1.268623

Sum squared resid

3.553665

Schwarz criterion

-1.121406

Log likelihood

159.0632

Hannan-Quinn criter.

-1.209272

F-statistic

4.580765

Durbin-Watson stat

1.918950

Prob(F-statistic)

0.000015

Inverted AR Roots

.92+.28i

.92-.28i

.49+.81i

.49-.81i

-.16+.91i

-.16-.91i

-.77-.58i

-.77+.58i

-.95

Inverted MA Roots

.95+.29i

.95-.29i

.47+.78i

.47-.78i

-.16+.87i

-.16-.87i

-.77-.57i

-.77+.57i

Как мы видим, многие из включенных нами в модель элементов являются незначимыми, так как значение probability>0,05. Это относится к элементам: AR(5), AR(7), MA(1), MA(5), MA(7). Однако, несмотря на это, модель в целом оказывается значима, так как коэффициент F-stat.<0,05. Данная модель будет работать 12,2 % случаев (коэффициент детерминации скорректированный=0,122).

Для повышения качества модели попробуем исключить из анализа некоторые незначимые элементы. Исключим из анализа AR(7):

Ls ddollar c AR(2) AR(5) AR(9) MA(1) MA(2) MA(5) MA(7) MA(9).

Таблица 11. Уравнение 2

Dependent Variable: DDOLLAR

Method: Least Squares

Date: 05/28/11 Time: 21:06

Sample: 6/21/2010 5/13/2011

Included observations: 235

Convergence achieved after 28 iterations

MA Backcast: 6/08/2010 6/18/2010

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-0.008024

0.008129

-0.987132

0.3246

AR(2)

0.226210

0.032208

7.023467

0.0000

AR(5)

0.241278

0.034234

7.047976

0.0000

AR(9)

-0.661015

0.033977

-19.45465

0.0000

MA(1)

0.032839

0.016312

2.013128

0.0453

MA(2)

-0.390025

0.026808

-14.54864

0.0000

MA(5)

-0.254471

0.035176

-7.234275

0.0000

MA(7)

0.168498

0.051493

3.272246

0.0012

MA(9)

0.648206

0.042273

15.33382

0.0000

R-squared

0.161100

Mean dependent var

-0.011072

Adjusted R-squared

0.131405

S.D. dependent var

0.134049

S.E. of regression

0.124932

Akaike info criterion

-1.284549

Sum squared resid

3.527410

Schwarz criterion

-1.152054

Log likelihood

159.9345

Hannan-Quinn criter.

-1.231133

F-statistic

5.425056

Durbin-Watson stat

1.918610

Prob(F-statistic)

0.000003

Inverted AR Roots

.93+.28i

.93-.28i

.48+.83i

.48-.83i

-.15-.90i

-.15+.90i

-.78+.60i

-.78-.60i

Inverted MA Roots

.95-.29i

.95+.29i

.45+.82i

.45-.82i

-.14+.86i

-.14-.86i

-.79-.61i

-.79+.61i

Как мы видим, это положительно сказалось на качестве модели. Скорректированный коэффициент детерминации вырос, то есть эта модель работает в 13,2 % случаев, а значительных изменений в значении показателей Акайке, Шварц и Хан-Квин не произошло. Однако, попробуем усовершенствовать модель, руководствуясь «принципом экономии».

Проверим остатки данной модели на соответствие белому шуму, а также проанализируем коррелограму остатков, так как это может нам помочь в определении важных для включения и прогнозирования элементов регрессии.

Для начала создадим переменную остатков регрессии 2:

Genr resid02=ddollar-ddollarf.

Проверим, выполняется ли равенство среднего значения остатков нулю и постоянна ли дисперсия. Для этого построим график остатков и для начала определим это графически.

Рис. 6. График остатков уравнения 2

По графику мы можем сказать, что среднее значение ошибки приблизительно равно 0. Также мы сможем сделать вывод о приблизительном постоянстве дисперсии. Для более точных результатов воспользуемся функцией «описательные статистики»:

Рис. 7. Описательные статистики остатков уравнения 2

Как мы видим, среднее значение ошибки действительно близко к нулю, так как равно = -0,01. Поэтому гипотеза о равенстве среднего нулю подтверждается.

Проверку гипотезы о постоянстве дисперсии мы осуществим с помощью тесте White на гетероскедастичность. В этом тесте нулевая гипотеза соответствует гипотезе о гомоскедастичности (постоянстве дисперсии). Мы принимаем нулевую гипотезу в случае, если значение probability>0,05.:

Таблица 12. Тест Уайта

Heteroskedasticity Test: White

F-statistic

1.189434

Prob. F(54,180)

0.2004

Obs*R-squared

61.80219

Prob. Chi-Square(54)

0.2174

Scaled explained SS

93.32930

Prob. Chi-Square(54)

0.0007

Мы видим, что probability(F-stat)=0,2>0,05, поэтому мы принимаем гипотезу о гомоскедастичности, то есть о постоянстве дисперсии остатков регрессии номер 2.

Теперь построим коррелограму остатков:

Таблица 13. Коррелограма остатков уравнения

Значения частной автокорреляционной функции должны подчиняться нормальному закону распределения со средним значением 0 и дисперсией 1/N, где N-количество значений автокорреляционной функции. Проверим, выполняется ли это для остатков нашего уравнения номер 2.

Рис. 8. Описательные статистики частной автокорреляционной функции ошибок

Как мы видим, среднее значение автокорреляционной функции ошибок уравнения 1 приблизительно равно 0. Значение среднеквадратичного отклонения =0,046, то есть дисперсия значений автокорреляционной =0,002. Получается, что дисперсия не равна 1/200, поэтому выполняются не все условия соответствия остатков регрессии белому шуму.

Судя по графику, распределение значений частной автокорреляционной функции близко к нормальному, однако, судя по значению коэффициента ассиметрии, распределение смещено влево, а, согласно коэффициенту эксцесса, распределение является островершинным.

Также для проверки соответствия ошибок регрессии белому шуму, нам необходимо проверить на нормальность распределение ошибки. Условием этого является значения автокорреляционной функции, не выходящие за границы 2±, а также подтверждения нулевой гипотезы Q-stat, которая заключается в отсутствии автокорреляции. Это условие выполняется при значении probability>0,1.

Проверим эти условия по коррелограме ошибок уравнения 2 (см. таблица 13).

Как мы видим из коррелограмы, эти условия выполняются, поэтому мы можем сделать вывод о нормальности распределения ошибок уравнения регрессии 2.

Таким образом, остатки этого уравнения близки к белому шуму, поэтому мы можем использовать полученную модель (уравнение 2) для прогнозирования разницы значений (то есть абсолютного прироста) значений курса доллара по отношению к рублю. Однако, эта модель будет работать лишь в 13,2 % случаев. Попробуем улучшить качество модели, экспериментируя с включенными в модель параметрами разных порядков AR и MA.

Попробуем включить в модель параметр AR(10), так как значение автокорреляционной функции на этом лаге приближается к границе, а также исключим незначимые параметры (константа, MA(1)):

Ls ddollar AR(2) AR(5) AR(9) MA(2) MA(5) MA(7) MA(9) AR(10).

Таблица 14. Уравнение 3

Dependent Variable: DDOLLAR

Method: Least Squares

Date: 05/29/11 Time: 01:22

Sample: 6/21/2010 5/13/2011

Included observations: 235

Convergence achieved after 25 iterations

MA Backcast: 6/08/2010 6/18/2010

Variable

Coefficient

Std. Error

t-Statistic

Prob.

AR(2)

0.191249

0.035626

5.368269

0.0000

AR(5)

0.196079

0.041703

4.701752

0.0000

AR(9)

-0.653089

0.036135

-18.07380

0.0000

AR(10)

0.048552

0.035826

1.355227

0.1767

MA(2)

-0.323387

0.031589

-10.23747

0.0000

MA(5)

-0.254608

0.036202

-7.032948

0.0000

MA(7)

0.186527

0.050224

3.713921

0.0003

MA(9)

0.657807

0.042662

15.41915

0.0000

R-squared

0.160236

Mean dependent var

-0.011072

Adjusted R-squared

0.134340

S.D. dependent var

0.134049

S.E. of regression

0.124721

Akaike info criterion

-1.292029

Sum squared resid

3.531045

Schwarz criterion

-1.174256

Log likelihood

159.8135

Hannan-Quinn criter.

-1.244549

Durbin-Watson stat

1.874474

Inverted AR Roots

.91-.29i

.91+.29i

.47-.83i

.47+.83i

.07

-.16-.90i

-.16+.90i

-.78+.61i

-.78-.61i

-.96

Inverted MA Roots

.95-.30i

.95+.30i

.45+.83i

.45-.83i

-.13+.86i

-.13-.86i

-.78-.62i

-.78+.62i

-.99

Как мы видим, в модели все параметры являются значимыми, за исключением AR(10), значение probability=0.1. Однако при включении этого параметра в анализ общее качество модели возросло. Об этом свидетельствует скорректированный коэффициент детерминации, который показывает, что теперь модель работает в 13,5% случаев. Также мы видим, что значения критериев Akaike, Shwarz, Hannan-Quinn уменьшились, что также свидетельствует об улучшенном качестве последней модели (уравнение 3).

Качественная модель предполагает, что остатки регрессии будут иметь вид белого шума, поэтому проверим остатки регрессии 3 на предмет соответствия нашему предположению:

Для начала создадим переменную остатков регрессии 3:

Genr resid03=ddollar-ddollarf3.

Проверим, выполняется ли равенство среднего значения остатков нулю и постоянна ли дисперсия. Для этого построим график остатков и для начала определим это графически:

Рис. 9. График остатков уравнения 3

По графику мы можем сказать, что среднее значение ошибки приблизительно равно 0. Также мы сможем сделать вывод о приблизительном постоянстве дисперсии, но для более точных результатов нам необходимо воспользоваться функцией «описательные статистики», провести equality test by classification (для дисперсии) и проверить также постоянство дисперсии с помощью теста Уайта:

Рис. 10. Описательные статистики остатков уравнения 3

Как мы видим, среднее значение ошибки действительно близко к нулю, так как равно = -0,009. Поэтому гипотеза о равенстве среднего нулю подтверждается.

Теперь проведем equality test by classification (для дисперсии):

Таблица 14. Проверка дисперсии остатков регрессии 3 на независимость от времени

Test for Equality of Variances of RESID03

Categorized by values of RESID03

Date: 05/29/11 Time: 12:59

Sample: 6/21/2010 5/13/2011

Included observations: 235

Method

df

Value

Probability

Bartlett

5

10.76499

0.0562

Levene

(5, 229)

2.722076

0.0207

Brown-Forsythe

(5, 229)

1.981415

0.0823

Category Statistics

Mean Abs.

Mean Abs.

RESID03

Count

Std. Dev.

Mean Diff.

Median Diff.

[-0.6, -0.4)

2

0.013760

0.009730

0.009730

[-0.4, -0.2)

16

0.025352

0.021709

0.021474

[-0.2, 0)

104

0.052589

0.043538

0.042807

[0, 0.2)

101

0.051866

0.043014

0.041672

[0.2, 0.4)

11

0.050301

0.037477

0.035287

[0.4, 0.6)

1

NA

0.000000

0.000000

All

235

0.128347

0.041070

0.040051

Bartlett weighted standard deviation: 0.050715

Так как значение probability>0,05, то мы делаем вывод о том, что дисперсия остатков регрессии 3 действительно не зависит от точки отсчета, то есть о времени.

Также, для более точных результатов, проверку гипотезы о постоянстве дисперсии мы осуществим с помощью теста White на гетероскедастичность. В этом тесте нулевая гипотеза соответствует гипотезе о гомоскедастичности (постоянстве дисперсии). Мы принимаем нулевую гипотезу в случае, если значение probability>0,05.:

Таблица 15. Тест Уайта

Heteroskedasticity Test: White

F-statistic

1.134617

Prob. F(36,198)

0.2885

Obs*R-squared

40.18847

Prob. Chi-Square(36)

0.2899

Scaled explained SS

59.71830

Prob. Chi-Square(36)

0.0078

Мы видим, что probability(F-stat)=0,2885>0,05, поэтому мы принимаем гипотезу о гомоскедастичности, то есть о постоянстве дисперсии остатков регрессии номер 3.

Теперь построим коррелограму остатков:

Таблица 16. Коррелограма остатков уравнения 3

Значения частной автокорреляционной функции должны подчиняться нормальному закону распределения со средним значением 0 и дисперсией 1/N, где N-количество значений автокорреляционной функции. Проверим, выполняется ли это для остатков нашего уравнения номер 3.

Рис. 11. Описательные статистики частной автокорреляционной функции ошибок

Как мы видим, среднее значение автокорреляционной функции ошибок уравнения 3 приблизительно равно 0. Значение среднеквадра...


Подобные документы

  • Анализ изменения курса доллара и проведение аналитического выравнивания. Вычисление точечного прогресса на начало 2018 года с помощью уравнения динамического ряда. Расчет среднеквадратического отклонения от тренда для определения интервального прогноза.

    задача [85,6 K], добавлен 15.04.2014

  • Составление модели для прогнозирования курса доллара. Создание оптимально работающей нейросети для прогнозирования курсов доллара. Использование метода скользящих окон. Определение количества нейронов на внутреннем слое, выполнение обучения сети.

    презентация [78,1 K], добавлен 14.08.2013

  • Теория и анализ временных рядов. Построение линии тренда и прогнозирование развития случайного процесса на основе временного ряда. Сглаживание временного ряда, задача выделения тренда, определение вида тенденции. Выделение тригонометрической составляющей.

    курсовая работа [722,6 K], добавлен 09.07.2019

  • Анализ временных рядов с помощью статистического пакета "Minitab". Механизм изменения уровней ряда. Trend Analysis – анализ линии тренда с аппроксимирующими кривыми (линейная, квадратическая, экспоненциальная, логистическая). Декомпозиция временного ряда.

    методичка [1,2 M], добавлен 21.01.2011

  • Основные элементы эконометрического анализа временных рядов. Задачи анализа и их первоначальная обработка. Решение задач кратко- и среднесрочного прогноза значений временного ряда. Методы нахождения параметров уравнения тренда. Метод наименьших квадратов.

    контрольная работа [37,6 K], добавлен 03.06.2009

  • Анализ упорядоченных данных, полученных последовательно (во времени). Модели компонентов детерминированной составляющей временного ряда. Свободные от закона распределения критерии проверки ряда на случайность. Теоретический анализ системы линейного вида.

    учебное пособие [459,3 K], добавлен 19.03.2011

  • Временные ряды и их характеристики. Факторы, влияющие на значения временного ряда. Тренд и сезонные составляющие. Декомпозиция временных рядов. Метод экспоненциального сглаживания. Построение регрессионной модели. Числовые характеристики переменных.

    контрольная работа [1,6 M], добавлен 18.06.2012

  • Теоретические выкладки в области теории хаоса. Методы, которые используются в математике, для прогнозирования стохастических рядов. Анализ финансовых рядов и рядов Twitter, связь между сентиметными графиками и поведением временного финансового ряда.

    курсовая работа [388,9 K], добавлен 01.07.2017

  • Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.

    контрольная работа [298,2 K], добавлен 19.01.2011

  • Графическое решение и оптимальный план задачи линейного программирования. Свойства двойственных оценок и теорем двойственности. Адаптивная модель Брауна. Свойства независимости остаточной компоненты, соответствия нормальному закону распределения.

    контрольная работа [556,2 K], добавлен 17.02.2010

  • Статистические методы анализа одномерных временных рядов, решение задач по анализу и прогнозированию, построение графика исследуемого показателя. Критерии выявления компонент рядов, проверка гипотезы о случайности ряда и значения стандартных ошибок.

    контрольная работа [325,2 K], добавлен 13.08.2010

  • Сглаживание с помощью метода скользящей средней. Анализ исходного ряда на наличие стационарности. Тест Дики-Фуллера. Выделение сезонной компоненты в аддитивной и мультипликативной модели. Составление уравнения тренда в виде полинома пятой степени.

    лабораторная работа [2,6 M], добавлен 17.02.2014

  • Изучение понятия имитационного моделирования. Имитационная модель временного ряда. Анализ показателей динамики развития экономических процессов. Аномальные уровни ряда. Автокорреляция и временной лаг. Оценка адекватности и точности трендовых моделей.

    курсовая работа [148,3 K], добавлен 26.12.2014

  • Использование статистических характеристик для анализа ряда распределения. Частотные характеристики ряда распределения. Показатели дифференциации, абсолютные характеристики вариации. Расчет дисперсии способом моментов. Теоретические кривые распределения.

    курсовая работа [151,4 K], добавлен 11.09.2010

  • Изучение особенностей стационарных временных рядов и их применения. Параметрические тесты стационарности. Тестирование математического ожидания, дисперсии и коэффициентов автокорреляции. Проведение тестов Манна-Уитни, Сиджела-Тьюки, Вальда-Вольфовитца.

    курсовая работа [451,7 K], добавлен 06.12.2014

  • Автокорреляционная функция временного ряда темпов роста производства древесноволокнистых плит в Российской Федерации. Расчет значений сезонной компоненты в аддитивной модели и коэффициента автокорреляции третьего порядка по логарифмам уровней ряда.

    контрольная работа [300,6 K], добавлен 15.11.2014

  • Определение и роль валютного курса. Конъюнктурные и структурные факторы, влияющие на его изменение. Понятие инфляции и ее темпы. Исследование изменения курса валют и инфляции с помощью графиков ряда динамики и трендов и уравнения множественной регрессии.

    курсовая работа [927,8 K], добавлен 12.05.2015

  • Решение задачи изучения изменения анализируемых показателей во времени при помощи построения и анализа рядов динамики. Элементы ряда динамики: уровни динамического ряда и период времени, за который они представлены. Понятие переменной и постоянной базы.

    методичка [43,0 K], добавлен 15.11.2010

  • Построение интервального вариационного ряда распределения предприятий по объему реализации. Графическое изображение ряда (гистограмма, кумулята, огива). Расчет средней арифметической; моды и медианы; коэффициента асимметрии; показателей вариации.

    контрольная работа [91,1 K], добавлен 10.12.2013

  • Аддитивная модель временного ряда. Мультипликативная модель временного ряда. Одномерный анализ Фурье. Регрессионная модель с переменной структурой. Сущность адаптивной сезонной модели Тейла – Вейджа. Прогнозирование естественного прироста населения.

    курсовая работа [333,1 K], добавлен 19.07.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.