Многофакторный анализ. Временные ряды
Матрица парных линейных коэффициентов корреляции. Расчетные критерии Стьюдента. Расчет параметров уравнения линейной регрессии. Множественный коэффициент детерминации. Определение аномальных значений временного ряда. Сглаживание временных рядов.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 22.02.2013 |
Размер файла | 756,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
ПРИЛОЖЕНИЕ А. МНОГОФАКТОРНЫЙ АНАЛИЗ
Целью данной работы является проведение многофакторного анализа и построение уравнения зависимости состояния углерода (С) от параметров температуры (TEPLOTAFE), содержания кремния(SI), серы(S) и марганца(MN).
Используя табличный процессор Microsoft Office Excel и последовательность расчетов, постоим и выберем аналитическую форму уравнения регрессии по данным, приведенным в таблице 1.
Таблица 1 - Исходные данные
№ |
TEPLOTAFE(0C) |
SI(%) |
MN(%) |
S(%) |
C(%) |
|
1 |
1423 |
0,38 |
0,40 |
0,024 |
4,91 |
|
2 |
1410 |
0,44 |
0,52 |
0,029 |
4,84 |
|
3 |
1449 |
0,94 |
0,49 |
0,021 |
4,87 |
|
4 |
1416 |
0,73 |
0,40 |
0,023 |
4,87 |
|
5 |
1401 |
0,68 |
0,39 |
0,021 |
4,80 |
|
6 |
1425 |
0,65 |
0,41 |
0,020 |
4,99 |
|
7 |
1431 |
0,89 |
0,52 |
0,013 |
4,85 |
|
8 |
1422 |
0,38 |
0,42 |
0,013 |
4,94 |
|
9 |
1425 |
0,61 |
0,51 |
0,009 |
4,96 |
|
10 |
1453 |
0,70 |
0,51 |
0,012 |
4,94 |
|
11 |
1451 |
0,91 |
0,56 |
0,005 |
4,90 |
|
12 |
1467 |
0,83 |
0,58 |
0,007 |
4,96 |
|
13 |
1460 |
0,66 |
0,52 |
0,010 |
4,97 |
|
14 |
1432 |
0,53 |
0,48 |
0,016 |
5,01 |
|
15 |
1438 |
0,84 |
0,55 |
0,011 |
4,96 |
|
16 |
1449 |
0,68 |
0,50 |
0,015 |
4,97 |
|
17 |
1435 |
0,79 |
0,49 |
0,014 |
4,92 |
|
18 |
1398 |
0,34 |
0,35 |
0,035 |
4,78 |
|
19 |
1411 |
0,73 |
0,43 |
0,021 |
4,76 |
|
20 |
1417 |
0,52 |
0,36 |
0,028 |
4,75 |
|
21 |
1411 |
0,88 |
0,43 |
0,020 |
4,72 |
|
22 |
1407 |
0,70 |
0,37 |
0,033 |
4,72 |
|
23 |
1411 |
0,80 |
0,40 |
0,028 |
4,71 |
|
24 |
1420 |
0,61 |
0,39 |
0,025 |
4,87 |
|
25 |
1416 |
0,51 |
0,40 |
0,023 |
4,88 |
|
26 |
1421 |
0,53 |
0,40 |
0,024 |
4,96 |
|
27 |
1428 |
0,65 |
0,36 |
0,024 |
4,87 |
|
28 |
1420 |
0,47 |
0,34 |
0,030 |
4,91 |
|
29 |
1424 |
0,45 |
0,31 |
0,035 |
4,76 |
|
30 |
1407 |
0,40 |
0,33 |
0,035 |
4,74 |
|
31 |
1425 |
0,53 |
0,38 |
0,022 |
4,88 |
|
32 |
1444 |
0,74 |
0,44 |
0,017 |
4,94 |
|
33 |
1425 |
0,56 |
0,45 |
0,022 |
4,89 |
|
34 |
1421 |
0,62 |
0,56 |
0,015 |
4,95 |
|
35 |
1441 |
0,60 |
0,47 |
0,011 |
5,01 |
|
36 |
1438 |
0,55 |
0,48 |
0,009 |
5,02 |
|
37 |
1444 |
0,67 |
0,52 |
0,012 |
5,02 |
|
38 |
1459 |
1,09 |
0,57 |
0,008 |
4,99 |
|
39 |
1416 |
0,86 |
0,55 |
0,006 |
4,81 |
|
40 |
1406 |
0,66 |
0,62 |
0,009 |
4,88 |
|
41 |
1428 |
0,81 |
0,47 |
0,011 |
4,94 |
|
42 |
1439 |
0,61 |
0,44 |
0,015 |
4,96 |
|
43 |
1447 |
0,98 |
0,50 |
0,009 |
4,95 |
|
44 |
1445 |
0,84 |
0,51 |
0,010 |
4,94 |
|
45 |
1431 |
0,65 |
0,40 |
0,018 |
4,97 |
|
46 |
1421 |
0,59 |
0,40 |
0,022 |
4,94 |
|
47 |
1425 |
0,64 |
0,40 |
0,017 |
4,96 |
|
48 |
1432 |
0,71 |
0,52 |
0,014 |
4,96 |
|
49 |
1430 |
0,60 |
0,49 |
0,018 |
4,98 |
|
50 |
1436 |
0,79 |
0,45 |
0,015 |
4,96 |
1. Корреляционный анализ
Для количественной оценки связи зависимости исследуемого параметра от нескольких критериев строим и проанализируем матрицу парных линейных коэффициентов корреляции.
Проведение корреляционного анализа воспользуемся помощью Microsoft Office Excel , пакета анализа, Корреляция. (Таблица 2).
Таблица 2 - Матрица парных линейных коэффициентов корреляции.
TEPLOTAFE |
SI |
MN |
S |
||
TEPLOTAFE |
1 |
||||
SI |
0,49 |
1 |
|||
MN |
0,54 |
0,56 |
1 |
||
S |
-0,65 |
-0,58 |
-0,83 |
1 |
|
C |
0,66 |
0,09 |
0,46 |
-0,64 |
Анализируя матрицу парных линейных коэффициентов корреляции rху принимается во внимание:
1. Знак коэффициента парной корреляции, который указывает на характер взаимосвязи величин. «+» - означает, что зависимость прямая между зависимым параметром C и всеми факторными признаками, кроме серы у нее знак «-» означает обратную связь.
2. Величина коэффициента парной корреляции.
Для оценки тесноты связи сравнивали значение парного коэффициента между углеродом и всеми независимыми признаками и определили заметную связь углерода с серой и температурой, умеренную связь с марганцем и слабую с кремнием.
3. Значимость (существенность) линейного коэффициента корреляции. Интерпретируя значение коэффициента корреляции, следует иметь в виду, что он рассчитан для ограниченного числа наблюдений и подвержен случайным колебаниям, т.е. как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями. Поэтому на основе t-критерия Стьюдента оценивают существенность (значимость) самого rху и, соответственно реальность измеряемой связи между C и TEPLOTAFE, SI, MN, S.
Для этих целей строят и анализируют матрицу расчетных значений t-критерия Стьюдента. (Таблица 3).
Таблица 3 - Расчетные критерии Стьюдента
TEPLOTAFE |
SI |
MN |
S |
C |
||
TEPLOTAFE |
1 |
|||||
SI |
1,95 |
1 |
||||
MN |
2,21 |
2,33 |
1 |
|||
S |
2,99 |
2,45 |
5,10 |
1 |
||
C |
3,04 |
0,30 |
1,81 |
2,91 |
1 |
Если tрасч > tтабл, то нулевая гипотеза отвергается и линейный коэффициент считается значимым, а связь между х и у - существенной.
Расчетные значения критерия Стьюдента углерода с температурой кремнием марганцем серой равны соответственно 3,04; 0,30; 1,81, 2,91, а табличное значение равно 2,01.
По критерию Стьюдента коэффициенты корреляции TEPLOTAFE, S являются значимыми, а коэффициент корреляции между SI, MN и C является не значимым.
Наличие мультиколлинеарности между факторными признаками является превышение величины парного коэффициента корреляции 0,8 в данном случае мультиколлинеарные факторы отсутствуют.
После проверки на существенность и значимость из выборки исключили SI и по критерию силы связи и существенности связи между C обозначим за Y и коэффициентами оставляем x1 - TEPLOTAFE, x4 - S .
Поэтому выше перечисленные признаки могут быть включены в модель.
2. Расчет параметров уравнения линейной регрессии
Построение регрессионной модели осуществлялось с помощью Microsoft Office Excel , пакета анализа, Регрессия, результаты приведены в таблицах. (см. таблицы. 4 - 8)
Таблица 4 - Регрессионная статистика
Регрессионная статистика |
||
Множественный R |
0,73 |
|
R-квадрат |
0,53 |
|
Нормированный R-квадрат |
0,50 |
|
Стандартная ошибка |
0,06 |
|
Наблюдения |
50 |
Эти результаты соответствуют следующим статистическим показателям:
Множественный R -- множественный коэффициент корреляции R;
R-квадрат - множественный коэффициент детерминации R2;
Стандартная ошибка -- остаточное стандартное отклонение
Наблюдения -- число наблюдений n.
Таблица 5 - Дисперсионный анализ
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
3,00 |
0,19 |
0,06 |
17,19 |
0,0000001 |
|
Остаток |
46,00 |
0,17 |
0,00 |
|||
Итого |
49,00 |
0,37 |
Столбцы таблицы 5 имеют следующую интерпретацию:
1. Столбец df -- число степеней свободы.
Для строки Регрессия число степеней свободы определяется количеством факторных признаков m в уравнении регрессии kФ= m.
Для строки Остаток число степеней свободы определяется числом наблюдений n и количеством переменных в уравнении регрессии m + 1: kО = n - (m+1).
Для строки Итого число степеней свободы определяется суммой kY = kФ + kО.
2. Столбец SS -- сумма квадратов отклонений.
Для строки Регрессия -- это сумма квадратов отклонений теоретических данных от среднего.
Для строки Остаток -- это сумма квадратов отклонений эмпирических данных от теоретически.
3. Столбец МS -- дисперсии.
4. Столбец F -- расчетное значение F - критерия Фишера Fp.
5. Столбец Значимость F -- значение уровня значимости, соответствующее вычисленному значению Fр.
Таблица 6 - Значение коэффициентов регрессии
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
1,90 |
1,06 |
1,79 |
0,08 |
-0,23 |
4,03 |
-0,23 |
4,03 |
|
TEPLOTAFE |
0,00 |
0,00 |
3,11 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
|
MN |
-0,25 |
0,21 |
-1,18 |
0,24 |
-0,68 |
0,18 |
-0,68 |
0,18 |
|
S |
-5,88 |
2,16 |
-2,73 |
0,01 |
-10,22 |
-1,55 |
-10,22 |
-1,55 |
Столбцы таблицы 6 имеют следующую интерпретацию:
Коэффициенты -- значения коэффициентов аi.
Стандартная ошибка -- стандартные ошибки коэффициентов аi.
t-статистика -- расчетные значения t-критерия
Перейдем к анализу сгенерированных таблиц.
Рассчитанные в таблице 6 коэффициенты регрессии аi позволяют построить уравнение, выражающее зависимость
Y= 1,9 + 0,002*X1 - 0,25* X3 -5,88*Х4 Для измерения степени совокупного влияния отобранных факторов на результативный признак рассмотрим совокупный коэффициент детерминации R2 и совокупный коэффициент множественной корреляции R - общие показатели тесноты связи многих признаков.
Значение множественного коэффициента детерминации R2 = 0,53 (Таблица 4) показывает, что 53 % общей вариации результативного признака объясняется вариацией факторных признаков X1 Х3 , Х4 . Значит, выбранные факторы существенно влияют на Y, что подтверждает правильность их включения в построенную модель.
Рассчитанный уровень значимости р = 0,0000001 < 0,05 (показатель Значимость F в таблице 5) подтверждает значимость R2, и следовательно свидетельствует о существенности связи между рассматриваемыми признаками.
Другой подход к проверке значимости R2 основан на сравнении расчетного и критического значения F - критерия. В генерируемых таблицах режима не приводится значение F кр, но его можно легко вычислить с помощью функции FРАСПОБР. Для рассматриваемого примера Fкр =2,8,
Так как Fрасч =17,19 (показатель F в таблице 5) больше Fкр =2,8, то гипотеза H0: R2 = 0 отвергается, т. е. коэффициент детерминации R2 является значимым.
Следующим этапом является проверка значимости коэффициентов регрессии: а0, а1 , a4 и а3. Сравнивая попарно эти элементы со стандартными ошибками, видим, что абсолютное значение коэффициента а1 является больше своей стандартной ошибки. Так же он является значимым, это можно проверить по значениям показателя Р- значение (см. Таблица 6), которые меньше заданного уровня значимости = 0,05, остальные же коэффициенты не значимы.
Другой способ проверки значимости коэффициентов осуществляется с помощью сравнения расчетного и критического значений t-критерия Стьюдента. Значение tкр=2,01,
Так как таких коэффициентов, как TEPLOTAFE и свободный член (см. таблица 6) превышает tкрл (теоретическое) значение t-критерия Стьюдента, то коэффициенты регрессии в уравнении являются значимыми, а значение коэффициентов критериев SI и MN меньше tкрл (теоретическое) значение t-критерия Стьюдента, то коэффициенты регрессии в уравнении являются не значимыми.
По аналогии, проанализировав таблицы и проверив коэффициенты на значимость путем сравнения значений коэффициентов Стьюдента расчетного с теоретическим, получили, что свободный коэффициент не значимым.
В случае статистической не значимости свободного члена а0 для пересчета уравнения регрессии в диалоговом окне Регрессия задаются те же самые параметры, за исключением лишь того, что следует активизировать флажок Константа-ноль. На данном этапе был выполнен шаг 2.
Полученные данные показаны в таблицах 7-9.
Таблица 7 - Регрессионная статистика
Регрессионная статистика |
||
Множественный R |
1,00 |
|
R-квадрат |
1,00 |
|
Нормированный R-квадрат |
0,98 |
|
Стандартная ошибка |
0,06 |
|
Наблюдения |
50 |
Таблица 8 - Дисперсионный анализ
df |
SS |
MS |
F |
|||
Регрессия |
1,00 |
1201,05 |
1201,05 |
284428,04 |
0,00 |
|
Остаток |
49,00 |
0,21 |
0,00 |
|||
Итого |
50,00 |
1201,26 |
||||
Fтабл = |
4,03 |
Таблица 9 - Значение коэффициентов регрессии
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
0 |
#Н/Д |
#Н/Д |
#Н/Д |
#Н/Д |
#Н/Д |
#Н/Д |
#Н/Д |
|
TEPLOTAFE |
0,003 |
0,00001 |
533,318 |
0,000 |
0,003 |
0,003 |
0,003 |
0,003 |
Полученное уравнение удовлетворяет всем критериям значимости и существенности, следовательно, модель признана адекватной.
Для принятия решения о выборе уравнения сведем полученные характеристики в таблицу 10.
Таблица 10 - Пошаговая регрессия
Шаг |
Модель |
Параметры модели |
t-критерий Стьюдента |
F-критерий Фишера |
Стандартная ошибкаапроксимации |
Коэффициент детерминации |
|||||
расчетное |
критическое |
результаты сравнения |
расчетное |
критическое |
результаты сравнения |
||||||
1 |
Y= 1,9 + 0,002*X1 - 0,25* X3 -5,88*Х4 |
a0 |
1,79 |
2,01 |
незначим |
17,19 |
2,81 |
значим |
0,73 |
0,53 |
|
a1 |
3,11 |
значим |
|||||||||
a3 |
-1,18 |
незначим |
|||||||||
a4 |
-2,73 |
незначим |
|||||||||
3 |
Y=0,003*X1 |
a1 |
461,8 |
2,01 |
значим |
284428 |
4,04 |
значим |
1 |
1 |
Вывод: Проделав многофакторный анализ данных, мы видим из таблицы 10, что искомое значимое уравнение регрессии Y=0,003*X1, содержащее значимые параметры было получено на втором шаге.
Этот выбор подтверждается увеличением множественного коэффициента детерминации.
ПРИЛОЖЕНИЕ Б. ВРЕМЕННЫЕ РЯДЫ
Целью данной работы является описание особенностей ряда и подбор статистической модели, которая описывает временной ряд.
В таблице 1 представлен исходный временной ряд.
Таблица 1 - Исходный временной ряд
t(с) |
SI(%) |
t(с) |
SI(%) |
t(с) |
SI(%) |
t(с) |
SI(%) |
t(с) |
SI(%) |
|
1 |
0,38 |
11 |
0,91 |
21 |
0,88 |
31 |
0,53 |
41 |
0,81 |
|
2 |
0,44 |
12 |
0,83 |
22 |
0,70 |
32 |
0,74 |
42 |
0,61 |
|
3 |
0,94 |
13 |
0,66 |
23 |
0,80 |
33 |
0,56 |
43 |
0,98 |
|
4 |
0,73 |
14 |
0,53 |
24 |
0,61 |
34 |
0,62 |
44 |
0,84 |
|
5 |
0,68 |
15 |
0,84 |
25 |
0,51 |
35 |
0,60 |
45 |
0,65 |
|
6 |
0,65 |
16 |
0,68 |
26 |
0,53 |
36 |
0,55 |
46 |
0,59 |
|
7 |
0,89 |
17 |
0,79 |
27 |
0,65 |
37 |
0,67 |
47 |
0,64 |
|
8 |
0,38 |
18 |
0,34 |
28 |
0,47 |
38 |
1,09 |
48 |
0,71 |
|
9 |
0,61 |
19 |
0,73 |
29 |
0,45 |
39 |
0,86 |
49 |
0,60 |
|
10 |
0,70 |
20 |
0,52 |
30 |
0,40 |
40 |
0,66 |
50 |
0,79 |
График 1 - Модель временного ряда
1. Определение аномального значения
Суть анализа временных рядов заключается в выявлении и устранении аномальных значений уровней ряда.
Значение SI обозначим за y, и далее будем использовать.
Таблица 2 - Определение аномальных значений ряда
t |
SI |
(y-?)2 |
л |
Результат |
|
1 |
0,38 |
0,082 |
|||
2 |
0,44 |
0,051 |
0,4 |
||
3 |
0,94 |
0,075 |
3,0 |
аномальное |
|
4 |
0,73 |
0,004 |
1,3 |
аномальное |
|
5 |
0,68 |
0,000 |
0,3 |
||
6 |
0,65 |
0,000 |
0,2 |
||
7 |
0,89 |
0,050 |
1,4 |
||
8 |
0,38 |
0,082 |
3,1 |
аномальное |
|
9 |
0,61 |
0,003 |
1,4 |
аномальное |
|
10 |
0,70 |
0,001 |
0,5 |
||
11 |
0,91 |
0,059 |
1,3 |
аномальное |
|
12 |
0,83 |
0,027 |
0,5 |
||
13 |
0,66 |
0,000 |
1,0 |
||
14 |
0,53 |
0,019 |
0,8 |
||
15 |
0,84 |
0,030 |
1,9 |
аномальное |
|
16 |
0,68 |
0,000 |
1,0 |
||
17 |
0,79 |
0,015 |
0,7 |
||
18 |
0,34 |
0,107 |
2,7 |
аномальное |
|
19 |
0,73 |
0,004 |
2,3 |
аномальное |
|
20 |
0,52 |
0,021 |
1,3 |
аномальное |
|
21 |
0,88 |
0,046 |
2,2 |
аномальное |
|
22 |
0,70 |
0,001 |
1,1 |
||
23 |
0,80 |
0,018 |
0,6 |
||
24 |
0,61 |
0,003 |
1,1 |
аномальное |
|
25 |
0,51 |
0,025 |
0,6 |
||
26 |
0,53 |
0,019 |
0,1 |
||
27 |
0,65 |
0,000 |
0,7 |
||
28 |
0,47 |
0,039 |
1,1 |
||
29 |
0,45 |
0,047 |
0,1 |
||
30 |
0,40 |
0,071 |
0,3 |
||
31 |
0,53 |
0,019 |
0,8 |
||
32 |
0,74 |
0,005 |
1,3 |
аномальное |
|
33 |
0,56 |
0,011 |
1,1 |
||
34 |
0,62 |
0,002 |
0,4 |
||
35 |
0,60 |
0,004 |
0,1 |
||
36 |
0,55 |
0,014 |
0,3 |
||
37 |
0,67 |
0,000 |
0,7 |
||
38 |
1,09 |
0,179 |
2,5 |
аномальное |
|
39 |
0,86 |
0,037 |
1,4 |
аномальное |
|
40 |
0,66 |
0,000 |
1,2 |
аномальное |
|
41 |
0,81 |
0,021 |
0,9 |
||
42 |
0,61 |
0,003 |
1,2 |
аномальное |
|
43 |
0,98 |
0,098 |
2,2 |
аномальное |
|
44 |
0,84 |
0,030 |
0,8 |
||
45 |
0,65 |
0,000 |
1,1 |
аномальное |
|
46 |
0,59 |
0,006 |
0,4 |
||
47 |
0,64 |
0,001 |
0,3 |
||
48 |
0,71 |
0,002 |
0,4 |
||
49 |
0,60 |
0,004 |
0,7 |
||
50 |
0,79 |
0,015 |
1,1 |
аномальное |
Таблица 3 - Данные расчетов
Среднее значение |
0,67 |
|||
Среднеквадратическое отклонение (СКО) |
0,166 |
|||
Проверка правилом 3у |
||||
Интервал допустимых значений |
0,168 |
< y i < |
1,164 |
|
3у |
0,50 |
|||
MAX |
1,09 |
|||
MIN |
0,34 |
Для выявления аномальных значений временных рядов используются методы, рассчитанные для статистических совокупностей, такие как: метод Ирвина, метод 3у.
По результатам анализа методом Ирвина воспользуемся следующей формулой:
,
гдe среднеквадратическое отклонение рассчитывается с использованием формул:
Расчетные значения сравниваются с табличными значениями критерия Ирвина л табл = 1,1 , и если расчетное значение больше табличного, то значение yt уровня ряда - это аномальное значение. Вследствие этого условия были определены аномальные значения ряда данных. В таблице 2 представлен результат определения аномальных значений ряда.
А так же проверка осуществлялась по методу трех сигм (3у), суть которого состоит в определении закона распределения случайной величины с доверительной вероятностью. С вероятностью 0,95 значение временного ряда должно попадать в интервал [y-3у; y+3у]. Если значение попадает в данный интервал, то речь идет о нормальном распределении случайной величины и не аномальном значении ряда, если же значение выходит за границы доверительного интервала, то значение - аномальное.
2. Проверка наличия тренда
Чтобы определить наличие тренда в данном временном ряду применяется несколько методов: Критерий серий, Критерий «восходящих» и «нисходящих» серий.
Рассмотрим «Критерий серий». С целью проверки гипотезы о неизменности среднего значения временного ряда рассмотрим критерий серий, основанный на медиане.
Значение временного ряда сопоставляется с выборочной медианой, и если x(t) > , то для соответствующего наблюдения член последовательности, образующего серии, принимает знак«+», если x(t) < , то - знак «-».
Таблица 4 - Проверка наличия тренда методом «Критерий серий»
SI |
Серии |
Число серий |
Нисходящие серии |
Серии |
|
0,38 |
- |
- |
|||
0,44 |
- |
2 |
- |
2 |
|
0,94 |
+ |
+ |
|||
0,73 |
+ |
+ |
|||
0,68 |
+ |
3 |
+ |
3 |
|
0,65 |
- |
- |
|||
0,89 |
+ |
+ |
|||
0,38 |
- |
- |
|||
0,61 |
- |
2 |
- |
2 |
|
0,70 |
+ |
+ |
|||
0,91 |
+ |
+ |
|||
0,83 |
+ |
+ |
|||
0,66 |
+ |
4 |
+ |
4 |
|
0,53 |
- |
- |
|||
0,84 |
+ |
+ |
|||
0,68 |
+ |
+ |
|||
0,79 |
+ |
3 |
+ |
3 |
|
0,34 |
- |
- |
|||
0,73 |
+ |
+ |
|||
0,52 |
- |
- |
|||
0,88 |
+ |
+ |
|||
0,70 |
+ |
+ |
|||
0,80 |
+ |
3 |
+ |
3 |
|
0,61 |
- |
- |
|||
0,51 |
- |
- |
|||
0,53 |
- |
- |
|||
0,65 |
- |
- |
|||
0,47 |
- |
- |
|||
0,45 |
- |
- |
|||
0,40 |
- |
- |
|||
0,53 |
- |
8 |
- |
8 |
|
0,74 |
+ |
+ |
|||
0,56 |
- |
- |
|||
0,62 |
- |
- |
|||
0,60 |
- |
- |
|||
0,55 |
- |
4 |
- |
4 |
|
0,67 |
+ |
+ |
|||
1,09 |
+ |
+ |
|||
0,86 |
+ |
+ |
|||
0,66 |
+ |
+ |
|||
0,81 |
+ |
5 |
+ |
5 |
|
0,61 |
- |
- |
|||
0,98 |
+ |
+ |
|||
0,84 |
+ |
2 |
+ |
2 |
|
0,65 |
- |
- |
|||
0,59 |
- |
- |
|||
0,64 |
- |
3 |
- |
3 |
|
0,71 |
+ |
+ |
|||
0,60 |
- |
- |
|||
0,79 |
+ |
+ |
Таблица 5 - Данные расчетов
Медиана |
0,655 |
|
Число серии(n) |
11 |
|
max серия(t) |
8 |
|
ЛОЖЬ |
||
ЛОЖЬ |
||
Проверка по нисходящему критерию серий |
||
Число серии(n) |
11 |
|
max серия(t) |
8 |
|
ИСТИНА |
||
ЛОЖЬ |
В методе «Критерий серий», основанном на медиане выборки, для того чтобы не была отвергнута гипотеза о случайности исходного ряда, должны выполняться следующие неравенства:
(1)
где n - длина временного ряда;
н(n) - число серий;
фmax(n) - число подряд идущих плюсов или минусов в самой длинной серии;
квадратные скобки, как обычно, обозначают целую часть числа.
Если хотя бы одно из неравенств (1) нарушается, то гипотеза об отсутствии тренда отвергается, в данном случае нарушены оба неравенства. Из этого следует вывод о наличии тренда
Проверка гипотезы «Критерий «восходящих» и «нисходящих» серий» основывается на том, что при условии случайности ряда протяженность самой длинной серии не должна быть слишком большой, а общее число серий - слишком малым.
«Критерий «восходящих» и «нисходящих» серий» устанавливается исходя из системы неравенств (2)
(2)
где n - длина временного ряда;
н(n) - число серий;
фmax(n) - число подряд идущих плюсов или минусов в самой длинной серии.
Если хотя бы одно из неравенств (2) окажется нарушенным, то гипотезу об отсутствии тренда следует отвергнуть, т.е. в ряде данных присутствует неслучайная компонента, зависящая от времени t. Наличие тренда.
3. Сглаживание временных рядов
3.1 Метод простой скользящей средней
Метод простой скользящей средней, согласно которому фактические уровни заменяются средними уровнями, рассчитанными для последовательно подвижных (скользящих) укрупненных интервалов, охватывающих т уровней ряда.
По заданию, проведены расчеты для трех и пяти точек: m=3, m=5.
матрица корреляция временной ряд
Таблица 6 - Сглаживание простой скользящей средней
Метод простой скользящей средней |
||||
t |
SI |
Сглаживание по 3 точкам |
Сглаживание по 5 точкам |
|
1 |
0,38 |
|||
2 |
0,44 |
|||
3 |
0,94 |
0,587 |
||
4 |
0,73 |
0,703 |
||
5 |
0,68 |
0,783 |
0,634 |
|
6 |
0,65 |
0,687 |
0,688 |
|
7 |
0,89 |
0,740 |
0,778 |
|
8 |
0,38 |
0,640 |
0,666 |
|
9 |
0,61 |
0,627 |
0,642 |
|
10 |
0,70 |
0,563 |
0,646 |
|
11 |
0,91 |
0,740 |
0,698 |
|
12 |
0,83 |
0,813 |
0,686 |
|
13 |
0,66 |
0,800 |
0,742 |
|
14 |
0,53 |
0,673 |
0,726 |
|
15 |
0,84 |
0,677 |
0,754 |
|
16 |
0,68 |
0,683 |
0,708 |
|
17 |
0,79 |
0,770 |
0,700 |
|
18 |
0,34 |
0,603 |
0,636 |
|
19 |
0,73 |
0,620 |
0,676 |
|
20 |
0,52 |
0,530 |
0,612 |
|
21 |
0,88 |
0,710 |
0,652 |
|
22 |
0,70 |
0,700 |
0,634 |
|
23 |
0,80 |
0,793 |
0,726 |
|
24 |
0,61 |
0,703 |
0,702 |
|
25 |
0,51 |
0,640 |
0,700 |
|
26 |
0,53 |
0,550 |
0,630 |
|
27 |
0,65 |
0,563 |
0,620 |
|
28 |
0,47 |
0,550 |
0,554 |
|
29 |
0,45 |
0,523 |
0,522 |
|
30 |
0,40 |
0,440 |
0,500 |
|
31 |
0,53 |
0,460 |
0,500 |
|
32 |
0,74 |
0,557 |
0,518 |
|
33 |
0,56 |
0,610 |
0,536 |
|
34 |
0,62 |
0,640 |
0,570 |
|
35 |
0,60 |
0,593 |
0,610 |
|
36 |
0,55 |
0,590 |
0,614 |
|
37 |
0,67 |
0,607 |
0,600 |
|
38 |
1,09 |
0,770 |
0,706 |
|
39 |
0,86 |
0,873 |
0,754 |
|
40 |
0,66 |
0,870 |
0,766 |
|
41 |
0,81 |
0,777 |
0,818 |
|
42 |
0,61 |
0,693 |
0,806 |
|
43 |
0,98 |
0,800 |
0,784 |
|
44 |
0,84 |
0,810 |
0,780 |
|
45 |
0,65 |
0,823 |
0,778 |
|
46 |
0,59 |
0,693 |
0,734 |
|
47 |
0,64 |
0,627 |
0,740 |
|
48 |
0,71 |
0,647 |
0,686 |
|
49 |
0,60 |
0,650 |
0,638 |
|
50 |
0,79 |
0,700 |
0,666 |
График 2 - Сглаживание по 3 точкам
График 3 - Сглаживание по 5 точкам
Вывод: Визуально проанализировав графики, заметно, что сглаживание по 5 точкам более плавно выявляет тенденцию развития временного ряда и приближает его к среднему значению, а сглаживание по 3 точкам более точно отражает исходный ряд данных.
3.2 Метод медианного сглаживания
Суть метода: вместо скользящей средней можно использовать медиану значений, попавших в окно.
Таблица 7 - Метод медианного сглаживания
Метод медианного сглаживания |
||||
t |
SI |
Сглаживание по 3 точкам |
Сглаживание по 5 точкам |
|
1 |
0,38 |
0,44 |
0,68 |
|
2 |
0,44 |
0,73 |
0,68 |
|
3 |
0,94 |
0,73 |
0,73 |
|
4 |
0,73 |
0,68 |
0,68 |
|
5 |
0,68 |
0,68 |
0,65 |
|
6 |
0,65 |
0,65 |
0,65 |
|
7 |
0,89 |
0,61 |
0,70 |
|
8 |
0,38 |
0,61 |
0,70 |
|
9 |
0,61 |
0,70 |
0,70 |
|
10 |
0,70 |
0,83 |
0,70 |
|
11 |
0,91 |
0,83 |
Подобные документы
Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.
контрольная работа [298,2 K], добавлен 19.01.2011Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.
лабораторная работа [890,1 K], добавлен 06.12.2014Выборка и генеральная совокупность. Модель множественной регрессии. Нестационарные временные ряды. Параметры линейного уравнения парной регрессии. Нахождение медианы, ранжирование временного ряда. Гипотеза о неизменности среднего значения временного ряда.
задача [62,0 K], добавлен 08.08.2010Временные ряды и их характеристики. Факторы, влияющие на значения временного ряда. Тренд и сезонные составляющие. Декомпозиция временных рядов. Метод экспоненциального сглаживания. Построение регрессионной модели. Числовые характеристики переменных.
контрольная работа [1,6 M], добавлен 18.06.2012Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.
контрольная работа [681,9 K], добавлен 03.08.2010Методика определения параметров линейной регрессии, составления экономической интерпретации коэффициентов регрессии. Проверка выполнения предпосылок МНК. Графическое представление физических и модельных значений. Нахождение коэффициентов детерминации.
контрольная работа [218,0 K], добавлен 25.05.2009Проверка графика на анормальности и наличие тренда. Определение параметров линейной регрессии. Сглаживание уровней ряда методом простой скользящей средней. Расчет среднеквадратического отклонения. Адекватность и точность параметров нелинейных регрессий.
контрольная работа [912,4 K], добавлен 26.05.2016Оценка корреляционной матрицы факторных признаков. Оценки собственных чисел матрицы парных коэффициентов корреляции. Анализ полученного уравнения регрессии, определение значимости уравнения и коэффициентов регрессии, их экономическая интерпретация.
контрольная работа [994,1 K], добавлен 29.06.2013Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.
контрольная работа [108,5 K], добавлен 28.03.2018Экономическая интерпретация коэффициента регрессии. Нахождение статочной суммы квадратов и оценка дисперсии остатков. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента. Расчет средней относительной ошибки аппроксимации.
контрольная работа [261,1 K], добавлен 23.03.2010Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.
лабораторная работа [1,8 M], добавлен 25.05.2009Вычисление парных коэффициентов корреляции и построение их матрицы. Нахождение линейного уравнения связи, коэффициентов детерминации и эластичности. Аналитическое выравнивание ряда динамики методом наименьших квадратов. Фактические уровни вокруг тренда.
контрольная работа [121,1 K], добавлен 01.05.2011Основные элементы эконометрического анализа временных рядов. Задачи анализа и их первоначальная обработка. Решение задач кратко- и среднесрочного прогноза значений временного ряда. Методы нахождения параметров уравнения тренда. Метод наименьших квадратов.
контрольная работа [37,6 K], добавлен 03.06.2009Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [58,3 K], добавлен 17.10.2009Этапы и проблемы эконометрических исследований. Параметры парной линейной регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициентов автокорреляции второго порядка для временного ряда расходов на потребление.
контрольная работа [60,3 K], добавлен 05.01.2011Теория и анализ временных рядов. Построение линии тренда и прогнозирование развития случайного процесса на основе временного ряда. Сглаживание временного ряда, задача выделения тренда, определение вида тенденции. Выделение тригонометрической составляющей.
курсовая работа [722,6 K], добавлен 09.07.2019Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.
контрольная работа [155,8 K], добавлен 11.12.2010