Анализ и прогнозирование временных рядов: метод главных компонент SSA (гусеница)

Временные ряды и их исследования. Методы анализа временных рядов: метод Гусеница, основные направления его использования, сравнение его с другими методами (автоагрессия, разложение Фурье, Параметрическая регрессия). Описание метода, теоретические аспекты.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 29.05.2014
Размер файла 283,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Анализ и прогнозирование временных рядов: метод главных компонент SSA (гусеница)

Введение

Временномй ряд - это собранный в разные моменты времени статистический материал о значении параметров исследуемого процесса. Во временном ряде для каждого отсчёта указано время измерения или номер измерения по порядку. Значения параметров могут сохранять стабильные значения, или изменяться случайным образом, или иметь некий тренд (возрастание, убывание, изменение в соответствии с полиномиальной или экспоненциальной функцией и т. д.)

Временной ряд содержит информацию об исследуемом процессе, но для ее осмысления, а также для прогнозирования необходимо выполнить анализ. временной гусеница авторегрессия параметрический

1. Временные ряды и их исследование

Совокупность математических статистических методов, применяемых для анализа временных рядов, включает в себя как простые в использовании и интуитивно понятные методы, например сглаживание по среднему, так и более сложные методы, например спектральный анализ или метод главных компонент SSA (гусеница).

В результате анализа выявляется структура ряда, тренды развития процесса (развитие, затухание, стабильность и т.д.), периодичность тех или иных изменений. Выявление структуры временного ряда необходимо для того, чтобы построить математическую модель исследуемого явления,

Прогноз будущих значений временного ряда используется для эффективного принятия решений. Прогнозные оценки с помощью методов экстраполяции рассчитываются в несколько этапов:

· проверка основной линии тренда;

· выявление закономерностей прошлого протекания процесса;

· оценка достоверности выявленной закономерности протекания процесса (подбор функции тренда);

· экстраполяция, перенос выявленных тенденций на будущий период;

· корректировка полученного прогноза с учётом результатов анализа текущего состояния.

Для получения прогноза развития изучаемого процесса данные базовой линии должны соответствовать некоторым требованиям:

· шаг по времени для всей базовой линии должен быть одинаков;

· наблюдения выполняются в один и тот же момент каждого временного отрезка;

· пропуск данных не допускается, недостающие данные можно дополнять средним значением;

· корректировка прогноза выполняется с учётом влияния периодических или скачкообразных изменений наблюдаемого явления.

Примеры временных рядов: характеристики технических систем, показатели природных, социальных, экономических и других систем. Типичным примером временного ряда можно назвать биржевой курс.

2. Методы анализа временных рядов: «гусеница» и другие

Временной ряд содержит большой объем информации, и для ее прочтения применяются различные методы. Временной ряд характеризуется тенденцией, имеющий долговременный характер, а также периодическими составляющими и шумами - изменением параметров под воздействием случайных факторов. Самые простые методы исследования рядов позволяют выявить тенденцию, при этом сглаживают влияние шумов и периодических компонент. Более сложные методы направлены на выявление периодических возмущений, на подбор аппроксимирующей функции, моделирующей процесс.

2.1 Метод Гусеница и основные направления его использования

Темой данной работы является SSA (Singular spectrum analysis или Анализ сингулярного спектра), или «гусеница» -- метод анализа временных рядов, основанный на преобразовании одномерного временного ряда в многомерный ряд с последующим применением к полученному многомерному временному ряду метода главных компонент.

Применение метода основано на преобразовании одномерного ряда в многомерный, «свёртку» временного ряда в матрицу, содержащую фрагменты ряда, полученные с некоторым сдвигом, и выполнение матричных операций определенного характера. Длина сдвигового фрагмента называется длиной «гусеницы», а величина сдвига одного фрагмента относительно другого шагом «гусеницы».

Singular spectrum analysis (SSA) сочетает в себе элементы классического анализа временных рядов, многомерной статистики, многомерной геометрии, динамических систем и обработки сигналов.

Диапазон областей знаний, где метод может быть применен, очень широк: Техника, экономика, финансы, естественные науки, климатология, океанология, геофизика, обработка изображений, медицина, и так далее. В практических приложениях используются различные модификации метода.

Главные направления использования метода Гусеница:,

· Метод Гусеница универсальный метод, позволяющий выделить тенденцию, обнаружить периодичности, внести корректировку на сезонность, выполнить сглаживание, подавление шума.

· Метод Гусеница для спектрального анализа стационарных временных рядов, имеющий большое число приложений в тех областях, где такие ряды наблюдаются: в климатологии, медицине и т.д.

2.2 Сравнение метода Гусеница с другими методами

Рассмотрим основные методы анализа временных рядов в сравнении с методом Гусеница

2.2.1 Метод Гусеница и сглаживание по среднему

Сглаживание по среднему - простой метод, применяющийся для устранения шумов. Метод используется для выявления тенденции развития процесса. Усреднение помогает уменьшить влияние случайных факторов, но при этом подавляет и периодические компоненты, В отличие от простого сглаживания, метод Гусеница позволяет не только выявить долговременную тенденцию, но и дает возможность проследить за периодическими компонентами.

2.2.2 Метод Гусеница и Авторегрессия

Типичная модель ряда, рассматриваемая в SSA, это

,

где ,  - шум.

Модель авторегрессии имеет вид . В методе Гусеница случайные компоненты добавляются ко всему сигналу, а методе авторегрессия - на каждом шаге. Метод Гусеница точнее, фильтрация шумов эффективнее.

2.2.3 Метод Гусеница и Разложение Фурье

Анализ Фурье заключается в разложении сигнала по ортонормированным составляющим, представляющим собой фиксированный базис из синусов и косинусов. Метод Гусеница использует адаптивный базис, порождаемый самим рядом. Модель ряда, используемая в методе Гусеница, более общая, можно выделять амплитудно-модулированные синусы и косинусы с частотами, отличающимися от . Это позволяет оценивать частоты с более высоким разрешением, чем спектральный Фурье анализ.

2.2.4 Метод Гусеница и Параметрическая регрессия

Метод Гусеница может выделять экспоненциальные, логарифмические, полиномиальные и тренды. В отличие от регрессии, Гусеница не требует предварительного задания параметрической модели. Это ценное качество, позволяющее начальном исследовании выявить нечетко выраженную тенденцию. Метод Гусеница позволяет выделять периодические изменинения без знания значений периодов.

2.2.5 Метод Гусеница и его преимущества по сравнению с другими методами

Метод может быть использован без предварительного задания модели ряда для анализа произвольных, стационарных и нестационарных рядов. Основная цель метода Гусеница - разложить ряд в сумму компонент, таких как тренд, периодические компоненты, шум. При этом знание параметрической формы этих компонент не требуется.

2.2.6 Возможная сфера применения метода Гусеница

Использование данного метода связано с большим объемом вычислений возможно лишь при наличии компьютера с адекватным программным обеспечением. В отличие от многих других статистических методов, Гусеница не имеет методики ручного расчета. Исследование ряда с применением таблиц Excel по методу Гусеница возможно, но весьма громоздко и трудоемко. Лучше использовать программные пакеты Mathlab или Matkad.

Не всегда преимущества от применения метода Гусеница очевидны. Во многих случаях результаты ненамного отличаются от тех, что получены более простыми и интуитивно понятными методами. Но интерес к исследованию временных рядов Гусеница велик, поскольку его широко применяют для анализа и прогноза в сфере финансов, биржевых операций.

3. Описание метода Гусеница

Рассмотрим этапы, из которых состоит обработка статистической информации по методу Гусеница.

3.1 Вложение

Строится  траекторная матрица ряда  следующим образом:

где  --- вектора вложения длины . Матрица  имеет одинаковые элементы  на антидиагоналях .

3.2 Сингулярное разложение (SVD)

Производится сингулярное разложение (SVD) траекторной матрицы . Необходимо построить транспонированную матрицу и найти скалярное произведение траекторной и транспонированной матриц: . В результате получается квадратная матрица S, для которой находят собственные числа . Их ранжируют - располагают в невозрастающем порядке (). Вычисляются соответствующие собственные векторы  , составляющие ортонормированную систему собственных векторов матрицы , соответствующих собственным числам.

Положим  и  . В этих обозначениях сингулярное разложение траекторной матрицы  может быть записано как

где матрицы  имеют ранг 1 и называются элементарными матрицами. Набор  называется -й собственной тройкой сингулярного разложения. Векторы  и  называются левыми и правыми, соответственно, сингулярными векторами матрицы , числа  сингулярные числа, они составляют сингулярный спектр . Векторы , по аналогии с анализом главных векторов, называются векторами главных компонент.

3.3 Группировка собственных троек

Множество всех индексов  разбивается на  непересекающихся подмножеств .

Пусть . Тогда результирующая матрица , соответствующая группе , определяется как . Результирующие матрицы вычисляются по группам и сгруппированное SVD разложение матрицы  может быть записано как

3.4 Диагональное усреднение

Каждая матрица  сгруппированного разложения усредняется по антидиагоналям. Полученная ганкелева матрица трансформируется в новый временной ряд длины  на основе взаимно-однозначного соответствия между ганкелевыми матрицами и временными рядами. Диагональное усреднение, примененное к каждой результирующей матрице , производит восстановленные ряды . Таким образом, исходный ряд  раскладывается в сумму  восстановленных рядов:

Данное разложение является главным результатом алгоритма SSA для анализа временного ряда. Это разложение имеет смысл. если каждая из его компонент может быть интерпретируема как либо тренд, либо колебания (периодики), либо шум.

Метод имеет такие модификации как Гусеница с однократным центированием и Гусеница с двойным центрированием. Последний вариант хорошо работает при наличии линейного тренда.

4. Теоретические аспекты метода Гусеница

Теория метода отвечает на следующие вопросы:

· какие составляющие временного ряда могут быть разделены SSA

· как выбрать длину окна и провести правильную группировку, чтобы выделить нужную компоненту.

Тенденция ряда, определяется как медленно меняющаяся компонента.

Периодические компоненты и шум асимптотически разделимы при . На практике  фиксировано и речь идет о приближенной разделимости компонент временного ряда. Определить, есть ли приближенная разделимость, можно с помощью ряда индикаторов.

Длина окна  определяет разрешение метода: большие значения  обеспечивают наиболее подробное разделение на элементарные компоненты и, как следствие, лучшую разделимость. В некотором смысле, длина окна определяет разрешимость метода, в частности,  соответствует максимальному периоду, который может быть обнаружен с такой длиной окна. Тренд может быть выделен группировкой собственных строек с медленно-меняющимися собственными векторами. Синусоиде с частотой меньше 0.5 соответствует пара синусообразных собственых векторов с той же частотой и разницей в фазах, примерно равной .

Разделение двух временных рядов может быть формализовано как выделение одного ряда в присутствии возмущения другим рядом.

4.1 Метод Гусеница для стационарных рядов

Для стационарных временных рядов метод Гусеница может быть рассмотрен как непараметрический метод оценивания спектра. Основное отличие алгоритма заключается в использовании лаг-ковариационной матрицы  вместо . Матрица  может быть оценена непосредственно по исходному ряду как теплицева матрица с константами на диагоналях

4.2 Прогнозирование и другие расширения метода Гусеница

В случае  на основе SSA разложения можно построить оценку сигнального пространства и получить оценку коэффициентов линейного рекуррентного соотношения, управляющего сигналом, т.е. . Сигнальное подпространство и полученное линейное рекуррентное соотношение служат основой для алгоритмов прогнозирования.

Если на этапе вложения построить траекторную матрицу системы временных рядов, состыковав вместе траекторные матрицы одномерных рядов, то получим метод MSSA, позволяющий строить одновременное разложение сразу нескольких рядов. MSSA лучше применения метода Гусеница SSA к рядам по отдельности, если ряды имеют похожую структуру. Можно также рассмотреть одновременный прогноз системы рядов.

5. Пример анализ временного ряда

Рассмотрим временной ряд, соответствующий поквартальным объемам выручки от пассажирских перевозок в развивающемся курортном городе в период 2001-2008 гг. Временные отрезки показаны условно.

Рис.1. График объема пассажирских перевозок

Визуальный анализ ряда свидетельствует о том, что в указанный период времени имелась тенденция а возрастанию пассажирских перевозок с выраженными сезонными колебаниями. Задачей является разложение ряда на тренд, сезонную составляющую и шум.

Выбираем ширину окна. Для этого оценим размерность. Тренд близок к линейной функции и описывается одной или двумя собственными тройками, периодичность имеет частоту ј, 2/4. Размерность ряда не должна превосходить 5. Для учета шумов и «наведения на резкость» увеличиваем длину окна, выбираем 8 - число, кратное частоте.

Таким образом, при длине ряда N=32 формируем траекторную матрицу 25*8.

Вводим данные в таблицу Excel, формируем матрицу. Для этого копируем столбцы со сдвигом в каждом очередном столбце. Формируем прямоугольную матрицу, показанную на рис.2. Аналогичным образом строим транспонированную матрицу. Используя аппарат Excel, выполняем матричное умножение и находим S=MMT

Рис.2. Транспонированная Траекторная матрица ряда

Выполняем сингулярное разложение матрицы. Для этого находим собственные числа и собственные векторы.

Собственные числа находим из условия равенства нулю определителя

|M-лE|=0. В среде Excel это можно выполнить методом подбора и с использованием надстройки Поиск решения. При этом минимизируется значение определителя, зависящего от изменяемой ячейки, содержащей собственное число.

Собственные числа для данной матрицы:

777667; 7441; 7804; 1196; 686,828; 17,967; 14,876; 9,392.

Собственные вектора находятся в процессе решения систем уравнений, коэффициентами которых являются элементы матрицы S. В данном случае это системы из восьми уравнений с восемью неизвестными, причем уравнения линейно зависимы, поскольку определитель системы равен нулю. можно вычислить в Excel при помощи настройки Поиск решения. При этом целевая ячейка содержит значение, которое надо минимизировать. Это значение - сумма квадратов произведений элементов собственного вектора на строки матрицы S. Изменяемые ячейки - элементы собственного вектора, причем один из элементов фиксируется, а семь других изменяются в процессе поиска решения.

Рис.4. Вычисление собственного вектора в среде Excel при помощи надстройки Поиск решения.

После того, как вектора вычислены, выполняются матричные операции по вычислению Vi=XTUi и вычисляется Хi.

В итоге получается набор из восьми матриц, из которых формируются рялы, посредством диагонального усреднения и выбора элементов первой строки и последнего столбца.

Решение характеристического уравнения, а также нахождение собственных векторов, значительно проще выполнять в среде программы MathCad.

Введем ряд в окно программы MathCad, выполним вложение, сформируем матрицу и транспонированную матрицу. На рис.4 приводится листинг формирования матрицы.

Рис.4. Формирование траекторной матрицы

Далее формируем транспонированную матрицу, воспользовавшись матричной функцией d=cT , и находим произведение траекторной транспонированной матриц.

Собственные числа матрицы вычисляем с помощью функции eigenvals(), Собственные векторы находим с помощью функции eigenvecs(); в итоговой матрице столбцами являются собственные векторы.

Для того, чтобы выполнить сингулярное разложение, сформируем наборы из тех элементов: . В этих наборах - i-е собственное число, - соответствующий собственному числу собственный вектор, .

Сингулярное разложение представляет собой сумму

, где

Вычисляем соответствующие элементы:

Графики собственных векторов

Вычисляем элементы сингулярного разложения

В итоге получены 8 матриц размерности 8*24- элементы сингулярного разложения

На завершающем этапе выполним процедуру перевода каждой матрицы в отдельный ряд. Такой перевод несложно выполнить для ганкелевой матрицы, у которой элементы на антидиагоналях равны между собой, а элементы первой строки и последнего столбца соответствуют элементам ряда.

Рассмотрим фрагмент одного из элементов разложения

Элементы на антидиагонали имеют близкие, но не равные между собой значения. Перевод матриц, полученных в процессе сингулярного разложения, в ганкелевы, производится усреднением значений элементов на антидиагоналях.

Процедура диагонального усреднения выполняется по следующему алгоритму, рассмотренного на примере матрицы m0, размерность которой 8*24. Ее разлагаем в ряд g0 в соответствии с алгоритмом:

Выполнив диагональное усреднение и выбрав элементы первой строки и последнего столбца, получим ряды, соответствующие различным компонентам исследуемого ряда: тренду, периодическим составляющим, шумам.

В Excel диагональное усреднение выполняется введением функций в соответствующие ячейки. В среде Маткад получаем результат, введя следующую программу:

В качестве параметров в наборе функций используются матрицы, полученные в результате сингулярного разложения, и номера элементов в формируемом ряде. Каждая функция формирует соответствующую часть ряда.

Вычисляем функции для соответствующих матриц, получаем набор рядов.

Данный график отображает долговременную тенденцию. Она близка к линейной функции, а также к экспоненциальной.

Периодическая функция отображает сезонную составляющую.

Наклон этого графика противоположен графику тенденции, но имеет меньшие значения. В нем сосредоточены «краевые эффекты», неизбежные при усреднениях и сглаживаниях.

Периодическая функция, являющаяся гармоникой сезонных колебаний.

Низкочастотные шумы

Высокочастотные шумы

Этот ряд можно объединить с предыдущим, они отображают одинаковые процессы - случайные отклонения.

Размещено на Allbest.ru

...

Подобные документы

  • Ознакомление с математическим аппаратом анализа временных рядов и моделями авторегрессии. Составление простейших моделей авторегрессии стационарных временных рядов. Оценка дисперсии и автоковариации, построение графика автокорреляционной функции.

    лабораторная работа [58,7 K], добавлен 14.03.2014

  • Основные понятия теории рядов. Методы суммирования расходящихся рядов. Суть метода степенных рядов, теоремы Абеля и Таубера. Метод средних арифметических, взаимоотношение между методами Пуассона-Абеля и Чезаро. Основные методы обобщенного суммирования.

    курсовая работа [288,0 K], добавлен 24.10.2010

  • Изучение изменений анализируемых показателей во времени как важнейшая задача статистики. Понятие рядов динамики (временных рядов). Числовые значения того или иного статистического показателя, составляющего ряд динамики. Классификация рядов динамики.

    презентация [255,0 K], добавлен 28.11.2013

  • Метод степенных рядов, применяемый для суммирования расходящихся рядов. Формулировка Пуассона, теорема Абеля. Метод средних арифметических и метод Чезаро. Знакопостоянный ряд натуральных чисел. Взаимоотношение между методами Пуассона-Абеля и Чезаро.

    реферат [313,4 K], добавлен 11.04.2014

  • Построение многофакторной корреляционно-регрессионной модели доходности предприятия: оценка параметров функции регрессии, анализ факторов на управляемость, экономическая интерпретация модели. Прогнозирование доходности на основе временных рядов.

    дипломная работа [5,1 M], добавлен 28.06.2011

  • Биография Исаака Ньютона, его основные исследования и достижения. Описание порядка нахождения корня уравнения в рукописи "Об анализе уравнениями бесконечных рядов". Методы касательных, линейной аппроксимации и половинного деления, условие сходимости.

    реферат [1,6 M], добавлен 29.05.2009

  • Определение степенного ряда. Теорема Абеля как определение структуры области сходимости степенного ряда. Свойства степенных рядов. Ряды Тейлора, Маклорена для функций. Разложение некоторых элементарных функций в ряд Маклорена. Приложения степенных рядов.

    реферат [89,3 K], добавлен 08.06.2010

  • Понятие об основной тенденции ряда динамики, ее сущность и визуальное представление, методы анализа. Аналитическая оценка уравнения тренда. Характеристика, использование различных методов для выделения тренда временных рядов, прогнозирование показателей.

    курсовая работа [207,2 K], добавлен 04.03.2013

  • Постановка задачи прогнозирования количества отказов радиоэлектронного оборудования на следующий год в аэропорту. График общей тенденции отказов. Использование метода временных рядов. Выделение тренда, применение метода скользящих средних значений.

    курсовая работа [109,9 K], добавлен 19.12.2009

  • Разложение в ряд Фурье. Определение функции и нахождение коэффициентов разложения. Проведение замены в интеграле. Условия теоремы о разложении функции в ряд Фурье. Примеры взятия интеграла по частям. Разложение в ряд Фурье четных и нечетных функций.

    презентация [73,1 K], добавлен 18.09.2013

  • Определение условий сходимости положительного ряда и описание свойств гармонических рядов Дирихле. Изучение теорем сравнения рядов и описание схемы Куммера для вывода из нее признаков сравнения ряда. Вывод признаков сравнения Даламбера, Раабе и Бертрана.

    курсовая работа [263,6 K], добавлен 14.06.2015

  • Особенности дифференциального исчисления. Использование правила Коши при разложении в ряд функций cos x и sin x для перемножения рядов. Запись элементов бесконечной матрицы в форме последовательности. Абсолютная сходимость рядов, порождаемых матрицей.

    курсовая работа [1012,0 K], добавлен 06.08.2013

  • Главная задача спектрального анализа временных рядов. Параметрические и непараметрические методы спектрального анализа. Сущность понятия "временный ряд". График оценки спектральной плотности для окна Дирихле, при центрированном случайном процессе.

    курсовая работа [332,8 K], добавлен 17.09.2009

  • Табличный метод представления данных правовой статистики. Абсолютные и обобщающие показатели. Относительные величины, их основные виды и применение. Среднее геометрическое, мода и медиана. Метод выборочного наблюдения. Классификация рядов динамики.

    контрольная работа [756,5 K], добавлен 29.03.2013

  • Описание признака сходимости числовых рядов Даламбера, решение задач на исследование сходимости. Формулировка радикального признака сходимости Коши знакоположительного ряда в предельной форме. Доказательство знакочередующихся и знакопеременных рядов.

    реферат [190,9 K], добавлен 06.12.2010

  • Применение в статистике конкретных методов в зависимости от заданий. Методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод. Корреляционный и дисперсный анализ. Расчет средних статистических величин.

    контрольная работа [29,5 K], добавлен 21.09.2009

  • Исследование числовых рядов на сходимость. Область сходимости для разных степенных рядов. Разложение функции в ряд Тейлора. Нормы сеточной функции. Исследование устойчивости разностной схемы для однородного уравнения. Совокупность разностных уравнений.

    курсовая работа [586,9 K], добавлен 19.04.2011

  • Алгоритм введения понятия ряда Фурье, опирающийся на моделирование физических задач в теоретическом курсе высшей математики для студентов физико-математических и инженерно-технических специальностей вузов. Функции и свойства рядов, их физический смысл.

    курсовая работа [1,8 M], добавлен 20.05.2015

  • Градиентные уравнения и уравнения в вариациях, функционалы метода наименьших квадратов. Численное решение градиентных уравнений: полиномиальные системы, метод рядов Тейлора и метод Рунге-Кутта. Числовые модели осциллирующих процессов в живой природе.

    реферат [221,4 K], добавлен 10.08.2010

  • Нахождение наибольшего и наименьшего значения (экстремумы) функции в замкнутой ограниченной области. Геометрический и симплексный метод составления плана выпуска продукции, разложение в ряд Фурье по синусам непериодической функции, её график и сумма.

    курсовая работа [282,7 K], добавлен 25.04.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.