Анализ временных рядов и выявление процессов с размытой периодичностью

Исследование методики оценки шумовой компоненты во временных рядах и ее удаление, выделение тренда и колебаний c различными периодами. Понятие Т-е и Т-h-е почти периодов для конечных рядов. Достижение гладкости функции, представляющей исходные данные.

Рубрика Математика
Вид статья
Язык русский
Дата добавления 08.03.2019
Размер файла 1,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Анализ временных рядов и выявление процессов с размытой периодичностью

Скляр Александр Яковлевич

кандидат технических наук

доцент, кафедра прикладной математики, Российский технологический университет (МИРЭА)

Аннотация

Предметом исследования является методика оценки шумовой компоненты во временных рядах и ее удаление, выделение тренда и колебаний c различными периодами, вводится понятие Т-е и Т-h-е почти периодов для конечных рядов. В основу анализа положено требование гладкости функции, представляющей исходные данные и имеющей производные до четвертого порядка включительно и выделение почти периодов на основе функций типа Альтера - Джонсона. Отдельно выделяется тренд длины периодов, выявленных в данных ряда колебаний. Алгоритм решения задачи основан на минимизации отклонений рассчитываемых значений от гладкой функции при условии соответствия отклонений от исходных данных уровню шума. Для выявления колебательной составляющей и тренда почти периодов используется модифицированная функция Альтера - Джонсона. Предлагаемая методика и алгоритмы оценки и устранения шума в данных позволяют обоснованно определить уровень шума в данных, удалить из данных шумовую компоненту, выявить почти периоды в данных в смысле введенных в статье определений, выделить в данных трендовую и колебательную составляющие, выявить, при необходимости, тренд изменения почти периодов.

Ключевые слова: шум, фильтрация шума, временной ряд, тренд, почти период, периодические функции, спектр сигнала, декомпозиция данных, численное моделирование, анализ временного ряда

шумовой временной ряд период

Abstract

The subject of research is the method of estimating the noise component in the time series and its removal, the selection of the trend and fluctuations with different periods, the concept of T-е and T-h-е almost periods for the final series is introduced. The analysis is based on the requirement of smoothness of a function representing the original data and having derivatives up to the fourth order inclusive and the allocation of almost periods based on functions of the Alter-Johnson type. Separately, the trend of the length of the periods identified in the data of a number of fluctuations. The algorithm for solving the problem is based on minimizing the deviations of the calculated values from the smooth function, provided that the deviations from the source data correspond to the noise level. To identify the oscillatory component and the trend of almost periods, the modified Alter-Johnson function is used. The proposed methodology and algorithms for estimating and eliminating noise in the data allow us to reasonably determine the noise level in the data, remove the noise component from the data, identify almost the periods in the data in the sense of the definitions introduced in the article, highlight the trend and oscillation components in the data, identify, if necessary, the trend of changes almost periods.

Keywords: data decomposition, signal spectrum, periodic functions, almost period, trend, time series, noise filtering, noise, numerical modeling, time series analysis

Статистическая информация, данные, отражающие результаты экспериментальных исследований в различных областях можно описать в виде временных рядов или последовательностей данных. Во многих случаях подобные ряды в той или иной мере содержат повторяющиеся последовательности данных. Наличие таких повторов говорит о присутствии циклических участков в этих процессах. В то же время нельзя говорить о наличии в них строгой периодической составляющей.

Обычно почти периодические функции понимают в смысле определения X. Бора [1, 2, 3].

Функция f( x) , непрерывная в интервале (-?,?), называется почти периодической функцией, если для любого е>0существует относительно плотное множество U е - почти периодов этой функции. То есть, почти периодическая функция, если для каждого е>0 существует такое L= L(е) , что в каждом интервале длины L найдется хотя бы одно число ф , для которого .

2. Почти периодические функции, их определение и выделение почти периодов

В нашем случае рассматривается почти периодичность на конечном интервале, поэтому далее будем рассматривать ее в несколько ином смысле.

Для этого ведем предварительно несколько определений.

Функцию f( x) будем называть периодической на интервале [a, b ] с периодом T>0, если для любого x, x+ T [a, b ] f(x)= f( x+ T).

В определенном отношении понятие периодичности можно обобщить, введя почти периодические функции. Здесь будем придерживаться следующего определения.

Функцию f( x) будем называть T-е почти периодической на интервале [a, b ] с периодом T >0 и константой е>0 , если для любого x, |f( x)- f( x+ T)|< е.

Введем теперь еще одно понятие, описывающее наличие цикличности в поведении функций.

Функцию f( x) будем называть T- h-е почти периодической с периодом T>0 и константами T> h> 0, е> 0, если для любого x, существует такое, что |f( x)- f( x+ T+ ф)|< е.

Рассмотрим некоторые методы, позволяющие выделить подобные периодические составляющие в эмпирических данных.

Наиболее популярны методы, основанные на преобразовании Фурье, для которого разработано большое количество программных средств [4]. В нашем случае речь может идти только о дискретном преобразовании на ограниченном интервале. В первую очередь речь идет о быстром преобразовании. Недостатком такого преобразования (шаг идет по частотам) является его неточность для длиннопериодических колебаний, то есть таких, что период колебаний имеет порядок интервала, на котором задаются данные. Альтернативой является дискретное преобразование Фурье с шагом по выбранному диапазону периодов, однако последнее значительно медленнее и, кроме того, неточно для короткопериодических (высокочастотных) колебаний. В этих спектрах точкам максимумов соответствуют периоды колебаний анализируемых процессов.

Другую группу методов представляют методы прямого анализа периодичности, не предполагающего синусоидальности самих колебаний.

В частности для введенной выше T-е почти периодической функции можно задать функцию Альтера - Джонсона [5,6], преобразующую исходный временной ряд в спектр периодов ц( T)

(1)

В ряде случаев удобнее использовать нормированный спектр в виде

(2)

В последнем случае .

Под нормой удобнее всего использовать просто .

Для T- h-е почти периодической функции можно в качестве аналога функции Альтера - Джонсона использовать ее модификацию, преобразующую исходный временной ряд в спектр периодов ц h( T)

или

(3)

В подобных спектрах минимумам соответствуют периоды колебаний анализируемых процессов. На рисунках 1 и 2 представлены результаты выявления колебательных характеристик функции . Функция задана таблицей с шагом 0,1.

График на рисунке 1 иллюстрирует результаты анализа спектра функции при постоянном шаге по частотам (быстрое дискретное преобразование Фурье) и при постоянном шаге по периодам. Первое, очевидно, точнее выявляет высокочастотные (короткопериодические) колебания, второе - низкочастотные (длиннопериодические) колебания. Кроме того, преобразование Фурье дает, вообще говоря, посторонние максимумы для несинусоидальных колебаний, а дискретное быстрое преобразования Фурье небезразлично к некратности исследуемого интервала значений функции ее периоду (или почти периоду).

Рисунок 1

На рисунке представлены значения функции Альтера - Джонсона и ее модификации, значение h , для которой задается величиной h= T/20 .

Рисунок 2

Для функции Джонсона (T-е ) характерно выделение кратных периодов с постепенным ростом величины е , для ее модификации (T- h-е, h= kT ) характерно выделение кратных периодов менее выражено и наблюдается уменьшение величины е . В общем случае модификация T- h-е плохо выделяет длинные периоды при наличии более коротких. Последнее показывает границы применимости различных схем выделения периодической составляющей во временных рядах.

При использовании схемы T- h-е в процессе расчета для i точки вычисляются величины li , определяющие значения, «подозреваемые в качестве периода». Последовательность значений li , точнее ее тренд, показывают зависимость (или отсутствие зависимости) величины периода от времени.

График колебаний периода рассматриваемой выше последовательности приведен на рисунки 3.

Рисунок 3

3. Анализ временных рядов и выявление процессов с размытой периодичностью

Рассмотрим некоторые проблемы анализа временных рядов. Элементами таких рядов являются пары, задающие момент наступления события (значение аргумента) и соответствующий ему результат (значение функции). Последовательность событий может измеряться как с постоянным, так и с переменным шагом. Значения, сопоставляемые элементам получающегося ряда, содержат и ошибки измерения и, в общем случае, подвержены случайным внешним воздействиям. В дальнейшем такого рода ошибки измерений и результаты внешних воздействий будем трактовать, как шум.

Анализ и обработка зашумленных данных вызывает значительные трудности. Возникает задача устранения, по возможности, такого шума. Для его устранения используются различные методы сглаживания, такие как, методы скользящей средней, экспоненциального сглаживания и др. [7,8,9,10]. Другой подход может быть реализован на основе представления исходных данных, как суммы гладкой функции, представляющей анализируемый процесс и шума. Требование гладкости при этом оказывается достаточно сильным, что позволяет не только оценить уровень шума, но и выделить такую гладкую функцию [11].

4. Алгоритм выявления шума, почти периодических процессов и долговременного тренда

При анализе данных, представленных временным рядом важно выделить такие характеристики описываемого им процесса, как апериодический тренд и набор сопровождающих процесс колебательных подпроцессов.

При таком подходе можно использовать следующую схему:

· Удаление шума.

· Выделение короткопериодических колебаний.

· Удаление короткопериодических колебаний на основе их рассмотрения как шума.

· Выделение колебаний с более длинным периодом с последовательным их удалением до получения апериодической составляющей.

Удаление шума осуществляется согласно [11], исходя из соотношения

, (4)

которое справедливо для любой четырежды дифференцируемой функции.

Для слабо осциллирующих функций, то есть таких, для которых период осцилляции значительно больше шага исследуемого временного, выражение в правой части равенства (4) пренебрежимо мало. В этих условиях

(5)

среднеквадратичное значение шума у находится в соответствии с (4, 5) и составит

(6)

Значения функции при этом определяются из

(7)

Величину минимального почти периода в смысле введенных выше определений будем определять исходя из соотношений (2,3). Для повышения точности определения почти периодов целесообразно удалить из данных заведомо апериодическую часть. В качестве такой части (тренда) наиболее естественно принять либо функцию , либо функцию . В первом случае коэффициенты a, b находятся методом наименьших квадратов. Во втором для нахождения коэффициентов можно использовать производную выделенной после удаления шума функции f( x). Поскольку при устранении шума функцию f( x) можно считать дифференцируемой, возможно численное нахождение ее производной с приемлемой точностью. Если f'( x) на всем интервале значений сохраняет знак, то гипотеза о наличии экспоненциального тренда допустима. Исходя из того, что , получаем, что в полулогарифмических координатах , где б= 1, если f'( x)>0, либо б= -1 в противном случае. Последняя задача о нахождении коэффициентов b, k сводится к нахождению линейной зависимости методом наименьших квадратов, после чего аналогично находится коэффициентов a, что позволяет легко выделить экспоненциальный тренд.

Удаление короткопериодических колебаний с периодом T можно проводить на основе трактовки короткопериодических колебаний, как шума. Величина шума в точке i определяется из

При целых ( T-1)/2 последний член в скобках исчезает.

Таким образом, задача об устранении коротких колебаний полностью сводится к задаче (7).

Последние шаги алгоритма повторяются до устранения периодических составляющих.

В результате применения алгоритма исходный временной ряд приводится к сумме вида

(8)

Здесь yi, xi, si - значения исходного ряда, аргумента и шума соответственно; - значения апериодической части тренда и его очередных колебательных составляющих.

Такое представление позволяет провести содержательный анализ процесса и выявить составляющие его подпроцессы.

5. Результаты численного моделирования

В качестве примера использования предлагаемой методики рассмотрим просчеты на данных о количестве солнечных пятен по годам (числа Вольфа) с 1700 по 2016 год [12]. Соответствующие данные представлены на рисунках ниже.

Рисунок 4

На рисунке 4 представлены соответственно исходные данные, данные с удалением шума, трендовые данные с удалением 11-летних циклов, долговременный тренд с удалением длинных циклов (94-106 лет).

На рисунке 5 представлены соответственно шум, 11-летних почти периодические колебания, длинные (94-106 лет) почти периодические колебания и долговременный тренд.

Полученные данные являются, вообще говоря, предметом для дальнейшего анализа. В частности выделенная шумовая компонента не является белым шумом: прослеживаются короткопериодические колебания и меняется амплитуда колебаний. 11-летние почти периодические колебания существенно изменяются по амплитуде. Периоды длинных колебаний значительно меняются во времени. Долговременный тренд, скорее всего, является фрагментов низкочастотных колебаний, период которых не определяется из-за малости самого временного интервала, на котором проводились наблюдения.

Таким образом, предлагаемая методика и алгоритмы оценки и устранения шума в данных, выявления T -е и Т- h -епочти периодов, позволяют:

* обоснованно определить уровень шума в данных;

* удалить из данных шумовую компоненту;

* найти T -е и Т- h -е почти периоды;

* выявить, при необходимости, тренд изменения почти периодов;

* выделить в данных трендовую и колебательную составляющие;

* проводить независимый анализ выделенных трендовых данных и зависимостей, носящих колебательный характер, и выявлять в них аналитические и дифференциальные зависимости.

Библиография

1. Воhr Н., "Acta math.", 1925, t. 45, p. 29-127

2. Левитан Б. М. Почти-периодические функции. М., 1953.

3. Бор Г. Почти периодические функции. М., 2009.

4. Дьяконов В. П. MATLAB 6.5 SP1/7.0 + Simulink 5/6. Обработка сигналов и проектирование фильтров. -- М.: СОЛОН-Пресс, 2005.

5. Кузьмин В.И., Самохин А.Б., Гадзаов А.Ф., Чердынцев В.В. Модели и методы определения параметров нелинейных процессов. - М.: Московский технологический университет (МИРЭА), 2016. - 148 с.

6. Johnson M. Correlations of cycles in weather, solar activity, geomagnetic values and planetary configurations. - San Fransisco, Phillips and Van Orden, 1944

7. Грешилов А.А., Стакун В.А., Стакун А.А. Математические методы построения прогнозов. М.: Радио и связь, 1997. 112 с.

8. Булашев С.В. Статистика для трейдеров. М.: Компания Спутник+, 2003. 245 с.

9. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Вып. 1. М.: Мир, 1974. 406 с.

10. Андерсон Т. Статистический анализ временных рядов. М: Мир, 1976. 523 с.

11. Скляр А.Я. Анализ и устранение шумовой компоненты во временных рядах. Успехи современной науки 2017 г. № 11, 11 с.

12. Royal Observatory of Belgium Av. Circulaire, 3 B-1180 Brussels, Belgium http://www.sidc.be/silso/datafiles

References (transliterated)

1. Vohr N., "Acta math.", 1925, t. 45, p. 29-127

2. Levitan B. M. Pochti-periodicheskie funktsii. M., 1953.

3. Bor G. Pochti periodicheskie funktsii. M., 2009.

4. D'yakonov V. P. MATLAB 6.5 SP1/7.0 + Simulink 5/6. Obrabotka signalov i proektirovanie fil'trov. -- M.: SOLON-Press, 2005.

5. Kuz'min V.I., Samokhin A.B., Gadzaov A.F., Cherdyntsev V.V. Modeli i metody opredeleniya parametrov nelineinykh protsessov. - M.: Moskovskii tekhnologicheskii universitet (MIREA), 2016. - 148 s.

6. Johnson M. Correlations of cycles in weather, solar activity, geomagnetic values and planetary configurations. - San Fransisco, Phillips and Van Orden, 1944

7. Greshilov A.A., Stakun V.A., Stakun A.A. Matematicheskie metody postroeniya prognozov. M.: Radio i svyaz', 1997. 112 s.

8. Bulashev S.V. Statistika dlya treiderov. M.: Kompaniya Sputnik+, 2003. 245 s.

9. Boks Dzh., Dzhenkins G. Analiz vremennykh ryadov. Prognoz i upravlenie. Vyp. 1. M.: Mir, 1974. 406 s.

10. Anderson T. Statisticheskii analiz vremennykh ryadov. M: Mir, 1976. 523 s.

11. Sklyar A.Ya. Analiz i ustranenie shumovoi komponenty vo vremennykh ryadakh. Uspekhi sovremennoi nauki 2017 g. № 11, 11 s.

12. Royal Observatory of Belgium Av. Circulaire, 3 B-1180 Brussels, Belgium http://www.sidc.be/silso/datafiles

Размещено на Allbest.ru

...

Подобные документы

  • Ознакомление с математическим аппаратом анализа временных рядов и моделями авторегрессии. Составление простейших моделей авторегрессии стационарных временных рядов. Оценка дисперсии и автоковариации, построение графика автокорреляционной функции.

    лабораторная работа [58,7 K], добавлен 14.03.2014

  • Изучение изменений анализируемых показателей во времени как важнейшая задача статистики. Понятие рядов динамики (временных рядов). Числовые значения того или иного статистического показателя, составляющего ряд динамики. Классификация рядов динамики.

    презентация [255,0 K], добавлен 28.11.2013

  • Понятие об основной тенденции ряда динамики, ее сущность и визуальное представление, методы анализа. Аналитическая оценка уравнения тренда. Характеристика, использование различных методов для выделения тренда временных рядов, прогнозирование показателей.

    курсовая работа [207,2 K], добавлен 04.03.2013

  • Постановка задачи прогнозирования количества отказов радиоэлектронного оборудования на следующий год в аэропорту. График общей тенденции отказов. Использование метода временных рядов. Выделение тренда, применение метода скользящих средних значений.

    курсовая работа [109,9 K], добавлен 19.12.2009

  • Исследование первого момента состоятельной оценки взаимной спектральной плотности. Задачи спектрального анализа временных рядов. Графики оценки для временного ряда, представляющего собой последовательность наблюдений температуры воздуха в городе Бресте.

    курсовая работа [324,9 K], добавлен 16.08.2011

  • Исследование числовых рядов на сходимость. Область сходимости для разных степенных рядов. Разложение функции в ряд Тейлора. Нормы сеточной функции. Исследование устойчивости разностной схемы для однородного уравнения. Совокупность разностных уравнений.

    курсовая работа [586,9 K], добавлен 19.04.2011

  • Главная задача спектрального анализа временных рядов. Параметрические и непараметрические методы спектрального анализа. Сущность понятия "временный ряд". График оценки спектральной плотности для окна Дирихле, при центрированном случайном процессе.

    курсовая работа [332,8 K], добавлен 17.09.2009

  • Решение неравенств и определение области сходимости рядов по признаку Даламбера и теореме Лейбница для знакопеременных рядов. Условия и пределы сходимости ряда. Исследование границ интервала. Проверка условия Лейбница при знакочередующемся ряде.

    контрольная работа [127,2 K], добавлен 07.09.2010

  • Построение многофакторной корреляционно-регрессионной модели доходности предприятия: оценка параметров функции регрессии, анализ факторов на управляемость, экономическая интерпретация модели. Прогнозирование доходности на основе временных рядов.

    дипломная работа [5,1 M], добавлен 28.06.2011

  • Основные понятия теории рядов. Методы суммирования расходящихся рядов. Суть метода степенных рядов, теоремы Абеля и Таубера. Метод средних арифметических, взаимоотношение между методами Пуассона-Абеля и Чезаро. Основные методы обобщенного суммирования.

    курсовая работа [288,0 K], добавлен 24.10.2010

  • Понятие сходящихся рядов с комплексными числами. Действительные и мнимые части комплексной последовательности. Сумма и разность рядов в комплексными членами. Переход при помощи Эйлера от тригонометрической формы комплексного числа к показательной.

    презентация [110,0 K], добавлен 17.09.2013

  • Определение условий сходимости положительного ряда и описание свойств гармонических рядов Дирихле. Изучение теорем сравнения рядов и описание схемы Куммера для вывода из нее признаков сравнения ряда. Вывод признаков сравнения Даламбера, Раабе и Бертрана.

    курсовая работа [263,6 K], добавлен 14.06.2015

  • Понятия, связанные с рядами и дифференциальными уравнениями. Необходимый признак сходимости. Интегрирование дифференциальных уравнений с помощью рядов. Уравнение Эйри и Бесселя. Примеры интегрирования в Maple. Приближенные вычисления с помощью рядов.

    курсовая работа [263,9 K], добавлен 11.12.2013

  • Описание признака сходимости числовых рядов Даламбера, решение задач на исследование сходимости. Формулировка радикального признака сходимости Коши знакоположительного ряда в предельной форме. Доказательство знакочередующихся и знакопеременных рядов.

    реферат [190,9 K], добавлен 06.12.2010

  • Метод степенных рядов, применяемый для суммирования расходящихся рядов. Формулировка Пуассона, теорема Абеля. Метод средних арифметических и метод Чезаро. Знакопостоянный ряд натуральных чисел. Взаимоотношение между методами Пуассона-Абеля и Чезаро.

    реферат [313,4 K], добавлен 11.04.2014

  • Область сходимости степенного ряда. Нахождение пределов, вычисление определенных интегралов. Применение степенных рядов в приближенных значениях. Изучение особенностей решения дифференциальных уравнений. Достаточное условие разложимости функции в ряд.

    курсовая работа [1,3 M], добавлен 21.05.2019

  • Вспомогательные леммы. Теоремы Джексона для к-го обобщенного модуля гладкости. Обобщенное неравенство Минковского. Тригонометрический полином. Вычисление модулей гладкости для некоторых функций. Понятие прямой и обратной теоремы теории приближений.

    курсовая работа [3,0 M], добавлен 26.05.2013

  • Понятие и общая характеристика почти возрастающей функции, ее отличительные признаки и свойства, направления исследования и определяющие критерии. Главные ограничения и требования к изучаемой функции, анализ ее непрерывности и дифференцируемости.

    реферат [677,3 K], добавлен 13.05.2014

  • Особенности дифференциального исчисления. Использование правила Коши при разложении в ряд функций cos x и sin x для перемножения рядов. Запись элементов бесконечной матрицы в форме последовательности. Абсолютная сходимость рядов, порождаемых матрицей.

    курсовая работа [1012,0 K], добавлен 06.08.2013

  • Особенности применения степенных рядов для вычислений с различной степенью точности значений функций и определенных интегралов. Рассмотрение примеров решения ряда задач этим математическим методом с условием принятия значений допустимой погрешности.

    презентация [68,4 K], добавлен 18.09.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.