Применение деревьев решений в задачах прогнозирования многомерных временных рядов

Подходы к решению задачи прогнозирования многомерных временных рядов. Обоснование применения деревьев решений для анализа дискретного многомерного временного ряда с неизменными во времени статистическими свойствами. Способы построения деревьев решений.

Рубрика Математика
Вид статья
Язык русский
Дата добавления 27.02.2019
Размер файла 225,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Применение деревьев решений в задачах прогнозирования многомерных временных рядов

Одной из важных задач во многих отраслях промышленности является задача прогнозирования возникновения нештатных ситуаций в многомерной среде временных рядов. Например, на нефтеперерабатывающих заводах сотни датчиков переменных процессов установлены на различных участках блоков обработки. В процессе мониторинга за критическими переменными, существенно влияющими на работу, при срабатывании сигнала тревоги бывает слишком поздно, чтобы выполнить корректирующее действие. Это может привести к снижению качества продукта, или аварии. Таким образом, большое значение имеет задача прогнозирования возникновения нештатных ситуаций предсказание того, когда эти критические переменные достигнут нежелательных диапазонов. В этом случае инженеры могут иметь достаточно времени для принятия необходимых мер.

Традиционно, инженеры и исследователи пытались построить математические модели, чтобы понять физический процесс и определить временные отношения между переменными. Однако в задачах прогнозирования многомерных временных рядов имеется множество переменных, и анализ их взаимодействия является чрезвычайно сложным процессом. Построение точной математической модели очень затруднительно, а иногда и невозможно. Процедуры оценки параметров и прогнозирования, зачастую предполагают, что математическая модель процесса известна. Однако исследования в данной области свидетельствуют, что в данных нет отчетливо выраженных регулярных составляющих, и поэтому возникает необходимость построения прогностической модели непосредственно из многомерных временных рядов [1]. В этих целях используются деревья решений в задачах прогнозирования временных рядов. Рассмотрим подробнее сами деревья и способы их построения.

Пусть для описания некоторого объекта исследования используется набор случайных характеристик значения которых меняются с течением времени. Характеристики могут быть как количественными, так и качественными.

Пусть характеристики измеряются в последовательные моменты времени … Для определенности будем предполагать, что измерения проводятся через равные интервалы времени. Обозначим через значение характеристики в момент времени . Таким образом, имеем n-мерный разнотипный временной ряд

Пусть выбрана некоторая прогнозируемая характеристика . Обозначим, для удобства, эту характеристику через . Характеристика может быть как количественной, так и качественной.

Рассмотрим произвольный момент времени , а также набор предыдущих моментов времени , где - некоторая заданная величина (лаг или «глубина предыстории»), . Будем полагать, что условное распределение , при условии, что заданы все предыдущие значения , зависит только от значений ряда в предыдущих моментов времени.

Кроме того, предположим, что эта зависимость одна и та же для любых . Данное предположение означает, что статистические свойства ряда, определяющие зависимость, неизменны во времени.

Для произвольного момента времени можно образовать набор представляющий собой реализации временного ряда в предшествующих моментов времени. Набор назовем предысторией длины для момента .

Требуется построить модель зависимости характеристики от ее предыстории для произвольного момента времени. Модель позволяет прогнозировать значение характеристики в будущий момент времени по значениям характеристик за прошлых моментов. Иначе говоря, данная модель представляет собой решающую функцию для прогнозирования по предыстории.

В зависимости от типа характеристики можно рассматривать различные типы задач прогнозирования.

1. - качественная характеристика. Задачу данного типа, по аналогии с обычной задачей распознавания образов, назовем задачей распознавания динамического объекта. Анализируемый объект может с течением времени менять соответствующий ему образ.

2. - количественная характеристика: В этом случае имеем задачу прогнозирования количественной характеристики объекта.

Решающую функцию для прогнозирования временного ряда по его предыстории будем представлять в виде дерева решений. В нем проверяются высказывания относительно некоторых характеристик в некоторый j-й предыдущий отсчет времени. Для удобства, будем обозначать эти характеристики, с учетом предыстории, через (рисунок 1). Таким образом, означает «характеристика в j-й предыдущий момент времени (относительно текущего момента).

Итак, пусть имеется набор измерений характеристик в моменты времени и задано значение . Таким образом, имеем многомерный разнотипный временной ряд длины . Сформируем множество всех предысторий длины для моментов времени .

Для любого заданного дерева решений в задаче прогнозирования по предыстории можно определить его качество.

Рисунок 1. Пример дерева решений

прогнозирование многомерный статический

Для обычного дерева: обозначим через прогнозируемое значение , полученное с помощью дерева по предыстории , тогда критерий качества будет

где

для задачи распознавания динамического объекта;

для задачи прогнозирования количественной характеристики.

Будем считать, что данный ряд используется для «обучения» прогнозированию.

Пусть имеется ряд длины , . Тогда можно сравнить полученные в результате обучения прогнозируемые значения с «истинными» значениями и определить погрешность прогноза. В этом случае будем говорить, что данный ряд используется для «контроля» качества прогнозирования.

Опишем несколько способов, при использовании которых исходная задача построения дерева решений разбивается на ряд более простых задач распознавания образов или регрессионного анализа, в зависимости от типа прогнозируемой характеристики Y.

Набор представим в виде таблицы , содержащей строк и столбцов. Тогда исходной информацией для прогнозирования является набор таблиц , вместе с указанными для каждой таблицы значениями прогнозируемой характеристики .

Mножество можно представить в виде трехмерной таблицы размерности , которой будет соответствовать вектор (рисунок 2). Однако имеющиеся методы распознавания или регрессионного анализа с использованием деревьев решений используют в качестве входной информации двумерные таблицы [2].

Рисунок 2. Трехмерная таблица размерности

Можно указать несколько различных способов использования данных методов для решения задачи анализа трехмерных таблиц данных.

Каждая таблица представляется в виде строки соответствующих значений характеристик

(иначе говоря, таблица просто «вытягивается» в строку).

В результате получаем двумерную таблицу размерности , для которой затем строится решающая функция, представленная в виде дерева решений.

Данный способ очень прост в реализации, однако, как показывают исследования, полученные решения, в условиях большого числа характеристик, большой длины предыстории и сравнительно малой длины ряда, могут оказаться неустойчивыми, т.е. будут давать большую ошибку на контрольном ряде (известно, что эффект неустойчивости проявляется при малом объеме выборки и большом числе характеристик).

Исходная задача решается в два этапа.

На первом этапе рассматриваются двумерных таблиц вида , где принимает значения - значения - значения образованных «горизонтальными» срезами исходной трехмерной таблицы данных (рисунок 3).

Рисунок 3. Срезы трехмерной таблицы данных

Строятся различных деревьев решений для предсказания величины по каждой из данных таблиц. Каждая из таблиц, с помощью построенного дерева, «свертывается» в одномерную строку символов (каждый символ кодируется номером соответствующей конечной вершины дерева). Таким образом, получается двумерная таблица, для которой на втором этапе снова строится дерево решений. Затем каждый символ обратно преобразуется в соответствующую цепочку высказываний.

3. Задача решается также в несколько этапов.

1) Рассматриваются таблиц вида , где принимает значения

- значения - значения , и затем таблиц вида , где принимает значения - значения - значения . Таким образом, имеем «горизонтальных» и «вертикальных» срезов исходной таблицы (рисунок 4). Для каждой из полученных двумерных таблиц строится дерево решений. В итоге получаем набор деревьев . Обозначим через наилучшее из этих деревьев.

2) Рассматриваются все конечные вершины дерева и выделяются те из них, для которых ошибка прогнозирования превышает заданную величину. Для каждой из этих вершин формируется соответствующий набор предысторий и далее процесс достраивания дерева для повторяется, начиная с п. 1).

прогнозирование многомерный статический

Рисунок 4. Результирующий набор деревьев

3) Процесс продолжается до тех пор, пока на некотором шаге полученное дерево не будет удовлетворять условию окончания (т.е. если число конечных вершин достигнет определенной величины , либо ошибка прогнозирования станет меньше заданного значения).

Можно заметить, что данный способ отличается от предыдущего пошаговым достраиванием дерева решений для прогнозирования.

Построенные деревья решений были протестированы на реальных данных, результаты эксперимента свидетельствуют, что они выполняют достаточно точные прогнозы [1].

Таким образом, применение деревьев решений в задачах прогнозирования многомерных временных рядов является практически обоснованным.

Литература

1. B. Liu and J. Liu. Multivariate Time Series Prediction via Temporal Classification. // Proceeding of the 18th International Conference on Data Engeneering. Computer Society. Vol 2, 2002, pp.17.

2. Lbov, G. and Berikov, V. Recognition of a Dynamic Object and Prediction of Quantitative Characteristics in the Class of Logical Functions. // Pattern Recognition and Image Analysis. Vol 7, №4, 1997, pp. 407-413.

Размещено на Allbest.ru

...

Подобные документы

  • Ознакомление с математическим аппаратом анализа временных рядов и моделями авторегрессии. Составление простейших моделей авторегрессии стационарных временных рядов. Оценка дисперсии и автоковариации, построение графика автокорреляционной функции.

    лабораторная работа [58,7 K], добавлен 14.03.2014

  • Главная задача спектрального анализа временных рядов. Параметрические и непараметрические методы спектрального анализа. Сущность понятия "временный ряд". График оценки спектральной плотности для окна Дирихле, при центрированном случайном процессе.

    курсовая работа [332,8 K], добавлен 17.09.2009

  • Изучение изменений анализируемых показателей во времени как важнейшая задача статистики. Понятие рядов динамики (временных рядов). Числовые значения того или иного статистического показателя, составляющего ряд динамики. Классификация рядов динамики.

    презентация [255,0 K], добавлен 28.11.2013

  • Основные понятия оптимизационных задач. Нахождение наибольших или наименьших значений многомерных функций в заданной области. Итерационные процессы с учетом градиента. Функционал для градиентного равенства и применение его в задачах условной оптимизации.

    реферат [81,5 K], добавлен 15.08.2009

  • Понятие об основной тенденции ряда динамики, ее сущность и визуальное представление, методы анализа. Аналитическая оценка уравнения тренда. Характеристика, использование различных методов для выделения тренда временных рядов, прогнозирование показателей.

    курсовая работа [207,2 K], добавлен 04.03.2013

  • Постановка задачи прогнозирования количества отказов радиоэлектронного оборудования на следующий год в аэропорту. График общей тенденции отказов. Использование метода временных рядов. Выделение тренда, применение метода скользящих средних значений.

    курсовая работа [109,9 K], добавлен 19.12.2009

  • Исследование первого момента состоятельной оценки взаимной спектральной плотности. Задачи спектрального анализа временных рядов. Графики оценки для временного ряда, представляющего собой последовательность наблюдений температуры воздуха в городе Бресте.

    курсовая работа [324,9 K], добавлен 16.08.2011

  • Понятие о голоморфном решении задачи Коши. Теорема Коши о существовании и единственности голоморфного решения задачи Коши. Решение задачи Коши для линейного уравнения второго порядка при помощи степенных рядов. Интегрирование дифференциальных уравнений.

    курсовая работа [810,5 K], добавлен 24.11.2013

  • Исследование семейства решений линейной системы и связь семейства решений этой системы с её отражающей функцией, а также её свойствами. Установление условий, при которых линейная система имеет общее решение, четная часть которого не зависит от времени.

    курсовая работа [103,9 K], добавлен 21.08.2009

  • Особенности применения степенных рядов для вычислений с различной степенью точности значений функций и определенных интегралов. Рассмотрение примеров решения ряда задач этим математическим методом с условием принятия значений допустимой погрешности.

    презентация [68,4 K], добавлен 18.09.2013

  • Определение условий сходимости положительного ряда и описание свойств гармонических рядов Дирихле. Изучение теорем сравнения рядов и описание схемы Куммера для вывода из нее признаков сравнения ряда. Вывод признаков сравнения Даламбера, Раабе и Бертрана.

    курсовая работа [263,6 K], добавлен 14.06.2015

  • Характеристика булевой алгебры и способы представления булевых функций. Понятие и сущность бинарных диаграммах решений. Упорядоченные бинарные диаграммы решений, их построение и особенности применения для обработки запросов в реляционных базах данных.

    дипломная работа [391,7 K], добавлен 21.01.2010

  • Область сходимости степенного ряда. Нахождение пределов, вычисление определенных интегралов. Применение степенных рядов в приближенных значениях. Изучение особенностей решения дифференциальных уравнений. Достаточное условие разложимости функции в ряд.

    курсовая работа [1,3 M], добавлен 21.05.2019

  • Степенные ряды. Радиус сходимости. Ряды Лорана. Полюса и особые точки. Интегрирование дифференциальных уравнений при помощи степенных рядов. Общее дифференциальное уравнение Риккати. Исследование решений в окрестности полюса и существенно особой точки.

    дипломная работа [252,1 K], добавлен 15.12.2012

  • Решение неравенств и определение области сходимости рядов по признаку Даламбера и теореме Лейбница для знакопеременных рядов. Условия и пределы сходимости ряда. Исследование границ интервала. Проверка условия Лейбница при знакочередующемся ряде.

    контрольная работа [127,2 K], добавлен 07.09.2010

  • Построение многофакторной корреляционно-регрессионной модели доходности предприятия: оценка параметров функции регрессии, анализ факторов на управляемость, экономическая интерпретация модели. Прогнозирование доходности на основе временных рядов.

    дипломная работа [5,1 M], добавлен 28.06.2011

  • Элементы общей теории многомерных пространств. Понятие векторного многомерного пространства на основе аксиоматики Вейля. Евклидово векторное пространство. Четырёхмерное пространство, его пределение и исследование. Применение многомерной геометрии.

    дипломная работа [1,0 M], добавлен 24.02.2010

  • Рассмотрение понятия и видов графов как совокупности непустого конечного множества элементов; условия их связанности. Доказательства существования замкнутых Эйлеровой, Гамильнотовой и бесконечной цепей. Ознакомление с элементарными свойствами деревьев.

    курсовая работа [1,4 M], добавлен 10.02.2012

  • Появление понятия функций Ляпунова. Развитие теории устойчивости движения. Применение функций Ляпунова к исследованию продолжимости решений дифференциальных уравнений. Методы построения функций Ляпунова, продолжимость решений уравнений третьего порядка.

    дипломная работа [543,4 K], добавлен 29.01.2010

  • Задачи с параметрами и методы их решений. Использование свойств функций, параметра как равноправной переменной, симметрии аналитических выражений, "каркаса" квадратичной функции, теоремы Виета. Трансцендентные уравнения с параметром и методы их решений.

    дипломная работа [3,2 M], добавлен 06.11.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.