Локально-аппроксимационные алгоритмы классификации траекторий
Применение процедур локальной аппроксимации для решения задачи классификации траекторий на основе критериев точечного сходства. Представление рядов в виде матричных наборов данных и применение алгоритма нечетких средних для их дальнейшей кластеризации.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 27.02.2019 |
Размер файла | 32,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
ЛОКАЛЬНО-АППРОКСИМАЦИОННЫЕ АЛГОРИТМЫ КЛАССИФИКАЦИИ ТРАЕКТОРИЙ
Гимаров В.А., Гимаров В.В., Дли М.И.
Аннотация
В настоящее время анализ динамических рядов является актуальной проблемой для многих предметных областей, например, таких как медицинские исследования, анализ социально-экономических процессов, диагностика состояния сложных технических систем и других. Алгоритмы анализа таких данных разнообразны и построены на структурном и поточечном сопоставлении траекторий, отражающих динамические ряды. В статье изложены предложения автора о применении процедур локальной аппроксимации для решения задачи классификации траекторий на основе критериев точечного сходства. Суть представленного метода заключается в представлении рядов в виде матричных наборов данных и применении алгоритма нечетких c-средних для их дальнейшей кластеризации.
Ключевые слова: динамические ряды, локальная аппроксимация, нечеткая логика, алгоритм нечетких c-средних, кластеризация, центры кластеров.
Annotation
LOCAL APPROXIMATION CLASSIFICATION ALGORITHM PATHS
Gimarov V. A., Gimarov V. V., Dli M. I.
Currently, the analysis of dynamic rows is an urgent problem for many areas, such as medical research, analysis of socio- economic processes, diagnostics of complex technical systems, and others. Algorithms for analyzing such data are varied and are built on structural and pointwise comparison trajectories reflecting the dynamic rows. The article describes the author's proposals on the use of local approximation procedures for solving the problem of trajectory classification based on the criteria of point similarity. The essence of the method is presented in the rows representation in the form of matrix data sets and application of the algorithm of fuzzy c- means for their further clustering.
Key words: time series, local approximation, fuzzy logic algorithm fuzzy c-means, clustering, cluster centers.
На сегодняшний день в основе применяемых методов анализа данных лежит представление исследуемых объектов в виде вектора значений определенного набора признаков, которые описывают состояние объекта в данный момент, не учитывая при этом временной динамики изменения значений. Такой подход является статическим и плохо применим для решения большинства практических задач, в которых анализ динамики изменения признаков является более значимым, чем отдельный временной срез значений параметров [7]. В связи с этим проведение анализа данных должно основываться на исследовании траекторий изменения значений факторов, описывающих состояние исследуемого объекта.
Основы классификационного анализа динамических данных рассмотрены в работах отечественных и зарубежных ученых [1,2].
В работе [2] в качестве показателя классификации используется средняя близость точек в классе. Однако при использовании многомерной информации, изменяющейся во времени, использование данных алгоритмов классификации невозможно, так как данные невозможно сопоставить. В работе [2] проанализирована возможность выполнения динамического классификационного анализа на основе критерия качества классификации в виде обобщенного среднего.
В работе [1] классификация траекторий основана на применении аппарата нечеткой логики и предполагает выделение двух типов схожести траекторий:
структурное сходство: чем больше две различные траектории имеют общего в форме, динамике изменения, характеристиках, тем больше сходства между этими двумя траекториями;
точечное сходство: чем меньше расстояние между точками двух траекторий, тем большее сходство наблюдается между ними.
Структурное сравнение, прежде всего, используется в ситуациях, когда необходимо осуществить классификацию фрагмента траектории с высокой точностью. Поточечное сходство предопределяет близость траекторий в пространстве. В этом случае поведение траекторий не является единственным фактором, и некоторые различия по форме допустимы, так как траектории пространственно близки. В отличие от структурного сходства, расчет точечного не требует использования характеристик траекторий и основывается непосредственно на их значениях.
Как представляется, для решения задачи классификации траекторий с использованием критериев точечного сходства, может быть применен алгоритм c-means и методы локальной аппроксимации, основные положения которых изложены в работах [5,6]. Применение процедур локальной аппроксимации для решения задачи классификации траекторий включает следующие этапы [4]:
1) Построение локально-аппроксимационных моделей, описывающих траектории изменения состояний системы, которые представляют собой наборы строковых данных вида .
Для получения таких данных применяется процедура [3]:
1. Проведение эксперимента с фиксацией значений и создание исходной матрицы U с количеством строк, большим М.
2. Ввод нового значения . Расчет прогнозируемой величины по формуле:
задача алгоритм матричный аппроксимация
где F - матрица размера , строками которой являются
Анализ истинности неравенства:
где d - некоторая заданная константа, предопределяющая показатель точности модели.
Если неравенство верно, в матрицу U дополнительно включается строка . В противном случае матрица U не изменяется.
4. Анализ выполнения условий прерывания работы алгоритма (общее число значений , используемых для формирования матрицы U может быть как фиксированным или переменным); например, условием останова процесса обучения может быть невыполнение неравенства, приведенного на этапе 3 раз подряд. При его неисполнении осуществляется переход к этапу 2, в противном случае - переход к пункту 4.
Необходимо отметить, что нескольких уточняющих итераций (по выбору параметров ) достаточно для создания матрицы U умеренной величины, при которой прогностические показатели алгоритма отвечают допустимым.
В результате, любая из анализируемых траекторий изменения состояний системы представляется в виде набора данных (матрицы) U. Для проведения кластеризации траекторий на определенное (заданное заранее) количество подмножеств (кластеров), в каждом из которых анализируемые объекты схожи между собой, целесообразно применять метод нечетких c-средних.
2) На каждом этапе стандартного алгоритма нечетких С-средних в соответствии со следующей формулой рассчитывается значение функции принадлежности объекта i к классу j:
где Хi i-ый объект (траектория), Vj и Vk центры кластеров j и k, с число кластеров, m степень размытости кластеров.
Выражение d(X,V) используется для представления меры близости между двумя векторами. Для определения данной меры используется предложенная автором методика.
На первом этапе для каждой пары матриц U, описывающих анализируемые траектории динамики изменения состояния системы, проводится следующая процедура.
Проводится поиск строк в наборах данных U, максимально близких друг к другу по значениям. Так, в локальной модели поиск близких строк будет выполняться в соответствии с выражением [6]:
Для найденных пар строк наборов данных проводится построение локальных моделей и рассчитываются величины . Таким образом, мера близости двух траекторий может быть определена с помощью выражения:
С помощью данной меры сходства между функциями классический алгоритм нечетких С-средних можно использовать для классификации динамических объектов. При этом расчет центров кластеров bi будет осуществляться по формуле:
, p - число кластеров
Перерасчет значений функций принадлежности:
Таким образом, с помощью описанного алгоритма траектории динамики состояния системы объединяются в отдельные классы, что позволяет повысить эффективность принятия управленческих решений.
Литература
1. Angstenberger L. Dynamic Fuzzy Pattern Recognition with Applications to Finance and Engineering. Boston: Kluwer Academic Publishers, 2001.
2. Бауман Е.В., Дорофеюк А.А. Классификационный анализ данных // Труды Международной конференции по проблемам управления. - Том 1. - М.: СИНТЕГ, 1999. - С. 62-77.
3. Гимаров В.А., Гимаров В.В., Дли М.И., Иванова И.В. Модели поведения агентов для мультиагентной системы управления телекоммуникационным предприятием // Научное обозрение. 2013. № 12. С. 223-226.
4. Гимаров В.А., Гимаров В.В., Иванова И.В. Построение динамической мультиагентной модели с использованием классификации трендов // Программные продукты и системы. 2011. № 3. С. 40.
5. Дли М.И., Круглов В.В., Осокин М.В. Локально-аппроксимационные модели социально-экономических систем и процессов. - М.: Наука. Физматлит, 2000.
6. Дли М.И. Обобщенная локально-аппроксимационная модель динамического объекта // Программные продукты и системы. - 1999. - №3. - С. 15-21.
7. Стоянова О.В., Иванова И.В., Багузова О.В. Интеллектуальная поддержка принятия решений по управлению сложными проектами // Вестник Российской академии естественных наук (Санкт-Петербург). 2012. № 1. С. 88-90.
Размещено на Allbest.ru
...Подобные документы
Разработка самообучающейся интеллектуальной информационной системы для анализа кредитоспособности заемщика и оценки кредитных рисков на основе подхода иммунокомпьютинга. Применение процедур кластеризации, классификации и формирования оценок рисков.
курсовая работа [822,3 K], добавлен 09.06.2012Статистическая аппроксимация законов распределения. Основные теоретические сведения теории классификации. Алгоритмы параметрической аппроксимации функции плотности распределения вероятностей. Апробация и применение средств автоматизации в виде макросов.
дипломная работа [5,0 M], добавлен 23.08.2009Сущность и понятие кластеризации, ее цель, задачи, алгоритмы; использование искусственных нейронных сетей для кластеризации данных. Сеть Кохонена, самоорганизующиеся нейронные сети: структура, архитектура; моделирование кластеризации данных в MATLAB NNT.
дипломная работа [3,1 M], добавлен 21.03.2011Обзор методов и подходов решения поставленной задачи аппроксимации логического вывода экспертной системы. Разработка и описание метода сетевого оператора для решения данной задачи. Разработка алгоритма решения. Проведение вычислительного эксперимента.
дипломная работа [1,5 M], добавлен 23.02.2015Сущность интеллектуальных систем. Запись математического выражения в виде ориентированного графа. Особенности разработки генетического алгоритма для решения задачи аппроксимации логического вывода экспертной системы на основе метода сетевого оператора.
дипломная работа [1,0 M], добавлен 17.09.2013Описание решения задачи, ее постановка, общий подход к решению. Представление исходных данных, условий задачи и целей ее решения. Составление алгоритма решения поставленной задачи. Написание программного обеспечения и тестирование конечного продукта.
курсовая работа [1,1 M], добавлен 03.07.2011Оптимизация решения задачи с помощью алгоритма отжига. Анализ теории оптимизации как целевой функции. Метод градиентного спуска. Переменные и описание алгоритма отжига. Представление задачи коммивояжера через граф. Сведение задачи к переменным и решение.
курсовая работа [784,0 K], добавлен 21.05.2015Разработка алгоритма аппроксимации данных методом наименьших квадратов. Средства реализации, среда программирования Delphi. Физическая модель. Алгоритм решения. Графическое представление результатов. Коэффициенты полинома (обратный ход метода Гаусса).
курсовая работа [473,6 K], добавлен 09.02.2015Обзор алгоритмов решения задачи: точные методы, генетический и жадный алгоритмы. Характеристика жадного алгоритма: его описание, анализ точности приближения, вычислительной сложности. Программная реализация и проверка корректности и быстродействия.
курсовая работа [228,7 K], добавлен 14.10.2017Программное обеспечение для получения исходных данных для обучения нейронных сетей и классификации товаров с их помощью. Алгоритм метода обратного распространения ошибки. Методика классификации товаров: составление алгоритма, программная реализация.
дипломная работа [2,2 M], добавлен 07.06.2012Создание базы данных, построение на ее основе информационной системы в виде веб-сайта. Обоснование и выбор системы управления базой данных. Датологическое проектирование, разработка алгоритма решения задачи, создание форм. Результаты обработки данных.
отчет по практике [904,1 K], добавлен 13.04.2015Этапы решения задачи классификации цифр арабского алфавита на основе нейронных сетей: выбор класса, структуры и пакета нейронной сети, ее обучение, требования к информационной и программной совместимости, составу и параметрам технических средств.
реферат [111,6 K], добавлен 19.10.2010Понятие алгоритма и история его формулировки, характерные свойства и формы представления. Виды алгоритмический структур и их признаки. Алгоритмы сортировки и методы их реализации. Применение алгоритмических законов для решения экономических задач.
курсовая работа [359,0 K], добавлен 03.01.2010Симметричные криптосистемы; алгоритмы шифрования и дешифрования данных, их применение в компьютерной технике в системах защиты конфиденциальной и коммерческой информации. Основные режимы работы алгоритма DES, разработка программной реализации ключа.
курсовая работа [129,6 K], добавлен 17.02.2011Графоаналитический метод решения задач. Получение задачи линейного программирования в основном виде. Вычисление градиента и поиск экстремумов методом множителей Лагранжа. Параболоид вращения функции. Поиск решения на основе условий Куна-Таккера.
контрольная работа [139,3 K], добавлен 13.09.2010Проблема представления знаний. Представление декларативных знаний как данных, наделенных семантикой. Представление процедурных знаний как отношений между элементами модели, в том числе в виде процедур и функций. Представление правил обработки фактов.
курсовая работа [33,1 K], добавлен 21.07.2012Решение задачи средствами Паскаль и блок-схемы выполненных процедур, составление программы. Результаты решения задачи по перевозке грузов. выполнение задачи средствами MS Excel, создание таблиц. Порядок и особенности решения задачи в среде MathCAD.
курсовая работа [2,5 M], добавлен 27.02.2011Этапы работы генетического алгоритма, область его применения. Структура данных, генерация первоначальной популяции. Алгоритм кроссинговера - поиск локальных оптимумов. Селекция особей в популяции. Техническое описание программы и руководство пользователя.
реферат [1014,2 K], добавлен 14.01.2016Особенности кластеризации социальных сетей, методы распознавания сообществ. Особенности локального прореживания графа. Разработка рекомендаций по выбору метода кластеризации для выделенных классов задач. Оптимизация процесса дальнейшей обработки данных.
курсовая работа [1,8 M], добавлен 30.06.2017Программная реализация метода оптимальной классификации одномерного упорядоченного множества на основе "склеивания с ближайшим". Проверка работоспособности программы на основе алгоритмов классификации, вычислительные эксперименты по оценке эффективности.
курсовая работа [414,4 K], добавлен 24.05.2015