Формирование интеллектуальных критериев в задачах кластеризации сложной графической информации
Применение кластеризации данных для решения задачи группировки графических образов. Построение схемы последовательной кластеризации сложной графической информации. Обзор вопроса выбора меры различия, учитывающей степень визуального сходства изображений.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 31.08.2018 |
Размер файла | 42,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ФОРМИРОВАНИЕ ИНТЕЛЛЕКТУАЛЬНЫХ КРИТЕРИЕВ В ЗАДАЧАХ КЛАСТЕРИЗАЦИИ СЛОЖНОЙ ГРАФИЧЕСКОЙ ИНФОРМАЦИИ
М.И. Бояркин
На примере схемы последовательной кластеризации сложной графической информации рассматривается вопрос выбора меры различия, учитывающей степень визуального сходства изображений.
Уровень развития теории искусственных нейронных сетей и их применения в задаче распознавания графических и иных сложных образов на данный момент достиг большого прогресса. Существует достаточное количество стабильно работающих автоматизированных систем, решающих частные случаи данной задачи.
Однако в последнее время на рынке автоматизированных информационных систем по ряду причин большими темпами растет спрос на решения, позволяющие интеллектуально обрабатывать большие объемы графической информации. Под интеллектуальной обработкой имеется в виду в первую очередь группировка, поиск и сортировка графической информации на основе ее контекстного содержания. Задачи сортировки и поиска выходят за рамки исследований данной статьи.
Для решения задачи группировки графических образов можно применить кластеризацию данных. Кластеризация - это процесс группировки образов различной природы по некоторым, заранее выбранным признакам. Образы - это вектора, состоящие из значений различных свойств или признаков кластеризуемых объектов. Набор выбранных признаков должен достаточно полно характеризовать объект с интересующей исследователя точки зрения. В нашем случае признаки - это цифровые значения пикселов изображения, построенного в градациях серого. По общему смысловому определению процедуры кластеризации, образы внутри одной группы должны быть более похожи друг на друга, чем образы из разных групп. Рассматриваемая в данной статье модифицированная модель кластеризации графических данных, учитывающая специфику обрабатываемых, в данном случае, изображений лиц людей, позволяет группировать изображения по признаку их визуального сходства [1]. Специфика данных упомянута неслучайно, так как структура данных и принцип их поступления в систему (как и в прочих случаях практического использования моделей кластеризации) накладывают существенные ограничения на выбор алгоритмических схем кластеризации.
Наиболее сложным и интересным для рассмотрения является случай реализации работы данной модели в режиме «реального времени», т.е. данные поступают в модель последовательно и постоянно, и в каждый момент времени должна существовать готовая структура сгруппированных графических образов, уже имеющихся на данный момент в системе.
Для такой структуры работы подходят так называемые «последовательные алгоритмы кластеризации». Наиболее распространенным представителем данного семейства алгоритмов является «базовая последовательная алгоритмическая схема» (basic sequential algorithmic scheme (BSAS)) [2].
Основой разработанного метода кластеризации является более сложная многоуровневая модификация последовательной алгоритмической схемы [1]. В данной статье будут рассмотрены ключевые моменты подобных алгоритмических схем в задаче группировки графических образов по признаку их визуального сходства. Для иллюстрации ключевых моментов алгоритма BSAS вполне достаточно. В разных алгоритмических схемах наибольшую важность представляют различные параметры (заранее определенное количество кластеров, выбор стоимостной функции кластеризации). Как видно из данного алгоритма (см. рисунок), ключевыми элементами являются функция , которая называется мерой различия (dissimilarity measure), а также значение порога И.
Для того чтобы функция могла исполнять роль меры различия в терминах кластеризации, она должна удовлетворять некоторым требованиям [3]: ,
где X - набор образов, подвергающихся кластеризации.
кластеризация графический образ визуальный
;(1)
;(2)
. (3)
Basic Sequential Algorithmic Scheme (BSAS)
·
·
·
o
o
§
§
o
§
§ Если нужно, обновить «представителя».
o
·
Схема работы алгоритма BSAS
В большинстве случаев . обозначает меру различия между образом и кластером. В таких случаях в основном используется мера различия между образом и «представителем» кластера C (в рассматриваемой модели представителем кластера является некоторая группа образов, называемая «ядром» кластера [1]). Видов функций, удовлетворяющих условиям (1) - (3) и эффективно исполняющих роль меры различия в прикладных задачах кластеризации, довольно много [4]. Однако в большинстве случаев используемая мера различия не учитывает специфику обрабатываемых данных, а работает в основном непосредственно с числовыми векторами и их геометрическим положением в пространстве модели (например, часто используется евклидова метрика [3]). При решении данной специфической задачи мера должна отражать не только близость образов в геометрическом смысле, но также коррелировать со степенью их визуального сходства, т.е. для эффективного решения данной задачи требуется ввести в меру некоторый «интеллектуальный» распознающий элемент.
Основная «геометрическая» составляющая меры вычисляется следующим образом: для векторов x и y выполняется разложение на ортогональные составляющие
,
,
где , - вектор «Да» и вектор «Нет» соответственно. Так как образы в системе представляются нормированными векторами действительных чисел, то соблюдается . Мера различия . Данная мера различия удовлетворяет требованиям (1)-(3). Более того, из ее описания логично вытекает значение порога. Составляющая «Нет» должна быть меньше составляющей «Да»:
.
Если требуется рассчитать меру между образом и группой образов (например, для расчета меры между образом и «представителем» кластера), то y заменяется на матрицу, сформированную из образов как из столбцов: . «Интеллектуальный» элемент вводится при помощи некоторой модификации алгоритма в целом. При поиске кластера С, в который попадает образ , выбирается не минимальный из кластеров с , а берутся все кластеры такие, что
.
После этого применяется модель распознавания на основе синергетической нейронной сети Хакена, предложенная в [5] и позднее развитая в [6, 7].
В процессе распознавания модель со временем эволюционирует в одно из устойчивых состояний - узлов в фазовом пространстве мод, соответствующее одному из запомненных образов системы согласно динамике системы дифференциальных уравнений вида:
,
где - в общем случае неотрицательные настраиваемые параметры, а начальные условия определяются соотношениями: , , ; векторы-столбцы составляют матрицу V.
Номер победившей моды указывает на кластер, к которому, в конечном итоге, будет отнесен образ .
Внедрение подобной интеллектуальной в смысле распознавания образов [6] прослойки позволяет эффективно учитывать при кластеризации визуальное сходство изображений лиц людей. Реализация данной идеи в алгоритме последовательной кластеризации совместно с реализацией других инновационных идей дает возможность создать мощную интеллектуальную систему поиска изображений в сети Интернет на основе их контекстного содержания. Эффективность и работоспособность разработанной модели кластеризации подтверждается тестированием и анализом результатов ее работы в данный момент времени в составе системы www.picollator.ru.
Библиографический список
Бояркин М.И., Данилушкин И.А., Колпащиков С.А., Миронов А.А., Рязанов А.С., Юдашкин А.А. Возможности кластеризации сложной графической информации в соответствии с топологическими свойствами фазового пространства динамической системы распознавания образов // Вестн. Самар. гос. техн. ун-та. Сер. Физ.-мат. науки. 2007. № 2(15). С. 202-204.
Hall A.V. Methods for demonstrating resemblance in taxonomy and ecology // Nature. 1967. Vol. 214. P. 830-831.
Theodoridis S., Koutroumbas K. Pattern recognition. 2ed., Elsevier, 2003.
Spath H. Cluster Analysis Algorithms. Ellis Horwood, 1980.
Haken H. Synergetic computers and cognition: A top-down approach to neural nets. Berlin: Springer-Verlag, 1991.
Юдашкин А.А. Бифуркации стационарных решений в синергетической нейронной сети и управление распознаванием образов // Автоматика и Телемеханика. 1996. №11. C. 139-147.
Yudashkin A., Danilushkin I., Kolpaschikov S., Maslennikov A., Demyanenko R. Mobile Biometric Person Identification System on the Basis of Pattern Recognition Software and GSM Cellular Networks // In: eAdoption and the Knowledge Economy: Issues, Applications, Case Studies (Proc. of eChallenges-2004, Vienna, Austria, 2004). Amsterdam, Berlin, Oxford, Tokyo, Washington: IOS Press, 2004. Part 1. P. 102-108.
Размещено на Allbest.ru
...Подобные документы
Сущность и понятие кластеризации, ее цель, задачи, алгоритмы; использование искусственных нейронных сетей для кластеризации данных. Сеть Кохонена, самоорганизующиеся нейронные сети: структура, архитектура; моделирование кластеризации данных в MATLAB NNT.
дипломная работа [3,1 M], добавлен 21.03.2011Представление графической информации в компьютере. Графические форматы и их преобразование. Информационные технологии обработки графической информации. Формирование и вывод изображений. Файлы векторного формата и растровый графический редактор.
курсовая работа [1,0 M], добавлен 25.04.2013Технология обработки графической информации с помощью ПК, применение в научных и военных исследованиях: формы, кодирование информации, ее пространственная дискретизация. Создание и хранение графических объектов, средства обработки векторной графики.
реферат [20,7 K], добавлен 28.11.2010Стандартное устройство вывода графической информации в компьютере IBM - система из монитора и видеокарты. Основные компоненты видеокарты. Графическое и цветовое разрешение экрана. Виды мониторов и видеокарт. Мультимедиа-проекторы, плазменные панели.
контрольная работа [38,7 K], добавлен 09.06.2010Обзор методов реализации алгоритмов искусственного интеллекта. Примеры интеллектуальных систем, основанных на алгоритмах самообучения и кластеризации данных. Создание общей структурной схемы. Выбор языков программирования и инструментальных средств.
дипломная работа [1,6 M], добавлен 20.08.2017Особенности кластеризации социальных сетей, методы распознавания сообществ. Особенности локального прореживания графа. Разработка рекомендаций по выбору метода кластеризации для выделенных классов задач. Оптимизация процесса дальнейшей обработки данных.
курсовая работа [1,8 M], добавлен 30.06.2017Назначение, классификация и экономическая целесообразность использования устройств ввода текстовой и графической информации. Обзор и сравнительный анализ программ распознавания образов Acrobat Reader и ASDee. Охрана труда при работе на компьютере.
дипломная работа [4,3 M], добавлен 23.07.2010Основы для проведения кластеризации. Использование Data Mining как способа "обнаружения знаний в базах данных". Выбор алгоритмов кластеризации. Получение данных из хранилища базы данных дистанционного практикума. Кластеризация студентов и задач.
курсовая работа [728,4 K], добавлен 10.07.2017Роль информации в мире. Теоретические основы анализа Big Data. Задачи, решаемые методами Data Mining. Выбор способа кластеризации и деления объектов на группы. Выявление однородных по местоположению точек. Построение магического квадранта провайдеров.
дипломная работа [2,5 M], добавлен 01.07.2017Общие сведения о графической информации. Характеристика растровой, векторной и демонстрационной графики. Обзор программ обработки и просмотра графических изображений Paint, Adobe Photoshop, MS Power Point, ACDSee. Возможности графических редакторов.
курсовая работа [55,7 K], добавлен 01.07.2010Изучение существующих методов и программного обеспечения для извлечения числовых данных из графической информации. Программное обеспечение "graphtrace", его структура и методы обработки данных. Использование этой системы для данных различного типа.
дипломная работа [3,9 M], добавлен 06.03.2013Исследование истории концепции электронного издания для образовательных целей. Характеристика требований к электронному изданию учебного назначения. Анализ технологии создания проекта "Обработка графической информации". Описание алгоритма решения задачи.
курсовая работа [505,8 K], добавлен 13.01.2015Анализ проблем, возникающих при применении методов и алгоритмов кластеризации. Основные алгоритмы разбиения на кластеры. Программа RapidMiner как среда для машинного обучения и анализа данных. Оценка качества кластеризации с помощью методов Data Mining.
курсовая работа [3,9 M], добавлен 22.10.2012Знакомство с идеей векторного способа представления изображений в цифровом виде. Разработка последовательности команд для кодирования графического объекта. Основные команды; двоичное кодирование графической информации, растровый и векторный варианты.
презентация [128,5 K], добавлен 05.01.2012Преобразование графической информации из аналоговой формы в цифровую. Количество цветов, отображаемых на экране монитора. Расчет объема видеопамяти для одного из графических режимов. Способы хранения информации в файле. Формирование векторной графики.
презентация [2,1 M], добавлен 22.05.2012Представление графической информации в компьютере. Графические форматы и их преобразование. Назначение и функции Corel Draw и Adobe Photoshop. Практическое построение таблиц в MS Excel о доходах и расходах семьи за квартал, общий вид гистограммы.
контрольная работа [1,1 M], добавлен 27.04.2013Общие сведения о графической информации: понятие и содержание, типы графики и их особенности (растровая, векторная и демонстрационная). Обзор современных программ обработки и просмотра графических изображений: Paint, Adobe Photoshop, PowerPoint.
курсовая работа [50,4 K], добавлен 20.12.2013Характеристика растровой, векторной и демонстрационной графики. Способы формирования изображений. Обзор современных программ обработки и просмотра графической информации: Paint, Adobe Photoshop, MS Power Point. Основные функции графических редакторов.
курсовая работа [36,8 K], добавлен 07.04.2015Обзор пакетов программ, предназначенных для визуализации и анализа данных. Обоснование выбора среды программирования. Организация аварийного буфера. Передача данных от нижнего уровня к верхнему и сохранение данных. Отображение данных в графической форме.
дипломная работа [512,4 K], добавлен 28.08.2012Разработка приложения, целью которого ставится преобразование черно-белых полутоновых изображений в цветные. Обзор методики обработки изображения, способов преобразования изображения с помощью нейронной сети. Описания кластеризации цветового пространства.
дипломная работа [6,3 M], добавлен 17.06.2012