Использование локализованных фракталов для кодирования и распознавания изображений

Фрактальное кодирование изображений для распознавания. Анализ пространственного распределения доменных и ранговых блоков, полученных в процессе кодирования. Построение фрактального кода, снижающего влияние дефектов изображения на качество распознавания.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 27.05.2018
Размер файла 616,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.Allbest.ru/

Использование локализованных фракталов для кодирования и распознавания изображений

В.К. Гулаков, С.Б. Клепинин

Аннотация

Рассмотрен вопрос фрактального кодирования изображения для задач распознавания изображений. Проанализировано пространственное распределение соответствующих друг другу доменных и ранговых блоков, полученных в процессе кодирования. Предложен новый метод построения фрактального кода, призванный минимизировать влияние дефектов изображения на качество распознавания.

Ключевые слова: фракталы, системы итерируемых функций, распознавание изображений, фрактальный код изображения, локализованные фракталы.

Человеческий глаз способен различать лица достаточно хорошо с минимальными усилиями при разных условиях. Существует необходимость в разных областях экономики (например, охрана общественного порядка, медицина) получить автоматическую систему распознавания, работающую с подобной скоростью и точностью. За последние 20 лет было предложено большое количество алгоритмов решения этой задачи на основе нейронных сетей [1], скрытых марковских моделей [2], самоорганизующихся карт [3] и других способов.

В данной статье представлен улучшенный метод фрактального распознавания лиц. Для получения фрактального кода [4] изображение необходимо разбить на множество ранговых и доменных блоков. Для каждого рангового блока ищется наиболее подходящий (по некоторым критериям) доменный блок, который может быть подвержен аффинным преобразованиям. Также могут быть скорректированы контрастность и яркость. Сжимающее отображение, преобразующее доменный блок в ранговый, называется фрактальным кодом рангового блока. Фрактальный код изображения - это коллекция фрактальных кодов всех его ранговых блоков.

Распределение пар «доменный блок - ранговый блок» зависит от содержания изображения и используемого алгоритма фрактального кодирования. Некоторые методы ищут лучшее совпадение пар блоков, другие - первое совпадение, удовлетворяющее некоторому пороговому значению. Доменный и ранговый блоки могут принимать форму квадрата, прямоугольника, треугольника. Размер доменного блока может быть как фиксированным, так и переменным. Все эти параметры можно использовать для того, чтобы сделать фрактальный код нечувствительным к небольшим изменениям в изображении. Так как нет очевидной связи между расположением соответствующих ранговых и доменных блоков, то изменения в одной части изображения могут повлиять на фрактальный код другой части изображения.

В этой статье предлагается метод фрактального кодирования, позволяющий сделать фрактальный код одной части изображения нечувствительным к случайным изменениям других частей того же изображения.

Локализованные фракталы. Существует ли зависимость между позициями на изображении рангового блока и соответствующего ему во фрактальном коде доменного блока? Для ответа на этот вопрос мы построили фрактальный код для изображения в градациях серого размером 256 x 256 (использовался классический алгоритм фрактального кодирования на основе квадро-дерева и квадратичной метрики [5]). На рис. 1 показаны три случайным образом выбранные пары «ранговый блок - доменный блок».

Рис. 1. Расположение трех произвольных пар «ранговый блок - доменный блок» на изображении Lena (пару составляют квадраты одного типа: меньшего размера - ранговый блок, большего - доменный)

Как видно из рисунка, доменные блоки расположены на достаточном расстоянии от ранговых, интуитивно нельзя выявить логику взаимоположения. Далее для всех пар во фрактальном коде была вычислена разница между X-координатой центра рангового блока и центра соответствующего доменного блока. Распределение полученных величин представлено на рис. 2. Из графика можно сделать вывод о том, что не существует предрасположенности к ассоциации доменных блоков из некоторой окрестности ранговых блоков. На рис. 3 представлена аналогичная картина распределения расстояний по X-координате для пар случайно выбранных точек в рамках одного и того же изображения.

Рис. 2. Распределение расстояний между центрами ранговых и доменных блоков, составляющих фрактальный код (ось X - расстояние между центрами блоков в пикселях, ось Y - количество пар «ранговый блок - доменный блок»)

Ювал Фишер рассматривает фрактальное кодирование с позиции задачи сжатия изображений. Он также задаётся вопросом о наличии связи положений рангового и доменного блоков и приходит к выводу, чтотакой зависимости в общем случае нет [6]. С точки зрения алгоритмов сжатия изображений отсутствие таких закономерностей действительно может не играть большой роли. К сожалению, мы не можем сказать то же самое относительно задачи распознавания образов.

Рис. 3. Распределение расстояний между парами случайно выбранных точек изображения (количество пар совпадает с количеством ранговых блоков во фрактальном коде изображения Lena)

Если связь между доменным и ранговым блоками случайна, то небольшие изменения в одной части изображения могут непредсказуемо повлиять на фрактальный код (тройка «ранговый блок, доменный блок, преобразование»). Риски такого искажения увеличиваются из-за следующих двух факторов:

· Один доменный блок может соответствовать нескольким ранговым блокам (при использования разных преобразований), следовательно, дефект такого доменного блока приведет к изменению кода для всех соответствующих ему ранговых блоков.

· Доменные блоки, попавшие во фрактальный код, располагаются неравномерно на изображении. На рис. 4 представлена схема распределения доменных блоков, используемых во фрактальном коде тестового изображения Lena. Явно выделяются 3-4 области с более плотной сеткой. Можно сделать вывод, что изменение изображения в этих областях кардинальным образом повлияет на весь фрактальный код.

Рис. 4. Расположение доменных блоков фрактального кода на кодируемом изображении

С другой стороны, Фишер говорит [6], что традиционные методы фрактального кодирования для определенных типов изображений имеют тенденцию к выбору пространственно близких доменного и рангового блоков, но это не всегда происходит. Эксперименты показывают, что для определенных типов изображений ранговые блоки из некоторого сегмента с большей вероятностью будут соответствовать доменным блокам из этого же сегмента. Это объясняется подобностью свойств (например, одинаковой текстурой). Такая особенностьделает фрактальное кодированиестойким к небольшим изменениям или дефектам [7] (например, изменение настроения - в случае распознавания лиц - влечет только маленькие изменения вокруг губ, глаз, что не влияет на остальной фрактальный код).

Для усиления этого свойства предлагается новый способ фрактального кодирования, который выбирает доменные блоки только из некоторой окрестности ранговых блоков (на рис. 6 показан пример такого распределения). Это гарантирует, что любые перемены в определенном сегменте изображения повлияют только на фрактальный код этого сегмента и не отразятся на коде других частей, код различных областей изображения станет независимым. Получаемые таким образом фракталы называются локализованными фракталами. Полный фрактальный код изображения получается объединением всех локализованных фракталов. Однако получение полного фрактального кода не является целью для задачи распознавания образов. Достаточно найти локализованные фрактальные коды ключевых областей изображения и использовать только их для сравнения. фрактальный кодирование распознавание изображение

Алгоритм распознавания образов на основе локализованных фракталов. Принципиальная схема реализации системы фрактального распознавания образов представлена на рис. 5.

Рис. 5. Принципиальная схема системы распознавания образов на основе локализованных фракталов

Изначально искомое изображение (элемент Query Image на схеме) поступает в модуль (элемент Fractal Encoder), который вычисляет фрактальный код. В нашем случае это будет совокупность фрактальных кодов локализованных областей, а не полный код изображения. Как правило, параметры алгоритма (размер ранговых и доменных блоков, шаг доменных блоков, используемые трансформации и др.) хранятся в конфигурационном файле (блок Fractal Encoder Config File). После получения локализованных фрактальных кодов они применяются для каждого изображения из поисковой базы (элемент Image DB) в специальном модуле, который работает по принципу обычного фрактального декодера (элемент Fractal Decoder). Далее измеряется расстояние (в элементе Distance Calculator) между локализованными областями оригинального изображения из базы и его проекции, полученной после применения фрактального кода. Такой метод сравнения детально описан в работе [4]. Основная идея заключается в том, что чем ближе изначально изображение к тому, для которого построили фрактальный код, тем расстояние между оригиналом и первой проекцией, первой и второй проекциями будет меньше. Важно, чтобы метрика, используемая для измерения расстояний между проекциями, совпадала с метрикой, применяемой в процессе построения фрактального кода, при сравнениях ранговых и доменных блоков. В результате получается упорядоченное по сходству с искомым множество изображений (элемент Image Result Set).

Представленная на рис. 5 схема была реализована на языке программирования Java с применением JDK 1.7.0.51. В качестве базы изображений использовалась нормализованная база Yale Face Database.

Рассмотрим более подробно шаги алгоритма:

1. Локализация фрактальных областей, таких как глаза, нос, губы и остальные части лица, вручную для одного произвольного изображения в нормализованной базе. Эта информация в дальнейшем будет использована для всех изображений в базе.

2. Подготовка конфигурационного файла (также ручной шаг), который содержит следующую информацию:

· Координаты локализованных фрактальных областей.

· Максимальный размер рангового блока.

· Максимальная глубина квадродерева.

Конфигурационный файл может быть любого удобного формата. В нашей реализации это обычный property-файл, содержащий набор «ключ - значение».

3. Нахождение фрактального кода для каждой локализованной области:

· Построение доменного пула. Покрываем фрактальную область сеткой пересекающихся доменных блоков квадратной формы. Размер доменного блока выбирается в два раза больше размера рангового блока, с которым он в дальнейшем будет сравниваться. Соответственно наш пул распадается на n-е количество слоев, в каждом из которых размер доменных блоков одинаковый. Число слоев равно максимальной глубине квадродерева, указанной в конфигурационном файле. Шаг, через который помещается следующий доменный блок, в 4 раза меньше размера блока. Далее каждый доменный блок урезается в два раза (чтобы точно совпадать по размеру с ранговым в момент сравнения) и трансформируетсяc использованием набора аффинных преобразований:

- поворот на 90, 180, 270 градусов;

- отражение относительно вертикальной оси, горизонтальной оси, главной диагонали, второстепенной диагонали.

Полученные преобразованные блоки, как и оригинальный, помещаются в соответствующий слой доменного пула.

· Построение квадродерева ранговых блоков. Фрактальная область покрывается сеткой непересекающихся ранговых блоков. Размер берется из конфигурационного файла. Далее ранговый блок сравнивается со всеми блоками из слоя доменного пула, который соответствует размеру данного рангового блока. Находится наилучшее совпадение, запоминается. Затем ранговый блок разбивается на 4 дочерних, для которых повторяется процедура поиска наиболее подходящего доменного блока. Процедура останавливается, когда достигается максимальная глубина квадродерева. Далее необходимо определиться с наилучшим покрытием области оригинального рангового блока. Для этого полученное дерево обходится от вершины к листам и сравниваются расстояние до найденного доменного блока родительской вершины и суммарное расстояние всех (четырех) ее детей. Выбирается наименьшее.

Используемая метрика:

где di- интенсивность i-точки доменного блока;

ri- интенсивность i-точки рангового блока;

s- изменение контраста;

o- сдвиг яркости.

Параметры яркости и контраста подбираются индивидуально для каждой пары «ранговый блок -доменный блок» по формулам (выведение было описано в [4])

Где

4. Сохранение фрактальных кодов локализованных областей в файл. Опциональный шаг, присутствует в нашей реализации для возможности анализа фрактального кода. Используется CSV-формат. Файл содержит следующие столбцы:

· X-координата рангового блока.

· Y-координата рангового блока.

· Размер рангового блока.

· X-координата доменного блока.

· Y-координата доменного блока.

· Размер доменного блока.

· Контрастность.

· Яркость.

· Набор преобразований для доменного блока.

· Идентификатор локализованной фрактальной области.

Таким образом, каждая строчка в файле означает одно отображение рангового блока в доменный блок.

5. Применение полученного фрактального кода к изображениям из базы.

· Вырезаем из изображения область, соответствующую координатам и размеру доменного блока.

· Преобразуем полученный кусок, используя трансформации, указанные во фрактальном коде.

· Вставляем полученный блок, используя координаты рангового блока из фрактального кода.

Процедура применяется для всех ранговых блоков в локализованном фрактальном коде.

6. Измеряем расстояние (используется квадратичная метрика) между локализованными фрактальными областями на оригинальном изображении из базы и получившемся после применения фрактального кода. Суммируем расстояния всех фрактальных областей в рамках одного изображения.

7. На основе цифр, получившихся на предыдущем шаге, сортируем базу изображений в возрастающем порядке. Первые элементы упорядоченного множества и будут наиболее близкими к искомомуизображениями (рис. 6).

а) б)

Рис. 6. Расположение ранговых и доменных блоков в локализованных фрактальных областях (показаны только ранговые блоки первого уровня, состояние до построения квадро-дерева): а - ранговые блоки; б - доменные блоки

Проводился эксперимент: на тестовые изображения (как в базе, так и искомые) наносились дефекты (затемнения, осветления, инородные фигуры), далее эти изображения подавались на вход реализациям классического алгоритма фрактального распознавания и алгоритма на основе локализованных фракталов. Оказалось, что классический алгоритм дает ошибку в ~20% случаев, в то время как алгоритм на основе локализованных фракталов - всего в ~5%.

Итак, был предложен новый метод фрактального кодирования, основанный на локализованных фракталах.Изображение разбивается на фрактальные области, коды для которых строятся независимо друг от друга. Для каждого рангового блока ищется доменный блок только из той же фрактальной области. Для увеличения доменного пула каждого локализованного фрактала мы используем перекрывающее разбиение, варьируем размеры доменных блоков, используем перевернутые и отраженные версии каждого блока. В дальнейшем имеет смысл исследовать возможность сравнения изображений не по всем фрактальным областям, а по некоторым (например, улыбка человека почти не затрагивает носовую область, следовательно, ее можно использовать для минимизации ошибок при распознавании эмоций).

Список литературы

1. Lin, S.H. Face Recognition/Detection by Probabilistic Decision-BasedNeural Network / S.H. Lin, S.Y. Kung // IEEE Trans. On Neural Networks. - 1997. - №8(1). - P.114-132.

2. Гультяева, Т.А. Скрытые марковские модели с одномерной топологией в задаче распознавания лиц / Т.А. Гультяева, А.А. Попов.- Новосибирск: НГТУ, 2006.

3. Kohonen, T. TheSelf-organizingMap / T. Kohonen // Proceedingsofthe IEEE.- 1990. - №78(9). - P.1464-1480.

4. Гулаков, В.К. Методы распознавания изображений на основе фрактального кодирования / В.К. Гулаков, С.Б. Клепинин // Вестн. Брян. гос. техн. ун-та. - 2012. - №4(36). - С. 54-61.

5. Jacquin, A. Image Coding Based on a Fractal Theory of Iterated Contractive Image Transformations / A. Jacquin // IEEE Transactions on image processing. - 1992. - №1(1). - P.18-30.

6. Fisher, Y. Fractal Image Compression: Theory and Application / Y. Fisher. - Springer-Ver, 1994.

7. Ebrahimpour, H. Face recognition using fractal codes / H. Ebrahimpour, V. Chandran, S. Sridharan // Proceedings of International Conference on Image Processing. - 2007. - P. 58-61.

Размещено на Allbest.ru

...

Подобные документы

  • Методы предобработки изображений текстовых символов. Статистические распределения точек. Интегральные преобразования и структурный анализ. Реализация алгоритма распознавания букв. Анализ алгоритмов оптического распознавания символов. Сравнение с эталоном.

    курсовая работа [2,1 M], добавлен 20.09.2014

  • Появление технических систем автоматического распознавания. Человек как элемент или звено сложных автоматических систем. Возможности автоматических распознающих устройств. Этапы создания системы распознавания образов. Процессы измерения и кодирования.

    презентация [523,7 K], добавлен 14.08.2013

  • Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.

    дипломная работа [887,3 K], добавлен 26.11.2013

  • Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.

    дипломная работа [1019,9 K], добавлен 13.10.2017

  • Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.

    курсовая работа [16,2 M], добавлен 21.06.2014

  • Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

    дипломная работа [1,8 M], добавлен 08.02.2017

  • Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.

    курсовая работа [462,2 K], добавлен 15.01.2014

  • Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.

    презентация [469,2 K], добавлен 15.03.2015

  • Оптическое распознавание символов как механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов. Компьютерные программы для оптического распознавания символов и их характеристика.

    презентация [855,2 K], добавлен 20.12.2011

  • Определение понятий кода, кодирования и декодирования, виды, правила и задачи кодирования. Применение теорем Шеннона в теории связи. Классификация, параметры и построение помехоустойчивых кодов. Методы передачи кодов. Пример построения кода Шеннона.

    курсовая работа [212,6 K], добавлен 25.02.2009

  • Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.

    курсовая работа [2,7 M], добавлен 15.08.2011

  • Принцип работы нейросетей и модели синтеза. Ключевые моменты проблемы распознавания речи. Система распознавания речи как самообучающаяся система. Описание системы: ввод звука, наложение первичных признаков на вход нейросети, модель и обучение нейросети.

    курсовая работа [215,2 K], добавлен 19.10.2010

  • Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.

    курсовая работа [3,0 M], добавлен 14.11.2013

  • Специфические особенности распознавания лиц. Взаимодействие компьютер - человек. Создание новой нейросистемы, разработанной в программе разработчиков Borland Delphi, которая будет состоять из поля захвата изображения и дальнейшим обучением нейросети.

    презентация [212,5 K], добавлен 14.08.2013

  • Понятие и сущность процесса кодирования информации, его закономерности и направления использования на современном этапе. Порядок составления и содержание таблицы кодировки. Методика и инструменты компьютерного представления изображений, а также звука.

    презентация [896,4 K], добавлен 22.10.2013

  • Основные цели и задачи построения систем распознавания. Построение математической модели системы распознавания образов на примере алгоритма идентификации объектов военной техники в автоматизированных телекоммуникационных комплексах систем управления.

    дипломная работа [332,2 K], добавлен 30.11.2012

  • Обнаружение деталей и их границ изображения. Применение ранговых алгоритмов. Использование алгоритмов адаптивного квантования мод в режиме пофрагментной обработки. Обобщенная линейная фильтрация изображений. Восстановление отсутствующих участков.

    курсовая работа [1,8 M], добавлен 17.06.2013

  • Обзор математических методов распознавания. Общая архитектура программы преобразования автомобильного номерного знака. Детальное описание алгоритмов: бинаризация изображения, удаление обрамления, сегментация символов и распознавание шаблонным методом.

    курсовая работа [4,8 M], добавлен 22.06.2011

  • Функции текстового редактора как программы для работы с текстом. Использование редактора MS Word в научной деятельности исследователя-ономаста. Технология распознавания текста и организация работы с программой FineReader. Системы распознавания речи.

    реферат [979,3 K], добавлен 16.10.2013

  • Создание программного средства, осуществляющего распознавание зрительных образов на базе искусственных нейронных сетей. Методы, использующиеся для распознавания образов. Пандемониум Селфриджа. Персептрон Розенблатта. Правило формирования цепного кода.

    дипломная работа [554,8 K], добавлен 06.04.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.