Математическая модель представления изображения в системах распознавания образов

Разработка модели для представления, фильтрации и сегментации изображения в современных системах распознавания образов. Сокращение вычислений, связанных с манипуляциями с каждым пикселем. Изображение как вещественная функция двух переменных х и y.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 01.02.2019
Размер файла 1,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1

29TMN215

1

29TMN215

Математическая модель представления изображения в системах распознавания образов

Штанчаев Хайрутин Баширович

ОАО “Каспийский завод листового стекла”

Инженер АСУ ТП

ФГБОУ ВПО “Дагестанский государственный

технический университет”

Россия, Махачкала Аспирант

С математической точки зрения, изображение можно представить как вещественную функцию img двух переменных х и y, I(x,y).

Функция ?????? = ??(??, ??), в общем случае определяется в прямоугольной форме [4,5], но для удобства исследований в работе все изображения определяются квадратными областями, т.е. ?? ? [0; ??], а ?? ? [0; ??], где W - ширина изображения, H-высота изображения и W=H. Тогда говорят, что изображение имеет размер WxH. Значение, стоящее на пересечении x и y, называется пикселем. Не трудно заметить, что изображение схоже с прямоугольной системой координат. Можно отметить, что началом координат (0,0) применительно к изображению, нужно считать (x,y)=(1,1). Важно знать, что пара (x,y)=(1,2) относится ко второму пикселю.

Для легкости преобразований фильтрации и обработки, можно представить изображение в матричном виде:

где H- высота изображения, W- ширина изображения.

Особенностью такого представления цифрового изображения является то, что первый элемент в выражении (1) имеет координаты (x,y)=(0,0), а не (x,y)=(1,1) как указывалось выше[2].

Обобщенная графовая модель

Описанная выше модель не всегда удобна. Это обуславливается трудностью осуществлять поиск пикселей по цвету, проводить фильтрацию или сегментацию изображения. В этой связи представим изображение в качестве неориентированного графа:

?? = (??, ??), ?? = {????1}, E = {e??2}, ??1 ? ?? ? ??, ??2 ? 1 … ??[1,3]

где: V - множество вершин графа;

E - множество ребер графа;

W - ширина изображения;

H - высота изображения.

В качестве вершин графовой модели выступают пиксели исходного изображения. А ребра графа это связь пикселей между собой. Такую графовую модель будем называть обобщенной графовой моделью. Формула для получения графовой модели выглядит следующим образом:

?????(????, ????) ? ??????, ?? = 1 … (?? ? ??), ?? = {?? ? ????(????, ????), ?? ? (????, ????+??)} (2)

где: x, y - координаты пикселя ????; ?? = 1 … ??, ?? = 1 … ??

Графически обобщенная модель для изображения img представлена на рисунке 1.

Рис. 1. Обобщенная графовая модель изображения A, B, C, D - стороны решетки графовой модели

Представленная на рисунке 1 обобщенная модель практически можно применить только для представления изображения в качестве графа, т.к. кроме положения пикселей и связи между ними другой информации не несет. Однако такую модель можно преобразовать в другие графовые модели. Стоит отметить, что координаты (????, ????) закрепляются за вершиной ????. И в случае удаления этой вершины место в решетке с координатами (????, ????) остается пустым.

Операции удаления и добавления вершины, ребер графовой модели идентичны операциям для графов. Однако имеются некоторые особенности:

Ново добавленная вершина заменяет старую если их координаты совпадают.

Ребра могут добавляться в любом количестве.

Введем основные определения графовой модели.

Определение 1. Восстановление изображения по графовой модели - получение изображения из графа представляя вершину графа как пиксель. Т.е. для некоторого графа G имеем: ?????2(??, ??) ? ??, ?????? = ?????? ? ????2(??, ??).

Определение 2. Ограничение графовой модели - уменьшение графовой модели в определенных пределах. Ограничение может проводиться в определенных пределах и в любые стороны решетки графовой модели.

Ограничение обозначается как R(x1,x2,x3,x4); x1 - глубина ограничения со стороны A, x2 -глубина ограничения со стороны B, x3 -глубина ограничения со стороны C, x4 - глубина ограничения со стороны D.

Ограничение означает удаление ??1строк для стороны A, x2 столбцов для стороны B, x3 строк для стороны C, x4 столбцов для стороны D:

Ограничение возможно и в определенном интервале, тогда из графовой модели удаляется область с определенной стороны. Ограничение на интервале :

.

где: N - наименование стороны; [o, q] - интервал вершин; m - глубина ограничения.

Определение 3. Наращивание графовой модели - увеличение графовой модели в одну или несколько сторон. Наращивания не происходит в интервал. Т.е. Наращивание означает добавление вершин в графовую модель по всей длине строки и или по всей высоте столбца.

Наращивание графовой модели обозначается N(x1,x2,x3,x4) Редукция означает добавление x1 строк для стороны A, x2 столбцов для стороны B, x3 строк для стороны C, x4 столбцов для стороны D:

Следует отметить, что . Из этого следует, что записи и означают, что вершины из старой модели переносятся в новый со смещением на глубину наращивания:

где: k1, k2 - глубина наращивания.

Определение 4. Зона графовой модели - область вершин графовой модели выбранная для решения поставленной задачи. Зона представляет собой сплошную область вершин ограниченную четырьмя ключевыми вершинами либо цепь из определенных вершин. Зона ограниченная четырьмя вершинами представляет собой следующую последовательность:

Zone - название зоны - верхняя левая вершина

- верхняя правая вершина.

- нижняя левая вершина.

- нижняя правая вершина.

Зону с ограничением можно видеть на рисунке 2. Если G графовая модель, то ограниченная зона получается удалением вершин не входящих в указанный интервал. Так же можно получить зону ограничением. Но при ограничении получается “обрезанный” основной граф, а зона может иметь вид многоугольника. В этом случае зона имеет вид:

????????(????1, ????2, … , ??????)

где: ?????? - последняя вершина многоугольной зоны. Также и представляется зона которая состоит из цепи вершин выражается как:

????????{??1 … . ????3}, получить ее можно из любой графовой модели

?????????? = ??(??)/????4 если ?????4 ? ?? ????4 ? ????3

Рис. 2. Зона в графовой модели. Слева зона с ограничением. Справа зона образованная цепью вершин

Цветная графовая модель

Определение 5. Цвет вершины графа (z) - цвет в который окрашена вершина исходя из цвета пикселя составившей эту вершину. Цвет z исходя из поставленный задачи можно выразить численно как в цветовой системе RGB (например черный - 000000) или лингвистически (черный цвет или black). Если окрасить все вершины графа G в соответствующий цвет Z получим цветную графовую модель. Тогда вместо графа G имеем тройку:

???????????? = (??, ??, ??), ?? = {????3}, E = {e??4}, ?? = {????5}, ??3 = ??5 ? ?? ? ??, ??4 ? 1 … ?? где:

V - множество вершин графа;

E - множество ребер графа;

W - ширина изображения;

H - высота изображения;

Z - множество цветов вершин графа.

Например на рисунке 3 показан цветной граф у которого первые и последние вершины черного цвета.

Рис. 3. Цветная графовая модель изображения Для составления такого графа перепишем 2: ?????(??, ??) ? ??????, ?? = 1 … (?? ? ??)

???????????? = {?? ? ????(??, ??), ?? ? (????, ????+??), ?? ? ??(????(??, ??)}(2.3)

где: x,y -координаты пикселя ????;

Такой граф очень удобно использовать для сегментации.

Определение 6. Сегментация графа - разделение графа на ?? подграфов по цветовому признаку. Цветовой признак зависит от поставленной задачи. Восстановив изображение по сегментированному графу можно получить сегментированное изображение.

Обозначим цветовой признак как P. Опишем сегментацию графа Gcolor как удаление вершины ????6 с цветом z(????6) который не равен P, т.е.:

?????6, если ??(????6) ? ??,

??(??????????) = ??(????????????)\{????6} , ??(??????????) = ??(????????????)\{(????6, ????6+1)|????6 ? ??(????????????)}

Например если сегментировать граф показанный на рисунке 3 по черному цвету, мы получим граф представленный на рисунке 4

Рис. 4. Цветной граф после сегментации

Для восстановления цветного графа имеем:

?????3(??, ??) ? ??, ?????? = {?????? ? ????3, ??????????(????3) = ????3}

Где запись color означает установку цвета пикселя в указанный.

Раздельная графовая модель

Раздельную графовую модель можно получить разделив обобщенную графовую модель на i графов которые представляют собой столбцы изображения или на j графов которые представляют собой строки изображения.

???????????? = {????}, т.е. ???? ? ????????????

Разделение суперграфа ???????????? на подграфы по столбцам:

???? = ??(????????????)\??(??, ??9), ??(????) = ??(????????????)\{(??, ??)|?? ? ??(????)}, ??9 = 1 … ??.

Разделение суперграфа ???????????? на подграфы по строкам:

???? = ??(????????????)\??(??10, ??), ??(????) = ??(????????????)\{(??, ??)|?? ? ??(????)}, ??10 = 1 … ??.

Такая модель оказывается полезной при поиске того или иного пикселя. Например поиск первого черного пикселя в 4 строке, или пиксель другого цвета в первой половине изображения и т.д. Следует отметить что раздельный граф должен отвечать условию:

??????(??1) = 1, ??????(????) = 1, ??????(???? … . ?????1) = 2.

Также стоит обратить внимание на то, то раздельная графовая модель может быть выстроена как для обобщенного графа так и для цветного и сегментированного графов.

Раздельная модель для столбцов суперграфа 2 графически показана на следующем рисунке.

Рис. 5. Раздельная графовая модель для обобщенного суперграфа по столбцам

А раздельная модель для графа 5 по строкам выглядит так:

Рис. 6. Раздельная графовая модель для цветного суперграфа по строкам

Стоит отметить, что при восстановлении изображения по раздельному графу мы получим j изображений.

Описанная в статье математическая модель, основанная на графах, является достаточной и качественной заменой классической модели представления изображения. Такая модель хорошо подходит для представления, фильтрации и сегментации изображения в современных системах распознавания образов[6]. Одно изображение можно представить в разных графовых моделях в зависимости от поставленной задачи. Математический аппарат модели является гибким и встраиваемым в любую систему по необходимости. Графовая модель позволяет сократить вычисления связанные с манипуляциями с каждым пикселем.

Литература

изображение распознавание образ пиксель

1. Асанов М.О. Дискретная математика: графы, матроиды, алгоритмы: учебное пособие / М.О. Асанов, В.А. Баранский, В.В. Расин. - СПб.: Лань, 2010.

2. Брусенцов В., Поляков А. Методы и алгоритмы компьютерной графики в примерах на Visual C++ - БХВ-Петербург,2012.-544 c.

3. Мельников О.И. Теория графов в занимательных задачах. Изд. 3, испр. и доп.2009. 232 с.

4. Методы компьютерной обработки изображений / под. ред. В.А. Сойфера-М.: ФИЗМАТЛИТ, 2003. -784 с.

5. Тропченко А.Ю., Тропченко А.А. Методы сжатия изображений, аудио сигналов и видео: Учебное пособие - СПб: СПбГУ ИТМО, 2009. - 108 с.

6. Штанчаев Х.Б. Применение графовой модели и априорного классификатора для сегментации изображения в задачах распознавания лица человека // Интернетжурнал «НАУКОВЕДЕНИЕ» Том 7, № 2 (2015) http://naukovedenie.ru/PDF/130TVN215.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ. DOI: 10.15862/130TVN215.

Размещено на Allbest.ru

...

Подобные документы

  • Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.

    курсовая работа [462,2 K], добавлен 15.01.2014

  • Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.

    дипломная работа [1019,9 K], добавлен 13.10.2017

  • Словесный, графический, табличный, программный способы представления алгоритма. Основные конструкции в любом алгоритмическом языке. Теория обнаружения, различения и оценивания сигналов. Радиолокационные системы обнаружения. Система распознавания образов.

    презентация [4,8 M], добавлен 09.06.2015

  • Понятие и особенности построения алгоритмов распознавания образов. Различные подходы к типологии методов распознавания. Изучение основных способов представления знаний. Характеристика интенсиональных и экстенсиональных методов, оценка их качества.

    презентация [31,6 K], добавлен 06.01.2014

  • Обзор задач, возникающих при разработке систем распознавания образов. Обучаемые классификаторы образов. Алгоритм персептрона и его модификации. Создание программы, предназначенной для классификации образов методом наименьшей среднеквадратической ошибки.

    курсовая работа [645,2 K], добавлен 05.04.2015

  • Описание структурной схемы искусственного нейрона. Характеристика искусственной нейронной сети как математической модели и устройств параллельных вычислений на основе микропроцессоров. Применение нейронной сети для распознавания образов и сжатия данных.

    презентация [387,5 K], добавлен 11.12.2015

  • Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.

    курсовая работа [2,7 M], добавлен 15.08.2011

  • Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.

    курсовая работа [3,0 M], добавлен 14.11.2013

  • Создание программного средства, осуществляющего распознавание зрительных образов на базе искусственных нейронных сетей. Методы, использующиеся для распознавания образов. Пандемониум Селфриджа. Персептрон Розенблатта. Правило формирования цепного кода.

    дипломная работа [554,8 K], добавлен 06.04.2014

  • Алгоритм реализации векторного пространства, метод фильтрации шумов на изображении. Формально-логическая модель разработки программного обеспечения, выбор инструментальных средств его реализации. Анализ точности совпадения распознанного изображения.

    дипломная работа [2,7 M], добавлен 13.02.2013

  • Основные цели и задачи построения систем распознавания. Построение математической модели системы распознавания образов на примере алгоритма идентификации объектов военной техники в автоматизированных телекоммуникационных комплексах систем управления.

    дипломная работа [332,2 K], добавлен 30.11.2012

  • Задачи цифровой обработки изображений. Методы пороговой сегментации. Создание программы представления рисунка в виде матрицы и применения к нему пороговой обработки. Разработка интерфейса программы загрузки и фильтрации изображения с выбранным порогом.

    курсовая работа [2,0 M], добавлен 12.11.2012

  • Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.

    курсовая работа [16,2 M], добавлен 21.06.2014

  • Появление технических систем автоматического распознавания. Человек как элемент или звено сложных автоматических систем. Возможности автоматических распознающих устройств. Этапы создания системы распознавания образов. Процессы измерения и кодирования.

    презентация [523,7 K], добавлен 14.08.2013

  • Распознавание образов - задача идентификации объекта или определения его свойств по его изображению или аудиозаписи. История теоретических и технических изменений в данной области. Методы и принципы, применяемые в вычислительной технике для распознавания.

    реферат [413,6 K], добавлен 10.04.2010

  • Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.

    презентация [469,2 K], добавлен 15.03.2015

  • Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.

    дипломная работа [887,3 K], добавлен 26.11.2013

  • Фильтрация шумов изображения. Алгоритмы его бинаризации и поворота. Формирование информативных признаков для распознавания нот. Схема программного обеспечения. Описание классов, функций, методов, реализованных в программе. Тестирование приложения.

    курсовая работа [2,0 M], добавлен 17.12.2013

  • Первое систематическое изучение искусственных нейронных сетей. Описание элементарного перцептрона. Программная реализация модели распознавания графических образов на основе перцептрона. Интерфейс программы, основные окна. Составление алгоритма приложения.

    реферат [100,5 K], добавлен 18.01.2014

  • Отображение на плоскости точек из многомерного пространства, интерактивное распознавание отдельных классов образов в качестве объекта разработки программного продукта. Концептуальная модель предметной области. Классы и объекты интерфейса пользователя.

    дипломная работа [1,5 M], добавлен 10.06.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.