Аспекты практического применения цветового различия для распознавания и выделения границ изображений
Выделение границ на изображениях при помощи цветового различия. Обоснованное применение современных подходов, касающихся распознавания графической информации. Улучшение методов анализа изображений и выделение весовых для распознавания признаков.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 29.04.2017 |
Размер файла | 603,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ФГБОУ ВПО «Кубанский государственный технологический университет», Краснодар, Россия
Аспекты практического применения цветового различия для распознавания и выделения границ изображений
Малыхина Мария Петровна
к.т.н., профессор
Шичкин Дмитрий Александрович
В современный высокотехнологический век одним из важных средств обмена информацией между людьми и вычислительными машинами являются сигналы и изображения. В связи с этим актуальными являются вопросы автоматизированной обработки и понимания визуальной информации. Особенный интерес представляет обоснованное применение современных подходов, касающихся распознавания графической информации.
Целью является улучшение методов анализа изображений и выделение весовых для распознавания признаков. Задача - предложить новый, альтернативный способ анализа изображений для их распознавания.
Одним из основных подходов к анализу изображений - контурный анализ. В основе контурного анализа лежит - поиск контура объекта и исследование его свойств (связность, наличие углов и т. д.). Суть контурного анализа сводится к нахождению границ изображения, а, следовательно, и контура объекта различными методами.
В современных инновационных технологиях контурный анализ в практических применениях все чаще сводится к бинаризации изображений - приведению изображения к двум цветам (обычно черному и белому). Данный способ позволяет значительно упростить процедуру нахождения контура объекта, но значительно увеличивает потерю важной информации. Процесс основан на обнаружении достижения яркостной или контрастной характеристики объекта ее порогового значения, где выбранной точке назначается один из двух цветов. При правильно подобранных пороговых значениях удается полностью выделить интересующий объект.
Существует другой метод выделения границ с использованием дифференцируемой (в точке) функции - поиск градиента яркости. Однако, стоит отметить, что выделение границ предмета или объекта на основе градиентов яркостной и контрастной характеристик изображения не позволяют добиться максимально точного установления этих границ. Существуют алгоритмы, позволяющие оптимизировать этот процесс вводом дополнительных критериев, но и они не позволяют добиться четкого определения границ. Алгоритмы же, сводящиеся в основном к обработке исходных изображений, приносят небольшое улучшение качества: повышение резкости, подбор коэффициентных весов, оптимальных ядер. Особенно стоит отметить исследования, проводимые Scharr Hanno по нахождению самых оптимальных ядер оператора Собеля (матрица выборки 3*3 с весовыми коэффициентами).
Возникновение сложностей при обнаружении границ в современной практике распознавания объектов находится в прямой зависимости от научных исследований Вебера, чьи труды принимались многими исследователями в рассматриваемой области за основу, так как он отмечал, что распознавание предметов характеризуется способностью глаза различать разницу в яркостях точек предмета. Он также рассматривал и контрастную характеристику глаза (1) [14].
, (1)
где Кпор - пороговое значение различаемого контраста.
Вебер отмечал, что для распознавания предметов внешнего мира необходимо выделить их не только по яркости или цвету на окружающем фоне, он считал целесообразным учитывать и иные характеристики объекта, но детальных исследований не проводил. В настоящее время возможности современных вычислительных систем позволяют реализовать иные характеристики (цвет, тон, насыщенность, светлота) при вычислениях и тем самым получить подходы, позволяющие минимизировать указанные выше потери информации в процессе выделения объекта.
Получаемая при компьютерной обработке информация графических изображений сохраняется в цифровом виде по определенным моделям. Самая распространенная цветовая модель RGB, предложенная Джеймсом Максвеллом. Максвелл исследовал аддитивный синтез цвета как способ получения цветных изображений в 1861 году (рисунок 1) [13].
Рисунок 1. Синтез цвета
Стоит сразу же отметить ограничение данной модели. Модель RGB базируется на сочетании трех цветов - красный, зеленый и синий. В изображениях точкам отводится соответствующая пропорция смешивания этих цветов. И под каждый цвет выделяется фиксированная память восемь бит. Возможные пересечения дадут приблизительно 16 млн. цветов, которые все же не могут отобразить всю гамму воспринимаемого человеком цвета (рисунок 2).
Рисунок 2. Ограничение RGB по возможности передачи цветов
Цветовое пространство XYZ -- это цветовая модель, представленная организацией CIE (International Commission on Illumination -- Международная комиссия по освещению) в 1931 году [3] и являющаяся эталоном для практически всех остальных цветовых моделей, используемых в технических областях [4].
Хроматические координаты модели XYZ представлены на рисунке 3. В пределах модели RGB, когда работают с яркостной характеристикой изображения, вычисляется приблизительное значение яркости. Его можно назвать приблизительным по причинам весовых коэффициентов для каждого цвета, посредством которых вычисляется яркость. В системе XYZ координата Y по определению соответствует воспринимаемой яркости цвета [2].
Таким образом, чтобы получить из RGB монохромное изображение с учетом воспринимаемых человеком яркостей, необходимо преобразовать каждый пиксель в XYZ и взять координату Y в качестве результата. Известно, что преобразование между любыми аддитивными цветовыми системами линейное (в силу линейности восприятия цвета человеком [5]), а, значит, может быть описано матрицей M3Ч3, такой, что .
Рисунок 3. Хроматическая диаграмма с длинами волн цветов
Коэффициенты (0.3, 0.59, 0.11) -- это округленная до второго знака строчка из матрицы преобразования MNTSC из системы NTSC RGB ([8]) в XYZ, а формула (1) вычисляет воспринимаемую яркость Y для изображения, закодированного в NTSC RGB.
(2)
Полная матрица преобразования:
Большинство цифровых изображений на данный момент соответствуют стандарту sRGB, разработанному для компьютерных мониторов, поэтому формула будет иного вида [6].
Корректное преобразование для sRGB:
(3)
Необходимо обратить внимание на то, что RGB-изображения имеют нелинейную кодировку яркости, так называемую гамма-коррекцию
Cgamma = Clinear1?г, (4)
где г является также частью профиля изображения (для sRGB можно считать гамму равной 2.2, хотя на практике функция сложнее [1,9].
Преобразование в черно-белое изображение необходимо проводить в линейном пространстве, поэтому перед преобразованием надо выполнить гамма-преобразование, обратное гамма-коррекции [9]
Clinear = Cgammaг. (5)
Таким образом, корректное преобразование из цветного sRGB-изображения в монохромное выглядит так (цвета изображения лежат в диапазоне [0,255]):
(6)
На рисунке 4 показана значительная разница между преобразованиями, произведенными по формулам (2) и (6) [9], такие отличия очень существенны для требовательных приложений обработки графической информации.
Согласно приведенному примеру на рисунке 4 много информации теряется в процессе получения яркостной характеристики изображения в точке за счет неточной передачи цветов моделью RGB и использования их для вычисления коэффициентов для определения яркости.
(а) (б) (в) (г)
Рисунок 4. Пример преобразование цветного в черно-белое изображение: (а) Исходное изображение, (б) Обычное преобразование, (в) sRGB-преобразование (г) Линейная разница (x15)
Альтернативным подходом выделения границ изображения может служить непосредственное использование цвета, а именно - цветовое различие. Привлечением формулы цветового различия с определением градиента можно многократно повысить точность распознавания контуров объектов. Данный подход должен позволить минимизировать потери столь важной информации.
Формула цветового различия, которую также называют формулой цветового отличия, а так же цветоразность или цветовое расстояние (расстояние между цветами) -- математическое представление, позволяющее численно выразить различие между двумя цветами в колориметрии. Распространенные определения цветового различия обычно используют формулу вычисления расстояния в евклидовом пространстве. Однако стоит заметить, что при этом не любое цветовое пространство является евклидовым со строгой математической точки зрения.
Международный комитет CIE (Commission Internationale de l'Eclairage) формулирует определение цветовой разницы через метрику , где буква «E» обозначает (Empfindung) ощущение.
, такое значение примерно соответствует минимально различимому для человеческого глаза отличию между цветами [4].
Существует несколько стандартов, задающих цветовое различие, каждый из которых был принят в соответствующее время комитетом CEI: CIE76, CIE94, CIEDE2000.
CIEDE2000. Ввиду того, что определение 1994 года не полностью устранило неоднородности восприятия цветового различия, комитет CIE разработал новый стандарт, который включил пять дополнений [7,15]:
Поворот цветового угла тона (RT), чтобы устранить проблемы в синей области (угол Hue 275°)
Компенсация для нейтральных цветов
Компенсация для светлоты (SL)
Компенсация для насыщенности цвета (SC)
Компенсация для тона (SH)
Нахождение цветоразности по стандарту CIEDE2000 рассчитывается следующим образом (7):
(7)
Практические результаты были получены предварительно по формуле CIE76 в цветовом пространстве RGB (8).
(8)
В проведенном исследовании данная формула была выбрана для предварительной оценки результативности предлагаемого подхода. Результаты исследования получены без применения ядер Собеля простым определением присутствия вокруг текущей точки резкого перепада цвета. Несмотря на то, что данный подход в основном используется только для цветовой характеристики изображения, черно-белое изображение и изображение с градациями серого оттенка воспринимаются программой, реализующей алгоритм, аналогично цветным изображениям.
Рассмотренные выше положения были проверены на обработке изображений объектов, которые плохо поддаются выделению, например, облаков. Результаты таковы. Не смотря на то, что облака изображены на фоне зашумленного неба, применение выбранного метода обработки изображения, позволило не отразить множественные артефакты и шумы исходного изображения - помехи отсутствуют (рисунок 5).
В процессе экспериментов выявлены следующие особенности данного метода обработки изображений:
- получение важных цветовых характеристик о контурах: если восстановить цвета, по имеющимся краевым пикселям, то восстанавливается исходное изображение;
- при применении данного подхода к анализу изображений, полученных при помощи цифровых фотокамер с максимально открытой диафрагмой, выделяется объект, находящийся в зоне резкости (то есть идет акцент только на объекте съемки и деталях этого объекта), а пространство, находящееся за объектом, не учитывается даже при сложной структуре. Это видимо связанно с размером (3*3 пикселя) анализируемого участка изображения вокруг текущей точки за один проход цикла.
Рисунок 5. Полученные характеристики облаков
Говоря о дальнейшем развитии рассмотренных в статье положений, стоит отметить, что повышение эффективности работы распознавания изображений планируется на пути подключения к анализу изображений интеллектуальных компонентов, таких как гибридные интеллектуальные системы [10-12].
Предлагаемый подход выявляет ряд преимуществ контурного анализа для распознавания образов и перспективен в практическом применении данного исследования в инновационных технологиях.
Литература
распознавание графический информация цветовой
1. A Standard Default Color Space for the Internet - sRGB Michael Stokes (Hewlett-Packard), Matthew Anderson (Microsoft), Srinivasan Chandrasekar (Microsoft), Ricardo Motta (Hewlett-Packard) Version 1.10, November 5, 1996 [Электронный ресурс]/ Стандарт цветового пространства для Интернета - sRGB - Режим доступа: http://www.w3.org/Graphics/Color/sRGB.html, свободный. -- Загл. с экрана. -- Яз. англ.
2. CIE 1971, International Commission on Illumination. Colorimetry: Official Recommendations of the International Commission on Illumination. Publication CIE No. 15 (E-1.3.1) 1971, Bureau Central de la CIE, Paris, 1971.
3. CIE - INTERNATIONAL COMMISSION ON ILLUMINATION. [Электронный ресурс]/ Web page of INTERNATIONAL COMMISSION ON ILLUMINATION -- Режим доступа: http://www.cie.co.at/index.php, свободный. -- Загл. с экрана.
4. Gaurav Sharma Digital Color Imaging Handbook. -- CRC Press, 2003. -- ISBN 084930900X [Электронный ресурс] / Электронная библиотека GOOGLE - Режим доступа:http://books.google.com/books?id=OxlBqY67rl0C&pg=PA31&vq=1.42&dq=jnd+gaurav+sharma&source=gbs_search_s&sig=vresXi1emghh1Jq57hr2R6cVXIs, свободный. -- Загл. с экрана. -- Яз. англ.
5. Hermann Grassmann, Gert Schubring (1996). Hermann Gьnther Grassmann (1809-1877): visionary mathematician, scientist and neohumanist scholar : papers from a sesquicentennial conference. Springer. p. 78. ISBN 978-0-7923-4261-8.
6. IEC 61966-2-1:1999 is the official specification of sRGB. It provides viewing environment, encoding, and colorimetric details.
7. Sharma, Gaurav; Wencheng Wu, Edul N. Dalal. The CIEDE2000 color-difference formula: Implementation notes, supplementary test data, and mathematical observations [Электронный ресурс]/Color Research & Applications (Wiley Interscience) - April 2004. - Режим доступа: http://www.ece.rochester.edu/~gsharma/ciede2000/ciede2000noteCRNA.pdf, свободный. -- Загл. с экрана.
8. Джакония В.Е. Система цветного телевидения NTSC // Телевидение. -- М.,: «Горячая линия -- Телеком», 2002. -- С. 249--265. -- 640 с. -- ISBN 5-93517-070-1.
9. Игнатенко А. Откуда берется формула Y = 0.3R + 0.59G + 0.11B для преобразования из цветного RGB-изображения в черно-белое (монохромное)? [Электронный ресурс]/ «Компьютерная Графика и Мультимедиа Сетевой журнал» при ф-те ВМиК МГУ статья от 7.02.2010 г. - Режим доступа: http://cgm.computergraphics.ru/, свободный -- Загл. с экрана.
10. Малыхина М.П., Бегман Ю.В. Нейросетевая экспертная система на основе прецедентов для решения проблем обслуживания абонентов сотовой сети. Известия вузов. Северо-кавказский регион. Технические науки. - Новочеркасск. №3. 2009. С. 6-9.
11. Оценка эффективности гибридизации интеллектуальных методов на примере нейросетевой экспертной системы на основе прецедентов/ Малыхина М.П., Бегман Ю.В. / Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2013. - № 86(02).- Режим доступа: http://ej.kubagro.ru/2013/02/pdf/24.pdf.
12. Симанков В.С., Частикова В.А. Генетические алгоритмы и поиск оптимальных решений // Автоматизация и современные технологии. 2003. № 6. С. 39-45.
13. Синтез цвета // Фотокинотехника: Энциклопедия / Главный редактор Е.А. Иофис. -- М.: Советская энциклопедия, 1981.
14. Тищенко Г.А. Осветительные установки: Учебник для учащихся техникумов специальности «Электроосветительные приборы и установки» - М.: Высш. шк.,1984, -247 с., ил.
15. Формула цветового отличия//Википедия - свободная энциклопедия [Электронный ресурс] /Wikipedia® - Электрон. дан. 7 апреля 2013 - Режим доступа: http://ru.wikipedia.org/wiki/Формула_цветового_отличия, свободный. -- Загл. с экрана.
Размещено на Allbest.ru
...Подобные документы
Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.
дипломная работа [1019,9 K], добавлен 13.10.2017Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.
дипломная работа [887,3 K], добавлен 26.11.2013Методы предобработки изображений текстовых символов. Статистические распределения точек. Интегральные преобразования и структурный анализ. Реализация алгоритма распознавания букв. Анализ алгоритмов оптического распознавания символов. Сравнение с эталоном.
курсовая работа [2,1 M], добавлен 20.09.2014Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.
презентация [469,2 K], добавлен 15.03.2015Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.
курсовая работа [16,2 M], добавлен 21.06.2014Распознавание слов в слитной речи, изолированных слов. Проблема автоматического распознавания речи. Структурная схема устройства выделения признаков речевых сигналов. Моделирование работы блока выделения начала и окончания слова количества звуков на ЭВМ.
дипломная работа [649,5 K], добавлен 13.11.2008Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.
курсовая работа [462,2 K], добавлен 15.01.2014Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.
дипломная работа [1,8 M], добавлен 08.02.2017Оптическое распознавание символов как механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов. Компьютерные программы для оптического распознавания символов и их характеристика.
презентация [855,2 K], добавлен 20.12.2011Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.
курсовая работа [2,7 M], добавлен 15.08.2011Принцип работы нейросетей и модели синтеза. Ключевые моменты проблемы распознавания речи. Система распознавания речи как самообучающаяся система. Описание системы: ввод звука, наложение первичных признаков на вход нейросети, модель и обучение нейросети.
курсовая работа [215,2 K], добавлен 19.10.2010Обзор существующего программного обеспечения для автоматизации выделения границ на изображении. Разработка математической модели обработки изображений и выделения контуров в оттенках серого и программного обеспечения для алгоритмов обработки изображений.
дипломная работа [1,7 M], добавлен 27.03.2013Литературный обзор методов распознавания кромок для схожих задач. Объекты в приложении и их отображение. Генерация выходных данных. Алгоритм распознавания линии (графика), отличный от градиентных подходов и использующий алгоритм предварительной обработки.
дипломная работа [711,8 K], добавлен 27.04.2014Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.
курсовая работа [3,0 M], добавлен 14.11.2013Цифровые рентгенографические системы. Методы автоматического анализа изображений в среде MatLab. Анализ рентгеновского изображения. Фильтрация, сегментация, улучшение изображений. Аппаратурные возможности предварительной нормализации изображений.
курсовая работа [890,9 K], добавлен 07.12.2013Определение компьютерной графики, задачи, виды, области применения. Способы распознавания образов, системы технического зрения. Инструменты для синтеза изображений и обработки визуальной информации. Представление цветов, форматы графических файлов.
шпаргалка [49,9 K], добавлен 13.09.2011Понятие и особенности построения алгоритмов распознавания образов. Различные подходы к типологии методов распознавания. Изучение основных способов представления знаний. Характеристика интенсиональных и экстенсиональных методов, оценка их качества.
презентация [31,6 K], добавлен 06.01.2014Появление технических систем автоматического распознавания. Человек как элемент или звено сложных автоматических систем. Возможности автоматических распознающих устройств. Этапы создания системы распознавания образов. Процессы измерения и кодирования.
презентация [523,7 K], добавлен 14.08.2013Условия применения и технические требования для работы программно-аппаратной платформы. Система распознавания лиц VOCORD Face Control. Система распознавания текста ABBYY FineReader. Алгоритмы и методы, применяемые в программе. Алгоритм хеширования MD5.
дипломная работа [1,8 M], добавлен 19.01.2017Строение артикуляционного аппарата человека с точки зрения возможности распознавания речи по артикуляции. Комплекс параметров артикуляции на основе контура внутренней области губ. Реализация модуля распознавания фонем русской речи по изображениям губ.
дипломная работа [3,1 M], добавлен 19.08.2012