Системы распознавания плоских и объемных изображений по их форме на основе контурного анализа

Выбор пространства для отображения сигналов в решении задач распознавания изображений. Создание адекватных моделей плоских и объемных изображений на основе контурного, кватернионного анализа. Разработка метода детектирования формы участков 3D поверхности.

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид автореферат
Язык русский
Дата добавления 03.02.2018
Размер файла 1,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

На правах рукописи

Автореферат диссертации

на соискание ученой степени доктора технических наук

Системы распознавания плоских и объемных изображений по их форме на основе контурного анализа

Хафизов Ринат Гафиятуллович

Специальность 05.12.04 - Радиотехника, в том числе системы и устройства телевидения

Казань - 2009

Работа выполнена на кафедре радиотехнических и медико-биологических систем Марийского государственного технического университета.

Научный консультант: доктор технических наук, профессор Фурман Яков Абрамович, ГОУ ВПО «Марийский государственный технический университет», г. Йошкар-Ола.

Официальные оппоненты: доктор физико-математических наук, профессор Надеев Адель Фирадович, ГОУ ВПО «Казанский государственный технический университет им А.Н. Туполева», г. Казань;

доктор технических наук, профессор Попов Дмитрий Иванович, ГОУ ВПО «Рязанский государственный радиотехнический университет», г. Рязань;

доктор технических наук, профессор Петров Евгений Петрович, ГОУ ВПО «Вятский государственный технический университет», г. Киров.

Ведущая организация: ФГУП НПО «Государственный институт прикладной оптики», г Казань.

Защита состоится на заседании диссертационного совета Д 212.079.04 при ГОУ ВПО «Казанский государственный технический университет им. А.Н. Туполева» по адресу: 420111, Казань, ул. К. Маркса, 31/7.
Отзывы на автореферат просим присылать по адресу: 420111, Казань, ул. К. Маркса, 10. КГТУ им. А.Н. Туполева, ученому секретарю диссертационного совета.
С диссертацией можно ознакомиться в библиотеке Казанского государственного технического университета им. А.Н. Туполева.
Автореферат разослан: 20__ г.
Ученый секретарь диссертационного совета кандидат технических наук, профессор В.Р. Линдваль.
Общая характеристика работы
Актуальность темы. Современный этап развития радиотехнических информационных систем характеризуется следующей общей тенденцией. Она заключается в том, что объектом их обработки являются различного рода изображения, достаточно сложные по структуре и с неоднородными статистическими свойствами. Примером могут служить телевизионные, диагностические и охранные системы, системы наблюдения за земной и водной поверхностями, ближним космическим пространством и др. Задачей таких систем является не только такая пассивная функция, как формирование самих изображений, но, в первую очередь, понимание изображений - обнаружение на сложном статистически неоднородном и многоградационном по яркости фоном представляющих интерес объектов, распознавание и оценка их параметров. Аэрокосмические сцены поверхности Земли и сцены с изображениями медико-биологических объектов относятся к наиболее сложным для обработки изображениям. Чаще всего изображения содержащихся в них объектов весьма несовершенны, обладают недостаточной по отношению к фону контрастностью, четкостью, искажены помехами и шумами. По этим сигналам оператору затруднительно принимать необходимые решения в темпе поступления изображения, т.е. в реальном масштабе времени. Особенно остро стоит эта проблема в полностью автоматизированных системах. Требуемая для решения поставленных задач производительность цифрового процессора составляет 108-1014 и более элементарных операций в секунду, что затрудняет, а в целом ряде случаев, исключает получение результатов обработки в реальном или близком к нему масштабах времени.
В последние годы задача значительно осложнилась в связи с необходимостью обработки не только плоских, 2D изображений, но и пространственных, 3D изображений. Как показывает обзор достигнутых результатов в этой области, решение таких задач, как с теоретических, так и с практических позиций, далека от завершения. Существует немало причин для подобного вывода, но необходимо отметить, что такая часто приводимая причина как недостаточная степень развития вычислительной техники, является, на наш взгляд, второстепенной. Отсутствие результатов обработки изображений, сопоставимых по своей эффективности с возможностями человека, объясняется, в первую очередь, недостаточно развитыми теоретическими подходами. В большинстве публикаций по вопросам обработки изображений рассматриваются различные эвристические подходы и даются рекомендации в пользу слабо проверенных и сильно ограниченных методов.

Особенностью данной диссертационной работы является компромисс, состоящий в выборе упрощенной, но достаточно адекватной модели изображения, и применение на базе такой модели строгих теоретических подходов для обработки реальных изображений, основанных на теории сигналов. Рассматриваемая в диссертации упрощенная модель изображения, представляет в аналитическом виде форму этого изображения, задаваемую ее контуром. Форма изображения является концентратором информации, содержащейся в изображении. Она интерпретируется как заданный в аналитическом виде сигнал, для обработки которого используются известные и новые разработанные в диссертации методы контурного и кватернионного анализа сигналов.

В экспериментальных исследованиях по психологии оператора радиолокационной станции обзора земной поверхности было показано, что процесс предварительного формирования у него зрительного образа состоит из следующих этапов: грубое различение общих пропорций изображения объекта и его положения на экране индикатора, мерцание формы, различение резких перепадов яркости, выделение отдельных деталей, восприятие формы и контура изображения объекта. Приводится гипотеза о формировании зрительного образа в сознании человека. Предполагается, что при восприятии глаз осуществляет отслеживание границы изображения объекта. В результате в сознании человека отличаются характерные особенности формы объекта. Также высказывается мнение о том, что при восприятии в сознании человека вырабатываются два образа: образ формы и образ внутренней части изображения объекта. Вместе с тем, общепринятое определение формы объекта отсутствует. В большинстве работ, где определение этого термина является важным моментом, указывается на сложность данного вопроса.

Большой вклад в развитие теории распознавания изображений внесли: У. Прэтт, Р. Гонсалес, Т. Павлидис, Ю.И. Журавлев, В.А. Сойфер, В.С. Киричук, Ю.Г. Васин, В.С. Титов, К.К. Васильев, А.А. Потапов, Г.И. Василенко, П.А. Бакут и многие другие. Важнейшие результаты в области анализа радиотехнических сцен и распознавания образов получены учеными, входящими в Российскую общественную организацию «Ассоциация распознавания образов и анализа изображений»

Научная проблема, на решение которой направлена диссертационная работа, заключается в разработке методов распознавания изображений, инвариантных к преобразованиям переноса, масштабирования и вращения этих изображений при условии сохранении их формы. Выбор в качестве адекватной модели изображения аналитического представления формы этого изображения, задаваемую ее контуром, позволяет с единых позиций теории сигналов подходить к обработке реальных изображений. Интерпретация формы изображения как заданный в аналитическом виде сигнал, для обработки которого используются разработанные в диссертации методы контурного и кватернионного представления сигналов, должно послужить основой для применения аналитических методов обработки 3D изображений при создании новых, более совершенных, систем.

Цель диссертационной работы заключается в разработке методов распознавания плоских и объемных изображений по их форме, заданной в аналитическом виде на основе контурного и кватернионного анализа. Для достижения этой цели в диссертационной работе решаются следующие задачи:

1) выбор пространства для представления сигналов при решении задачи распознавания изображений;

2) формирование адекватных моделей изображений плоских и объемных изображений на основе контурного и кватернионного анализа;

3) разработка аналитического представления формы плоских и объемных изображений на основе контурного и кватернионного анализа;

4) разработка методов фильтрации поливекторных сигналов, задающих контуры плоских и объемных изображений;

5) разработка методов обработки и распознавания, расположенных на плоскости и в 3D пространстве изображений по их форме;

6) реализация разработанных методов обработки и распознавания 2D и 3D изображений по их форме и оценка их эффективности.

Методы исследования. Для решения поставленных в диссертационной работе задач были использованы методы теории распознавания образов, контурного и кватернионного анализа, цифровой обработки сигналов и изображений, теории вероятностей, теории функции комплексного переменного, алгебры гиперкомплексных чисел, численные методы и методы математического моделирования.

Научная новизна определяется результатами, полученными в диссертации впервые, и заключается в следующем:

1. Разработаны методы распознавания двумерных и трехмерных изображений по их форме, инвариантные к преобразованиям переноса, масштабирования и вращения этих изображений.

2. Исследованы методы фильтрации комплекснозначных и кватернионных сигналов, задающих контуры плоских и объемных изображений. Получены аналитические соотношения для согласованной фильтрации поливекторных сигналов и выяснены механизмы работы таких фильтров. Обнаружен эффект расщепления кватернионным фильтром гармоник спектра фильтруемого сигнала.

3. Разработан метод обработки изображений на основе согласованно-избирательной фильтрации для решения задачи обнаружения изображений объектов на сложном многоградационном и статистически неоднородном фоне.

4. Разработан на базе анализа векторных полей метод детектирования формы участков 3D поверхности.

Практическая значимость работы.

1. Полученные методы распознавания изображений по их форме, задаваемой контуром в комплекснозначном (для 2D изображений) или в кватернионном (для 3D изображений) виде, применены для решения задач распознавания плоских и объемных изображений биомедицинских объектов при создании информационных автоматизированных систем поддержки хирурга.

2. Разработанный метод согласованно-избирательной фильтрации изображений позволил решить задачу обнаружения изображений объектов на сложным нестационарном фоне в ландшафтных сценах и в сценах с изображениями медико-биологических объектов.

3. На базе фильтров, согласованных с комплекснозначными и кватернионными сигналами, решены инвариантно к преобразованиям переноса, масштабирования, вращения и сдвига начальной точки задачи распознавания плоских и объемных изображений по их форме.

4. Разработанный метод детектирования формы участков 3D поверхности использован для решения задач визуализации пространственных изображений.

Реализация результатов работы. Теоретические и практические результаты диссертационной работы использованы в НИР «Притирка-1К» и «Эксперт» при разработке распределенных информационных систем специального назначения ФГУП «Курский НИИ» МО РФ, а также при проведении НИР № 200/01709 («Статуэтка-УПКБ») в ОАО «УПКБ «Деталь». Результаты диссертационной работы использованы в следующих НИР, выполняемых автором в качестве исполнителя по грантам РФФИ (№№ 97-01-00906, 99-01-00186, 01-01-14029, 01-01-00298, 03-01-14065д, 04-01-00243, 05-01-96510 р_поволжье_а), Министерства общего и профессионального образования РФ (1997-1998 гг.), Миннауки и технологий (№0201.05.021, 1998г.), Минобразования РФ (№03.01.06.001, 2000г.), а также в НИР, выполняемых автором в качестве руководителя по г/б НИР в рамках Государственного контракта от «28» февраля 2006 г. №02.442.11.7328 ФЦНТП «Исследования и разработки по приоритетным направлениям развития науки и техники» на 2002-2006 годы» «Единая теория обработки изображений групповых точечных объектов» (шифр 2006-РИ-19.0/001/348), а также по гранту РФФИ «Разработка методов и создание информационной технологии визуализации и сравнительного анализа сопряженных пространственных статических и динамических сцен», проект 08-01-12000-офи. Результаты диссертационной работы внедрены в учебный процесс по направлениям подготовки «Радиотехника» и «Биомедицинская инженерия».

Апробация работы. Результаты работы обсуждались на международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Нижний Новгород, 1997; Великий Новгород, 2002; Санкт-Петербург, 2004; Йошкар-Ола, 2007; Нижний Новгород, 2008); на Всероссийской конференции «Математические методы распознавания образов» (Москва, 2003, 2005, 2009); на Всероссийской научно-технической конференции «Компьютерные технологии в науке, проектировании и производстве» (Нижний Новгород, 1999); на международной конференции «Распознавание» (Курск, 2001, 2005, 2008); на международной научной конференции к 95-летию академика В.А. Котельникова «Современная радиоэлектроника в ретроспективе идей В.А. Котельникова» (Москва, 2003); на региональной научно-технической конференции (Казань, 2004); на международной научно-практической конференции «Авиакосмические технологии и оборудование» (Казань, 2006); на ежегодных научных конференциях по итогам НИР МарГТУ и научных семинарах кафедры радиотехнических и медико-биологических систем и др.

Публикации. Всего по теме диссертации опубликовано 67 работ: из них 2 монографии (издательство «Физматлит», Москва); 14 -в центральных научных журналах из Перечня ВАК; 26 - материалы конференций; 18 - в других научных изданиях и депонированные в ВИНИТИ; 6 - свидетельств об официальной регистрации программ в Роспатент.

Структура и объем работы. Диссертация состоит из введения, 6 глав, заключения и содержит 140 рисунков, 8 таблиц. Список литературы включает 179 наименований. Основная часть работы изложена на 322 страницах.

На защиту выносятся.

1. Метод аналитического представления формы плоских и объемных изображений, обладающего метрическими свойствами и содержащим необходимую для их распознавания информацию.

2. Методы распознавания плоских и объемных изображений по их форме, обеспечивающие инвариантность к преобразованиям переноса, масштабирования и вращения этих изображений.

3. Методы фильтрации комплекснозначных и кватернионных сигналов, задающих контуры плоских и объемных изображений, обеспечивающие формирование достаточной статистики для принятия решения при распознавании изображений по их форме.

4. Метод обработки изображений на основе согласованно-избирательной фильтрации, обеспечивающий обнаружение изображений объектов на сложном многоградационном и статистически неоднородном фоне.

5. Метод детектирования формы 3D изображений поверхности на базе принципа обработки множества ближайших точек генерального точечного поля и анализа векторных полей.

Краткое содержание работы

Во введении обоснована актуальность темы, сформулирована цель, направление исследований и основные научные положения, показана научная новизна и практическая значимость полученных результатов.

В первой главе исследовано современное состояние и проблемы теории обработки и распознавания изображений. Показано, что эти проблемы обусловлены действием следующих факторов: низкое отношение сигнал/шум; высокая степень детальности изображений объектов в анализируемой сцене; необходимость получения результатов распознавания в реальном или близком к нему масштабов времени; сильная статистическая неоднородность многоградационных по яркости фонов и изображений объектов; неинвариантность применяемых алгоритмов к линейным преобразованиям изображений, в первую очередь, к их повороту; несовершенство теоретических подходов к обработке и распознаванию изображений, особенно в 3D сценах, вызванных использованием эвристических подходов.

Рассмотрен метод распознавания, относящийся к классу алгоритмов вычисления оценок (АВО). Алгоритм основан на вычислении приоритетов (оценки сходства, меры близости, меры сходства), характеризующих «близость» распознаваемого и эталонного объектов по системе ансамблей признаков, представляющей собой систему подмножеств заданного множества признаков. Важным частным случаем АВО применительно к решению задач распознавания сигналов и изображений являются алгоритмы распознавания, основанные на геометрическом подходе. В соответствии с ним, сигнал в виде непрерывной функции может обрабатываться (преобразовываться) методами математического анализа. При дискретизации функции с интервалом дискретизации ей можно поставить в соответствие вектор , компонентами которого являются отсчеты функции . Векторный сигнал обрабатывается с применением методов векторного анализа. По векторному сигналу с некоторой ошибкой восстанавливается непрерывный сигнал . Эта ошибка стремится к нулю при уменьшении интервала дискретизации . Таким образом, бесконечномерный векторный сигнал полностью адекватен непрерывному сигналу . Если же выполняются условия теоремы Котельникова (теоремы отсчетов), то адекватность и наблюдается и при некотором конечном значении интервала . По s-мерному векторному сигналу в s - мерном пространстве можно задать точку с координатами, равными компонентам векторного сигнала . При наблюдается полная адекватность непрерывной функции , точки и вектора , заданных в бесконечномерном пространстве. Отсюда следует, что для обработки сигналов с одинаковым конечным результатом, (естественно, с разными затратами и ресурсами) можно применять методы математического анализа, дискретной математики и геометрии.

Сформулирована следующая научная концепция диссертационного исследования: использование упрощенных моделей изображений объектов, не связанных со значительной потерей содержащейся в изображении информации, позволяющих исключить эвристические подходы и использовать для распознавания изображений аппарат теории обработки сигналов. Подход, основанный на этой концепции, заключается в отказе от обработки каждого элемента изображения и переходе к обработке лишь его контуров, концентрирующих содержащую в изображении информацию.

Во второй главе в качестве линейных пространств для представления изображений в виде сигналов и вычисления скалярного произведение этих сигналов, как меры схожести изображений, выбраны четыре пространства, в которых определены основные арифметических действия - сложение, вычитание, умножение и деление. Это следующие пространства: линейное действительно пространство R, линейное комплексное пространство C и псевдолинейные кватернионное H и октавное O пространства. В пространстве R возможно представление и обработка как плоских, так и пространственных (трехмерных) изображений, в пространстве C - только плоских изображений. Псевдолинейность пространства H обусловлена некоммутативными свойствами операции умножения; в нем возможно представление и обработка трехмерных и четырехмерных изображений.

Пусть

и -

два одинаковой мощности s подмножества в аффинном пространстве, задающие одноименные векторные сигналы и (рис. 1). Радиус-векторы и , , назовем элементарными векторами (ЭВ) или моновекторами. Если с аффинным пространством сопоставляется линейное действительное пространство , то ЭВ содержат в качестве своих компонент вещественные числа, равные длинам проекций точек подмножеств на оси системы от-счета:

сигналы: ; , ,

сигналы: ; .

Рис. 1. 2D и 3D векторные сигналы, заданные подмножествами точек и

Для этого случая сигналы и - вещественные векторные сигналы. Когда с аффинным пространством сопоставляется линейное комплексное пространство , то моновекторы сигналов и задаются комплексными числами:

; , .

Такие сигналы назовем комплекснозначными сигналами. Если же с аффинным пространством сопоставляется псевдолинейное кватернионное пространство , то моновекторы представляются векторными кватернионами:

; .

Подобные сигналы назовем кватернионными сигналами (КТС). Решение задачи распознавания векторных сигналов связано с формированием меры схожести распознаваемого сигнала

с каждым из эталонных сигналов

, ,

алфавита классов и принятием, с теми или иными вариациями, решения в пользу класса, эталонный сигнал которого наиболее близок к распознаваемому сигналу . Различие между двумя ЭВ и определяется величиной реальной части скалярного произведения нормированных векторов и .

Векторные сигналы, представленные в пространствах R,C и H, содержат в качестве своих компонент соответственно двумерные или трехмерные декартовые координаты точек, комплексные числа и кватернионы. Каждая из таких компонент может рассматриваться в качестве вектора. Для подчеркивания этой особенности в ряде случаев векторные сигналы будем называть поливекторными. С целью обоснованного выбора пространства для представления сигналов при решении задачи распознавания изображений исследованы информативные свойства скалярного произведения поливекторных сигналов и их моновекторов в пространстве R,C и H.

Показано, что скалярное произведение плоских изображений, в виде скалярного произведения нормированных поливекторных сигналов, заданных в пространстве R, обладает функциональной зависимостью от угла между распознаваемым и эталонным изображениями. Поэтому при случайном значении скалярное произведение не может быть использовано в качестве меры схожести плоских изображений для их распознавания. Показано, что при проведении дополнительных вычислений, связанных с поворотом изображения, решением системы линейных уравнений и рядом тригонометрических вычислений возможно получение инвариантной к повороту меры схожести. Однако при определении обратных тригонометрических функций, появляются неоднозначные значения этой меры. Для трехмерных изображений, представленных в R, получение такой инвариантной меры возможно лишь в частных случаях, например, когда изображения расположены в одной гиперплоскости.

Исследованы свойства векторных сигналов, задающих плоские изображения в линейном комплексном пространстве C, и получено выражение для их скалярного произведения. Показано, что это произведение включает в качестве своей составной части скалярное произведение векторных сигналов в пространстве R. Реальная часть скалярного произведения многомерных поливекторных сигналов равна скалярному произведению этих сигналов в пространстве R: . Она содержит всю информацию о схожести сигналов и , которая определяется величиной расстояния между поливекторами и . Значение этого расстояния зависит как от угла между поливекторами и , так и от различия форм, задаваемых ими изображений. Мнимая часть скалярного произведения, равная

,

содержит дополнительную информацию о векторных сигналах. Она позволяет однозначно определить величину угла поворота векторного сигнала и значительно проще, чем в случае представление сигналов в пространстве R, найти инвариантное к вращению изображений значение меры их схожести.

Поскольку процесс линейной фильтрации сигналов связан с последовательным вычислением значений скалярного произведения фильтруемого сигналом с сигналом в виде импульсной характеристики фильтра, то приведенные выше свойства скалярного произведения в пространстве С позволяют получить инвариантные к вращению фильтруемого сигнала результаты фильтрации. Отмечено, что платой за обеспечение подобной инвариантности является ухудшение примерно в два раза отношения сигнал/шум, вызванное необходимостью учитывать влияние шума как по косинусному, так и по синусному каналам.

Получено аналитическое выражение для скалярного произведения векторных сигналов с трехмерными моновекторами в кватернионном пространстве H и исследованы его информативные свойства. Показано, что скалярное произведение таких сигналов в пространстве R является его составной частью, а дополнительная гиперкомплексная часть обеспечивает более высокую информативность меры схожести объемных изображений.

Кватернионный сигнал (КТС)

представляет собой упорядоченную совокупность множества точек в аффинном пространстве, радиус-векторы которых являются элементами псевдолинейного кватернионного пространства и заданы векторными кватернионами. КТС представляет поливекторный сигнал, а кватернионы , , являются его моновекторами (элементарными векторами).

Решены прямая и обратная задачи вращения поливекторного сигнала в трехмерном пространстве. Прямая задача вращения поливекторного сигнала сформулирована следующим образом: определить вид поливекторного сигнала

,

полученного в результате поворота 3D векторного сигнала вокруг оси. Повороту на угол вокруг оси, задаваемой вектором , подвергается по отдельности каждый моновектор , вектора . Представлена оценка трудоемкость решения прямой задачи вращения в пространствах R и H.

Получено, что применение матричных методов для поворота вектора на заданный угол вокруг оси с направляющим вектором требует 55 операций сложения, умножения, деления и извлечения корня. Подобная процедура с применением кватернионов требует 43 операции сложения и умножение, т.е. в 1,3 раза меньше. Число сложений для обоих методов одинаково, а число более сложных операций, таких как умножение, деление и извлечение корня при использовании матричных методов значительно больше. Поэтому реальный выигрыш при решении прямой задачи вращения за счет применения кватернионов может быть намного большим. Приведено количество операций для случая, когда направляющий вектор оси вращения является одновременно нормалью к собственной плоскости, в которой расположены исходный и результирующий моновекторы. Здесь число требуемых операций меньше в 2,4 раза. Если операция вращения с одними и теми же параметрами и выполняется для нескольких векторов, то выигрыш в числе требуемого количества операций, обеспечиваемый кватернионами, уменьшается и при большом количестве векторов целесообразно использовать матричные методы. Причина в том, что последние требуют много операций на подготовительном этапе при вычислении элементов матрицы, а кватернионные методы - на этапе вычисления результата вращения. Разработан алгоритм оценки угла поворота распознаваемого кватернионного сигнала по отношению к эталонному сигналу своего класса на основе решения обратной задачи вращения поливекторов в трехмерном пространстве, использующего интерпретацию кватерниона как совокупность значений косинуса угла поворота и направляющего вектора оси вращения.

В третьей главе введено определение понятия формы изображения объекта как аналитического представления контура этого изображения, инвариантного к преобразованиям масштабирования, поворота и смещения начальной точки контура. В качестве понятия «форма изображения» принята следующая трактовка этого термина Т. Павлидисом: «форма изображения представляет собой информацию, содержащуюся в его контуре «. Данное определение предполагает, что контур кроме информации о форме, дополнительно содержит информацию о параметрах его линейных преобразований , или, что форма является инвариантой к представлению в аналитическом виде контура к ряду преобразований, которым может подвергаться изображение , а, следовательно, и контур , без искажения формы, т.е.:

,

где - обозначение инвариантности аналитического описания изображения к некоторым функциональным преобразованиям или к преобразованиям , касающихся аналитического описания контура . Минимизация расстояния между двумя контурами и , задающими соответственно формы и , приводит к устранению влияния линейных преобразований на величину этого расстояния. Минимальное значение расстояния будет мерой разности форм, если форму определить как аналитическое представление контура, инвариантное к классу преобразований

,

где ,

преобразование масштабирования в раз и поворота на угол , - параметр сдвига начальной точки на моновекторов, а - параметр смещения изображения. Выражение для вектор-формы записывается в виде:

.

Полученное аналитическое представление для формы позволило конкретизировать наметившийся в последнее время подход к понятию формы изображения как инварианты к заданной группе аналитических преобразований этого изображения. Форма изображения содержит в концентрированном виде информацию о классе объекта, мало меняется при смене вида датчика, формирующего изображения, определяется значениями яркостей пикселей (вокселов) в приграничной части изображения и допускает простое аналитическое описание. Поэтому задание формы в качестве элемента линейного пространства, можно рассматривать как получение упрощенной, но достаточно адекватной модели изображения, допускающей обработку с позиции теории сигналов. Такая модель дает возможность применить для решения задачи распознавания изображений строгие методы оптимальной обработки сигналов и отказаться от эвристических подходов. Следовательно, выбор формы изображения в качестве сигнала соответствует принятой научной концепции диссертационного исследования.

Показано, что для решения задачи распознавания плоских изображений объектов по их форме целесообразно использовать аппарат контурного анализа в линейном комплексном пространстве С. Описаны основные подходы к заданию и преобразованию контуров изображений как зашумленных поливекторных сигналов с комплексными компонентами.

Выражение для элемента кода в полигональном представлении имеет вид:

,

где ; ; и - модуль и аргумент ЭВ. Достоинством подхода к описанию контуров последовательностью комплексных чисел, задающих их ЭВ, является возможность выполнять преобразования этих контуров аналитическим путем. Интерпретируя обработку полигональных комплекснозначных контуров, обладающих свойствами периодичности и замкнутости, как дискретных сигналов, можно ввести понятие сигнального контура. Этот контур представляет собой исходный (эталонный) контур , подвергнутый группе заданных преобразований:

Показано, что для решения задачи распознавания изображений трехмерных объектов по их форме целесообразно использовать аппарат кватернионного анализа в псевдолинейном кватернионном пространстве H. Рассмотрены подходы к заданию и преобразованию контуров изображений как зашумленных поливекторных сигналов с кватернионными компонентами. Получен на базе преобразования Кели-Диксона ортогональный базис в пространстве H в виде полного семейства элементарных кватернионных сигналов и выполнено разложение контура изображения произвольного пространственного объекта в виде линейной комбинации элементарных кватернионных сигналов.

К кватернионным сигналам приводит упорядоченное в трехмерном пространстве множество точек

,

задающее групповой точечный объект (ГТО). Если выбрать в этом пространстве некоторую точку и принять ее в качестве начала системы отсчета, то можно сформировать с полюсом в этой точке пучок из векторов

,

соединяющих т. с точками множества , и каждый из этих векторов будем рассматривать как чисто векторный кватернион

, ,

где , и - мнимые единицы. В отличие от умножения вещественных и комплексных чисел, операция умножения кватернионов является некоммутативной:

, , .

Кватернионы тесно связаны с комплексными числами и выражаются через них. Их можно представить как сумму двух комплексных чисел, одно из которых берется с весом, равным мнимой единице.

При повороте КТС на угол вокруг оси, направление которой определяется единичным вектором , на данный угол поворачиваются все радиус-векторы сигнала вокруг оси:

,

где - вращающий кватернион, имеющий вид

.

КТС со смещенной на величину нумерацией его кватернионов записываются в виде

.

В общем случае масштабированный в раз, повернутый на угол вокруг оси, задаваемой единичным вектором , со смещенной на величину нумерацией кватернионов КТС представляется как

.

Для получения аналитического представления формы 3D изображения использован такой же подход, как и при получении формы плоского изображения. В качестве тестового изображения выбран пространственный дельтовидный контур

,

обладающий в классе замкнутых контуров непрерывным спектром. Элементарные векторы , , задаются векторными кватернионами

.

Требование равномерности спектра дельтовидного пространственного контура накладывает требование на равномерность спектра составляющих КТС комплексных сигналов и . Получено аналитическое представление формы пространственного изображения при выборе пространственного контура в качестве тестового. Вектор-форма записывается в виде:

.

Рассмотрен вопрос об аналитическом представлении контуров плоских изображений в виде непрерывной, недискретизированной на сетчатке рецепторного поля, линии. Такой контур задан функцией комплексного переменного. Контур

в виде непрерывной замкнутой кривой на комплексной плоскости задан в виде

,

где , -длина контура,

и -

амплитудное и фазовое представление функции . При многократном обходе вдоль замкнутой кривой контур можно представить как периодическую функцию с периодом , т.е.

, .

Получено выражение для скалярного произведения непрерывных контуров и рассмотрены его свойства. Найдены аналитические выражения для элементарных контуров, полное семейство которых задает ортогональный базис. Рассмотрено преобразование Фурье непрерывной контурной линии и исследованы его свойства.

В четвертой главе рассмотрены вопросы фильтрации КТС. Получены аналитические соотношения для согласованной фильтрации КТС и выяснены механизм работы таких фильтров. Показано, что их основная особенность по сравнению с фильтрами для вещественных и комплекснозначных сигналов заключается в расщеплении каждой -ой гармоники входного сигнала на две: одна по частоте соответствующей исходной, на частоте , другая - на зеркальной частоте .

Следствием этого является нарушение привычного для линейных систем соответствия между спектрами входного и выходного сигналов, хотя для кватернионных фильтров принцип суперпозиции не нарушается: если и - реакции фильтра на входные КТС и , а - на сумму этих КТС, то . Такое поведение фильтра обусловлено некоммутативностью операции перемножения кватернионов. В математическом плане эффект расщепления гармоники входного сигнала на исходную и зеркальную вызван следующим отличием алгебры кватернионов от алгебры комплексных чисел. Если

, -

ортогональный базис в комплексном линейном пространстве , то операция сопряжения ЭК не приводит к выходу из этого базиса, т.е.

есть компонента базиса , равная . Поэтому линейная фильтрация как сигнала , так и сигнала , характеризуется монохроматичностью выходных сигналов, т.е. и - это собственные векторы линейного оператора фильтрации, а частотный коэффициент передачи - характеристическое число этого оператора.

Если же

, -

ортогональный базис в кватернионном пространстве, то операция сопряжения из-за некоммутативности операции умножения является причиной выхода кватернионного сигнала

за пределы базиса, т.е. если

при , то .

В связи с этим операция кватернионного сопряжения, выполняемая в процессе фильтрации, приводит к появлению на выходе фильтра зеркальной частотной компоненты, отсутствующей во входном сигнале. В результате частотный коэффициент фильтра имеет уже не скалярный, а векторный характер. Компоненты этого вектора и определяют реакцию фильтра на гармонику входного сигнала с частотой , вызывающую отклик на частотах и . В том случае, когда процесс фильтрации не сопровождается операцией сопряжения, например, у фильтра скользящего среднего, расщепление входной гармоники не происходит.

Рис. 2. Влияние спектра входного сигнала КвЛФ на образование гармоник спектра выходного сигнала ( )

При фильтрации произвольного КТС в образовании -ой гармоники спектра выходного сигнала принимают участие -ая и -ая гармоники входного сигнала соответственно с коэффициентами передачи и . Таким образом, КТС

частотного коэффициента передачи фильтра состоит из элементов , каждый из которых представляет собой двухкомпонентный вектор

, .

Первая компонента является коэффициентом передачи по частоте исходной гармоники, а второй - по частоте зеркальной гармоники (рис. 2).

Показано, что кватернионный фильтр представляет собой совокупность из двух параллельно работающих звеньев: комплексного и гиперкомплексного (рис. 3). В момент

реакция кватернионного фильтра на согласованный с ним сигнал, как и у комплекснозначного фильтра, представляет собой вещественный сигнал, равный по величине энергии фильтруемого сигнала. Это максимально возможная по величине реакция фильтра на произвольный нормированный входной сигнал. Следовательно, в момент на выходе фильтра образуется пиковый по величине сигнал.

Рис. 3. Структура кватернионного фильтра

Показано, что обнаружение изображений объектов на сложном многоградационном по яркости фоне должно осуществляться на основе пространственного фильтра, учитывающего статистические свойства широкополосного и фонового шумов. Реальные сцены природных ландшафтов и медико-биологических объектов характеризуются сильной статистической неоднородностью. Модели реальных ландшафтных сцен и сцен медико-биологического содержания имеют аддитивно-мультипликативный характер:

,

где - постоянная составляющая яркости, обеспечивающая условие .

Одномерные АКФ в сценах природных аэроландшафтов, вещательного телевидения и с изображениями медико-биологических объектов в пределах локально-однородной области хорошо аппроксимируются экспоненциально-косинусной функцией вида:

,

где - дисперсия фонового шума, - декремент затухания непериодической, а - круговая частота периодической составляющей АКФ. В рамках принятой модели, несмотря на ее значительно более сложный, чем у аддитивной модели вид, ЧКП оптимального фильтра усложняется незначительно:

,

где - спектр сигнала , - спектральная плотность белого шума, - координаты центра тяжести изображения,

- энергетический спектр функции фона ,

- нормирующий множитель. Согласованное звено оптимального фильтра не изменилось, а ЧКП фоноподавляющего звена стал равен

.

Задача обнаружения начальной точки контура изображения объекта в рамках принятой модели ставится аналогично задаче обнаружения самого объекта, только вместо функции яркости всего изображения обнаруживается наличие в смеси функции яркости только границы . Фильтр обнаружителя, начальной точки контура изображения должен содержать два звена: фоноподавляющее и согласованное с формой скачка яркости на границе фон/объект.

Для формирования меры схожести форм изображений принят метод согласованно-избирательной фильтрации, Он основан на том, что спектральная плотность мощности фона в реальных ландшафтных сценах и в сценах с медико-биологическими объектами в области высоких пространственных частот хорошо аппроксимируется функцией квадратичной гиперболы. Учитывая, что при описании спектральных свойств изображений фонов интерес представляет область высоких пространственных частот, а область низких частот содержит избыточную информацию и оказывает мешающее воздействие на процесс опознавания, целесообразно обеспечить согласование фильтра с сигналом не во всем диапазоне его спектра, а лишь в высокочастотной части, для которой функциональная зависимость для спектральной плотности фона известна. В этом случае удается получить в общем виде аналитическое описание оптимального фильтра в составе обеляющего и согласованного звеньев. Согласованно-избирательный фильтр осуществляет корреляцию фильтруемого изображения с контуром, т.е. с формой эталонного и в пространственной области реализуется в виде свертки фильтруемого сигнала с лапласианом эталонного сигнала. Выходной сигнал СИФ с точностью до константы равен второй производной сигнала обычного согласованного фильтра.

Рассмотрены вопросы согласованно-избирательной фильтрации одномерных, 2D и 3D скачков и импульсов яркости с прямоугольными, линейными и параболическими фронтами. Приведены графики зависимостей входного и выходного отношения сигнал/шум для СИФ при условии, что дисперсия фонового шума на входе равна единице, а параметры АКФ фонового шума выбраны равными

.

Приведена зависимость выигрыша в отношении сигнал/фоновый шум при фильтрации линейного скачка яркости, как функции длительности фронта . Получено, что выигрыш максимален для фильтра, избирательно согласованного с прямоугольным скачком яркости.

В пятой главе рассмотрены вопросы обработки и распознавания, расположенных на плоскости изображений по их форме. Решена задача обнаружения зашумленного контура . В отличие от классической постановки задачи обнаружение сигнала на фоне белого шума, здесь имеются следующие особенности. Во-первых, из-за двумерного характера задачи имеются два неинформативных угловых параметра - угол поворота и сдвиг начальной точки сигнального контура. Второй параметр задается не угловыми единицами измерения, а количеством элементарных векторов. Во-вторых, закон распределений вероятностей значений масштаба зависит от способа формирования изображений. При этом часто масштаб является не случайной, а просто неизвестной величиной.

Рассмотрены особенности решения задачи обнаружения, когда в качестве сигнала используется зашумленный контур

,

где - сигнальный контур. Устройство обнаружения содержит формирователь скалярного произведения ФСП и пороговое устройство ПУ. Получены по методу максимального правдоподобия оценки параметров , и d зашумленного контура по результатам его фильтрации фильтром согласованного с эталонным контуром . Оценки найдены по значению векторного отсчета фильтра с максимальным значением модуля. Оценки угла поворота равна аргументу вектора, оценка растяжения - отношению модуля вектора к квадрату нормы эталонного контура, а оценка сдвига начальной точки контура инкрементированному номеру вектора.

Рис. 4. Структура устройства оценки параметров зашумленного контура

Устройство оценки параметров зашумленного контура содержит согласованный с контуром фильтр КСФ, формирователь ФМ модулей отчетов этого фильтра и экстремальное устройство ЭУ, определяющее параметр отсчета с максимальным модулем (рис. 4). По номеру выделяется соответствующий отсчет и далее определяются оценки , и параметров сигнального контура .

На рис.5 представлен пример решения задачи обнаружения заданного фрагмента береговой линии на изображении участка места. Максимальный на графике модуля нормированного выходного сигнала фильтра отсчет соответствует моменту, когда окно фильтра совместилось с искомым фрагментом. Область, выделенная маркером, соответствует решению, принятому обнаружителем о положении этого фрагмента.

Решена задача оптимального распознавания контуров изображений, заданных поливекторными комплекснозначными сигналами. Показано, что для принятия решения о классе формируется статистика в виде отношения функций правдоподобия зашумленного распознаваемого контура и контура эталонного изображения проверяемого класса.

а) б)

в) г)

д)

Рис. 5. Обнаружение заданного фрагмента береговой линии: а) исходная сцена, б) контур заданного фрагмента, в) контур протяженного участка береговой линии, г) результат обнаружения фрагмента, д) реакция контурного согласованного фильтра

Важным для принятия методики диссертационного исследования является тот фактор, что эта статистика для случая нормально распределенных шумов сводится к величине расстояния между поливекторами. При переходе к нормированным значениям всех поливекторных сигналов, как распознаваемого, так и эталонных, то такой статистикой будут служить скалярные произведения соответствующих контуров. Если кроме условия нормированности, потребовать выполнение условий совпадения начальных точек и нулевого значения угла поворота между распознаваемым и эталонным контурами, то задача распознавания плоских зашумленных изображений по их форме сводится к задаче распознавания их контуров.

Исследовано влияние поворота распознаваемого изображения относительно эталонного изображения своего класса и показано при увеличении угла поворота эффективность распознавания уменьшается до нулевого значения даже при отсутствии шумов. Показано, что оптимальный алгоритм распознавания контура со случайным углом поворота заключается в формировании модуля скалярного произведения распознаваемого контура с каждым из эталонных контуров и принятия решения в пользу класса, для которого величина этого модуля максимальна.

Рассмотрено применение полученного алгоритма распознавания к алфавиту плоских изображений. Результаты эксперимента по распознаванию незашумленного изображения с контуром в алфавите переменного объема M=2,3,4,5 и поворота на произвольный угол приведены на рис. 6,а.

а б

Рис. 6 Зависимости вероятности для объекта класса от угла

График 1 соответствует распознаванию по критерию максимума модуля скалярного произведения , m=1,2,3,4; m=1,2,3; m=1,2 и m=1. Для этого графика вероятность везде равна единице, т.е. принятый критерий обеспечивает инвариантность результатов распознавания при любом значении угла поворота . Графики , , соответствуют результатам распознавания незашумленного контура по критерию максимума реальной части скалярного произведения при разных значениях объема алфавита. Как следует из этого семейства графиков, вероятность принимает либо нулевое, либо единичное значение, причем зона нулевых значений расширяется по мере увеличения объема алфавита. Таким образом, подтверждается, что даже при полном отсутствии шумов при задании сигналов в действительном пространстве R существует обширный диапазон углов поворота контура , при котором форма изображения класса не может быть распознана. На рис. 6,б приведены результаты распознавания зашумленных изображений по их форме. Отношение к сигнал/шуму в контуре распознаваемого изображения класса равно . Графики 1 и 2 построены для критерия максимума реальной части скалярного произведения, причем график 1 относится к случаю, когда алфавит имеет объем M=5, а график 2 - для случая M=2. Из этих графиков видно, что появление шумов в распознаваемом сигнале и рост объема алфавита приводит к расширению зоны с очень низким значением . Графики 3 и 4 характеризуют процесс распознавания по критерию максимума модуля скалярного произведения. Влияние шумов привело к снижению вероятности , но зато эта вероятность не меняется при повороте распознаваемого контура. Уменьшение объема алфавита (график 4) способствует росту вероятности .

На рис. 7,а приведены графики, характеризующие снижение эффективности распознавания в случае, когда решение о распознавании принимается по критерию максимума реальной части скалярного произведения (графики 1 и 3).

а б

Рис. 7. Зависимость для объекта класса : а - от отношения сигнал/шум в распознаваемом сигнале; б - от количества накопленных значений скалярных произведений

Возможность распознавания при также характеризуется графиком 1, а график 2 указывает на резкое снижение эффективности распознавания по критерию максимума при повороте распознаваемого изображения на угол . На рис. 7,б представлены графические зависимости вероятности правильного распознавание от количества накопленных значений n скалярных произведений распознаваемого и эталонных сигнала. Для принятия решения в зависимости от применяемого алгоритма выбирались либо модуль, либо реальная часть нормированного по значению n накопленного комплексного числа. Отношение сигнал/шум в распознаваемом сигнале равно .

Решена задача о виде алфавита изображений с оптимальными по критерию максимума вероятности правильного распознавания формами. Такой алфавит состоит из M=s классов изображений. Контуры всех классов изображений составляют полное семейство элементарных контуров, образующих s - мерный ортонормированный базис. Высокая помехоустойчивость распознавания, обеспечиваемая таким алфавитом, объясняется нулевым значением меры схожести между эталонами разных классов. На рис. 8 приведены результаты распознавания зашумленного изображения, форма которого задается контуром . Алфавит состоит из полного семейства элементарных контуров размерности

: ; ; ; .

Рис. 8. Зависимость вероятности правильного распознавания зашумленного элементарного контура в алфавите от угла поворота: 1 - по критерию максимума модуля скалярного произведения, 2 - по критерию максимума реальной части скалярного произведения

Решена применительно к ландшафтным сценам и к сценам медико-биологического содержания задача обнаружения контуров изображений объектов на сложных многоградационных по яркости коррелированных фонах. Решение задачи обеспечивается особыми свойствами АКФ фонов в этих сценах. Рассмотренный в данной главе обнаружитель использует для формирования статистики принцип согласованно-избирательной фильтрации. На рис. 9 приведены характеристики обнаружения прямоугольного скачка яркости на фоне сильнокоррелированного шума.

Рис. 9. Характеристики обнаружения границы при использовании фильтра, избирательно согласованного с прямоугольным скачком яркости

Существует важный класс объектов, для которых можно принять решение об обнаружении контура их изображений не по одной, а по значительно большему количеству его точек. Таким классом являются объекты антропогенного вида, границы изображений которых содержат протяженные прямолинейные фрагменты. Если фрагмент такой границы расположить вертикально к направлению строк сцены и сложить яркости строк, через которые проходит этот фрагмент, то возникает скачок яркости, значительно превосходящий по величине значение яркости остальных изображений в других точках суммарной строки. В результате накопления энергии всех пикселов прямолинейного участка контура изображения создаются благоприятные условия его обнаружения. Поскольку ориентация прямолинейного фрагмента контура произвольна, описанную выше процедуру необходимо проводить для целого ряда сцен, получаемых последовательным поворотом исходной на небольшой угол. Решение об обнаружении принимается только для той сцены, в которой эта граница расположена вертикально. На рис.10 приведены характеристики обнаружения прямолинейной границы при накоплении и строк.

а б

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.