Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов
Разработка математических моделей и нейроноподобных алгоритмов, ориентированных на реализацию обучающейся системы для распознавания и мониторинга объектов с нетривиальной геометрией на сложном фоне в реальном времени. Архитектура программного комплекса.
Рубрика | Математика |
Вид | автореферат |
Язык | русский |
Дата добавления | 30.04.2018 |
Размер файла | 237,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
На правах рукописи
Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов
Специальность 05.13.18 «Математическое моделирование, численные методы и комплексы программ»
АВТОРЕФЕРАТ
диссертации на соискание ученой степени
кандидата физико-математических наук
Тельных Александр Александрович
Нижний Новгород 2009
Работа выполнена в отделении нелинейной динамики и оптики Учреждения Российской академии наук Институт прикладной физики РАН
Научный руководитель: доктор физико-математических наук Яхно Владимир Григорьевич
Официальные оппоненты:
доктор физико-математических наук, Макаренко Николай Григорьевич
доктор физико-математических наук, Казанцев Виктор Борисович
Ведущая организация: НИИ Нейрокибернетики им. А.Б. Когана, Южного федерального университета
Защита состоится « 23 » апреля 2009 года в 10.00 час. на заседании диссертационного совета Д 212.156.05 в Московском физико-техническом институте (государственном университете) по адресу: 141700, Московская обл., г. Долгопрудный, Институтский пер. 9, МФТИ, аудитория 903 КПМ .
С диссертацией можно ознакомиться в библиотеке Московского физико-технического института (государственного университета).
Автореферат разослан « 20 » марта 2009 г.
Ученый секретарь диссертационного совета Федько О.С.
нейроноподобный математический модель программный
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Задачи обнаружения объектов на цифровых изображениях характерны для целого ряда прикладных систем: обработки цифровой информации в системах видеонаблюдения, поиска полезной информации в цифровых фото- и видеоархивах, в системах ориентации автономных устройств, в системах контроля качества, в системах организации доступа на охраняемые объекты с использованием биометрических данных, в системах обработки медицинских изображений и многих других. Особенно актуальным является анализ видео-потока в реальном масштабе времени для создания интеллектуальных камер, позволяющих записывать только те события, происходящие в их поле зрения, которые «достойны внимания» с точки зрения пользователя системы. В настоящее время получили широкое распространение устройства, реагирующие на наличие «движения» в поле зрения камеры, как правило, работающие с использованием алгоритмов оценки «оптического потока». При этом классификация объекта или группы объектов, попавших в поле зрения камеры, отсутствует. Данная работа демонстрирует возможности расширения способностей подобных устройств. Обладая возможностью обнаруживать заданные объекты (людей, лица людей, транспортные средства и т.д.), идентифицировать их в реальном времени, устройства видео-наблюдения получают совершенно новые качества, которые позволяют оценивать «ситуацию» в наблюдаемом пространстве и реагировать только на такие события, которые интересны пользователям этих систем. В предлагаемой работе рассматриваются также актуальные задачи, связанные с систематизацией, индексацией и быстрым доступом к графическим данным в цифровых видеоархивах. Предложенные системы позволяют проводить поиск и автоматическую рубрикацию данных без участия оператора, опираясь только на заложенные в них алгоритмы и предложенную к рассмотрению видеоинформацию. Точность и надежность результатов, полученных при решении задач обнаружения, уточнения и распознавания объектов на сложном фоне, является критическим параметром всей системы в целом, наряду с быстродействием системы. Таким образом, актуальной является задача оптимизации параметров распознающей системы, как по точности, так и по времени отклика.
Цели диссертационной работы. Цель данной работы заключается в разработке математических моделей и нейроноподобных алгоритмов, ориентированных на реализацию обучающейся системы для распознавания и мониторинга объектов с нетривиальной геометрией на сложном фоне в реальном времени. Разработанная модель должна позволять использующей ее системе эффективно функционировать в типичной программной среде персональных компьютеров. Система должна обладать подсистемой контроля полученного результата.
Для достижения поставленных целей необходимо решить следующие задачи:
1. Разработка теоретических принципов распознающей модели.
2. Разработка архитектуры программного комплекса для настройки создаваемых распознающих систем, работающих в режиме реального времени.
3. Реализация комплекса в виде пакета программ.
4. Разработка модели тестирования эффективности работы создаваемых распознающих систем.
5. Разработка методики статистического обучения нейроноподобных моделей для обнаружения объектов на сложном фоне с использованием прецедентной базы данных.
Методы исследования. Для решения поставленных в диссертационной работе задач были использованы методы теории распознавания образов, математической статистики, математического моделирования, теории искусственных нейронных сетей, цифровой обработки сигналов и изображений, теории вероятностей.
Научная новизна работы.
1. Сформирована модель нейроноподобной системы для обнаружения, сопровождения и распознавания объектов заданного типа на сложном фоне в режиме реального времени.
2. Разработаны алгоритмы и архитектура нейроноподобной системы распознавания, позволяющие формировать модельное описание заранее заданных объектов.
3. Разработан способ параллельного соединения каскадов «сильных классификаторов», обученных на разных прецедентных базах, существенно повышающий производительность системы обнаружения.
4. Проведено исследование эффективности работы нескольких алгоритмов формирования функции активации сигналов от рецептивных полей.
5. Исследованы алгоритмы классификации найденного объекта с использованием нейроноподобной системы.
Практическая ценность работы. Полученные в диссертационной работе результаты по разработке моделей, алгоритмов и реализации программного комплекса для настройки нейроноподобных систем видеонаблюдения являются основой для построения перспективных систем и устройств обнаружения, сопровождения и классификации объектов на произвольном сложном фоне. Результаты данной работы могут использоваться также в системах оперативного анализа информации на борту летательных аппаратов и системах зрения автономных мобильных роботов.
Реализация результатов работы. Разработанные алгоритмы и программы используются в действующих вариантах демонстрационных биометрических систем для распознавания человека: по руке; по лицу; по дактоотпечатку;
с помощью интегральной биометрической системы. Создана система для распознавания музыкальных сигналов. Выполнена версия фотоархива с индексацией по лицам, система контекстного поиска для изображений специального характера. Системы ориентированы на применение в системах анализа информации в Интернете, в биометрических системах доступа, в системах обеспечения безопасности предприятий.
Апробация работы. Результаты работы обсуждались на 3-м рабочем семинаре-совещании «Теория приложения искусственных нейронных сетей» (Снежинск, РФЯЦ ВНИИТФ, 1998), на 4-й всероссийской конференции «Биомеханика» (Нижний Новгород, 1998), на 12-й международной конференции по нейрокибернетике (Ростов-на-Дону, 1999), на 2-м съезде биофизиков России (Москва, 1999), 4-й конференции по радиофизике (Нижний Новгород, 2000), на международной конференции ICONIP'02 (Сингапур, 2002), на международной конференции APHYS 2003 (Spain, Badajoz, 2003), на 6-й, 8-й, 9-й и 10-й всероссийской научно-технической конференции «Нейроинформатика» (Москва, МИФИ, 2004, 2006, 2007, 2008), на конференции «Управление и информационные технологии» (Санкт-Петербург, 2005), на 2-й Троицкой конференции «Медицинская физика и инновации в медицине» (Троицк, 2006), на 13-й всероссийской конференции «Математические методы распознавания образов» (Санкт-Петербург, 2007), на 9-й международной конференции Pattern Recognition and Image Analysis: New Information Technologies, PRIA-9-2008 (Нижний Новгород, 2008).
Публикации. Всего по теме диссертации опубликовано 26 работ, включая 7 в зарубежных изданиях. Из них две статьи - в изданиях из списка, рекомендованного ВАК РФ [9, 17], одна работа - международный патентах [26], а также два российских патента [24,25].
Структура диссертации. Диссертация состоит из введения, четырех глав, заключения, списка использованных источников, включающего 110 наименований и двух приложений. Диссертация изложена на 131 страницах.
Положения, выносимые на защиту
1. Архитектура нейроноподобных моделей распознавания для «слабых классификаторов» (сенсоры первого уровня).
2. Архитектура нейроноподобных моделей распознавания для «сильных классификаторов» (сенсоры второго уровня).
3. Способ параллельного соединения каскадов «сильных классификаторов», обученных на разных прецедентных базах, существенно повышающий производительность системы обнаружения.
4. Алгоритмы предварительного целеуказания, уточнения местоположения и классификации найденного объекта с использованием нейроноподобной системы.
5. Комплекс программ, позволяющий настраивать нейроноподобные системы распознавания для обнаружения и распознавания заданных классов на сложном произвольном фоне.
Личный вклад автора. В совместных работах автор принимал непосредственное участие в выборе направлений исследований, постановке основных задач, разработке и обсуждении результатов. Все представленные в диссертационной работе результаты получены лично автором.
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении обоснована актуальность диссертационной работы, сформулированы цель и задачи исследования, охарактеризована научная новизна полученных результатов и их практическая значимость, указаны методы исследования, указаны положения, выносимые на защиту.
В первой главе диссертации рассмотрена история исследования нейрофизиологических процессов в нейроноподобных системах из возбуждающих и тормозных элементов. Представлена биологоправдоподобная модель нейрона. Помимо устройства отдельной клетки относительно рассмотрены глобальные аспекты деятельности мозга, специализация его областей, связи между ними и т.п. Рассматриваются подходы к моделированию обработки информации на промежуточном уровне, в участках нейронной сети, содержащих сотни тысяч нервных клеток. Рассматривается модель распределенной среды в виде балансных интегро-диффиренциальных уравнений для «классической» схемы взаимодействия между нейроноподобными элементами с возбуждающими и тормозными связями. Затем рассматриваются упрощенные варианты базовой модели в приближении, когда влияние тормозных нейронов на себя мало. Введено понятие функции «латерального торможения» и в результате получена модель двумерного плоского слоя - однослойная (однокомпонентная) распределенная нейроноподобная система, которая записана как в непрерывном, так и в дискретном виде.
В разделе 1.3 рассмотрены методы исследования структур коллективной активности в таких распределенных однородных нейроноподобных системах. Указано, что в пространственно-временных структурах, полученных в результате эксперимента дискретизация по времени и пространству приводит к несоответствию с точными решениями распределенных систем. При этом, основываясь на результатах предыдущих работ, показано, что в дискретном варианте возможны различные режимы ее работы, в частности режимы взаимодействия фронтов и импульсов возбуждения.
В разделе 1.4 введена математическая модель рецептивного поля и указаны приближения, в которых была выполнена работа. В частности, предполагалось, что время срабатывания нейроноподобного элемента (рецептивного поля) равно шагу дискретизации системы. В этом приближении получена дискретная форма для уравнения рецептивного поля (1), которая может быть удобно запрограммирована на современной вычислительной технике.
, (1)
Где - активность рецептивного поля, - нелинейная функция активации рецептивного поля, - функция связи между элементами нейроноподобной системы, - входной стимул на элементы нейроноподобной системы, - дополнительные внешние сигналы, которые приходят на элементы нейроноподобной системы, , - нормировочный коэффициенты. - местоположение а пространстве нейроноподобного элемента. - расстояние от рассматриваемого элемента рецептивного поля, до взаимодействующего с ним нейроноподобного элемента окрестности, - радиус окрестности, в которой происходит взаимодействие между нейроноподобными элементами.
Заявлено, что проведя вычисление с использованием уравнения рецептивного поля для всех нейроноподобных элементов, входящих в нашу систему, мы получим так называемую «карту рецептивного поля». В терминах теории обработки изображений, карта рецептивного поля соответствует нелинейной фильтрации входного изображения. В нашем случае это карта активности нейроноподобных элементов, которая и будет в дальнейшем использоваться для построения систем распознавания, работающих в реальном времени.
В разделе 1.5 описаны различные виды рецептивных полей, которые определяются функциями пространственной связи между активными элементами. Функция пространственной связи показывает, какое воздействие активный элемент оказывает на своих соседей в зоне своего пространственного влияния. Если элемент старается возбудить соседей, это соответствует диффузной связи, а пространственно-временные структуры соответствуют результатам для диффузных сред Функции связи с положительным центром и отрицательными флангами, соответствуют тому, что каждый активный элемент старается поддержать, или активировать своих ближайших соседей, и подавить возбуждение более активных далеких элементов в своей сфере влияния, т.е. реализуется латеральное торможение за счет отрицательных коэффициентов связей между отдельными элементами. Такой принцип избирательности по пространственной частоте реализуется в зрительной коре млекопитающих. Показано, что функция связи может быть как изотропной, так и анизотропной, что позволяет выполять операции пространственной локализации, частотной локализации, избирательности пространственной частоты, избирательности направления. Рассмотрены некоторые типы функций пространственной связи, применение которых возможно для моделирования обработки сигналов сенсорной активности в мозгу млекопитающих и для формирования технических устройств построенных на таких «бионических принципах». В частности рассмотрены функции Габора, функции типа «латеральное торможение», лапласиан гауссиана и функции Хаара. Введено понятие «интегрального изображения» и показан способ быстрого вычисления значений откликов рецептивных полей Хаара с использованием интегрального изображения.
В завершении главы приведены примеры численных расчетов с использованием модели «рецептивного поля», которые показывают возможность проведения всевозможных обработок изображения с использованием одного единственного уравнения. Сущность обработки информации в распределенной нейроноподобной системе заключается в выборе из всего множества возможных автоволновых процессов (возникновение стационарных автоструктур, распространение фронтов, импульсов, возникновение источников волн, отражение импульсов при взаимодействии, развитие возмущений на фронте, прорастание локализованных областей активности в двухкомпонентной среде, режимы самовозбуждения в трехкомпонентной среде) таких, при которых в системе из исходного начального условия в неподвижного изображения формируются стационарные автоструктуры. Формирование различного вида стационарных структур интерпретируется как выделение различных упрощенных препаратов исходного неподвижного изображения (например, контур или линии разных направлений). С помощью модели однородной нейроноподобной среды исключительно за счет смены ее параметров, могут быть реализованы различные требуемые для обработки и принятия решений варианты нелинейной фильтрации изображений.
Во второй главе диссертации рассмотрены вопросы применения моделей однородных распределенных нейроноподобных систем для решения задачи предварительного целеуказания. Целью работы системы предварительной обработки изображения является уменьшение числа рассматриваемых классификатором (системой принятия решения) фрагментов изображения путем формирования относительно небольшого числа зон «внимания».
В разделе 2.1 введено понятие местоположения объекта (2), которое задается двумя точками. Для случая обнаружения лиц эти точки будут соответствовать глазам найденного объекта на изображении, введено понятие расстояния между местоположениями найденных объектов. Показано, как, зная местоположение найденного объекта, формировалась прямоугольная анализируемая область изображения. И наоборот, введено правило, как, зная прямоугольную анализируемую область, сформировать местоположение найденного объекта. На основании этих понятий, местоположения и анализируемой области, сформулирована задача предварительного целеуказания:
Из всего массива анализируемых областей, которые могут покрывать изображение, оставить для дальнейшего анализа только те, в которых возможно наличие искомого объекта и указать местоположения этих объектов. Также введено понятие эффективности работы системы целеуказания. Ошибки первого и второго рода.
Далее в главе рассмотрены два подхода к решению задачи предварительного целеуказания.
1. Синтез массива областей кандидатов для дальнейшего анализа. Синтез производится по изображению, сегментированному некоторым алгоритмом.
2. Исключение из предварительно заданного массива областей для анализа таких, в которых заведомо нет искомого объекта. В этом случае анализ производится на изображении сегментированном некоторым алгоритмом.
Показано, что для решения задачи обнаружения объектов в реальном времени, где основным критерием качества является скорость выполнения операции при фиксированной ошибке, предпочтительным является второй подход. Исключение из заданного массива областей позволяет проводить операцию предварительного целеуказания исходного изображения за фиксированное время.
В первом подходе, для системы синтеза анализируемых областей представлена блок-схема преобразования входного сигнала в массив местоположений, включающая следующие этапы: преобразование изображения в полутоновое, фильтрация с использованием модели распределенной однородной среды, состоящей из нейроноподобных элементов, выделение горизонтальных штриховых линий, пространственная кластеризация штриховых линий, фильтрация найденных кластеров по некоторому правилу, формирование массива анализируемых областей.
Рис. 1. Процесс синтеза массива областей кандидатов
Так же предложена математическая модель процесса фиксации взгляда в случае системы поиска лиц на изображении на основании описанных выше процедур и описано пространство ее параметров (3).
(3)
Видно, что математическая модель предварительного целеуказания состоит из 4х стадий преобразования входного сигнала в результат .
· Преобразование с использованием модели однородной среды, состоящей из нейроноподобных элементов (Net).
· Формирование массива штрихов (ST)
· Формирование массива пространственных кластеров и их центров(CT)
· Формирование массива местоположений (SF)
Предложен алгоритм оптимизации параметров этой модели относительно целевой функции, которая введена в 2.3.4. Далее в главе описывается детектор движения, построенный на основе предварительной обработки изображения с использованием нейроноподобных элементов. Его математическая модель и пространство ее параметров.
Следующая часть второй главы посвящена описанию второго подхода, связанного с алгоритмами исключения кандидатов из предварительного заданного массива возможных местоположений. Описана, регулярная сетка, на которую разбивается изображения и приведены результаты исследований, по оптимальным параметрам разбиения изображения на перекрывающиеся фрагменты. Показано, как с использованием «интегрального изображения» и карты активности рецептивных полей принимается решение об исключении исследуемого фрагмента изображения из массива предложенных кандидатов. Как и в случае синтеза областей для «фиксации взгляда», предложена математическую модель в виде цепочки преобразования исходного изображения. Описано пространство ее параметров и целевая функция для поиска максимума эффективности работы системы предварительного целеуказания в заданном пространстве параметров. Также описана модель детектора движения для рассматриваемого случая.
В заключении этой главы описан вычислительный эксперимент и приведены его результаты. Анализируя результаты сравнения двух алгоритмов предварительного разбиения на тестовой базе данных размеченных изображений объемом 1000 штук, мы получили, что алгоритм «синтеза областей фиксации взгляда» при максимально допустимом уровне ошибки локализации объекта имеет ненулевую ошибку потери объекта. При этом требует значительных вычислительных затрат. С другой стороны разбиение изображения с помощью регулярной сетки не дает ошибки локализации объекта и не требует времени для организации массива фрагментов, но предъявляет жесткие требования к временным параметрам срабатывания блока принятия решения. Компромисс между вычислительными затратами и точностью можно достичь, объединяя алгоритм разбиения входного изображения методом регулярной сетки, и последующего анализа наличия в каждом фрагменте изменений, генерируемых детектором движения.
В третьей главе диссертации рассмотрены вопросы построения функции обнаружения искомого объекта. Данная функция ищется как бинарный классификатор образцов фона и образцов полезного сигнала (4).
, (4)
Введено понятия области фиксации взгляда и предположение о том, что анализ изображения происходит именно в области фиксации взгляда путем формирования множества карт активности рецептивных полей различного типа. Другими словами, рецептивных полей с различными видами функции связи. Показано, что плотность распределения рецептивных полей не является равномерной по всему полю и содержит явно выраженную точку (Рис.2), где количество участвующих в процессе преобразования входного изображения рецептивных полей максимально.
Размещено на http://www.allbest.ru/
Рис.2. Плотность распределения по пространству области фиксации взгляда, рецептивных полей различных типов
Эта точка и является аналогом точки «фиксации взгляда» для живой системы, для которой число вовлеченных в анализ рецептивных полей максимально. При этом область, в которой произведено построение плотности распределения числа рецептивных полей и является областью анализа содержимого и принятия решения.
В главе предложена и рассмотрена математическая модель системы обнаружения объектов (5), состоящая из нейроноподобных элементов и пространство ее параметров.
,(5)
Процесс передачи возбуждения и принятия решения характеризуется числом сильных классификаторов N, которое не известно, каждый сильный классификатор H характеризуется порогом , который не известен, помимо порога, он характеризуется неизвестным числом К «слабых классификаторов» h и неизвестными весами слабых классификаторов , каждый слабый классификатор характеризуется неизвестной функцией активации и неизвестным видом рецептивного поля . Известными параметрами являются число видов рецептивных полей L, размеры пространственной области, на которой работает рецептивное поле R, параметры T и в модели рецептивного поля, а так же вид нелинейной функции, которую мы выбрали для модели рецептивного поля F.
.
Для нахождения неизвестных параметров модели мы должны найти удовлетворяющие нас значения для некоторой целевой функции (6).
Целевой функцией для пространства параметров , классификатора будем считать следующее соотношение:
,(6)
где - функция принятия решения на фрагменте исходного изображения , порог принятия решения, при котором ошибка отвержения своего на обучающем множестве стремится к нулю. - число образцов в обучающем множестве.
Предложен способ формирования целевой функции на множестве объектов U, которое в той или иной степени должно отражать реальный мир. Показано, что формирование детектора ведется до тех пор, пока изменение целевой функции детектора не будут меньше некоторого порога. (7)
, (7)
Введено понятие целевой функции для «сильного классификатора» и описана процедура формирования сильного классификатора как ассоциативной машины, построенной на большом множестве рецептивных полей с использованием процедуры AdaBoost. В некотором приближении описан процесс обучения детектора и задан критерий его окончания.
В разделе 3.2.4. рассмотрены модели обучения для слабых классификаторов и формированию функции активации рецептивного поля на некотором подмножестве исходного множества U. Причем подмножество выбирается таким образом, что, все образцы объектов в нем остаются, а образцы фона формируются из ошибок существующего классификатора. Для формирования функции активации рецептивного поля предложено использование правило принятия решения на основе критерия «максимального правдоподобия» с использованием его оценки по обучающему множеству U.
Рассмотрено несколько методов оценки плотностей вероятности полезных и шумовых сигналов для рецептивных полей Хаара. Рассмотрена гипотеза о нормальном распределении откликов от рецептивных полей, на основании которой, с использованием критерия «максимального правдоподобия» строится модель обучения для слабого классификатора. Предложено использование метода оценки плотности распределения с использованием дискретной гистограммы. Показано, что использование второго метода для слабой модели обучения дает лучшие результаты, чем использование гипотезы о нормальном распределении откликов от рецептивного поля на обучающем множестве.
Также рассмотрено применение рецептивных полей, основанных на Modified Census Transform для использования в модели детектора. И показано, что применение рецептивных полей на основе Modified Census Transform значительно уменьшает число используемых рецептивных полей в окончательном варианте детектора.
В разделе 3.3 описан вычислительный эксперимент по формированию высококачественной системы обнаружения объектов на произвольном фоне и представлены его результаты.
В заключении главы предложен алгоритм параллельного соединения детекторов. Суть параллельного соединения двух и более каскадов заключается в анализе активности каждого не на конкретном фрагменте изображения, а в некоторой области, которая окружает искомый объект. Разработанная нами система предварительного анализа формирует множество фрагментов, которые попадают в область рассогласования между истинным положением объекта и областями, где тестируется гипотеза о его наличии. Приведены результаты применения параллельного соединения каскадов на тестовой базе данных, которые демонстрируют сильное уменьшение ошибки ложных тревог, при незначительном увеличении ошибки пропуска цели. Рис. 3.
Рис.3. Результат уменьшения ошибки ложных тревог с использованием параллельного соединения двух детекторов ChaosFace-1 и ChaosFace-2 в детектор ChaosFace на стандартном множестве изображений MIT dataset newtest
В четвертой главе диссертации рассматриваются методы распознавания найденных объектов. Распознавание представляет собой отнесение исследуемого объекта, представленного совокупностью наблюдений, к одному из взаимоисключающих классов. Совокупность предъявленных наблюдений в процессе обучения обычно записывают в виде матрицы и называют «обучающей выборкой». Проводятся аналогии между системой обнаружения и системой классификации найденной цели. Рассмотрена процедура сведениия задачи многоклассовой классификации к задаче двуклассовой классификации, что прямо соответствует изложенным в предыдущих главах задачам. Применение методов, описанных в главе 3. к решению задач классификации найденного объекта позволяет формировать системы, способные к распознаванию цели из множества альтернатив. При этом они используют аппарат рецептивных полей, сильных классификаторов и детекторов. Таким образом, использование техники перехода к двухклассовой задаче и использование концепции рецептивных полей позволяет создавать работоспособные и универсальные нейроноподобные системы распознавания.
В главе приведено также описание конкретных систем распознавания, в которых используются разработанные в данной работе схемы и алгоритмы. Описываются основные характеристики интегральной биометрической системы по изображениям руки, лица, дактоотпечатка и звукам голоса. Приведены характеристики разработанных систем распознавания музыкальных сигналов. Дано описание системы видеонаблюдения с детектированием лиц и распознаванием по ним людей. Приведено описание электронного фотоархива с индексацией по лицам людей. Приведены данные о программе, позволяющей производить поиск специальных изображений по контексту.
В заключении изложены основные результаты диссертации.
В приложении 1 рассматривается инструментарий разработчика.
В приложении 2 рассматриваются технические особенности реализации программного комплекса.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Предложена математическая модель нейроноподобных сенсорных элементов (включающих рецептивное поле и функции активации), а также каскады из таких элементов, позволяющая сформировать способные работать в реальном времени системы обнаружения и классификации объектов на 2d-изображении. Предложена оптимальная модель рецептивного поля с точки зрения вычислительной эффективности.
2. Создана и реализована оригинальная методика настройки параметров модели объекта. На основе этой методики исследованы режимы формирования эффективной модели распознаваемого объекта на изображении по заранее заданному экспертом набору прецедентов.
3. Разработан алгоритм параллельного соединения детекторов. Показано, что предложенная методика параллельного соединения каскадов нейроноподобных элементов значительно снижает ошибку обнаружения ложных целей.
4. Предложена и реализована методика тестирования алгоритмов классификации найденных объектов. Показано, что алгоритм классификации, основанный на модели рецептивного поля и переходе к двухклассовой задаче, позволяет конструировать систему распознавания из универсальных элементов.
5. Исследованные алгоритмы реализованы в виде комплекса программ и использованы при разработке систем идентификации человека по биометрическим признакам. Комплекс позволяет работать как в интерактивном, так и в автоматическом режиме.
СПИСОК ПУБЛИКАЦИЙ АВТОРА ПО ТЕМЕ ДЛИССЕРТАЦИИ
1. Коган А.Н., Тельных А.А., Яхно В.Г. Оптимизация точности режимов распознавания системы "Рука Идентификатор Человека" - "РИЧ-1" // Тезисы III рабочего семинара-совещания "Теория и приложения искусственных нейронных сетей" - Снежинск, РФЯЦ ВНИИТФ, 1-3 апреля, 1998, -С. 25-26.
2. Тельных А.А., Яхно В.Г., Савельев Д.В., Смирнов Г.В., Новиков А.В., Ветушкин В.Д., Донченко Е.В. Программно - аппаратный комплекс для биометрии кисти // Тезисы докладов на IV Всероссийской конференции "Биомеханика -98", -Н. Новгород, 1998, -С.84.
3. Тельных А.А., Яхно В.Г. Нейроноподобные модели второго и третьего уровней - адаптивные распознающие системы // Материалы XII Международной конференции по нейрокибернетики, Издательство Северокавказского научного центра высшей школы, -Ростов на Дону, 1999 -С.164-168.
4. Коган А.Н., Тельных А.А., Яхно В.Г. Нейросетевые режимы принятия решений // II съезд биофизиков России 23-27 августа 1999 г. -Москва, 1999. Тезисы докладов, том II, -С. 419.
5. Бондаренко Б.Н., Коган А.Н., Нуйдель И.В., Сборщиков А.В., Тельных А.А., Хилько А.И., Хурлапов П.Г., Яхно В.Г. Разработка адаптивных алгоритмов распознавания сложных изображений в нейроноподобных средах // Труды четвертой конференции по радиофизике 5 мая 2000 г., Н. Новгород. 2000, -С.207-208.
6. Ivanov A.E., Eremin E.V., Bellustin N.S., Kostin M.A., Kogan A.N., Kraev A.V., Nuidel I.V., Perminov A.O., Sorokin M.A., Khil'ko A.I., Sborchikov V.N., Tel'nykh A,A,, Shilin S.G., Rohatgi U.S., Jain U.S. and Yakhno V.G. Recognition of ccomplex images by an adaptive neuron-like research system//Proceedings of Sixth ISTC Scientific Advisory Committee Seminar, Moscow, Russia, September 15-17, 2003, -P.308-325.
7. Nuidel I., A. Chaikin A., A.Telnykh, O.Sanina, V.Yakhno, T.Yakhno, O.Kruglun, and N.Makarenko Extraction of Informative features From the Images of Diagnostic Structures In Dried Drops of Biological Liquids// Proceeding of the First International Meeting on Applied Physics (APHYS 2003), Spain, Badajoz,13-18October 2003, "Recent Advances in Interdisciplinary Applied Physics", 2005, -P.639-643.
8. Беллюстин Н.С., Еремин Е.В., Тельных А.А. и Яхно В.Г. Применение мелкозернистых искусственных нейронных сетей в системе распознавания лиц//VI Всероссийская научно-техническая конференция «Нейроинформатика-2004», Сборник научных трудов, часть 2 МИФИ, Москва, янв. 2004, -C. 201-207.
9. Яхно В.Г., Нуйдель И.В., Иванов А.Е., Беллюстин Н.С., Будников Д.Н., Тельных А.А., Еремин Е.В., Коган А.Н., Костин М.А., Перминов А.О., Раджабова Ю.Х., Сорокин М.А., Тихомиров Д.А., Шилин С.Г., Чайкин А.В. Исследование динамических режимов нейроноподобных систем. Примеры приложений// Информационные технологии и вычислительные системы, -2004, №1, -C.126-148.
10. Tel'nykh O.S., Tel'nykh A.A., and Shilin S.G. Program for recording, analyzing, and automatic finding of characteristic features in encephalograms // Proceedings of Nijmengen Institute for Cognition and Information, 2004, -P.391-396.
11. Тельных А.А., Разумов В.А., Беллюстин Н.С., Калафати Ю.Д., Яхно В.Г. Создание электронной версии фотоальбома с индексированием по изображениям лиц // Сб. докладов «Управление и информационные технологии». Т. 1. 2005. -С.260-267.
12. Коган А.Н., Иванов А.Е., Тельных А.А., Раджабова Ю.Х., Еремин Е.В., Беллюстин Н.С., Jain A.K., Rohatgi U.S., Яхно В.Г. Интегральная биометрическая система распознавания человека // Сб. докладов Управление и информационные технологии. Т. 1.-С.Петербург, 2005. -С.267-275.
13. Яхно В.Г., Тельных А.А., Нуйдель И.В., Полевая С.А., Парин С.Б., Беллюстин Н.С., Еремин Е.В., Разумов В.А., Иванов А.Е., Чайкин А.В., Шемагина О.В., Спицын И.Г., Краева Т.А. Программные модели обработки зрительных сигналов// II Троицкая конференция "Медицинская физика и инновации в медицине" (16-19 мая 2006), Альманах клинической медицины, Том XII, -Москва, 2006б - С.69.
14. Беллюстин Н.С., Разумов В.А., Тельных А.А., Настройка и тестирование фрагментов системы анализа лица человека на видеоизображениях, //VIII Всероссийская научно-техническая конференция «Нейроинформатика-2006», Сборник научных трудов ISBN 5-7262-0634-7, часть 1 МИФИ, -Москва. 2006, -C. 157-164.
15. Беллюстин Н.С., Разумов В.А., Тельных А.А., Шемагина О.В.Повышение качества распознавания лиц на цифровых изображениях за счет системы уточнения положения лица, //Всероссийская научно-техническая конференция "Нейроинформатика-2007", Сборник научных трудов ISBN 5-7262-0709-2, часть 1 МИФИ, -Москва, 2007, -C. 88-94.
16. Ковальчук А.В., Беллюстин Н.С., Тельных А.А., Яхно В.Г. “О методах промежуточного контроля в сложной системе обнаружения и распознавания лиц” // Сб. докладов XIII всероссийской конф. ММРО-13.:МАКС-Пресс, М. 2007, -C. 471-481.
17. Беллюстин Н.С., Тельных А.А., Разумов В.А., Шемагина О.В., Ковальчук А.В., Яхно В.Г., Применение генетических алгоритмов для уточнения местоположения лица человека на видеоизображении // Нейрокомпьютеры: разработка и применение, 2007, № 11, -C. 43-45.
18. Беллюстин Н.С., Калафати Ю.Д., Ковальчук А.В., Тельных А.А., Шемагина О.В., Яхно В.Г., Нейроноподобный детектор лица. Технические особенности реализации и обучения. //Сборник научных трудов ISBN 978-5-7262-0878-7, часть 2, МИФИ, -Москва,2008, -C. 123-132.
19. Telnykh A.A., Bellyustin N.S., Shemagina O.V., Kalafati Yu.D., Yakhno V.G., The Training Algorithm of a Neuron-like Object Detector and Variants of its Implementation,//9-th International Conference on Pattern Recognition and Image Analysis: New Information Technologies, PRIA-9-2008, September 14-24, 2008, Conference Proceedings, v.2, -Nizhni Novgorod, 2008, -P. 208-211.
20. Telnykh A.A., Shemagina O.V., Bellyustin N.S., Kalafati Yu.D., Video clip segmentation algorithm and its realization, //9-th International Conference on Pattern Recognition and Image Analysis: New Information Technologies, PRIA-9-2008, September 14-20, 2008, Conference Proceedings, v.2, Nizhni Novgorod, 2008, -P. 212-214.
21. Telnykh A.A., Kovalchuk A.V., Object detection system using expert committeets, //9-th International Conference on Pattern Recognition and Image Analysis: New Information Technologies, PRIA-9-2008, September 14-20, 2008, Conference Proceedings, v.2, Nizhni Novgorod, 2008, -P. 212-214.
22. Ковальчук А.В., Соколов М.Е., Тельных А.А., Сопоставление нейроноподобных и классических методов в задаче уточнения координат глаз, //Сборник научных трудов ISBN 978-5-7262-0878-7, часть 2, МИФИ, Москва, 2008, -C. 123-132.
23. Бондаренко Б.Н., Нуйдель И.В., Сборщиков И.Ф., Тельных А.А., Хилько А.И., Яхно В.Г., Адаптивное построение изображений нейроноподобной исследовательской системой, Препринт / ИПФ РАН, №559, Нижний Новгород, 2001,- 29c.
24. Пат. 2160466 Российская Федерация, 7 G 06 K 9/00. Способ биометрической идентификации личности по кисти руки и формирователь изображения кисти руки для его осуществления. /Яхно В.Г., Перминов А.О., Тельных А.А., Красильникова И.Г., Прудников М.Б., Бабиков Д.Б., НЦИНТ; заявитель и патентообладатель Яхно В.Г. - №97116929/09; заявл. 29.09.1997; опубл. 10.12.2000, Бюл. №34. -11 с.
25. Пат. 2160467 Российская Федерация, 7 G 06 K 9/00. Метод адаптивного распознавания информационных образов и система для его осуществления. / Яхно В.Г., Нуйдель И.В., Тельных А.А., Бондаренко Б.Н., Сборщиков И.Ф., Хилько А.И.; заявитель и патентообладатель Яхно В.Г.- 99115239/09; заявл. 08.07.1999; опубл. 10.12.2000. Бюл. №34. - 14 с.
26. US Patent No.: US 6,751,353 B1, 2000 Yakhno V.G., Nuidel I.V., Telnykh A. A., Bondarenko B.N., Sborshikov V.A., Khilko A.I./ The method for adaptive recognition of information images, and the system of implementation thereof. - 12 p.
Размещено на Allbest.ru
...Подобные документы
Математические методы распознавания (классификации с учителем) и прогноза. Кластеризация как поиск оптимального разбиения и покрытия. Алгоритмы распознавания и интеллектуального анализа данных. Области практического применения систем распознавания.
учебное пособие [2,1 M], добавлен 14.06.2014Геометрическая формулировка задачи распознавания: построение поверхности, которая разделяет множества, соответствующие в пространстве признакам различных классов объектов. Основные понятия и определения. Непараметрические парзеновские оценки плотностей.
курсовая работа [272,7 K], добавлен 10.04.2011Некоторые математические вопросы теории обслуживания сложных систем. Организация обслуживания при ограниченной информации о надёжности системы. Алгоритмы безотказной работы системы и нахождение времени плановой предупредительной профилактики систем.
реферат [1,4 M], добавлен 19.06.2008Математические модели технических объектов и методы для их реализации. Анализ электрических процессов в цепи второго порядка с использованием систем компьютерной математики MathCAD и Scilab. Математические модели и моделирование технического объекта.
курсовая работа [565,7 K], добавлен 08.03.2016Основные свойства геологических объектов как пространственных переменных. Виды математических моделей геологических объектов. Вариограмма и ее аппроксимации. Вероятностные модели геологических полей. Влияние на вариограмму геометрической базы измерений.
презентация [345,8 K], добавлен 17.07.2014Возникновение и развитие теории динамических систем. Развитие методов реконструкции математических моделей динамических систем. Математическое моделирование - один из основных методов научного исследования.
реферат [35,0 K], добавлен 15.05.2007Процесс выбора или построения модели для исследования определенных свойств оригинала в определенных условиях. Стадии процесса моделирования. Математические модели и их виды. Адекватность математических моделей. Рассогласование между оригиналом и моделью.
контрольная работа [69,9 K], добавлен 09.10.2016Вводные понятия. Классификация моделей. Классификация объектов (систем) по их способности использовать информацию. Этапы создания модели. Понятие о жизненном цикле систем. Модели прогнозирования.
реферат [36,6 K], добавлен 13.12.2003Примеры основных математических моделей, описывающих технические системы. Математическая модель гидроприводов главной лебедки и механизма подъема-опускания самоходного крана. Описание динамики гидропривода механизма поворота стрелы автобетононасоса.
реферат [3,9 M], добавлен 23.01.2015Динамическая модель как теоретическая конструкция, описывающая изменение состояний объекта. Характеристика основных подходов к построению: оптимизационный, описательный. Рассмотрение способов построения математических моделей дискретных объектов.
контрольная работа [769,7 K], добавлен 31.01.2013Моделирование непрерывной системы контроля на основе матричной модели объекта наблюдения. Нахождение передаточной функции формирующего фильтра входного процесса. Построение графика зависимости координаты и скорости от времени, фазовой траектории системы.
курсовая работа [1,5 M], добавлен 25.12.2013Знакомство с особенностями построения математических моделей задач линейного программирования. Характеристика проблем составления математической модели двойственной задачи, обзор дополнительных переменных. Рассмотрение основанных функций новых переменных.
задача [656,1 K], добавлен 01.06.2016Приемы построения математических моделей вычислительных систем, отображающих структуру и процессы их функционирования. Число обращений к файлам в процессе решения средней задачи. Определение возможности размещения файлов в накопителях внешней памяти.
лабораторная работа [32,1 K], добавлен 21.06.2013Основные понятия теории графов. Степень вершины. Маршруты, цепи, циклы. Связность и свойства ориентированных и плоских графов, алгоритм их распознавания, изоморфизм. Операции над ними. Обзор способов задания графов. Эйлеровый и гамильтоновый циклы.
презентация [430,0 K], добавлен 19.11.2013Предмет и задачи исследования операций. Основные понятия и принципы исследований, математические модели. Детерминированная задача согласования по определению минимального времени выполнения комплекса работ, времени начала и окончания каждой операции.
курсовая работа [233,9 K], добавлен 20.11.2012Понятие и типы математических моделей, критерии их классификации. Примеры использования дифференциальных уравнений при моделировании реальных процессов: рекламная компания, истечение жидкости, водяные часы, невесомость, прогиб балок, кривая погони.
курсовая работа [410,0 K], добавлен 27.04.2014Анализ математических моделей, линейная система автоматического управления и дифференциальные уравнения, векторно-матричные формы и преобразование структурной схемы. Метод последовательного интегрирования, результаты исследований и единичный импульс.
курсовая работа [513,2 K], добавлен 08.10.2011Применение системы MathCAD при решении прикладных задач технического характера. Основные средства математического моделирования. Решение дифференциальных уравнений. Использование системы MathCad для реализации математических моделей электрических схем.
курсовая работа [489,1 K], добавлен 17.11.2016Компьютерное моделирование в базовом курсе информатики. Роль компьютерного моделирования в процессе обучения. Методические рекомендации курса "Математические основы моделирования 3D объектов" базового курса "компьютерное моделирование".
дипломная работа [284,6 K], добавлен 07.07.2003Применение интервальных графов. Алгоритмы распознавания интервальных графов: поиск в ширину, поиск в ширину с дополнительной сортировкой, лексикографический поиск в ширину, алгоритм "трех махов". Программа задания единичного интервального графа.
курсовая работа [1,5 M], добавлен 10.02.2017