Правило принятия решений при распознавании объектов на видеоизображении
Определение общего количества собственных векторов, используемых при распознавании образов. Необходимость обучения системы сформировать порог идентификации. Возможности по настройке системы для обеспечения необходимого качества распознавания образов.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 19.06.2018 |
Размер файла | 156,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Правило принятия решений при распознавании объектов на видеоизображении
канд. техн. наук М.А. Анохин
Построение систем распознавания образов на данный момент является одним из наиболее значимых направлений в развитии науки и техники, поскольку они позволяют распознавать ситуации, приводящие к природным и техногенным катастрофам, определять виды и типы движущихся объектов и даже прогнозировать социальные конфликты. Ключевой составляющей такой системы является модуль, реализующий разработанное правило принятия решений, а проектирование новых решающих правил позволяет повысить качество и увеличить скорость распознавания образов, что очень важно для построения телевизионной системы распознавания образов. Правила принятия решений могут быть сгруппированы по категориям и используют для классификации входных объектов дистанционные метрики, статистические методы и нейронные сети.
Анализ методов построения правил принятия решений. Дистанционные метрики позволяют количественно сравнить насколько далеко расположены один от другого два образа. Анализ данных, полученных в процессе сравнения входных образов и образов классов из базы данных, позволяет построить решающее правило на основе Евклидового расстояния [1]
(1)
где - набор признаков входного образа и образа из базы данных соответственно. Реализация данной метрики проста, но расчет разницы одинаковых видеоизображений уже при малых искажениях может давать большее расстояние, чем между разными изображениями. В таком случае стоит рассмотреть дистанционную метрику Манхэттена, которая используется в сетке тщательно спланированного города [2]. Передвижение может осуществляться по разным маршрутам, но невозможно пересекать квартал по диагонали. Расстояние между координатами двух образов рассчитывается по формуле
(2)
а дистанционная метрика Минковского - по формуле, являющейся обобщением метрики Манхэттена:
(3)
Когда параметр в формуле Минковского стремится к бесконечности, она приобретает вид дистанционной метрики Чебышева
(4)
При построении классификаторов с использованием статистического подхода, фундаментальным является применение байесовской теории принятия решений. Решающее правило может быть основано на максимуме апостериорной вероятности [3]
(5)
где - входной образ; - образы классов, находящиеся в базе данных системы. Изображение входного объекта относится к образу , если значение апостериорной вероятности является наибольшим относительно остальных образов из базы данных. Когда в коллекции находится большое количество классов, становится возможным выделение основного образа класса, для которого разница параметров относительно входного образа достаточна для принятия решения классификации. В таком случае для расчета байесовской вероятности используются два класса [4]. Если обозначить класс образов из базы данных, принимающий участие в текущей классификации , а - обобщенный класс, сформированный на базе признаков образов остальных классов. Тогда байесовская вероятность рассчитывается по формуле
(6)
Входной образ соответствует выбранному классу, если полученное значение вероятности больше 1/2. Применение описанных выше методов на практике оказывается затруднительным, поскольку невозможно достоверно предположить значение априорной вероятности. Критерий Неймана _ Пирсона, использующий вероятность ложной тревоги и правильного обнаружения , является возможным решением возникшей проблемы [5]. Данный критерий стремится минимизировать вероятность ложной тревоги, при которой вероятность правильного обнаружения будет достигать максимального значения. Однако когда классы из коллекции разделяются при помощи гиперплоскостей, то для принятия решения используется минимаксный критерий. Основополагающим принципом данного критерия является минимизация вероятности максимума ошибочной классификации. Для этого необходимо рассчитать параметры линейного классификатора, используемого при распознавании [6]
(7)
где , , , - Евклидово пространство размерности n. Тогда для каждого из классов коллекции строится отдельный классификатор, и входной образ относится к тому классу, для которого значение выражения будет минимальным.
Категория методов, спроектированных на основании обобщенных математических моделей нервной системы, использует искусственные нейронные сети. Элементы такой сети, занимающиеся обработкой информации, называются нейронами или узлами и могут быть представлены многослойным персептроном [7]. Процесс обучения нейронной сети необходим для формирования нескольких гиперплоскостей, которые разделяют классы из коллекции. После обучения многослойный персептрон способен определить для каждого набора входных параметров соответствующий набор выходных значений, классифицирующий входной образ. Также существует алгоритм обучения нейронной сети, основанный на использовании радиальных базисных функций [8]. Типичная структура такой сети содержит три слоя: входной, который принимает параметры входного образа, скрытый, который обрабатывает входные параметры, и выходной, формирующий выходные значения образа. Применение нейронных систем при распознавании образов ограничено, поскольку при большом количестве классов в коллекции процесс обучения занимает много времени.
Алгоритм разработанного правила принятия решений. Для принятия решений о принадлежности входного образа, представляющего собой двумерный спектр видеоизображения, к тому или иному классу было разработано и исследовано решающее правило, базирующееся на критерии подобия Дайса [10]. Собственные векторы, получаемые при ортогональном преобразовании двумерных спектров, позволяют рассчитывать коэффициенты подобия. При этом некоторая избыточность набора признаков, используемых для расчета значения коэффициента подобия, позволяет более эффективно классифицировать образы, поскольку использование малого количества признаков приводит к неправильному определению подобия пары образов [11]. Для расчета коэффициента подобия Дайса используется формула
(8)
где - количество совпавших признаков, - количество признаков первого образа, отсутствующих во втором, - количество признаков второго образа, отсутствующих в первом. Диапазон принимаемых значений ограничивается в пределах от 0 до 1, а значение, полученное в результате расчетов, определяет количество различных признаков из совокупности элементов наборов сравниваемых образов [12]. После проведенных расчетов набор признаков, поступивший на вход системы, соответствует некоторому классу, если значение подобия больше определенной пороговой величины. Улучшение качества распознавания при использовании коэффициентов подобия Дайса обеспечивается получением больших значений подобия для наиболее соответствующих образов, поскольку в расчете не учитываются малозначимые элементы набора признаков. Разрабатываемая система распознавания образов использует альтернативную формулу расчета коэффициента подобия
(9)
Модуль, реализующий правило принятия решений (рис. 1), обладает доступом к информации о классах из коллекции и когда на вход системы поступает образ для классификации его признаки соответственно сравниваются с признаками образов из коллекции. При определении достаточного уровня подобия идентификатор класса заносится в список совпавших классов входного образа. После проверки всех образов из коллекции выводится результат распознавания.
Экспериментальная оценка правила принятия решений. Прототип системы распознавания образов позволяет качественно оценить сформированное решающее правило. При разработке было выяснено, что качество распознавания, характеризуемое вероятностью ошибки распознавания , зависит от количества используемых векторов при определении подобия образов. На рис. 2 отображено, что уровень ошибки распознавания возрастает при использовании большего количества векторов . Это связано с тем, что наиболее информативные признаки находятся в первых собственных векторах, которые характеризуют образ, а остальные содержат признаки, значения которых близки к шумовому порогу и их использование при расчете коэффициентов подобия Дайса ухудшает качество распознавания образов системой.
вектор распознавание образ идентификация
Рис. 1. Правило принятия решений для классификации объектов
Перед предоставлением результатов распознавания классы из списка подобий входного образа ограничиваются порогом идентификации . Увеличение порога приводит к снижению вероятности ошибки распознавания.
Рис. 2. Зависимость вероятности ошибки распознавания от количества собственных векторов
Влияние порога на качество распознавания, которое характеризуется вероятностью правильного распознавания , отображено на рис. 3.
Рис. 3. Зависимость вероятности правильного обнаружения от количества собственных векторов
Выводы
Количество собственных векторов, используемых при распознавания образов, ограничено конфигурацией прототипа системы распознавания. Следовательно, количество векторов входного образа, подобных к образу класса из базы данных, возможно нормировать и при обучении системы сформировать порог идентификации. Требования к системе распознавания описывают стратегию определения оптимального значения порога. Затем данная величина будет использоваться для принятия решения при классификации входных образов, а на рис. 2 и 3 продемонстрированы возможности по настройке системы для обеспечения необходимого качества распознавания образов.
Список литературы
1. Sung-Huyk C. Comprehensive Survey on Distance / Similarity Measures between Probability Density Functions // International Journal of Mathematical Models and Methods in Applied Science, Volume 1, Issue 4, 2007, pp. 300 - 307.
2. Reynolds E. B. Taxicab Geometry // The Pi Mu Epsilon Journal, Volume 7, Number 2, 1980, pp. 77 - 88.
3. Liu C., Wechsler H. A unified Bayesian framework for face recognition // Image Processing, IEEE International Conference, Vvolume 1, 1998, pp. 151 - 155.
4. James E. A. K., Annadurai S. An Efficient Bayesian Approach to Face Recognition based on Wavelet Transform // International Journal of Computer Applications, Volume 15, Number 8, 2011, pp. 22 - 26.
5. Van Trees H. L. Detection, Estimation, and Modulation Theory, Part I: Detection, Estimation, and Linear Modulation Theory // John Wiley & Sons, 2001, 710 p.
6. Kitahara T., Mizuno S., Nakata K. An Extension of a Minimax Approach to Multiple Classification // Journal of the Operations Research Society of Japan, Volume 50, Number 2, 2007, pp. 123 - 136.
7. Ososkov G., Stadnik A. Face Recognition By a New Type of Neural Networks // Proceedings of World Scientific and Engineering Society, 2001, pp. 304 - 308.
8. Bhowmik M. K., Bhattacharjee D., Nasipuri M., Basu D. K., Kundu M. Classification of Fused Images using Radial Basis Function Neural Network for Human Face Recognition // Nature & Biologically Inspired Computing, IEEE, 2009, pp. 19-24.
9. Howell A. J., Buxton H. Face Recognition using Radial Basis Function Neural Networks // Proceedings of the British Machine Vision Conference, 1996, pp. 455-464.
10. Lin Z., Lyu M. R., King I. MatchSim: A Novel Similarity Measure Based on Maximum Neighborhood Matching // Knowledge and Information Systems, Volume 32, Issue 1, 2012, pp. 141 - 166.
11. Van Deemter K., Gatt A. Beyond DICE: Measuring The Quality of a Referring Expression // Proceeding of the Workshop on Production of Referring Expressions: bridging Computational and Psycholinguistic Approaches (preCogSci-09), 2009.
12. Anderson M. J., Ellingsen K. E., McArdle B. H. Multivariate Dispersion as a Measure of Beta Diversity // Ecology Letters, number 6, 2006, pp. 683 - 693.
Размещено на Allbest.ru
...Подобные документы
Основные цели и задачи построения систем распознавания. Построение математической модели системы распознавания образов на примере алгоритма идентификации объектов военной техники в автоматизированных телекоммуникационных комплексах систем управления.
дипломная работа [332,2 K], добавлен 30.11.2012Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.
курсовая работа [462,2 K], добавлен 15.01.2014Появление технических систем автоматического распознавания. Человек как элемент или звено сложных автоматических систем. Возможности автоматических распознающих устройств. Этапы создания системы распознавания образов. Процессы измерения и кодирования.
презентация [523,7 K], добавлен 14.08.2013Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.
дипломная работа [1019,9 K], добавлен 13.10.2017Создание программного средства, осуществляющего распознавание зрительных образов на базе искусственных нейронных сетей. Методы, использующиеся для распознавания образов. Пандемониум Селфриджа. Персептрон Розенблатта. Правило формирования цепного кода.
дипломная работа [554,8 K], добавлен 06.04.2014Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.
курсовая работа [3,0 M], добавлен 14.11.2013Обзор задач, возникающих при разработке систем распознавания образов. Обучаемые классификаторы образов. Алгоритм персептрона и его модификации. Создание программы, предназначенной для классификации образов методом наименьшей среднеквадратической ошибки.
курсовая работа [645,2 K], добавлен 05.04.2015Распознавание образов - задача идентификации объекта или определения его свойств по его изображению или аудиозаписи. История теоретических и технических изменений в данной области. Методы и принципы, применяемые в вычислительной технике для распознавания.
реферат [413,6 K], добавлен 10.04.2010Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.
дипломная работа [887,3 K], добавлен 26.11.2013Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.
курсовая работа [16,2 M], добавлен 21.06.2014Понятие и особенности построения алгоритмов распознавания образов. Различные подходы к типологии методов распознавания. Изучение основных способов представления знаний. Характеристика интенсиональных и экстенсиональных методов, оценка их качества.
презентация [31,6 K], добавлен 06.01.2014Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.
курсовая работа [2,7 M], добавлен 15.08.2011Описание структурной схемы искусственного нейрона. Характеристика искусственной нейронной сети как математической модели и устройств параллельных вычислений на основе микропроцессоров. Применение нейронной сети для распознавания образов и сжатия данных.
презентация [387,5 K], добавлен 11.12.2015Словесный, графический, табличный, программный способы представления алгоритма. Основные конструкции в любом алгоритмическом языке. Теория обнаружения, различения и оценивания сигналов. Радиолокационные системы обнаружения. Система распознавания образов.
презентация [4,8 M], добавлен 09.06.2015Распознавание образов как раздел кибернетики, развивающий теоретические основы и методы классификации и идентификации предметов. Знакомство с принципом действия сканирующих устройств. Анализ особенностей преобразования документа в электронный вид.
презентация [160,1 K], добавлен 06.01.2014Первое систематическое изучение искусственных нейронных сетей. Описание элементарного перцептрона. Программная реализация модели распознавания графических образов на основе перцептрона. Интерфейс программы, основные окна. Составление алгоритма приложения.
реферат [100,5 K], добавлен 18.01.2014Принципы и система распознавание образов. Программное средство и пользовательский интерфейс. Теория нейронных сетей. Тривиальный алгоритм распознавания. Нейронные сети высокого порядка. Подготовка и нормализация данных. Самоорганизующиеся сети Кохонена.
курсовая работа [2,6 M], добавлен 29.04.2009Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.
дипломная работа [1,8 M], добавлен 08.02.2017Информация, как сырье и как товар: абсолютная, относительная и аналитическая информация. Автоматизированные системы распознавания образов. Система искусственного интеллекта. Признаки и этапы жизненного цикла интеллектуальных информационных систем.
шпаргалка [60,4 K], добавлен 10.06.2009Отображение на плоскости точек из многомерного пространства, интерактивное распознавание отдельных классов образов в качестве объекта разработки программного продукта. Концептуальная модель предметной области. Классы и объекты интерфейса пользователя.
дипломная работа [1,5 M], добавлен 10.06.2013