Метод блочного оптического распознавания инвентарных номеров железнодорожных подвижных единиц на основе комитетной нейроиммунной модели классификации
Анализ способов блочного распознавания символов. Разработка метода распознавания инвентарных номеров железнодорожных подвижных единиц, основанного на комитетной нейроиммунной модели классификации. Обоснование преимуществ использования данного метода.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 29.06.2017 |
Размер файла | 610,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Метод блочного оптического распознавания инвентарных номеров железнодорожных подвижных единиц на основе комитетной нейроиммунной модели классификации
И.С. Артемьев
А.И. Лебедев
А.И. Долгий
А.Е. Хатламаджиян
В.Д. Меерович
Введение
Опыт внедрения системы автоматического распознавания номеров вагонов (АРНВ) [1] показывает необходимость максимального использования всей графической информации, нанесенной на железнодорожные подвижные единицы, в целях повышения качественных показателей системы.
Согласно утвержденному альбому «Знаки и надписи на вагонах грузового парка колеи 1520мм» № 632-2006 ПКБ ЦВ ОАО «РЖД» основные инвентарные номера, наносимые на борт вагона, дублируют в нижней части подвижной единицы: на кузове, раме, борте или нижней обвязке кузова, в зависимости от типа подвижной единицы. В связи с этим очевидна целесообразность применения в системе АРНВ нижних камер для распознавания номеров платформ и повышения устойчивости идентификации остальных подвижных единиц по дублирующим номерам.
Дублирующие номера вагонов имеют вдвое меньший размер по высоте и более широкий диапазон изменения масштаба, соответственно сильнее подвержены шуму, размытию, оптическим искажениям, что предъявляет повышенные требования к основным сложноорганизованным частям алгоритмов, таким как сегментация и распознавание, в существенной степени влияющим на итоговый результат [1].
Для решения задачи распознавания дублирующих номеров ж.-д. подвижных единиц к используемым алгоритмам предъявляются следующие требования: блочный распознавание номер железнодорожный нейроимунный
- устойчивость к шуму;
- инвариантность к существующим изменениям масштаба номера;
- возможность сегментации размытых и слипшихся цифр номера, имеющих разные шрифты и начертания;
- минимальное время выполнения обработки номера;
- точность и производительность.
Для решения поставленной задачи необходимо разработать подход, объединяющий этапы сегментации и классификации цифр дублирующего номера вагона с учетом предъявленных требований. Одним из путей решения этой задачи являются подходы, основанные на блочном распознавании текста.
Блочное распознавание
На текущий момент, разработанные подходы блочного распознавания символов можно разделить по принципу формирования визуального стимула рецептивного поля искусственных нейронных сетей (ИНС)[2, 3]:
1) эвристические подходы [4];
2) подходы, основанные на использовании «скользящего окна» [5];
3) специализированные архитектуры ИНС [6].
К эвристическим, как наиболее творческим приемам в поиске решения задачи, относятся самые разнообразные варианты решения проблем традиционных методов сегментации.
Одни из них дополнительно ставят перед ИНС, классифицирующей символы, задачу определения класса «не символ», другие комбинируют результаты разных ИНС, распределяя задачу определения класса «символ - не символ» и определения класса символа.
Также стоит отметить эвристические подходы (рис.1) к решению распространенной проблемы сегментации традиционным методом - разделение слипшихся цифр, которые используют специализированные ИНС, обученные для классификации сдвоенных или строенных цифр, количество которых на предоставляемом образе определяется эмпирически либо классифицируется отдельной ИНС.
Рис. 1. - Эвристические методы блочного распознавания:
1) определение количества символов в блоке; 2) определение позиции разделения символов; 3) пошаговая классификация признаков связности символов
Что касается подходов, основанных на формировании входного изображения ИНС с помощью скользящего окна, их можно отнести к наиболее популярным и часто встречающимся методам сегментации. Задачей «сегментатора» является определение позиций окна, в которых символы попадают полностью. Такие образы называются «истинными объектами», а образы, полученные на пространствах между соседними символами, именуются «анти-объектами» (рис.2).
Рис. 2. - Блочное распознавание с помощью «скользящего окна»
Специализированные архитектуры ИНС, такие как SDNN - SpaceDisplacementNeuralNetwork (рис. 3), TDNN - TimeDelayNeuralNetwork, представляют собой сетевую архитектуру прямого распространения для блочного распознавания многосимвольных строк, основанную на репликации входного поля с помощью сверточных ИНС. Прежде всего, благодаря тому, что сверточные ИНС являются очень устойчивыми к сдвигам и масштабным вариациям входного изображения, а также шуму и посторонним меткам на входе. Входной слой сети соединен с модулем интерпретации результатов, работающим по алгоритму Витерби, который выбирает лучшую последовательность сегментированных и распознанных символов входной строки.
Рис. 3. - Блочное распознавание с помощью SDNN
Перечисленные выше подходы объединяет использование классификатора для разделения подаваемых образов на два класса «символ» и «не символ». Однако, формирование репрезентативной обучающей выборки для класса «не символ» зачастую является крайне нетривиальной задачей, т.к. элементами этого класса являются все оставшиеся мыслимые объекты, лежащие вне класса «символ».
В качестве решения этой задачи в настоящей статье предлагается метод на основе комитетной модели классификации.
Метод блочного распознавания инвентарных номеров железнодорожных подвижных единиц
В основе предлагаемого метода лежит предположение о том, что члены комитета неустойчивых классификаторов, обученные только на положительных примерах, будут чаще противоречить друг другу, чем когда им будет предъявлен образ из известного им класса. Однако при этом необходимо, чтобы классификаторы, участвующие в комитете имели достаточно высокое разнообразие. Для этого их необходимо обучать на различных выборках данных. Так как в нашем распоряжении имеется лишь одно множество примеров, то различающиеся подмножества с близким статистическим распределением можно получить путем применения бутстрепа [7] -- случайной выборки с возвратом.
Подход, основанный на независимом обучении отдельных моделей на бутстреп-выборках из обучающего набора данных, был предложен в [8] и получил название «бэггинг».
Графическая интерпретация комитета неустойчивых классификаторов (нейронных сетей), разделивших при обучении на бутстреп-выборках множества классов гиперплоскостями, спроецированная на двумерную плоскость, демонстрирует суждение о результативности комбинирования неустойчивых моделей (рис.4).
Рис. 4. - Графическая интерпретация комитета линейных пороговых классификаторов. С1, С2 - множество объектов класса «1» и «2» соответственно, O - граница разделения классов, Nn - граница разделения классов по «мнению» n-й ИНС. K1, K2 - новые объекты для классификации
Очевидно, что точность классификации комитетом повышается с увеличением количества нейросетей. Однако, при наращивании численности членов комитета, пропорционально увеличивается и время классификации, что не соответствует требованиям производительности алгоритмов систем, работающих в реальном времени. Соответственно, при формировании комитета, количество входящих в него классификаторов определяется некоторым оптимальным соотношением точности и времени классификации.
В качестве комитета неустойчивых классификаторов предлагается применение разработанной ранее нейроиммунной модели классификации (НИМК) [9] для блочного распознавания инвентарных номеров вагонов. НИМК обладает свойством редукции данных за счет применения механизма иммунной кластеризации и, в отличие от алгоритма-прототипа AIRS2 (Artificial Immune Recognition System v2) [10], имеет быстрый механизм классификации новых примеров без потери точности, основанный на применении комитета неустойчивых классификаторов - ИНС прямого распространения, обучаемых на бутстреп выборках.
Алгоритм НИМК состоит из следующих основных этапов:
1. Применяется метод главных компонент для сокращения размерности данных.
2. Формируется множество клеток памяти по методу, применяемому в алгоритме AIRS2.
3. Формирование обучающих множеств для ансамбля ИНС методом бэггинга на основе множества клеток памяти, полученных на предыдущем этапе.
4. Эвристическое формирование и обучение ансамбля ИНС.
5. Классификация: классифицируемые примеры подаются на вход ансамбля ИНС, полученного на предыдущем шаге.
При формировании визуального стимула рецептивного поля НИМК методом «скользящего окна», наблюдается подтверждение особенности комитета, предположенной нами выше - о противоречии большинства ИНС друг другу, при предъявлении образов неизвестного им класса. Графическая интерпретация выявленной особенности представлена на рис. 5.
Рис. 5. - Графическое представление результатов классификации каждого шага скользящего окна с помощью НИМК
Изображение на рис. 5а) соответствует бинарному изображению области с инвентарным номером вагона, на рис.5б) (выходной сигнал) - результатам классификации комитетом каждого шага окна, где ось ординат - наибольшая величина суммы значений выходов комитета, ось абсцисс - координаты позиции окна.
Как видно по рис. 5б), существует необходимость подавления высокочастотной составляющей выходного сигнала для возможности корректной интерпретации полученных результатов. Для этого в разработанном методе используется КИХ-фильтр - линейный цифровой фильтр, характерной особенностью которого является ограниченность по времени его импульсной характеристики [11].
В задачах цифровой обработки сигналов и изображений КИХ-фильтр является эффективной унифицированной процедурой, осуществляющей базовую операцию - вычисление свертки входного изображения и линейного фильтра , которая может быть представлена в виде (1).
, (1)
где - выходной ряд;
- конечная область ненулевых отсчетов импульсной характеристики;
- отсчеты входного изображения;
- отсчеты коэффициентов фильтра.
Результат применения свертки выходного сигнала КИХ-фильтром изображен на рис. 6.
Рис. 6. - Результат блочного распознавания инвентарного номера
На полученном выходном ряде локальные минимумы соответствуют вертикальным уровням разделения цифр, локальные максимумы - центральным позициям цифр распознаваемого номера, а также номеру класса, к которому они относятся. Обнаружение точек локальных экстремумов производится на этапе итеративной свертки КИХ-фильтром с помощью вычисления определителя матрицы Гессе для точки в апертуре:
,
,
где - диагональные миноры симметрической матрицы Гессе.
Таким образом, сформируем основные этапы предлагаемого нами метода блочного распознавания инвентарных номеров железнодорожных подвижных единиц, основанного на комитетнойнейроиммунной модели классификации:
1. Формирование и обучение НИМК.
2. Классификация каждого шага входного изображения методом скользящего окна.
3. Сглаживание полученного ряда результатов классификации КИХ-фильтром.
4. Обнаружение локальных экстремумов за счет вычисления оператора матрицы Гессе для каждой точки ряда, полученного на предыдущем этапе.
5. Формирование результата распознавания по полученным на предыдущем этапе локальным максимумам.
Вычислительные эксперименты
Для проведения вычислительных экспериментов нами был реализован предлагаемый метод блочного распознавания инвентарных номеров железнодорожных подвижных единиц.
Обучение и тестирование НИМК производилось на множестве бинарных изображений цифр дублирующих номеров ж.-д. вагонов (рис.7), полученных на одном из объектов внедрения АРНВ.
Рис. 7. - Примеры бинарных изображений цифр дублирующих номеров ж.-д. вагонов
Обучающее множество содержало 10 тыс. уникальных примеров, а тестовое 1 тыс. размерностью 16 на 27 пикселей (432 признака).
Выборка для тестирования предлагаемого метода состояла из 1 тыс. примеров бинарных изображений дублирующих номеров размерностью 100 на 27 пикселей (рис. 8).
Рис. 8. - Примеры бинарных изображений дублирующих номеров
Эксперименты выполнялись на специализированном компьютере промышленного исполнения с установленным процессором IntelCore i7 частотой 3200 МГц.
В результате применения метода главных компонент размерность признакового пространства была снижена до 70.
Архитектура используемых в экспериментах ИНС - 70-35-20-10 нейронов.
Обучение всех ИНС производилось метом Левенберга-Марквардта.
Оптимальное количество ИНС в комитете подобрано эмпирически.
Количество правильно сегментированных и распознанных номеров составило 96,8% всей тестовой выборки. Среднее затраченное время на распознавание одного номера - 57 мс.
Заключение
Предложенный в настоящей статье метод блочного распознавания инвентарных номеров железнодорожных подвижных единиц основан на комитетной нейроиммунной модели классификации. Преимуществом использования комитета неустойчивых классификаторов является отсутствие необходимости формирования выборки отрицательных примеров.
Метод блочного распознавания инвентарных номеров подвижных единиц с использованием скользящего окна, объединяющий в себе этапы сегментации и классификации, позволяет достичь повышенной устойчивости к шуму, возможности сегментации размытых и слипшихся цифр номера, имеющих разные шрифты и начертания, а также инвариантности к существующим изменениям масштаба номера.
Кроме того, разработанный метод обладает важным свойством, унаследованными от модели НИМК - редукцией данных достигаемой за счет применения механизма иммунной кластеризации. Это свойство позволяет постоянно пополнять обучающую выборку комитета классификаторов новыми статистическими данными для последующего повышения точности классификации.
В настоящее время предложенный метод блочного распознавания инвентарных номеров железнодорожных подвижных единиц реализован в программном обеспечении системы АРНВ, находящейся в эксплуатации на сети дорог ОАО «РЖД».
Работа выполнена при финансовой поддержке РФФИ, проект № 13-07-00226 А, проект № 13-07-13109 офи_м_РЖД.
Литература:
1. Артемьев И.С., Лебедев А.И. Прогностическая модель сегментации трафаретных цифр в задаче оптической идентификации инвентарных номеров железнодорожных подвижных единиц // Труды международной научно-практической конференции «Транспорт-2013». - Ростов н/Д., 2013. С. 7 - 9.
2. Романов Д.Е. Нейронные сети обратного распространения ошибки [Электронный ресурс] // «Инженерный вестник Дона», 2009, №3. - Режим доступа: http://www.ivdon.ru/magazine/archive/n3y2009/143 (доступ свободный) - Загл. с экрана. - Яз.рус.
3. Лила В.Б. Алгоритм и программная реализация адаптивного метода обучения искусственных нейронных сетей [Электронный ресурс] // «Инженерный вестник Дона», 2012, №1. - Режим доступа: http://www.ivdon.ru/magazine/archive/n1y2012/626 (доступ свободный) - Загл. с экрана. - Яз.рус.
4. Marinai, S.Artificial neural networks for document analysis and recognition / S. Marinai, M. Gori, G. Soda // Pattern analysis and machine intelligence, pages 23-35, 2005.
5. Lee, SW. Integrated segmentation and recognition of handwritten numerals with cascade neural network / SW Lee, SY Kim // Systems, Man, and Cybernetics, Part C: Applications and Reviews, pages 285-290, 1999.
6. Y. LeCun, P. Haffner, L. Bottou and Y. Bengio. Object Recognition with Gradient-Based Learning.In Forsyth, D. (Eds), FeatureGrouping, Springer, 1999- 28 p.
7. Hastie T., Tibshirani R., Friedman J., The elements of statistical learning: Data mining, inference, and prediction. Springer, 2001- 533 p.
8. Breiman, L. Bagging predictors. Univ. California Technical Report No. 421, September 1994 - 20 p.
9. Артемьев И.С., Долгий А.И., Суханов А.В., Хатламаджиян А.Е. Нейроиммунная модель классификации в задачах идентификации на транспорте // Сборник научных трудов VII-й Международной конференции «Интегрированные модели и мягкие вычисления в искусственном интеллекте». - М.: Физматлит, 2013. - С. 980-987.
10. Watkins, A. Exploiting Immunological Metaphors in the Development of Serial, Parallel, and Distributed Learning Algorithms. PhD Thesis, Mississippi State University, 2005-314 p.
11. Ifeachor, E.C. Digital Signal Processing: A Practical Approach / E.C. Ifeachor, B.W. Jervis // Prentice-Hall, Inc., Cliffs, 2002 - 933 p.
Размещено на Allbest.ru
...Подобные документы
Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.
дипломная работа [887,3 K], добавлен 26.11.2013Методы предобработки изображений текстовых символов. Статистические распределения точек. Интегральные преобразования и структурный анализ. Реализация алгоритма распознавания букв. Анализ алгоритмов оптического распознавания символов. Сравнение с эталоном.
курсовая работа [2,1 M], добавлен 20.09.2014Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.
презентация [469,2 K], добавлен 15.03.2015Оптическое распознавание символов как механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов. Компьютерные программы для оптического распознавания символов и их характеристика.
презентация [855,2 K], добавлен 20.12.2011Обзор математических методов распознавания. Общая архитектура программы преобразования автомобильного номерного знака. Детальное описание алгоритмов: бинаризация изображения, удаление обрамления, сегментация символов и распознавание шаблонным методом.
курсовая работа [4,8 M], добавлен 22.06.2011Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.
курсовая работа [16,2 M], добавлен 21.06.2014Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.
курсовая работа [3,0 M], добавлен 14.11.2013Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.
дипломная работа [1019,9 K], добавлен 13.10.2017Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.
курсовая работа [462,2 K], добавлен 15.01.2014Процессы распознавания символов. Шаблонные и структурные алгоритмы распознавания. Процесс обработки поступающего документа. Обзор существующих приложений по оптическому распознаванию символов. Определение фиксированного шага и сегментация слов.
дипломная работа [3,3 M], добавлен 11.02.2017Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.
курсовая работа [2,7 M], добавлен 15.08.2011Как работает система оптического распознавания. Деление текста на символы. Образ страницы и распознавание по шаблонам, особенности коррекции ошибок. Увеличение скорости бесклавиатурного ввода документов в технологиях электронного документооборота.
контрольная работа [15,6 K], добавлен 29.04.2011Принцип работы нейросетей и модели синтеза. Ключевые моменты проблемы распознавания речи. Система распознавания речи как самообучающаяся система. Описание системы: ввод звука, наложение первичных признаков на вход нейросети, модель и обучение нейросети.
курсовая работа [215,2 K], добавлен 19.10.2010Строение артикуляционного аппарата человека с точки зрения возможности распознавания речи по артикуляции. Комплекс параметров артикуляции на основе контура внутренней области губ. Реализация модуля распознавания фонем русской речи по изображениям губ.
дипломная работа [3,1 M], добавлен 19.08.2012Разработка программной базы для исследований в области распознавания речи и поиска ключевых слов в ней. Расчет mel-фильтров. Скрытые марковские модели. Применение в алгоритме сверточного декодирования Витерби. Методы визуализации и обработки аудиоданных.
курсовая работа [1,1 M], добавлен 01.06.2015Первое систематическое изучение искусственных нейронных сетей. Описание элементарного перцептрона. Программная реализация модели распознавания графических образов на основе перцептрона. Интерфейс программы, основные окна. Составление алгоритма приложения.
реферат [100,5 K], добавлен 18.01.2014Обзор задач, возникающих при разработке систем распознавания образов. Обучаемые классификаторы образов. Алгоритм персептрона и его модификации. Создание программы, предназначенной для классификации образов методом наименьшей среднеквадратической ошибки.
курсовая работа [645,2 K], добавлен 05.04.2015Описание структурной схемы искусственного нейрона. Характеристика искусственной нейронной сети как математической модели и устройств параллельных вычислений на основе микропроцессоров. Применение нейронной сети для распознавания образов и сжатия данных.
презентация [387,5 K], добавлен 11.12.2015Основные цели и задачи построения систем распознавания. Построение математической модели системы распознавания образов на примере алгоритма идентификации объектов военной техники в автоматизированных телекоммуникационных комплексах систем управления.
дипломная работа [332,2 K], добавлен 30.11.2012Анализ систем распознавания поведения лабораторных мышей. Классификация движений на основе построенных дескрипторов. Существующие методы обнаружения движения, разработка соответствующего программного обеспечения и оценка его эффективности, функции.
дипломная работа [1,1 M], добавлен 16.09.2017