Комбинирование классификаторов при распознавании символов. Сравнительный анализ нескольких подходов

Описание способов комбинирования классификаторов в задаче распознавания символов. Различные методы реализации этапов комбинирования, их сочетания. Эксперимент, заключающийся в распознавании множества изображений отдельных заглавных букв английского языка.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 18.01.2018
Размер файла 429,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

Комбинирование классификаторов при распознавании символов. Сравнительный анализ нескольких подходов

С.С. Колотиенко

Д.А. Туганбаев

А.Л. Шамис

В работе описываются способы комбинирования классификаторов в задаче распознавания символов. Рассматриваются различные методы реализации этапов комбинирования и сравниваются их сочетания. В результате делается вывод о лучшей конфигурации схемы комбинирования.

Введение

Задача оптического распознавания символов состоит в приведении изображения с текстом в машинно-редактируемый формат. Это позволяет значительно увеличить скорость и качество обработки больших объемов документов, по сравнению с ручным вводом.

Основные методы, использующиеся при распознавании символов, основаны на теории распознавания образов. Ядром распознавания символов является классификатор или система классификаторов, которая по пришедшему на распознавание изображению определяет, какому символу оно соответствует наилучшим образом.

Первые системы распознавания символов использовали простейшие классификаторы, которые даже при незначительных искажениях в изображении уже не могли дать правильного ответа. В дальнейшем стали использоваться более сложные классификаторы разной природы. Лучших же результатов получилось добиться только путём совместного использования нескольких классификаторов.

Таким образом, основной вклад в качество распознавания символов вносят как сами используемые классификаторы, так и способы их комбинирования. В данной работе исследуются некоторые методы комбинирования.

1. Схема распознавания одного символа

Рис. 1. Схема распознавания символов

Эта схема соответствует алгоритму распознавания рукописных символов, используемому в ABBYY FlexiCapture [Терещенко и др., 1997], [Ян, 2003].

Рассмотрим схему детальнее и поясним обозначения: C1 … Cn - первичные классификаторы, задача которых состоит в порождении списка вариантов.

Один вариант - это пара, состоящая из графемы (класс символа) и оценки уверенности, что распознаваемое изображения является данной графемой.

N1 … Nn - этапы нормализации оценок от соответствующих классификаторов. Нормализация необходима, так как в результате распознавания первичными классификаторами полученные оценки имеют различные диапазоны у разных классификаторов и имеют различный смысл. Перед комбинированием необходимо как минимум привести их к единому диапазону.

Комбинирующий уровень объединяет список вариантов от различных классификаторов в единый список, расставляя вариантам объединенные оценки, которые учитывают оценки каждого из первичных классификаторов.

На дифференциальном уровне происходит попарное сравнение вариантов в списке между собой, в результате которого оценки могут быть переоценены.

Сильный классификатор отличается от первичных классификаторов тем, что помимо самого изображения, ему необходим список вариантов-гипотез. Это позволяет ограничить перебор при распознавании и использовать медленный, но качественный классификатор в качестве сильного. В результате его работы к оценкам вариантов добавится оценка от сильного классификатора. В качестве сильного классификатора в системе ABBYY FlexiCapture используется структурный классификатор, описанный в [Шамис, 2010].

Этап завершающего комбинирования объединяет оценки, полученные после комбинирующего этапа и после распознавания сильным классификатором.

Непосредственно к комбинированию относятся этап нормализации, комбинирующий этап и этап завершающего комбинирования. В дальнейшем рассмотрим различные варианты реализации этих этапов. Также один из вариантов реализации был рассмотрен в [Anisimovichetal., 1997].

2. Этапы комбинирования

2.1 Нормализация

Нормализовать оценки классификаторов к единому диапазону можно несколькими способами:

Прямое приведение

где nw(w) - нормализованная оценка nw, соответствующая ненормализованнойw;

wmax - максимальная ненормализованная оценка.

Положение в списке

где weights - упорядоченный список ненормализованных оценок, полученный после распознавания изображений из некоторого обучающего множества изображений;

length(weights) - количество элементов в weights;

pos(w) - индексwвweights.

Отношение «своих» и «чужих»

,

где rightWeights - упорядоченный список ненормализованных оценок, полученный после распознавания изображений некоторой графемы X эталоном этой же графемы X;

wrongWeights - аналогичный список, только составленный из оценок изображений, отличных от X;

less(w,weights) - количество элементов в weights, значение которых равно или меньше w;

more(w,weights) - количество элементов в weights, значение которых равно или больше w.

2.2 Комбинирующий уровень

Объединить оценки нескольких классификаторов можно следующими способами:

Максимум

Среднее арифметическое

Средневзвешенная сумма

Средневзвешенная сумма с коэффициентами, отдельными для каждой графемы

2.3 Завершающее комбинирование

Завершающее комбинирование сильного классификатора с результатами комбинирующего:

Простая формула

Здесь ws - оценка сильного классификатора;

wc - оценка, полученная после этапа комбинирования,

c - коэффициент, соответствующий степени доверия сильному классификатору;

a - минимальная степень доверия, если оценка сильного классификатора равна нулю.

Комбинирующая таблица

Для каждой пары оценок (ws, wc) будет ставиться в соответствие своя объединенная оценка w. Такое соответствие задаётся предварительно обученной таблицей. Получить коэффициенты этой таблицы можно путём распознавания изображений из обучающей базы всеми эталонами и разделения на множества «своих» и «чужих» оценок, аналогично способу нормализации, описанному ранее.

Далее для каждой пары оценок (ws, wc) считается количество «своих» и «чужих» изображений, распознанных с такой же парой оценок. Объединенная оценка будет равна отношению «своих» изображений с такой парой оценок к сумме «своих» и «чужих» изображений с такой же парой оценок. При этом можно учитывать также изображения, распознанные с близкими по значению парами оценок.

3. Эксперимент

Были проведены эксперименты, заключающиеся в распознавании множества изображений отдельных заглавных букв английского языка. Общее количество таких изображений было 56072, то есть примерно по 2000 изображений на одну графему. В качестве системы распознавания использовалось программное обеспечение, используемое в компании ABBYY для тестирования технологий распознавания рукописных символов, используемых в продукте ABBYYFlexiCapture и других. На момент начала работы в этих технологиях использовались следующие этапы комбинирования:

нормализация с помощью положения в списке,

комбинирующий уровень с помощью средневзвешенной суммы с коэффициентами, отдельными для каждой графемы,

завершающее комбинирование с помощью простой формулы.

Результаты экспериментов с различными вариантами реализации комбинирующих этапов представлены в таблицах 1-4 ниже. Результаты в таблице следует интерпретировать следующим образом: каждая первая строчка - правильный вариант оказался на 1-м месте в списке, каждая вторая строчка - правильный вариант оказался на 1-м или 2-м месте в списке.

Табл. 1.

Результаты распознавания каждым классификатором в отдельности в зависимости от различной нормализации

Простое приведение

Положение в списке

Отношение «своих» и «чужих»

Классификатор 1

93,70%

90,34%

93,19%

97,90%

96,76%

97,47%

Классификатор 2

69,81%

59,40%

75,58%

92,78%

79,72%

90,83%

Классификатор 3

85,88%

82,43%

87,72%

94,04%

92,42%

94,62%

Табл. 2.

Результаты распознавания после комбинирующего уровня

Простое приведение

Положение в списке

Отношение «своих» и «чужих»

Максимум

86,84%

96,34%

94,84%

96,98%

99,01%

98,59%

Среднее арифметическое

87,65%

96,51%

95,07%

97,47%

99,12%

98,69%

Средневзвешенная сумма

87,95%

96,62%

95,16%

97,56%

99,14%

98,72%

Средневзвешенная сумма с коэф., отд. для каждой графемы

87,78%

96,57%

95.02%

97.48%

99.07%

98.63%

Отдельно рассмотрим результаты распознавания только одним сильным классификатором. При этом в качестве списка гипотез использовалось все множество графем, из-за чего время распознавания было самое долгое среди рассматриваемых конфигураций.

Правильный вариант на первом месте: 97,33%.

Правильный вариант на первом или втором месте: 98.72%.

распознавание классификатор символ

Табл.3.

Результаты распознавания полной схемой с завершающим комбинированием с помощью простой формулы

Простое приведение

Положение в списке

Отношение «своих» и «чужих»

Максимум

96,23%

98,12%

97,48%

99,21%

99,62%

99,44%

Среднее арифметическое

96,24%

98,12%

97.49%

99,25%

99,63%

99,45%

Средневзвешенная сумма

96,28%

98,13%

97,49%

99,30%

99,63%

99,45%

Средневзвешенная сумма с коэф., отд. для каждой графемы

96,28%

98,12%

97,49%

99,27%

99,63%

99,44%

Табл.4.

Результаты распознавания полной схемой в зависимости от завершающего уровня

Простая формула

Комбинирующая таблица

Положение в списке + средневзвешенная сумма

98,13%

98,14%

99,63%

99,61%

Положение в списке + средневзвешенная сумма с отд. коэф.

98,12%

98,14%

99,63%

99,63%

Отношение «своих» и «чужих» + средневзвешенная сумма

97,49%

97,49%

99,45%

99,47%

Отношение «своих» и «чужих» + средневзвешенная сумма

97,49%

97,51%

99,44%

99,47%

Заключение

По результатам экспериментов были сделаны следующие выводы:

Наилучшие способы нормализации для распознавания отдельными классификаторами - простое приведение и отношение «своих» и «чужих».

Наилучший способ нормализации для комбинирования классификаторов - с помощью положения в списке.

Наилучший способ комбинирования нескольких классификаторов - с помощью средневзвешенной суммы. При этом незначительно худшими являются способы с помощью среднего арифметического и средневзвешенной суммы с коэффициентами, отдельными для каждой графемы.

Использование комбинирующей таблицы на завершающем уровне даёт незначительный прирост верного результата на 1-м месте, но не всегда - для верного результата на 1-м или 2-м месте. Поэтому предпочтительнее использовать простую формулу, так как она не требует долгого по времени предварительного обучения.

Наилучшая конфигурация комбинирования для рассматриваемой схемы распознавания одного символа: нормализация с помощью положения в списке, комбинирующий уровень с помощью средневзвешенной суммы, завершающий уровень с помощью простой формулы.

Список литературы

Терещенко В.В., Рыбкин В.Ю., Шамис А.Л., Ян Д.Е., Принципы распознавания рукописных символов в системе FineReader // РОАИ-III. - Нижний Новгород, 1997.

Шамис А.Л. Модели поведения, восприятия и мышления. - М.: Интуит.РУ, БИНОМ.ЛЗ, 2010.

Ян Д.Е. Исследование, развитие и реализация методов автоматического распознавания рукописных текстов в компьютерных системах. Дис. канд. физ.-мат. наук: 05.13.18. - М., 2003.

Anisimovich K., Rybkin V., Shamis A., Tereschenko V., Using combination of structural, feature and raster classifiers for recognition of hand-printed characters // Proc. of the Intl. Conf. on Document Analysis and Recognition, Ulm, Germany, 1997.

Размещено на Allbest.ru

...

Подобные документы

  • Методы предобработки изображений текстовых символов. Статистические распределения точек. Интегральные преобразования и структурный анализ. Реализация алгоритма распознавания букв. Анализ алгоритмов оптического распознавания символов. Сравнение с эталоном.

    курсовая работа [2,1 M], добавлен 20.09.2014

  • Процессы распознавания символов. Шаблонные и структурные алгоритмы распознавания. Процесс обработки поступающего документа. Обзор существующих приложений по оптическому распознаванию символов. Определение фиксированного шага и сегментация слов.

    дипломная работа [3,3 M], добавлен 11.02.2017

  • Оптическое распознавание символов как механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов. Компьютерные программы для оптического распознавания символов и их характеристика.

    презентация [855,2 K], добавлен 20.12.2011

  • Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.

    курсовая работа [2,7 M], добавлен 15.08.2011

  • Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.

    презентация [469,2 K], добавлен 15.03.2015

  • Классификация информации как неотъемлемая часть информационного обеспечения управления, без которой невозможно эффективно и оперативно осуществлять управленческую деятельность. Категории классификаторов ТЭСИ и их статус (международные, общероссийские).

    курсовая работа [57,2 K], добавлен 14.12.2010

  • Стиль как средство форматирования. Пользовательские стили, их сохранение и использование. Шаблоны документов и использование стилей в шаблонах. Изменение внешнего вида символов. Изменение в тексте размеров и стилей шрифтов. Изменение цвета букв.

    курсовая работа [1,6 M], добавлен 26.06.2015

  • Обзор математических методов распознавания. Общая архитектура программы преобразования автомобильного номерного знака. Детальное описание алгоритмов: бинаризация изображения, удаление обрамления, сегментация символов и распознавание шаблонным методом.

    курсовая работа [4,8 M], добавлен 22.06.2011

  • Ознакомление с приемами управления работой печатающих устройств в MS-DOS. Формирование новых символов для матричного принтера, разработка команд загрузки символов в оперативную память принтера и программы, реализующей процесс печати заданных символов.

    курсовая работа [1,2 M], добавлен 22.06.2011

  • Подсистема управления процессами и потоками вычислительной системы. Формирование новых символов для матричного принтера, разработка команд для загрузки символов в оперативную память принтера и программы, реализующей процесс печати заданных символов.

    курсовая работа [201,1 K], добавлен 23.06.2011

  • Построение математической модели программы, одноленточного автомата над алфавитом, допускающего различные множества слов. Алфавит терминальных символов, множество состояний и переходов. Определение начального и конечного состояний. Понятие сети Петри.

    контрольная работа [294,8 K], добавлен 17.09.2013

  • Методика разработки и частичная реализация транслятора для языка "С" с использованием языка "С++", производящего разбиение на минимальные неделимые конструкции языка исходной цепочки символов основываясь на лексике языка. Анализ работы программы.

    курсовая работа [841,3 K], добавлен 19.03.2012

  • Рассмотрение основ создания калькулятора на объектно–ориентированном языке программирования Java, который будет подсчитывать длину текста. Математическая модель и алгоритм работы программы. Описание файлов готовой программы расчета символов в тексте.

    курсовая работа [276,5 K], добавлен 28.11.2014

  • Описание системы кодирования, порядка присвоения кодов единицам информации. Изучение этапов создания классификаторов. Штриховое кодирование и особенности его применения. Юридическая сила документа, полученного из автоматизированной информационной системы.

    презентация [409,6 K], добавлен 25.06.2013

  • Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.

    дипломная работа [887,3 K], добавлен 26.11.2013

  • Проектирование приложения на языке С# в среде Microsoft Visual Studio 2008: составление алгоритмов сегментации текста документа и распознавания слова "Указ" в нем, создание архитектуры и интерфейса программного обеспечения, описание разработанных классов.

    курсовая работа [2,4 M], добавлен 05.01.2011

  • Логическая структура компилятора. Лексический анализ. Сканер. Синтаксический и семантический анализ. Формирование промежуточного кода. Метод четверок. Обоснование создания учебного комплекса. Описание учебного языка. Таблица терминальных символов.

    дипломная работа [424,1 K], добавлен 16.11.2004

  • Приемы управления работой печатающих устройств в MS-DOS. Формирование новых символов для матричного принтера. Разработка команд для их загрузки в оперативную память данного устройства. Подбор программы, реализующей процесс печати заданных символов.

    курсовая работа [814,6 K], добавлен 29.06.2011

  • Создание программного модуля, выполненного на языке программирования VBA (Visual Basic for Applications) и позволяющего во введенном массиве символов удалить все повторные вхождения этих символов. Разработка пользовательского интерфейса. Код программы.

    курсовая работа [317,4 K], добавлен 11.10.2012

  • Разработка клиентской программы, демонстрирующей возможности таблицы символов, реализованной на базе бинарного поиска. Программная проверка подлинности информационного массива. Временная эффективность поиска, алгоритмов создания таблицы символов.

    контрольная работа [235,1 K], добавлен 10.03.2019

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.