Исследование и разработка методов распознавания образов для синхронного перевода жестов
Понятие машинного зрения и распознавания образов, существующие разработки в области распознавания жестов глухонемых, основные требования и ограничения. Методы и этапы распознавания образов применительно к задаче распознавания языка жестов.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 21.09.2018 |
Размер файла | 3,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
На полученном изображении (рис. 11а) нужно найти наибольший контур (рис. 11б) и использовать его для создания маски с помощью которой можно удалить фон с изображения.
Результат использования детектора кожи на изображении с неоднородным фоном приведен на рисунке 12.
Рис. 12. Пример использования детектора кожи
Проанализировав методы и операторы выделения контура можно заключить что одним из наилучших является оператор Кэнни. Он наиболее точно выделяет контур и в отличие от других методов не нуждается в пост обработке [24].
Оператор Кэнни выделяет все сильные контура на изображении в связи с этим целесообразно по окончанию его работы выполнять фильтрацию полученных контуров. Также результаты работы данного метода можно улучшить, если предварительно удалить с изображения большую часть фона.
Важно заметить, что метод Кэнни является достаточно ресурсоемким по сравнению с другими методами, а с учётом предварительной обработки изображения и последующей фильтрации контуров работа системы может быть медленной в случае если придётся обрабатывать большое количество изображений в секунду. Данную проблему можно будет решить если ограничить число кадров в секунду.
На основании вышеперечисленного можно вывести наилучший метод для выделения контура жеста руки. Предлагаемый метод основывается на использовании фильтрации цвета, эрозию и дилатацию изображения для нахождения области для сегментирования, в качестве основного метода для выделения контура используется оператор Кэнни.
2.7 Анализ контуров и классификация
Перед тем как приступить к анализу контура объекта необходимо полученный набор контуров отфильтровать по размеру и соотношению сторон описанного вокруг контура прямоугольника, чтобы избавиться от случайно обнаруженных контуров.
Как было сказано ранее, в качестве основного метода анализа изображения для решения поставленной задачи будет контурный анализ. Существует ряд методов анализа контура которые в основном зависят от способа представления контура [25].
Обычно в контурном анализе контур хранится в виде последовательности комплексных чисел. Алгоритм описания контура выглядит следующим образом, выбирается начальная точка после чего контур обходится по часовой (или против часовой) стрелке и каждый вектор смещения записывается в виде комплексного числа:
где a и b смещения по осям x и y соответственно. Данное смещение берется относительно предыдущей точки [13].
Рис. 13. Координаты элементарного вектора при комплексозначном кодировании
В контурном анализе используется комплексное кодирования по причине того, что операции над вектором комплексных чисел описывающих контур обладают полезными математическими свойствами по сравнению с другими способами кодирования. Среди свойств контуров можно выделить:
1. Сумма элементарных векторов равна нулю, т.к. контур замкнут и элементарные векторы приводят в начальную точку.
2. Контур не зависит от положения на изображении т.к. контур кодируется относительно начальной точки.
3. Поворот контура на определенный угол можно осуществить поворотом каждого каждого элементарного вектора контура на тот же угол.
4. Набор элементарны векторов не зависит от начальной точки т.к. ЭВ кодируются относительно предыдущей точки.
5. Изменение масштаба контура можно осуществить умножением каждого элементарного вектора контура на коэффициент масштабирования [12].
Определить схожесть контуров при этом методе можно по следующему неравенству Коши-Буняковского для комплексных чисел:
где Г и N сравниваемые контуры, Ck - экстремальное свойство нормированного скалярного произведения. Чтобы получить коэффициент схожести контуров достаточно скалярное произведение векторов поделить на произведение норм векторов.
Вышеперечисленные свойства являются главными достоинствами данного способа, при этом данный метод имеет ряд значительных недостатков. Одним из которых является то, что для вычисления коэффициента схожести нужно вычислить скалярное произведение двух контуров (полученного и эталонного) для этого контура должны иметь одинаковое количество элементарных векторов.
Другим способом представления контура может быть представление в виде набора точек или набора отрезков состоящих из двух точек.
Одним из методов, основанным на таком представлении контура является метод сравнения моментов. [26, 27]
Момент это суммарная характеристика контура, рассчитанная суммированием всех пикселей контура. Формула для пространственного момента (p, q) определяется следующим образом:
где p и q - порядок возведения в степень соответствующего параметра при суммировании, а x и y координаты точки по горизонтали и вертикали соответственно.
Для сравнения контуров необходимо получить инвариантные моменты, для этого центральные моменты полученные по формуле 1, подвергаются нормализации по формуле 2, после чего на основании нормализованных центральных моментов создаются инвариантные функции.
Сравнение контуров с помощью моментов является одним из наиболее простых методов сравнения двух контуров, данный метод в отличии от других не зависит от количества точек контура, масштаба, вращения и отражения контура при использовании инвариантных моментов. Также данный метод позволяет судить о не только о том совпадают ли контуры, но и об уровне совпадения контуров.
Таким образом, вычислив инвариантные моменты эталонных контуров и моменты контура, полученного с изображения можно их сравнить и узнать разницу между найденным контуром и эталонными. На основании полученной разницы можно узнать эталонный контур, наиболее схожий с полученным, соответствующий определенному символу.
2.8 Распознавание слова
Каждый распознанный символ на предыдущем этапе должен попадать в временное хранилище и оставаться там до тех пор, пока не было распознано слово с использованием данного символа.
При получении каждого нового символа необходимо проверять возможно ли из полученных символов составить слово. При этом необходимо проводить попытки составить слово если достаточно долгое время не приходило новых символов для распознавания.
Существует ряд методов автокорректировки теста и орфографического анализа слов, однако обзор данных методов не входит в рамки данной работы. В рамках разрабатываемой системы достаточно использование одного из существующих готовых решений. Один из самых популярных и часто используемых автокорректоров для русского языка является Яндекс. Спеллер [28]. Данный автокорректор имеет достаточно удобное API что позволяет легко добавить его в свой проект.
2.9 Обучение
Обычно обучением в подобных системах считается процесс, в рамках этапа классификации объекта, в результате которого, система постепенно приобретает способность отвечать нужными реакциями на определенные совокупности внешних воздействий. В таком случае обучение имеет своей конечной целью формирование и эталонных описаний классов. Данный подход можно считать классическим подходом для обучения подобных систем. При этом нужно заметить что в прототипе нашей системы 32 эталонных контура должны быть заданы изначально, а в процессе обучения будет происходит не столько формирование данных контуров, сколько их корректировка под определенного пользователя.
Как было сказано ранее, на основе полученных после распознавания и грамматического анализа слов можно выяснить: при распознавании каких символов была допущена ошибка и на основании этого внести изменения, позволяющие избежать данную ошибку в дальнейшем. Таким образом система может обучаться без помощи пользователя. Необходимо заметить, что когда речь идет об обучении мы говорим о изменении следующих параметров:
? пороговых значений (бинаризации\метода Кэнни\уровня изменений) выделения контуров метода;
? корректировка и добавление новых контуров с учетом конкретного пользователя;
? изменение уровня предварительной обработки.
Изменение пороговых значений и уровня предварительной обработки может быть проведено по результатам обработки нескольких предыдущих кадров, и не требует хранения статистики. В то время как для определения того, каким образом можно откорректировать эталонный контур необходимо ведение статистики и сохранение выделенных контуров для последующего анализа. В простом случае на основании ряда контуров близких к эталонному можно находить средний контур и сохранять его в качестве эталонного.
3. Разработка и тестирование прототипа системы
В данной главе будут рассмотрены инструменты, использованные для разработки приложения, структура, состав модулей, а также функции, использованные и реализованные в процессе разработки системы. Кроме того, описаны составные части разрабатываемая системы и их взаимодействие. Приведены результаты экспериментов для выделения параметров функций, используемых в системе.
Раздел включает описание тестирования разработанного прототипа и вычисление среднего уровня ошибки предлагаемого метода. Проведено сравнение полученных результатов с результатами при использовании альтернативного метода предлагаемого в других источниках.
3.1 Выбор средств разработки
В качестве библиотеки для работы с изображениями была выбрана библиотека OpenCV [29, 30]. OpenCV наиболее известная библиотека компьютерного зрения, имеющая обширную аудиторию пользователей, является по сути стандартом в области компьютерного зрения. Данная библиотека имеет множество алгоритмов, работающих «из коробки», имеет открытый исходный код. Библиотека хорошо поддерживается, так как имеет большое количество пользователей.
У библиотеки имеется хорошая и подробная документация, существует большое количество материалов и описаний тех или иных функций. Библиотекой можно пользоваться на языках C, C++, Python (а также Matlab, C#, Java) под различными операционными системами и это далеко не полный список достоинств библиотеки, что позволяет заключить, что OpenCV является наилучшим выбором.
В процессе разработки использовалась кросс-платформенное. Net дополнение для библиотеки OpenCV - Emgu CV на данный момент последней, третьей версии [31, 32]. Данное дополнение было разработано для работы с.NET совместимыми языками, такими как C#, VB, VC++ и.т.д.
В качестве среды разработки использована Visual Studio.
Так как в рамках данной работы разрабатывается прототип, и необходимо осуществлять тестирование и отладку прототипа, Visual Studio является достаточно очевидным выбором.
Разработка осуществлена на языке C#.
3.2 Структура системы
На основании требований к системе и в соответствии с описанными этапами и методами распознавания, был разработан прототип системы распознавания жестов. Система состоит из следующих модулей:
- модуль захвата видео - данный модуль осуществляет захватывать видеопотока с камеры и отправляет его на дальнейшую обработку. Было принято решение, что в хранении видео нет необходимости, так как в рамках работы достаточно, если будут храниться отдельные ключевые кадры. Данный модуль был реализован стандартными средствами OpenCV с помощью класса VideoCapture.
- модуль обработки видео и извлечения кадров - данный модуль преобразовывает видео - масштабирует, приводит к заданному размеру и извлекает из видео изображения. Также данный модуль отвечает за определение производительности устройства на котором запущена система для определения максимально возможного числа кадров в секунду, которое система способна обрабатывать в режиме реального времени.
- модуль фильтрации кадров - данный модуль фильтрует кадры на предмет наличия в них жеста и определяет ключевые кадры, основываясь на уровне изменений в кадре по сравнению с предыдущим. Уровень изменений вычисляется с помощью класса MotionHistory библиотеки OpenCV. C помощью метода MotionInfo() данного класса выделяются площадь изменений и направление изменений. Площадь изменений используется для определения соотношения площади жеста и площади изменений, которое далее сравнивается с пороговым значением для определения является ли кадр подходящим для распознавания жеста. Направление изменений, в случае если кадр был выбран как ключевой, передается в модуль квалификации жеста и используется для определения динамических жестов, таких как «щ» и «ё».
- модуль обработки изображений - данный модуль отвечает за непосредственную обработку кадра и выделение контура, необходимого для последующего описания жеста и принятия решения. Этот модуль содержит функции предварительной обработки: удаления шума, сглаживания, сегментации, перевода изображения в серое полутоновое, операторы выделения контуров и выделения контура методом Кэнни и записи их в виде набора отрезков. На вход данный метод получает исходное цветное изображение изображение, а в виде результата выдает набор контуров представленных отрезками.
- Данный модуль имеет следующий алгоритм работы:
_ на изображении выполняется «поиск кожи» с помощью функции фильтрации цвета, для этого используется функция InRange библиотеки OpenCV. Данная функция получает на вход цветное изображение в формате кодирования Rgb или YCbCr и диапазон цветов в этом формате, а результате получаем изображение в котором всем пикселям не вошедшим в диапазон присвоен черный цвет. Данную функцию можно считать частным случаем бинаризации.
_ к полученному изображению применяется операция эрозии [33]. Для эрозии была использована функция Erode() библиотеки OpenCV. Данная функция принимает на вход исходное изображение и структурный элемент с заданной формой и размером. В результате операции эрозии все объекты, меньшие, чем заданный элемент, стираются, а объекты соединенные тонкими линиями становятся разъединенными, также размеры всех объектов уменьшаются. Данная операция позволяет стереть мелкие объекты и подавить почти весь шум, после этого изображение «восстанавливается» с помощью функции дилатации [34]. Для дилатации использовалась функция Dilate() библиотеки OpenCV, данная функция принимает аналогичные операции эрозии параметры. Размер структурного объекта для операции дилатации задается в два раза больше, чем у операции эрозии. Функции эрозии и дилатации повторяются пока на изображении остаются близко расположенные объекты. [35] При этом размер структурного элемента каждый раз увеличивается.
_ На полученном после этого изображении ищутся наибольшие контуры, по крайним точкам этих контуров вычисляются области для дальнейшей сегментации. Таким образом, строится маска и вычисляется область сегментирования изображения;
_ с помощью полученной маски с исходного изображения удаляется фон и происходит сегментация изображения;
_ полученное изображение обрабатывается оператором Canny (функция OpenCV);
_ на изображении полученном после обработки оператором Canny выполняется поиск контуров функция FindContour библиотеки OpenCV [36].
- модуль фильтрации контуров - данный модуль предназначен для фильтрации полученных контуров и выделения тех, что подходят по параметрам (таким как размер, площадь и др.). На вход данный метод получает набор контуров в виде набора отрезков состоящих из двух пикселей, результатом работы данного модуля будет являться один набор наиболее подходящий, по определенным параметрам таким как площадь и соотношение сторон описанного вокруг контура прямоугольника, для дальнейшего сравнения с контурами в базе данных. Данный этап контурного анализа может быть одним из самых ресурсоемких в случае, если на предыдущих этапах по какой-то причине было выделено большое количество контуров. Например, пороговые значения были неправильно подобраны системой. Это может замедлить работу всей системы в связи с чем данный модуль должен предусматривать взаимодействие с модулем обучения для изменения параметров модуля выделения контуров.
- модуль классификации жеста - данный модуль отвечает за сравнение полученных контуров с эталонными. На вход модуль получает контур в виде набора векторов. Результатом данного метода является число, описывающие коэффициент схожести эталонного и полученного контура, коэффициент является числом от 0 до 1, где 0 означает что контура ортогональны, а 1 означает что они эквивалентны. [37]
- модуль грамматического анализа распознанных символов и распознавания слова. Данный модуль на вход получает набор символов и по возможности составляет из них слова, результатом работы данного модуля будут собранные из распознанных символов и откорректированные слова, полученные с использованием автокорректора для русского языка Яндекс. Спеллер. Данный модуль также ведет статистику распознавания символа и результатов грамматического анализа, на основании чего выполняется дальнейшая корректировка эталонных контуров.
- модуль обучения - данный модуль вносит изменения в эталонные контура на основе статистики полученной от модуля грамматического анализа.
На рисунке 14 изображена структура работы системы.
Рис. 14. Структура системы
3.3 Результаты разработки и тестирования
В результате разработки был создан прототип системы, позволяющий протестировать предложенный метод распознавания жестов. При разработке были использован ряд функций библиотеки OpenCV таких как Canny, CvtColor, FindContours, BoundingRectangle, cvGetSpatialMoment, InRange и т.д. Ряд методов был реализован средствами системных библиотек таких как System. Numerics, System. Collections. Generic, System. Data.
В связи с отсутствием в интернете библиотек с контурами русской дактильной азбуки для проведения тестирования была создана база данных содержащая эталонные контуры 32 жестов. Эталонные контуры создавались на основе изображений жестов дактильной азбуки посредством выделения контура. Каждый эталонный контур состоит из 350 точек. Также база данных содержит временные данные необходимые для работы модулей обработки файлов, и обучения.
Создан интерфейс, позволяющий следить за каждым из этапов обработки изображения и в режиме реального времени менять:
- пороговые значения фильтра цветов;
- пороговое значение уровня изменений для модуля выделения ключевых кадров;
- размер структуры, её начальные координаты и форму для операций эрозии и дилатации;
- пороговые значения бинаризации и сглаживания, методов обработки изображений.
Это позволило экспериментальным методом выделить параметры функций обработки изображения, фильтрации контуров и выделения ключевых кадров, позволяющие достичь наилучшего результата. На рисунке 15 изображен графический интерфейс прототипа системы.
Рис. 15. Интерфейс прототипа системы
В рамках тестирования было осуществлено:
- распознавание жестов на статичных изображениях;
- распознавание жестов в потоке.
Тестирование распознавания статичных изображений. Набор изображений для тестирования системы на статических изображениях, представлен на рисунке 16 набор содержит 10 жестов.
Рис. 16 Тестовые изображения
В рамках тестирования каждое из изображений масштабировалось, а также поворачивалось на 450. Тестирование показало, что предложенный метод не зависит от размера жеста и угла его поворота.
В тоже время, тестирование статических изображений показало, что созданный набор эталонных контуров не учитывает поворот кисти относительно оси предплечья. В связи с этим, было принято решение необходимости расширения базы контуров и добавления контуров с разным углом поворота кисти.
Тестирование распознавания жестов в потоке. Как источник видеопотока использовалась веб-камера компьютера. Была протестирована работа системы с отдельными символами и словами. Для тестирования были выбраны жесты наиболее похожие друг на друга и символы с движением руки. На рисунке 17 продемонстрирован результат распознавания жеста в потоке. При данном тесте буква «ы» была распознана и совпадение контура составило 92%.
Рис. 17. Захваченный ключевой кадр и выделенный контур
В таблице приведены результаты тестирования на точность распознавания и совпадение распознанного и эталонного контура. Тест 1 - распознавание жестов на статичных изображениях, тест 2 - распознавание жестов в потоке.
Результаты тестирования жестов дактильной азбуки
буква |
Точность |
Совпадение |
|||
тест 1 |
тест 2 |
тест 1 |
тест 2 |
||
а |
100 |
93 |
94 |
82 |
|
в |
100 |
93 |
98 |
96 |
|
н |
100 |
83 |
95 |
86 |
|
о |
0* |
80 |
0* |
79 |
|
ы |
0* |
86.6 |
0* |
93 |
|
р |
- |
86.6 |
- |
95 |
|
c |
100 |
86.6 |
97 |
96 |
|
ы* |
100 |
86.6 |
95 |
93 |
|
ш |
100 |
66.6 |
97 |
96 |
|
щ* |
- |
80 |
- |
95 |
|
ф |
100 |
80 |
84 |
90 |
|
л |
100 |
93 |
98 |
96 |
|
итого |
80 |
84.6 |
75.8 |
91.4 |
Для сравнения был протестирован другой, популярный метод для решения таких задач [38, 39, 40, 41, 42], при котором контуры ищутся на изображении полученном после фильтрации цветов. Суть данного метода заключается в том, что изображение, полученное после фильтрации цвета подвергается бинаризации и на полученном после этого изображении, происходит поиск контуров.
Тестирование показало, что при большом диапазоне цвета на изображении будут оставаться лишние элементы фона, а при узком диапазоне цветов большая часть жеста может быть потеряна из-за неравномерного освещения или неравномерного цвета кожи. В следствии этого, полученные данным методом контуры могут значительно отличатся от эталонных, а то и вовсе не совпадать.
Метод выделения контура с помощью фильтрации цветов также оказался сильно зависящим от изменений уровня освещённости и требовал фона контрастного по отношении к цвету кожи т.к. в противном случае выделял лишние объекты.
В тоже время тестирование выявило, что предложенный метод не зависит от уровня освещения, и количества элементов фона и наличия шума и объектов фона. Однако, когда жест находится на не контрастном по отношении к жесту и неоднородном фоне качество работы системы значительно снижается.
Также было проведено тестирование точности работы системы с использованием грамматической обработки, что показало хороший результат и увеличило точность распознавания.
Результаты тестирования показали, что система с 85% вероятностью верно распознает символ изображённый на неоднородном фоне, а при последующей грамматической обработки система имеет достаточно низкий уровень ошибки равный 6%.
При этом, предложенный метод способен работать в режиме реального времени и обрабатывать при достаточно производительном устройстве до 30 кадров в секунду.
Таким образом, по результатам тестирования разработанный прототип показал достаточно высокий уровень точности распознавания символов и совпадения контуров.
Тестирование показало, что предлагаемый метод является более точным, а так же то, что в отличие от метода выделения контура с помощью фильтрации цветов он не зависит от освещения и не нуждается в постоянной настройке и корректировки диапазона цветов объекта распознавания. Кроме того, использование грамматической постобработки позволяет увеличить точность распознавания и исправлять эталонные контура в процессе работы системы, настраивая систему на определённого диктора.
Заключение
В результате выполнения данной работы осуществлен анализ существующих методов распознавания образов, выбран наиболее подходящий метод для целей распознавания языка жестов. Предложены пути повышения эффективности работы выбранного метода.
Результаты исследования показали, что применение контурного анализа и метода Кэнни дает хорошие результаты при распознавании языка жестов. При этом, применение предложенных в работе методов предварительной обработки и грамматического анализа повышают процент правильного распознавания в среднем до 85%.
В связи с тем, что в дальнейшем систему распознавания языка жестов предполагается использовать на мобильных устройствах, параллельно рассматривалась возможность снижения ресурсоемкости предлагаемых методов распознавания. Ресурсоемкость снижается за счет снижения количества кадров, обрабатываемых системой, в секунду. Снижение числа кадров происходит за счет фильтрации кадров и выделения ключевых кадров, а также путем снижения количества захватываемых кадров. Помимо этого, снижение ресурсоемкости было достигнуто благодаря предварительной сегментации изображения, что уменьшило количество обрабатываемых контуров.
Практическая ценность предлагаемых решений в том, что они могут быть взяты за основу при разработке мобильного приложения по распознаванию азбуки жестов глухонемых (дактиль). А также для использования в аналогичных задачах, где необходимо осуществлять распознавание движущегося объекта с узким цветовым диапазоном.
В качестве дальнейшего развития данной темы необходимо рассмотреть возможность применения и адаптации предлагаемых методов при распознавании остальных жестов языка глухонемых, которые зависят не только от положения кисти и пальцев одной руки но и от положения обеих рук и положение рук по отношению к другим частям тела.
Тестирование показало, что необходима дальнейшая дополнительная доработка метода для увеличения точности распознавания символов, при которых происходит движение руки, например «ш» и «щ» и символов, внешний контур которых совпадают с внешним контуром других символов, например «т» и «ш».
Список использованной литературы
1 Сайт разработчика приложения «Сурдофон». URL: http://surdophone.ru (дата обращения 25.12.2017);
2 Сайт разработчика ProDeaf. URL: http://prodeaf.net/en-us/Solucoes (дата обращения 25.12.2017);
3 Students Invented Gloves that Convert Sign Language into Speech. URL: http://globalaccessibilitynews.com/2017/01/27/students-invented-gloves-that-convert-sign-language-into-speech/ (дата обращения: 12.01.2018);
4 Helene Brashear, Thad Starner, Paul Lukowicz, Holger Junker. Using Multiple Sensors for Mobile Sign Language Recognition. URL: https://pdfs.semanticscholar.org/cf9c/1d4df7e970b056344e76f1442ddc39986544.pdf (дата обращения 26.12.2017);
5 Kinect Sign Language Translator - part 1 //Microsoft Research Blog. 29.10.2013 By Microsoft blog editor. URL: https://www.mocrosoft.com/en-us/research/blog/kinect-sign-language-translator-part-1/ (дата обращения 25.12.2017);
6 Сайт разработчика SignAll. URL: http://signall.us (дата обращения 25.12.2017);
7 Сайт разработчика MotionSavvy. URL: http://motionsavvy.com (дата обращения 25.12.2017);
8 Google запустила инициативу по улучшению технологий компьютерного зрения на мобильных устройствах. Дата публикации: 22.04.2018 URL: https://tproger.ru/news/google-announces-ovic/ (дата обращения: 28.04.2018);
9 Гонсалес Р., Вудс Р. Цифровая обработка изображений. 3-е изд. М.: Техносфера, 2012;
10 Матвеев Ю.Н. Основы теории систем и системного анализа: учебное пособие. 1-е изд. Тверь: ТГТУ, 2007;
11 Введение в контурный анализ. Под ред. Я.А. Фурмана, 2-е изд. М: Физматлит, 2003.
12 Рудь М.Н Контурный анализ в распознавании изображений. URL: http://www.lib.tpu.ru/fulltext/c/2012/C04/102.pdf (дата обращения: 10.03.2018)
13 Золотин И.А. Контурный анализ и его применение для распознавания объектов // Наука XXI века. №12 2016. URL: https://nauka21veka.ru/articles/tekhnicheskie-nauki/konturnyy-analiz-i-ego-primenenie-dlya-raspoznavaniya-obektov-1480087113/ (дата обращения: 07.03.2018)
14 Сорокин М.И. Методы распознавания образов на изображениях. URL: http://alley-science.ru/domains_data/files/JournalMay_2017/METODY % 20RASPOZNAVANIYa % 20OBRAZOV % 20NA % 20IZOBRAZhENIYaH.pdf (дата обращения: 12.02.2018);
15 Вдовин В.А. Муравьев А.В. Певзнер А.А. Метод адаптивной бинаризации растрового изображений // Ярославский педагогический вестник. 2012. №4, том III, c. 65-69. URL: http://masters.donntu.org/2014/fknt/kosheverov/library/article06.htm (дата обращения: 10.03.2018);
16 Федоров А. Бинаризация черно-белых изображений: состояние и перспективы развития. URL: http://it-claim.ru/Library/Books/ITS/wwwbook/ist4b/its4/fyodorov.htm (дата обращения: 14.03.2018);
17 Исрафилов Х.С. Исследование методов бинаризации изображений. // Вестник науки и образования. 2017. т. 2. №6. С. 43-50 URL: http://scientificjournal.ru/images/PDF/2017/VNO-30/issledovanie-metodov-binarizatsii.pdf (дата обращения: 12.03.2018);
18 Сергеев В.В., Гашников М.В., Мясников В.В. Локальные методы выделения контуров. Электронные методические указания. Самарский Государственный аэрокосмический Университет имени академика С.П.КОРОЛЕВА. Самара 2010 г.;
19 Методы нахождения границ изображения. Дата публикации 19.09.2011. URL: https://habr.com/post/128753/ (дата обращения: 14.02.2018);
20 Детектор границ Канни. Дата публикации 27.02.2011. URL: https://habr.com/post/114589/ (дата обращения: 27.03.2018);
21 J. Canny A Computational Approach to Edge Detection. //TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. PAMI-8, NO. 6, NOVEMBER 1986
22 Презентация: Canny Edge Detection. URL: http://soe.rutgers.edu/~meer/TEACH/ADD/cannyedge.pdf (дата обращения: 27.02.2018);
23 Презентация: Canny Edge Detector. URL: http://www.intelligence.tuc.gr/~petrakis/courses/computervision/canny.pdf (дата обращения: 27.02.2018);
24 Петров Е.П., Харина Н.Л., Чукаев К.Н. Метод выделения контуров объектов на спутниковых снимках минимальными вычислительными ресурсами // Современные проблемы дистанционного зондирования Земли из космоса. 2016. Т.13. №5. С 304-311. URL: http://d33.infospace.ru/d33_conf/sb2016t5/304-311.pdf
25 П.Ю. Сабельников Вычисление и использование моментов бинарных изображений при геометрическом сравнении объектов. // Штучний інтелект. 2013/ №3 C.223-232. URL:http://dspace.nbuv.gov.ua/bitstream/handle/
26 123456789/85083/ 25-Sabelnikov.pdf? sequence=1;
27 А.В. Казбеков, Н.А. Максимов Методы сравнения контуров в задачах распознавания образов. // Научный вестник МГТУ ГА. 2012 г. №185 С. 37-42;
28 Моменты в OpenCV URL: http://recog.ru/blog/opencv/11.html (дата обращения: 20.03.2018); [http://robocraft.ru/blog/computervision/867.html
29 Сайт компании Яндекс: Спеллер. URL: https: //tech.yandex.ru/speller/ (дата обращения: 12.02.2018);
30 OpenCV. URL: https://opencv.org/ (дата обращения: 10.01.2018);
31 Gary Bradski, Adrian Kaehle Learning OpenCV: Computer Vision with OpenCV Library. Cambridge: O'Reilly Media, 2008;
32 Начало работы с OpenCV и его применение в C# (дата публикации: 19.06.2015) URL: https://habr.com/post/260741/ (дата обращения: 15.02.2018);
33 Emgu CV. URL: http://www.emgu.com/wiki/index.php/Main_Page (дата обращения: 18.02.2018);
34 Erosion (morphology) URL: https://en.wikipedia.org/wiki/Erosion_(morphology) (дата обращения: 05.02.2018);
35 Altami Studio 3.1.0. Руководство пользователя. Раздел 8.5.1 Дилатация. URL: http://altamisoft.ru/products/altami_studio/user_manual_AS_3_1_0/filters/ morphological_operations/dilate/ (дата обращения: 02.03.2018);
36 OpenCV: Eroding and Dilating. URL: https://docs.opencv.org/2.4/doc/tutorials/imgproc/erosion_dilatation/erosion_dilatation.html (дата обращения: 02.02.2018);
37 Фурса Н.Е. Метод поиска объектов на изображении с помощью контурного анализа по заданным характеристикам их контуров // Открытые информационные и компьютерные интегрированные технологии. 2014. №64. с. 172-176;
38 OpenCV шаг за шагом. Сравнение контуров через суммарные характеристики - моменты. URL: http://robocraft.ru/blog/computervision/867.htm (дата обращения: 02.02.2018);
39 Chance M. Glenn, Divya Mandloi, Kanthi Sarella, Muhammed Lonon. An Image Processing Technique for the Translation of ASL Finger-Spelling to Digital Audio or Text. NTID International Instructional Technology and Education of the Deaf Symposium, June 2005. URL: http://citeseerx.ist.psu.edu/viewdoc/download? doi=10.1.1.131.1480&rep=rep1&type=pdf (дата обращения: 11.01.2018);
40 Aashni Haria, Archanasri Subramanian, Nivedhitha Asokkumar, Shristi Poddar, Jyothi S Nayak. Hand Gesture Recognition for Human Computer Interaction // 7th International Conference on Advances in Computing & Communications, ICACC-2017, 22 - 24 August 2017. Cochin, India.
41 Paula Escudeiro, Nuno Escudeiro, Rosa Reis, Maciel Barbosa, Jos Bidarra, Bruno Gouveia. Automatic Sign Language Translator Model. URL: https://www.researchgate.net/publication/258993179_Automatic_Sign_Language_Translator_Model;
42 S. Nagarajan, T.S. Subashini, M. Balasubramanian. Visual Interpretation of ASL Finger Spelling using Hough Transform and Support Vector Machine // International Journal of Advanced Research in Computer and Communication Engineering. Vol. 4, Issue 6, June 2015.
43 Kanthi Sarella. Formulation of an image processing technique for improving Sign2 performance. URL: http://scholarworks.rit.edu/cgi/viewcontent.cgi? article=1796&context=other (дата обращения: 10.04.2018).
Размещено на Allbest.ru
...Подобные документы
Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.
курсовая работа [462,2 K], добавлен 15.01.2014Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.
дипломная работа [1019,9 K], добавлен 13.10.2017Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.
курсовая работа [2,7 M], добавлен 15.08.2011Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.
курсовая работа [16,2 M], добавлен 21.06.2014Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.
курсовая работа [3,0 M], добавлен 14.11.2013Обзор задач, возникающих при разработке систем распознавания образов. Обучаемые классификаторы образов. Алгоритм персептрона и его модификации. Создание программы, предназначенной для классификации образов методом наименьшей среднеквадратической ошибки.
курсовая работа [645,2 K], добавлен 05.04.2015Появление технических систем автоматического распознавания. Человек как элемент или звено сложных автоматических систем. Возможности автоматических распознающих устройств. Этапы создания системы распознавания образов. Процессы измерения и кодирования.
презентация [523,7 K], добавлен 14.08.2013Создание программного средства, осуществляющего распознавание зрительных образов на базе искусственных нейронных сетей. Методы, использующиеся для распознавания образов. Пандемониум Селфриджа. Персептрон Розенблатта. Правило формирования цепного кода.
дипломная работа [554,8 K], добавлен 06.04.2014Понятие и особенности построения алгоритмов распознавания образов. Различные подходы к типологии методов распознавания. Изучение основных способов представления знаний. Характеристика интенсиональных и экстенсиональных методов, оценка их качества.
презентация [31,6 K], добавлен 06.01.2014Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.
дипломная работа [887,3 K], добавлен 26.11.2013Распознавание образов - задача идентификации объекта или определения его свойств по его изображению или аудиозаписи. История теоретических и технических изменений в данной области. Методы и принципы, применяемые в вычислительной технике для распознавания.
реферат [413,6 K], добавлен 10.04.2010Основные цели и задачи построения систем распознавания. Построение математической модели системы распознавания образов на примере алгоритма идентификации объектов военной техники в автоматизированных телекоммуникационных комплексах систем управления.
дипломная работа [332,2 K], добавлен 30.11.2012Описание структурной схемы искусственного нейрона. Характеристика искусственной нейронной сети как математической модели и устройств параллельных вычислений на основе микропроцессоров. Применение нейронной сети для распознавания образов и сжатия данных.
презентация [387,5 K], добавлен 11.12.2015Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.
презентация [469,2 K], добавлен 15.03.2015Словесный, графический, табличный, программный способы представления алгоритма. Основные конструкции в любом алгоритмическом языке. Теория обнаружения, различения и оценивания сигналов. Радиолокационные системы обнаружения. Система распознавания образов.
презентация [4,8 M], добавлен 09.06.2015Анализ основных аспектов технологии компьютерного зрения, необходимых для выполнения работы. Изучение характеристик библиотеки OpenCV, оценка актуальности работы по распознаванию жестов рук. Поэтапный отчет о работе над программным обеспечением.
курсовая работа [669,9 K], добавлен 20.05.2017Первое систематическое изучение искусственных нейронных сетей. Описание элементарного перцептрона. Программная реализация модели распознавания графических образов на основе перцептрона. Интерфейс программы, основные окна. Составление алгоритма приложения.
реферат [100,5 K], добавлен 18.01.2014Строение артикуляционного аппарата человека с точки зрения возможности распознавания речи по артикуляции. Комплекс параметров артикуляции на основе контура внутренней области губ. Реализация модуля распознавания фонем русской речи по изображениям губ.
дипломная работа [3,1 M], добавлен 19.08.2012Методы предобработки изображений текстовых символов. Статистические распределения точек. Интегральные преобразования и структурный анализ. Реализация алгоритма распознавания букв. Анализ алгоритмов оптического распознавания символов. Сравнение с эталоном.
курсовая работа [2,1 M], добавлен 20.09.2014Отображение на плоскости точек из многомерного пространства, интерактивное распознавание отдельных классов образов в качестве объекта разработки программного продукта. Концептуальная модель предметной области. Классы и объекты интерфейса пользователя.
дипломная работа [1,5 M], добавлен 10.06.2013