Использование сверточных нейронных сетей для распознавания автомобильных номеров. Преимущества и недостатки по сравнению с шаблонным методом

Использование сверточной нейронной сети, тренированной на базе данных Mixed National Institute of Standards and Technology. Рассмотрение применения шаблонов и нейронных сетей для распознавания автомобильных номеров с точки зрения производительности.

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид статья
Язык русский
Дата добавления 26.05.2017
Размер файла 1,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Кубанский государственный аграрный университет, Россия

Использование сверточных нейронных сетей для распознавания автомобильных номеров. Преимущества и недостатки по сравнению с шаблонным методом

Михалевич Юрий Сергеевич

магистрант

Ткаченко Василий Владимирович

к.э.н., доцент

В настоящее время интеллектуальные системы и решения получают все большее развитие. Одной из сфер применения интеллектуальных систем является видеонаблюдение. Обнаружение движения, дыма, огня, границ, подсчет людей в очереди, наблюдение за кассой, обнаружение людей, распознавание лиц, распознавание автомобильных номеров, - все эти и многие другие задачи решаются с использование интеллектуальных методов обработки изображений и видео. Однако, до сих пор не существует совершенного и универсального решения многих из перечисленных задач. Применяемые методы постоянно совершенствуются и иногда даже заменяются. В этом контексте представляет интерес задача распознавания автомобильных номеров.

Целью исследования является - проведение сравнительного анализа методов распознавания образов и разработка концепции по использованию сверточных нейронных сетей для задачи распознавания автомобильных номеров.

Знакомясь со статьями на данную тему, можно убедиться (на ряду с авторами этих статей) в том, что оптимальным методом решения этой задачи является применение шаблонов. И, действительно, многие системы распознавания автомобильных номеров используют методы, основанные на применении шаблонов. Суть таких методов заключается в том, что алгоритм располагает информацией о том, как выглядит автомобильный номер, какой у него может быть фон, как выглядят и на каких позициях могут находиться определенные символы (дифференцируются буквы и цифры), учитывает шрифт, используемый для их начертания, сразу рассматривает возможное место обнаружения автомобильного номера, а не все изображение. Все это позволяет добиться высокого качества распознавания стандартизированных номерных знаков. Производительность таких методов более чем удовлетворительна. Обыкновенно, уверенность авторов, защищающих методы, основанные на шаблонах, проистекает из того факта, что они рассматривают применение своих методов в рамках одной страны (или территории, на который автомобильные номерные знаки строго стандартизированы). Например, с использованием данного метода можно легко распознавать автомобильные номера, используемые на территории Российской Федерации (Рисунок 1).

Рисунок 1. Пример номера, для распознавания которого практично применять шаблоны

Однако, какой метод применять в случае, если необходимо распознавать номера на таможенном пункте, где проезжает множество автомобилей с номерами, удовлетворяющими разным шаблонам? Можно использовать множество шаблонов, в ущерб эффективности. Или усложнить один шаблон, сделав его более универсальным, в ущерб качеству. А какой метод использовать, если нам необходимо распознавать автомобильные номера вне формата, находящиеся в неожиданном месте (транзитные номера), содержащие различное количество букв и цифр, размещенные на различном фоне (США) (Рисунок 2)?

Рисунок 2. Автомобильные номерные знаки США

Возможным ответом на все эти вопросы является использование искусственных нейронных сетей. В машинном обучении и в когнитивистике, под искусственными нейронными сетями понимают семейство моделей, вдохновленных биологическими нейронными сетями (центральной нервной системой животных, в частности - мозгом), и используются для того, чтобы оценить или приблизить функции, которые могут зависеть от огромного количества входных данных и обычно неизвестны. Искусственные нейронные сети обычно представляются как системы соединенных между собой «нейронов», которые обмениваются сообщениями друг с другом. Соединения имеют множество весов, которые могут быть настроены на основании опыта, делая нейронные сети адаптируемыми к входным данным и способными обучаться.[2][5]

Например, нейронная сеть для распознавания текста определена как множество «входных нейронов», которые могут быть активированы пикселями входного изображения. После того, как они будут взвешены и преобразованы функцией (определенной проектировщиком сети), активность этих нейронов будет передана другим нейронам. Этот процесс будет повторен до тех пор, пока выходной нейрон не будет активирован. Это определит, какой символ был прочитан.[5]

Как и другие методы машинного обучения - системы, обучающиеся из данных - нейронные сети используются для решения множества задач, которые тяжело решить с использованием стандартного логического программирования, включая задачи компьютерного зрения и распознавания речи.[3]

Существует несколько видов искусственных нейронных сетей. Отличают feed-forward (от англ. feed - кормить и forward - вперед) и рекуррентные нейронные сети. В первых - связи между нейронами не могут формировать цикл, во вторых - формируют, с целью предоставления обратной связи более верхним уровням.

Также, нейронные сети классифицируют исходя из их архитектуры - многослойный персептрон (многослойные нейронные сети), глубокие (сложный многослойные нейронные сети, производящие множество нелинейных преобразований), сверточные (содержащие сверточные слои) и другие.[2]

В данной статье мы рассмотрим применение сверточных нейронных сетей. В машинном обучении, сверточные нейронные сети являются видом feed-forward искусственных нейронных сетей, в которой индивидуальные нейронные уложен таким образом, что они соответствуют перекрывающимся регионам в поле зрения. Сверточные нейронные сети были вдохновлены биологическими процессами и являются вариацией многослойного персептрона, спроектированного для использования минимального объема предобработки. Они находят широкое применение в обработке видео и изображений, советующих системах и обработке естественного языка.[4]

В случае, если такие сети используются для распознавания изображений, они состоят из множества слоев из небольших скоплений нейронов, которые принимают небольшие части входного изображения. Называются эти скопления - рецептивными полями. Результат работы данных скоплений затем размещается так, что они пересекаются для того, чтобы приобрести лучшее представление оригинального изображения; это повторяется для каждого следующего слоя.[6]

Однако, с применением нейронных сетей сопряжены несколько сложностей - сложность обучения сетей и низкая производительность. Для того, чтобы решить вторую проблему, сверточные сети могут содержать локальные или глобальные слои субдискретизации (subsampling, pooling слои), которые комбинируют вывод кластеров нейронов (Рисунок 3), тем самым снижая количество (и детализацию) информации.[1] Если правильно подобрать параметры таких слоев, можно существенно повысить производительность сети, не потеряв, при этом, в качестве.

Для решения задачи распознавания номеров было спроектировано несколько сверточных нейронных сетей с использованием фреймворка для построения нейронных сетей Caffe. Центральные слои одной из них описаны ниже в формате Caffe.

Рисунок 3. Пример работы слоя субдискретизации. Фильтр max pooling, 2х2, с шагом 2

layer {

name: "image28x28"; type: "MemoryData"; top: "image28x28"; top: "label"

}

layer {

name: "conv1"; type: "Convolution"; top: "conv1"; bottom: "image28x28";

convolution_param {weight_filler {type: "xavier"}; bias_filler {type: "constant"}}

}

layer {

name: "pool1"; type: "Pooling"; top: "pool1"; bottom: "conv1";

pooling_param { pool: MAX; kernel_size: 2; stride: 2; }

}

layer {

name: "conv2"; type: "Convolution"; top: "conv2"; bottom: "pool1";

convolution_param {weight_filler {type: "xavier"}; bias_filler {type: "constant"}}

}

layer {

name: "pool2"; type: "Pooling"; top: "pool2"; bottom: "conv2";

pooling_param { pool: MAX; kernel_size: 2; stride: 2; }

}

layer {

name: "ip1"; type: "InnerProduct"; top: "ip1"; bottom: "pool2";

inner_product_param {num_output: 500; weight_filler {type: "xavier"}; bias_filler {type: "constant"}}

}

layer {

name: "relu1"; type: "ReLU"; top: "ip1"; bottom: "ip1";

}

layer {

name: "drop1"; type: "Dropout"; top: "drop1"; bottom: "ip1";

}

layer {

name: "ip2"; type: "InnerProduct"; top: "ip2"; bottom: "drop1";

inner_product_param {num_output: 500; weight_filler {type: "xavier"}; bias_filler {type: "constant"}}

}

Для краткости, были убраны слои с входными и выходными нейронами, некоторые параметры и детали настройки отдельных слоев.

Как вы можете видеть, данная структура является отражает типовую структуру сверточной нейронной сети (Рисунок 4).

Рисунок 4. Типовая структура сверточной нейронной сети.

Более важным вопросом является подбор параметров описанных слоев. Данный вопрос слишком комплексный для того, чтобы осветить его в рамках данной обзорной статьи.

Выводы:

1. Проведена сравнительная характеристика методов распознавания автомобильных номеров, выявлены их достоинства и недостатки.

2. Для решения задачи распознавания номеров было спроектировано несколько сверточных нейронных сетей с использованием фреймворка для построения нейронных сетей Caffe.

3. В результате проведенных исследований, в ряде тестовых условий (были использованы различные наборы видео) удалось добиться качества распознавания номеров, превосходящее шаблонный метод при времени работы сети лишь незначительно превышающем время работы шаблонного метода. В настоящий момент производятся исследования, направленные на оптимизацию работы сети.

Литература

сверточный нейронный сеть распознавание

1. Зейлер М.Д., Фергус Р. Stochastic Pooling for Regularization of Deep Convolutional Neural Networks - 2013.

2. Коллоберт Р., Вестон Дж. A Unified Architecture for Natural Language Processing: Deep Neural Networks with Multitask Learning // Материалы 25-ой международной конференции о вопросах машинного обучения. ICML '08. - Нью-Йорк, США: ACM, 2008. - С. 160-167.

3. Корекадо К., Мур Т., Номура О., Андо Х., Нкано Т., Матсуго М., Ивата А. A Convolutional Neural Network VLSI for Image Recognition Using Merged/Mixed Analog-Digital Architecture // Интеллектуальные информационные и инженерные системы, основанные на знаниях. - 2003 - С. 169-176.

4. Крижевский А. ImageNet Classification with Deep Convolutional Neural Networks - 2013.

5. ЛеКун И. LeNet-5, convolutional neural networks - 2013.

6. «Экономическая характеристика географической информационной системы мониторинга машинотракторного парка в сельском хозяйстве» / Третьяков И.И., Ткаченко В.В. // В сборнике: «Научное обеспечение агропромышленного комплекса».

Размещено на Allbest.ru

...

Подобные документы

  • Рассмотрение принципов организации Deep Packet Inspection в телекоммуникации. Проведение исследований нейронных сетей. Выбор оптимальной модели для решения задач классификации мультимедийного трафика. Изучение вопросов безопасности жизнедеятельности.

    дипломная работа [1,0 M], добавлен 22.06.2015

  • Понятие и применение нейронных сетей, особенности классификации искусственных нейронных сетей по Терехову. Решение задачи классификации римских цифр на основе нейронной сети. Составление блок-схемы алгоритма обучения нейронной сети и анализ ее качества.

    дипломная работа [603,9 K], добавлен 14.10.2010

  • Определение и виды искусственных нейронных сетей. Функция активации. Биологический нейрон. Персептрон как инструмент для классификации образов. Классификация объектов с помощью нейронной сети. Нормализация входных сигналов. Алгоритм работы в MatlabR2009b.

    курсовая работа [349,7 K], добавлен 17.03.2016

  • Разработка нейронной сети, выполняющей задачу распознавания и обучения. Использование пакета Simulink программы Matlab. Проектирование архитектуры нейронной сети, удовлетворяющей поставленной задаче. Создание модели импульсного двухпорогового нейрона.

    дипломная работа [2,7 M], добавлен 14.10.2010

  • История появления сотовой связи, ее принцип действия и функции. Принцип работы Wi-Fi - торговой марки Wi-Fi Alliance для беспроводных сетей на базе стандарта IEEE 802.11. Функциональная схема сети сотовой подвижной связи. Преимущества и недостатки сети.

    реферат [464,8 K], добавлен 15.05.2015

  • Протокол беспроводной передачи данных, помогающий соединить n-ное количество компьютеров в сеть. История создания первого Wi-Fi. Стандарты беспроводных сетей, их характеристики, преимущества, недостатки. Использование Wi-Fi в промышленности и быту.

    реферат [31,3 K], добавлен 29.04.2011

  • Процесс построения мультисервисных сетей связи, его этапы. Анализ технологий сетей передачи данных, их достоинства и недостатки. Проектирование мультисервисной сети связи с использованием телекоммуникационного оборудования разных производителей.

    курсовая работа [1,8 M], добавлен 23.12.2012

  • Основные типовые топологии вычислительных сетей, их изучение, анализ, оценка. Вывод о работе сетей с различной топологией (цепочечной, полносвязной, ячеистой, комбинированной). Преимущества и недостатки топологий, влияющих на производительность сети.

    дипломная работа [65,9 K], добавлен 02.03.2009

  • Обзор современного состояния сетей передачи данных. Организация цифровых широкополосных сетей. Главные преимущества WiMAX и Wi-Fi. Проектирование сети в программе NetCracker. Расчет зоны действия сигнала. Требования к организации рабочего места техника.

    дипломная работа [1,1 M], добавлен 20.05.2013

  • Аппаратные средства глобальных и локальных компьютерных сетей, их конфигурация и организация обмена информацией. Виды архитектур и компоненты передачи данных по линии. Описание компьютерных телекоммуникаций, подготовка и использование глобальных сетей.

    реферат [37,5 K], добавлен 24.11.2010

  • Проблемы и области применения беспроводных локальных сетей. Физические уровни и топологии локальных сетей стандарта 802.11. Улучшенное кодирование OFDM и сдвоенные частотные каналы. Преимущества применения техники MIMO (множественные входы и выходы).

    контрольная работа [369,9 K], добавлен 19.01.2014

  • Классификация телекоммуникационных сетей. Схемы каналов на основе телефонной сети. Разновидности некоммутируемых сетей. Появление глобальных сетей. Проблемы распределенного предприятия. Роль и типы глобальных сетей. Вариант объединения локальных сетей.

    презентация [240,1 K], добавлен 20.10.2014

  • Цифровая обработка сигналов и ее использование в системах распознавания речи, дискретные сигналы и методы их преобразования, основы цифровой фильтрации. Реализация систем распознавания речи, гомоморфная обработка речи, интерфейс записи и воспроизведения.

    дипломная работа [1,1 M], добавлен 10.06.2010

  • Понятие сетей передачи данных, их виды и классификация. Оптико-волоконные и волоконно-коаксиальные сети. Использование витой пары и абонентских телефонных проводов для передачи данных. Спутниковые системы доступа. Сети персональной сотовой связи.

    реферат [287,1 K], добавлен 15.01.2015

  • Основные преимущества, получаемые при сетевом объединении персональных компьютеров в виде внутрипроизводственной вычислительной сети. Методы оценки эффективности локальных вычислительных сетей. Типы построения сетей по методам передачи информации.

    реферат [34,8 K], добавлен 19.10.2014

  • Исследование методов обработки информации в системах технического зрения роботов. Описания искусственных нейронных сетей и их использования при идентификации изображений. Определение порогового уровня изображений, техники обработки визуальной информации.

    магистерская работа [2,2 M], добавлен 08.03.2012

  • Преимущества беспроводных сетей передачи данных. Использование радиоканала для обмена данными со счетчиками. Архитектура, параметры и функции автоматизированных информационно-измерительных систем контроля и учета электроэнергии. Сети стандарта GSM/GPRS.

    реферат [2,1 M], добавлен 27.11.2014

  • Разработка схемы магистральной сети передачи данных и схемы локальных станционных сетей. Использование новых оптических каналов без изменений кабельной инфраструктуры. Установление в зданиях маршрутизаторов, коммутаторов, медиаконвертера, радиомоста.

    курсовая работа [1,3 M], добавлен 23.10.2014

  • Монтаж и настройка сетей проводного и беспроводного абонентского доступа. Работы с сетевыми протоколами. Работоспособность оборудования мультисервисных сетей. Принципы модернизации местных коммутируемых сетей. Транспортные сети в городах и селах.

    отчет по практике [1,5 M], добавлен 13.01.2015

  • Концепция интеллектуальной сети как одна из определяющих концепций развития современных сетей связи. Модульность и многоцелевое назначение сетевых функций. Эффективное использование сетевых ресурсов. Правила и элементарная схема предоставления услуг.

    презентация [211,2 K], добавлен 02.08.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.