Технология многопоточной обработки данных в программном комплексе распознавания номеров транспортных средств "Fbeholder"
Технология создания системы многопоточной обработки данных на основе информационного графа и конвейерной обработки в задаче распознавания номеров транспортных средств. Архитектура программного комплекса "FBeholder", структура графа разбора видеоданных.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 05.09.2021 |
Размер файла | 620,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Технология многопоточной обработки данных в программном комплексе распознавания номеров транспортных средств "FBeholder"
В.Л. Дубровин
(Поволжский государственный технологический университет, Йошкар-Ола),
М.В. Петропавловский, д-р техн. наук (Марийский государственный университет, Йошкар-Ола)
Представлена технология создания системы многопоточной обработки данных на основе информационного графа и конвейерной обработки в задаче распознавания номеров транспортных средств. Приведено описание архитектуры разработанного программного комплекса «FBeholder», а также структура графа разбора видеоданных.
Ключевые слова: обработка видеоданных, многопоточные вычисления, распознавание образов.
Введение
программный комплекс fbeholder распознавание транспортных номеров
Задача распознавания автомобильных номеров не является новой. В ряде статей рассматриваются алгоритмы распознавания номеров с описанием этапов преобразования графического изображения и представлением блок-схем процесса распознавания [1, 2]. Отметим, что работы ориентированы на описание этапов обработки изображения и методов, которые применяются для получения из входящего кадра отфильтрованного бинарного изображения, пригодного для выделения связных групп символов с применением соответствующих методов их распознавания. При этом никак не затрагивается вопрос создания программной архитектуры, позволяющей выполнять обработку графических данных в многопоточном режиме с максимально эффективным задействованием всего потенциала современных многоядерных процессоров, а также не рассматриваются возможности использования графической подсистемы для параллельной обработки данных.
Сам алгоритм распознавания автомобильных номеров от захвата исходного кадра до получения строки распознанного номерного знака зачастую представлен как статическая структура и имеет ограничения, поскольку не позволяет гибко адаптировать программу без модификации исходного кода как для различных условий съемки (день, ночь, наличие контрастной или градиентной засветки), так и для вычислительных систем разной мощности (например, изменением количества уровней порогового преобразования можно повышать или понижать качество распознавания, подстраивая общую скорость процесса обработки данных для конкретной аппаратной системы).
В статье рассматривается технология многопоточной обработки данных с использованием информационного графа [3] и вычислительного конвейера [4] применительно к задаче распознавания номеров транспортных средств (ТС).
Данная технология положена в основу программного комплекса « FBeholder», позволяющего эффективно распознавать государственные регистрационные знаки (ГРЗ) и вычислять параметры траектории движения ТС (координаты, скорость) по видеоданным даже при выполнении на офисных компьютерах начального уровня.
Предлагаемый подход может быть использован и для решения других задач, где на входе имеется некий поток данных, а на выходе посредством применения последовательности преобразований (фильтров) в параллельном многопоточном режиме извлекаются требуемые данные для представления пользователю. Разработанная программная архитектура укладывается в концепцию MVC (Model-ViewController)[5], а сам информационный граф и используемые в нем фильтры за счет модульной организации могут быть легко изменены или дополнены по технологии plug-in.
Постановка задачи
При разработке архитектуры программного комплекса распознавания номеров были сформулированы следующие требования:
программный комплекс на уровне архитектуры и используемых алгоритмов должен быть адаптирован для эффективного выполнения в многопоточных, многоядерных, многопроцессорных системах, при этом архитектура программного комплекса должна допускать возможность использования ресурсов графической подсистемы посредством выполнения гибридных параллельных вычислений при обработке данных;
степень многопоточности при выполнении обработки данных должна быть величиной настраиваемой, зависящей от алгоритма разбора данных;
алгоритм разбора данных должен быть настраиваемым в зависимости от конкретной задачи посредством описания схемы разбора данных и модульного представления с использованием технологии plug-in, без необходимости изменения исходного кода программного комплекса;
архитектура программного комплекса должна быть организована по схеме разделения данных приложения, пользовательского интерфейса и управляющей логики на три отдельных компонента с использованием концепции «Модель -Представление-Контроллер» .
Архитектура программного комплекса
Распознавание номера ТС реализуется последовательно на следующих трех уровнях (рис. 1):
статический уровень - осуществляет захват и распознавание отдельного статического кадра;
динамический уровень - осуществляет аккумулирование результатов распознавания статических кадров во времени с использованием алгоритмов слежения;
уровень представления - реализует получение аккумулированного результата распознавания для отображения в приложении, сохранения в базе данных (БД) или транслирования информации приложению -клиенту.
Рис. 1. Уровни распознавания номера транспортного средства.
Статический уровень включает в себя все этапы обработки отдельного кадра - от извлечения статического изображения с камеры (или из файла) до получениястрок символов распознанных номерных пластин. В процессе распознавания статического кадра также выполняется получение дополнительной информации - такой как тип номерной пластины, достоверность распознавания и др. Вся информация о распознанной номерной пластине сохраняется и передается на следующий уровень.
Отметим, что в отличие от аналогичных программных комплексов, использующих результат распознавания статического кадра как окончательный [6], результат, полученный на данном этапе, не может рассматриваться как достоверный и достаточный для представления информации пользователю, так как информация, полученная путем распознавания отдельного кадра, очень сильно зависит от качества этого кадра и может быть искажена помехами: достаточно привести букву «О», которая при засвечивании может быть распознана как буква «С». Кроме того, имея только статический кадр, невозможно сделать каких-либо выводов о траектории и параметрах движения транспортного средства.
Статический уровень конфигурируется информационным графом, который обладает следующими свойствами: каждый элемент графа реализуется так называемым фильтром, который выполняет самостоятельную процедуру преобразования данных. На вход каждого фильтра подключается выход одного входящего фильтра, который должен выполниться раньше, или первичный источник данных; на выход фильтра может подключаться множество исходящих фильтров, которые выполняются следом. Данные принимаются от входящего фильтра в едином контейнере, который содержит индекс типа данных, ссылку на данные фильтра и ссылку на контейнер-предок, принятый от входящего фильтра.
Поскольку каждый фильтр выполняется в собственном потоке, этап преобразования данных, реализуемый фильтром, может быть выполнен с применением параллельных гибридных вычислений с использованием свободных библиотек CUDAили OpenCL, без необходимости разработки сложных алгоритмов синхронизации с другими потоками.
Граф разбора данных обладает следующими свойствами: выполняется в собственном потоке, имеет начало (вход) и конец выполнения (выход), которые определяют такт выполнения; в рамках одного такта фильтры выполняются последовательно (передавая данные со своего выхода на вход ожидающим фильтрам), асинхронно (создавая независимые друг от друга в рамках такта пути выполнения), но с учетом (при наличии) списка зависимостей от других фильтров (рис. 2).
Рис. 2. Структура графа разбора данных.
Граф разбора данных может обрабатываться с использованием вычислительного конвейера, при этом начало выполнения очередного такта наступает до окончания выполнения предыдущего, что позволяет сократить среднее время обработки кадров.
Степень загрузки конвейера ограничивается только необходимостью синхронизации процесса передачи результата на другой уровень. Однако большинство трудоемких операций (более 80% всех фильтров), начиная с получения очередного кадра до этапов нахождения контуров, можно выполнять, используя конвейерную обработку, не дожидаясь завершения процесса разбора очередного кадра, что ранее не использовалось в подобных программных системах (рис. 3).
Рис. 3. Схема вычислительного конвейера с использованием графа разбора данных.
Граф разбора данных может быть встроенным в приложение, представлен в виде подгружаемого по технологии plug-inмодуля динамической библиотеки («.dll», «.so», «.dylib») или описан в формате XML-файла. Используемые графом фильтры могут быть встроенными в приложение или подгружаться в виде отдельных модулей.
Однозначная идентификация ГРЗ в соответствии с типом осуществляется с использованием информации о структуре и начертании номерных пластин, которая также описывается во встроенных или подгружаемых шаблонах номерных пластин.
Динамический уровень отвечает за выполнение следующих процедур: добавление данных распознанных частично или полностью номеров в список номеров или рамок для накопления;
реализацию алгоритма слежения: накопление информации о перемещении рамок для предсказания направления движения и сопоставления с результатами распознавания на следующем временном шаге;
обновление значений достоверности распознавания и горизонтальной относительной ошибки позиционирования для каждого символа, а также значений достоверности распознавания пластины в целом;
настройку шага распознавания при отсутствии или наличии «движения» в кадре для ускорения процесса сканирования видеофайлов;
кэширование кадров с движением для сохранения по требованию на уровне представления, удаление сохраненных и старых кадров.
Динамический уровень исполняется в самостоятельном потоке, отличном от главного потока программы. Взаимодействие динамического уровня со статическим реализовано по принципу событийной модели, т.е. статический уровень реализует события, а динамический осуществляет подписку на их обработку. События поступают на динамический уровень синхронно, в хронологическом порядке во времени.
Включение в алгоритм уровня представления позволяет выводить (передавать) пользователю не всю информацию, хранящуюся на динамическом уровне, а только удовлетворяющую заданным условиям, - например, критериям достоверности распознавания, в нужные промежутки времени. Использование данного уровня дает возможность оптимизировать процессы графического отображения информации пользователю, сохранять информацию в БД и передавать ее клиентским приложениям по подписке.
Также на данном уровне вычисляются параметры траектории движения ТС: средняя скорость на участке дороги, направление движения по отношению к плоскости наблюдения камеры, географическая координата и др.
Траектория движения вычисляется по видеопотоку с использованием предварительно заданных в программе, параметров камеры (метрических и пиксельных размеров матрицы камеры географической координаты ее размещения) и фактического фокусного расстояния объектива.
Пример функционирования программного комплекса
Программный комплекс разработан в среде быстрой разработки приложений Embarcadero RAD Studio. Графические преобразования над матрицами изображений и поиск контуров выполняются с использованием библиотеки компьютерного зрения OpenCV. Распознавание символов реализовано на основе шаблонного метода с применением собственных классов и оригинального растрового классификатора символов.
Программный комплекс тестировался с применением графа разбора данных, состоящего из 133 фильтров, каждый из которых выполнялся в собственном потоке, а общее количество потоков, одновременно используемых приложением, превышало 145.
Тестирование программного комплекса выполнялось в режиме реального круглосуточного использования для регистрации ТС, проезжающих через ворота крупного потребительского гаражного кооператива. Программа по видеопотоку с камеры, установленной на въезде в кооператив, распознавала номера, определяла направление, траекторию, среднюю скорость движения транспортного средства и сохраняла информацию в локальной БД. Для тестирования использовались две следующие аппаратные платформы:
1) рабочая станция на базе ЦП Intel Celeron G1840 2.80 ГГц (2 ядра, 2 потока) с оперативной памятью 4 ГБ; IP-камера Beward N35110 с разрешением видеопотока 1280x1024 и кодированием MJPEG;
2) рабочая станция на базе ЦП IntelCorei3 8100 3.6 ГГц (4 ядра, 4 потока) с оперативной памятью 8 ГБ; IP-камера BewardSV3210Rс разрешением видеопотока 2560x1920 и кодированием H265. Тестирование производилось с заданием области интереса (regionofinterest, ROI), достаточного для распознавания номеров въезжающих ТС за воротами и выезжающих - перед воротами, а также определения средней скорости и направления движения на данном участке траектории.
В ходе тестирования были получены следующие результаты скорости сканирования: в первом случае - более 10 кадров в секунду, во втором - более 8,9 кадров в секунду (рис. 4). В том и в другом вариантах происходило гарантированное распознавание номеров с читаемыми символами, даже в случае временного перекрытия номерной пластины препятствием (человеком или другим ТС) или частичного перекрытия номерной пластины фаркопом ТС.
Из проведенных экспериментов можно сделать вывод, что реализованная технология обработки данных в многопоточном режиме позволяет успешно использовать программный комплекс на офисных компьютерах бюджетного уровня с многоядерными процессорами.
Рис. 4.Просмотр архива распознанных номеров в режиме сканирования с отображением вектора направления движения на участке траектории.
Заключение
Основным преимуществом предложенного подхода является равномерность загрузки всех вычислительных ресурсов компьютерной системы со стороны программного комплекса. Это позволяет даже на компьютере среднего уровня параллельно использовать необходимые для офисной работы пользовательские программы, - например, приложения Microsoft Office, при этом средняя загрузка всех ядер ЦП приложением в процессе распознавания номеров ТС может достигать 80%.
Ключевыми особенностями описанного алгоритма, отличающими его от используемых подходов, являются: применение информационного графа в сочетании с конвейерной обработкой для эффективного разделения потоков выполнения и распределения вычислительных ресурсов в процессе преобразования данных; разделение процесса обработки данных на три уровня, позволяющих выполнять накопление информации для реализации алгоритмов слежения, повышения достоверности информации, вычисления параметров траектории движения ТС, а также возможность предоставления информации клиентам по заданным критериям.
Литература
1. Елизаров А.И., Афонасенко А.В. Методика построения систем распознавания автомобильного номера // Известия Томского политехнического университета. - 2006 - № 8. - С. 118-122
2. Обухов А.В., Ляшева С.А., Шлеймович М.П. Методы автоматического распознавания автомобильных номеров // Вестник Чувашского университета. - 2016 - № 3. - С. 201-207.
3. Артемьева И.Л., Тютюнник М.Б. Схемы распараллеливания вычислений для системы конфлюэнтных продукций // Информатика и системы управления. - 2005. - № 2(8). - С. 102112.
4. Ramamoorthy C.V. Pipeline Architecture // ACM Computing Surveys (CSUR). - 1977. - Vol. 9, № 1. - P. 61-102.
5. Krasner G.E., Pope S.T. A cookbook for using the model-view controller user interface paradigm in Smalltalk-80 // The Journal of Object Technology. - 1988. - Vol. 1, № 2. - P. 26-49.
6. Амосов О.С., Баена С.Г., Иванов Ю.С., Со Х. Система автоматического управления шлагбаумом с использованием технологий нечеткого вывода и компьютерного зрения // Интернет- журнал «Науковедение». 24.02.2017. URL: http://naukovedenie.ru/PDF/42TVN117.pdf(дата обращения: 28.07.19).
Размещено на Allbest.ru
...Подобные документы
Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.
дипломная работа [887,3 K], добавлен 26.11.2013Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.
презентация [469,2 K], добавлен 15.03.2015Особенности кластеризации социальных сетей, методы распознавания сообществ. Особенности локального прореживания графа. Разработка рекомендаций по выбору метода кластеризации для выделенных классов задач. Оптимизация процесса дальнейшей обработки данных.
курсовая работа [1,8 M], добавлен 30.06.2017Литературный обзор методов распознавания кромок для схожих задач. Объекты в приложении и их отображение. Генерация выходных данных. Алгоритм распознавания линии (графика), отличный от градиентных подходов и использующий алгоритм предварительной обработки.
дипломная работа [711,8 K], добавлен 27.04.2014Изучение особенностей информационного процесса обработки данных. Процессы, связанные с поиском, хранением, передачей, обработкой и использованием информации. Основные режимы обработки данных на ЭВМ. Организация обслуживания вычислительных задач.
реферат [130,9 K], добавлен 28.09.2014Требования и структура систем обработки экономической информации. Технология обработки информации и обслуживание системы, защита информации. Процесс создания запросов, форм, отчетов, макросов и модулей. Средства организации баз данных и работы с ними.
курсовая работа [2,7 M], добавлен 25.04.2012Создание программного продукта, предназначенного для автоматизированного учета гостиничных номеров, упрощения работы с базой данных, обеспечения быстрого поиска. Автоматизация резервирования номеров и регистрация постояльцев. Разработка экранных форм.
курсовая работа [1,8 M], добавлен 08.01.2014Выбор программных средст, основные требования. Разработка программного обеспечение для автоматизации учета использования и обслуживания транспортных средств. Инфологическая модель базы данных. Разработка SQL запросов, алгоритмов. Структура базы данных.
курсовая работа [1,0 M], добавлен 16.02.2015Программа как описание процесса обработки данных. Неконструктивность понятия правильной программы. Надежность программного средства. Технология программирования как технология разработки надежных программных средств. Интеллектуальные возможности.
курс лекций [168,3 K], добавлен 26.12.2008Изучение существующих методов и программного обеспечения для извлечения числовых данных из графической информации. Программное обеспечение "graphtrace", его структура и методы обработки данных. Использование этой системы для данных различного типа.
дипломная работа [3,9 M], добавлен 06.03.2013Периоды применения средств вычислительной техники. Переход к новому поколению электронно-вычислительных машин. Системы, основанные на знаниях. Экспертные системы и искусственный интеллект. Этапы обработки данных на ЭВМ. Иерархическая структура знания.
презентация [170,6 K], добавлен 14.08.2013Модели информационного процесса обработки данных. Классификация баз данных. Сеть архитектуры и технология клиент-сервер. Создание запросов к реляционным базам данных на SQL. Работа с электронными таблицами MS Excel: форматирование данных, вычисления.
контрольная работа [17,8 K], добавлен 17.01.2010Система компьютерной обработки данных для сбора, систематизации, статистической обработки, анализа результатов учебного процесса за четверть, полугодие, год. Модуль обработки данных о качестве обучения, итогов успеваемости и данных о движении учащихся.
реферат [22,5 K], добавлен 05.02.2011Обзор математических методов распознавания. Общая архитектура программы преобразования автомобильного номерного знака. Детальное описание алгоритмов: бинаризация изображения, удаление обрамления, сегментация символов и распознавание шаблонным методом.
курсовая работа [4,8 M], добавлен 22.06.2011Структура автомата для сбора данных. Программы, реализующие заданный пользователем алгоритм автоматизации процедуры обработки журнальных данных. Описание микропроцессорной системы, ее упрощенная модель, система команд, блок-схема алгоритма обработки.
контрольная работа [65,8 K], добавлен 14.11.2010Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.
курсовая работа [16,2 M], добавлен 21.06.2014Анализ существующих технологий создания web-приложений. Разработка сетевой технологии публикации и обработки информации о детях в детском саде №176 "Белочка" с помощью JSP-страниц и сервлетов с использованием JDBC-драйвера для доступа к базе данных.
курсовая работа [3,8 M], добавлен 18.12.2011Создание программного обеспечения автоматизированной информационной системы для учета и обработки метеорологической информации. Описание основных программных модулей. Требования к составу и параметрам технических средств, транспортированию и хранению.
дипломная работа [7,5 M], добавлен 16.08.2015Понятие баз данных, их место в сфере обработки информации. Разработка базы данных транспортных потоков для работы в геоинформационной системе ArcGis. Учет и анализ интенсивности движения на участках улично-дорожной сети на примере г. Ростова-на-Дону.
курсовая работа [4,0 M], добавлен 06.12.2012Термины "логический" и "физический" как отражение различия аспектов представления данных. Методы доступа к записям в файлах. Структура систем управления базами данных. Отличительные особенности обработки данных, характерные для файловых систем и СУБД.
лекция [169,7 K], добавлен 19.08.2013