Система наблюдения и распознавания личностей в видеопотоке

Построение системы идентификации и верификации лиц на основе видео с возможностью ее оперативного введения в эксплуатацию и масштабирования. Разработка алгоритмов идентифицирования и выделения изображений. Анализ результатов тестового запуска программы.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 17.11.2020
Размер файла 598,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

Санкт-Петербургский государственный университет

Система наблюдения и распознавания личностей в видеопотоке

Ахматов И., Кондратов И.В.

Аннотация

В работе рассматривались практические аспекты построения систем идентификации и верификации лиц в видеопотоке.

Практическая часть представляет собой прототип системы наблюдения и распознавания лиц в видеопотоке, с возможностью его оперативного введения в эксплуатацию и масштабирования. Для ее реализации были использованы передовые (так называемые “state of the art”) алгоритмы машинного обучения, а для создания необходимой инфраструктуры прототипа - способные к масштабированию и распределенным вычислениям средства контейнеризации и хранения данных.

Ключевые слова: распознавание, наблюдение, видеопоток, сверточная нейронная сеть.

Abstract

Videostream surveillance and face recognition system

Akhmatov I., Kondratov I. V.,Saint Petersburg State University,

The article looks into the practical aspects of developing a system of face identification and verification in a videostream. The practical part of this paper is made up of the pilot surveillance system capable of videostream face recognition, and the possibilities of scaling and putting it in operation quickly. For its implementation, advanced (so-termed “state of the art”) machine-learning algorithms were used; and for the creation of the necessary pilot framework, the authors used containerization and data storage tools capable of scaling and grid computing.

Keywords: recognition, surveillance, videostream, convolutional neural net.

Введение

Контроль доступа к режимным объектам, средствам производства, ресурсам и информации - важнейшая для обеспечения безопасности задача. С развитием науки и техники, широкое распространение получили биометрические системы аутентификации. Появившиеся в середине 60-х годов, первые образцы представляли собой сканеры отпечатков пальцев; параллельно с их введением началась разработка систем идентификации по геометрии ладони, почерку, термограмме лица [1]. Сейчас же популярными являются методы с использованием голоса как средства подтверждения личности, зачастую применяемые в банковской сфере как дополнительное средство авторизации при телефонном звонке в банк. Метод основывается на анализе комбинации таких факторов как тембр, тон, интонация.

Прогресс в области разработки нейронных сетей позволил вывести биометрические системы аутентификации на новый уровень - использование deep learning моделей помогло повысить точность и скорость распознавания личности как с точки зрения анализа голоса, так и лица, позволяя разворачивать такие системы с меньшими затратами ресурсов [2]. С точки зрения обеспечения безопасности населения в местах массового скопления людей проблема распознавания лиц и определения личности становится жизненно важной в современном мире. В рамках данной проблемы возникает задача идентификации человека не по статическому изображению, но в видеопотоке, где может присутствовать множество людей и качество данных может быть далеким от идеала. Подобные системы уже показали свою эффективность при контроле карантинного режима в Китае [3]. Результатом проделанной работы стал прототип полноценной системы идентификации лиц на основе видео, готовый к введению в эксплуатацию и совместимый с популярными серверными решениями.

Основная часть

Для реализации была выбрана архитектура ResNET. Это было сделано в силу нескольких причин:

· Данная сеть хорошо зарекомендовала себя в идентификации и верификации лиц, что показано в предыдущем разделе

· Обилие документации и примеров использования в исследовательских и коммерческих проектах

· Легко реализуемая масштабируемость в силу использования быстрых соединений, позволяющих информации пропускать некоторые слои

· ResNET имеет реализацию на трех основных фреймворках, применяемых в машинном обучении - TensorFlow, PyTorch и Caffe

ResNET вводит понятие быстрых соединений [4] - способа пропуска слоёв нейронной сети, что помогает бороться с проблемой затухающего градиента. Обычно используют пропуски одного, двух или трех слоёв. Использование дополнительной матрицы весов для пропуска применяют в вариации данной сети под названием HighwayNet.

При реализации практической части работы использовалась версия архитектуры нейронной сети ResNet-50. Наличие быстрых соединений позволяет снизить добиться более оптимальной производительности при достаточно большом числе слоев. Помимо этого, ResNet-50 и всё семейство ResNet в целом хорошо показали себя при работе на различных наборах данных с точки зрения как точности, так и производительности, что показано в работах [5], [6]. Для выделения области нахождения лица по интенсивности пикселей изображения на переведенном в черно-белый формат изображения, применяется классификатор вместе с методом HOG (Histogram of Oriented Gradients) [7]. Алгоритм строит на изображении сеть из ячеек фиксированного размера, для каждой из которых подсчитывается градиент, указывающий направление уменьшения интенсивности между ячейками (от более темных к более светлым). Путем вариации интенсивности алгоритм пытается достичь дискретизации областей освещенности, чтобы небольшие изменения интенсивности оказывали меньшее воздействие на значение градиента. Потом полученные карты изображения классифицируются, тем самым получая местоположение лица на кадре. В приложении используется комбинация из 5 перетренированных HOG-фильтров [8], [9], каждый из них для разной ориентации лица: спереди, слева, справа, а также спереди с поворотом влево и вправо. Это позволяет детектировать лица с различных ракурсов, тем самым повышая точность кодировок, подающихся на вход нейросети. В процессе работы программы дополнительно применяется алгоритм ShapePredictor-68 Landmarks для определения положения лица в пространстве, основанный на ансамбле алгоритмов машинного обучения, а именно деревьев решений. Данный подход, наряду с нейронными сетями широко применяется для предсказания позиции лица в пространстве.

Идея использования ансамблей заключается в том, что большое число достаточно “слабых” моделей, при усреднении их предсказаний дают весьма точный результат, что и было продемонстрировано в работе [10]. Определение положения лица в пространстве является важным шагом для идентифицирования личности по изображению, этот вопрос освещается в статье [6], где на наборе данных VGGFace2 показано, как различается точность при различном положении лица в кадре: профиль, анфас и 3/4. Весь алгоритм работы системы можно разделить на пять основных шагов:

· Инициализация

· Загрузка данных

· Подготовка к обработке

· Обработка

· Показ результатов

· Завершение работы

Рис. 1 - Инициализация, загрузка данных и подготовка к обработке

Рис. 2 - Процесс инициализации приложения

Рис. 3 - Инициализация, загрузка данных и подготовка к обработке

На рисунках, представленных ниже, основные этапы обозначены различными цветами: белый, оранжевый, зеленый, фиолетовый, желтый, серый соответственно. видео верификация изображение программа

На рисунке 1 представлен алгоритм запуска приложения из командной строки и первичная загрузка данных и сам процесс обработки.

На рисунке 2 представлен алгоритм идентифицирования лиц, а на рисунке 3 - алгоритм их выделения из видео.

Результаты тестового запуска программы представлены в таблице 1.

Таблица 1 - Скорость обработки видеозаписи на различных устройствах

Видеозапись 1, кадр/с

Видеозапись 2, кадр/с

Устройство 1

11.74

10.31

Устройство 2

9.33

8.394

Приложение было запущено на двух различных устройствах.

Устройство 1 представляет собой среднестатистический ноутбук с характеристиками:

процессор: Intel Core i5-7267U, 3.1 ГГц, двухъядерный, кэш 4 мегабайта;

видеокарта: Intel Iris Plus Graphics 650;

оперативная память: 8 гигабайт LPDDR3 с частотой 2.13 МГц.

Устройство 2 представляет собой стационарный компьютер:

процессор: Intel Core i7-8700B, 3.2 ГГц, шестиядерный, кэш 12 мегабайт;

видеокарта: Intel UHD Graphics 630;

оперативная память: 32 гигабайта DDR4 с частотой 2.6 МГц.

Видеозапись 1 длится 1 минуту 20 секунд, содержит 2356 кадров и имеет разрешение 800 Ч 600 Видеозапись 2 длится 44 секунды, содержит 1321 кадр и имеет разрешение 800 Ч 600.

Матрица неточностей (рисунок 4), полученная при обработке 1000 случайно выбранных изображения из набора данных VGGFace2 таким образом, что 90% изображений содержат лица, а оставшаяся часть - нет.

Рис. 4 - Матрица неточностей

Были получены следующие показатели: точность - 0,987000; полнота - 0,9871357; F-мера - 0,987067. Результат оценивался по нескольким показателям:

· Точность - отношение количества изображений, истинно принадлежащих классу к размеру всей выборки

· Полнота системы - доля найденных классификатором изображений, принадлежащих к классу относительно всех изображений этого класса в тестовой выборке

Заключение

На основе анализа предметной области был сделан выбор в пользу наиболее подходящих с практической точки зрения инструментов. Была реализована полноценная система слежения и идентификации лиц в видеопотоке с применением зарекомендовавших себя практик при создании приложений.

Построенная система выполняет свою задачу, а также обладает потенциалом к быстрому развертыванию на большинстве широко используемых систем и масштабированию.

Список литературы / References

1. Mayhew S. History of Biometrics // 2020, [El. Res.] URL: https://biometricupdate.com/ 201802/ history-of-biometrics-2 (ac.: 16.07.2020)

2. Sundararajan K. Deep Learning for Biometrics: A Survey / K. Sundararajan, Woodard K. Damon. // ACM Computing Surveys (51), 2018, pp. 1-34.

3. Jakhar P. Coronavirus: China's tech fights back / P. Jakhar // BBC Monitoring 2020, [El. Res.] URL: https://bbc.com/news/technology-51717164 (accessed: 16.07.2020)

4. He K. Identity Mappings in Deep Residual Networks / He, K., Zhang, X., Ren, S., Sun, J. // ArXiv, 2016, abs/1603.05027.

5. Shepley A.J. Deep Learning For Face Recognition: A Critical Analysis / A.J. Shepley // ArXiv, 2019, abs/1907.12739.

6. Wang Q. Benchmarking deep learning tech. for face recognition / Q. Wang, G. Guo // Journal of Visual Communic. and Image Represent., Vol. 65, 2019.

7. Jia Y. Caffe: Convolutional Architecture for Fast Feature Embedding / Jia Y. et al. // ArXiv, 2014, abs/1408.5093.

8. Cai Lei,. HOG-assisted deep feature learning for pedestrian gender recognition / Cai, Lei, Jianqing Zhu, Huanqiang Zeng, Jing Chen, Canhui Cai and Kai-Kuang Ma. // J. Frankl. Inst. 355 (2018): 1991-2008.

9. Wang Xiaoyu An HOG-LBP human detector with partial occlusion handling / Wang, Xiaoyu, Tony X. Han and Shuicheng Yan. 2009 IEEE 12th International Conference on Computer Vision (2009): 32-39.

10. Kazemi, V. One millisecond face alignment with an ensemble of regression trees. One millisecond face alignment with an ensemble of regression trees / V. Kazemi, J. Sullivan // IEEE Conference on Computer Vision and Pattern Recognition, 2014, 1867- 1874.

Размещено на Allbest.ru

...

Подобные документы

  • Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.

    дипломная работа [887,3 K], добавлен 26.11.2013

  • Анализ существующих методов масштабирования изображений. Повышение скорости обработки и изменения картинок. Алгоритм масштабирования с использованием параллелизма. Отбор пикселей для правильного расчета градиента. Выбор метода интерполяции изображения.

    курсовая работа [5,8 M], добавлен 17.06.2017

  • Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

    дипломная работа [1,8 M], добавлен 08.02.2017

  • Обзор основных алгоритмов и методов распознавания лиц. Архитектура средств динамического отслеживания лиц в видеопоследовательности. Результаты тестирования на больших объемах видеоданных. Разработка алгоритмов и методов динамического отслеживания лиц.

    дипломная работа [5,9 M], добавлен 20.07.2014

  • Обзор существующего программного обеспечения для автоматизации выделения границ на изображении. Разработка математической модели обработки изображений и выделения контуров в оттенках серого и программного обеспечения для алгоритмов обработки изображений.

    дипломная работа [1,7 M], добавлен 27.03.2013

  • Методы предобработки изображений текстовых символов. Статистические распределения точек. Интегральные преобразования и структурный анализ. Реализация алгоритма распознавания букв. Анализ алгоритмов оптического распознавания символов. Сравнение с эталоном.

    курсовая работа [2,1 M], добавлен 20.09.2014

  • Анализ системы получения изображений микропрепарата Атлант-микро. Разработка модели, алгоритмов совмещения фрагментов. Разработка пользовательского интерфейса системы. Оценка качества совмещения фрагментов алгоритмом с бинаризацией на основе гистограмм.

    дипломная работа [8,0 M], добавлен 23.09.2012

  • Разработка алгоритма формирования относительных параметров для минюций. Подбор параметров системы допусков и критериев схожести при сравнении отпечатков. Метод пригоден для распознавания битовых изображений: символьной информации, шрифтов и подписей.

    дипломная работа [4,0 M], добавлен 23.06.2008

  • Исследование структуры типовой вычислительной сети. Модель процесса вскрытия вычислительной сети и взаимосвязь основных его этапов. Конфликт в информационной сфере между субъектом и объектом познания. Описания алгоритмов динамического масштабирования.

    дипломная работа [2,9 M], добавлен 21.12.2012

  • Основные цели и задачи построения систем распознавания. Построение математической модели системы распознавания образов на примере алгоритма идентификации объектов военной техники в автоматизированных телекоммуникационных комплексах систем управления.

    дипломная работа [332,2 K], добавлен 30.11.2012

  • Трехмерное моделирование: улучшение алгоритмов рендеринга и просчета трехмерных изображений. Обоснование выбора алгоритмов. Выбор языка программирования и среды разработки. Структура данных и программного комплекса. Системные требования для работы.

    курсовая работа [263,8 K], добавлен 24.06.2009

  • Обработка изображений на современных вычислительных устройствах. Устройство и представление различных форматов изображений. Исследование алгоритмов обработки изображений на базе различных архитектур. Сжатие изображений на основе сверточных нейросетей.

    дипломная работа [6,1 M], добавлен 03.06.2022

  • Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.

    презентация [469,2 K], добавлен 15.03.2015

  • Анализ физических предпосылок селекции движущихся малоразмерных наземных целей по спектральным параметрам. Разработка алгоритмов обнаружения МНЦ и повышения эффективности их распознавания в интересах радиолокационных станций разведки и целеуказания.

    дипломная работа [830,3 K], добавлен 28.04.2009

  • Подсистема анализа изображения отпечатка пальца в составе системы идентификации личности по отпечаткам пальцев на основе папиллярного узора для дальнейшего распознавания личности. Характеристика функциональных возможностей системы и код програмы.

    дипломная работа [3,1 M], добавлен 01.07.2008

  • Обзор математических методов распознавания. Общая архитектура программы преобразования автомобильного номерного знака. Детальное описание алгоритмов: бинаризация изображения, удаление обрамления, сегментация символов и распознавание шаблонным методом.

    курсовая работа [4,8 M], добавлен 22.06.2011

  • Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.

    курсовая работа [16,2 M], добавлен 21.06.2014

  • Положения алгоритмов сжатия изображений. Классы приложений и изображений, критерии сравнения алгоритмов. Проблемы алгоритмов архивации с потерями. Конвейер операций, используемый в алгоритме JPEG. Характеристика фрактального и рекурсивного алгоритмов.

    реферат [242,9 K], добавлен 24.04.2015

  • Принципы разработки алгоритмов и программ на основе процедурного подхода и на основе объектно-ориентированного подхода. Реализация программы Borland Pascal 7.0, ее интерфейс. Разработка простой программы в среде визуального программирования Delphi.

    отчет по практике [934,7 K], добавлен 25.03.2012

  • Оптическое распознавание символов как механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов. Компьютерные программы для оптического распознавания символов и их характеристика.

    презентация [855,2 K], добавлен 20.12.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.