Построение информативных признаков подвижных объектов для их распознавания в видеопотоке

Изучение необходимости автоматизирования существующих систем анализа видеопотока и уменьшение влияния человеческого фактора на работоспособность этих систем. Исследование возможностей алгоритмического формирования признаков в реальном масштабе времени.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 19.06.2018
Размер файла 533,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Построение информативных признаков подвижных объектов для их распознавания в видеопотоке

канд. техн. наук М.А. Анохин

Возможность более эффективного автоматизирования существующих систем анализа видеопотока и уменьшение влияния человеческого фактора на работоспособность этих систем требуют разработки новых методов описания и распознавания подвижных объектов в видеопотоке. Постоянно возрастающие вычислительные способности современных устройств позволяют разрабатывать системы способные в реальном времени анализировать события и объекты в видеопотоке [1]. Решающее значение приобретают параметры информационных признаков, описывающих объекты, в частности информативность признаков и их количество, а также возможность алгоритмического формирования признаков в реальном масштабе времени. видеопоток алгоритмический масштаб время

Анализ информативных характеристик видеопотока. В системах распознавания образов наиболее важной и проблемной задачей является выделение признаков. Тяжело добиться обобщения алгоритма системы распознавания при отсутствии необходимого количества корректных признаков, достаточного для классификации объектов [2]. Выбор признаков влияет на процесс построения алгоритма распознавания, а также на производительность всей системы и качество распознавания. Методы, описанные в литературе, в основном используют три типа информативных признаков при описании видеообъектов: цвет, текстура и форма.

Цвет - один из самых широко используемых признаков при распознавании объектов [3]. Такие признаки относительно устойчивы к зашумленному фону и не зависят от размера и положения изображения. В основном в качестве признаков используется гистограмма изображения. Статистически она показывает суммарную интенсивность трех цветовых каналов. Существуют кумулятивные методы, учитывающие разреженность гистограмм, а следовательно, уменьшающие чувствительность к шуму. Кроме гистограммы используется метод цветовых моментов для уменьшения эффекта дискретизации. Математически это основывается на том, что любое распределение цвета может быть охарактеризовано его моментами, а так как большая часть информации сосредоточена в моментах низшего порядка, то в качестве признаков используются только средняя величина , среднеквадратическое отклонение и коэффициент асимметрии. Если значение i-го цветового тона в j-м пикселе изображения есть , то для отсчетов цветового тона моменты можно рассчитать по следующим формулам [4]:

; ; (1)

Также существует метод цветовых наборов, который использует в качестве признаков выборки оттенков из цветового пространства после дискретизации.

Текстура не зависит от цвета или яркости и относится к признакам, обладающим свойством однородности [3]. Она содержит важную информацию о структурном расположении поверхности и о ее связи с окружающими элементами. В качестве признаков используются такие свойства текстур, как зернистость, контраст, направленность и перегруженность мелкими деталями [5].

Зернистость определяется средним количество максимумов в оригинальных изображениях и полученных после автокорреляции

(2)

Контраст определяется произведением среднего модуля градиента автокорреляционной функции , относительного числа точек с модулем больше некоторого порога и зернистости

(3)

Для определения направленности используются два параметра: направление и степень направленности . Направление - это градиент оригинального изображения или полученного после автокорреляции

(4)

Степень направленности рассчитывается исходя из количества точек, обладающих основным направлением:

(5)

Перегруженность мелкими деталями связана с зернистостью зависимостью

(6)

При использовании представления признака в виде формы возможно использование границ или области изображения [3]. Часто признаками являются границы изображения после преобразования Фурье, а также моменты распределения, рассчитанные по области изображения. В широком смысле признаками после преобразования Фурье являются коэффициенты, полученные после преобразования нормализации формы [6]:

(7)

Двумерное преобразование Фурье массива видеоданных дает новые информационные признаки - распределение яркости либо цветовых тонов по колебаниям различных пространственных частот, что позволяет осуществлять эффективную коррекцию и фильтрацию изображений [7]. Поэтому, несмотря на рассмотренное многообразие методов формирования информационных признаков, остановимся на их формировании по пространственным спектрам видеоизображений. Ортогонализация спектров позволяет выбрать во вторичном пространстве более информативные признаки при меньшем их количестве для описания объекта видеоизображения.

Формирование вторичных информативных признаков на базе пространственного спектра изображения. Перспективным на данный момент является использование вторичных информативных признаков, полученных путем ортогональных преобразований. Пространственный спектр изображения можно получить, если оно будет представлено в виде двумерной дискретной функции, значения которой определяют уровень серого для изображения в каждой точке [7]. Для этого необходимо рассчитать двумерное прямое дискретное преобразование Фурье изображения по формуле

(8)

Значения, полученные после преобразования, определяют амплитуды колебаний пространственных частот изображения. Пространственные частоты характеризуют периодические изменения уровня серого по горизонтали или вертикали и указывают количество синусоидальных компонентов яркости на единицу длины. Точки, расположенные вблизи начала координат Фурье-преобразования, соответствуют плавным изменениям яркости на изображении, а по мере удаления от центра расположены точки, описывающие резкие изменения яркости, такие как границы объектов или шум.

Изображение (а) и его Фурье-преобразование (б)

Модуль пространственного спектра изображения можно вычислить, воспользовавшись формулой

(9)

где , - действительная и мнимая часть .

С целью получения более эффективных признаков распознавания осуществляется переход во вторичное пространство путем ортогональных преобразований. Для этого значения спектра представляются в виде симметричной матрицы , которая имеет различные собственные значения . Каждому собственному значению ставится в соответствие собственный вектор [8], а каждый собственный вектор представляет собой одномерное собственное подпространство, называемое собственным направлением. Допустим - собственные векторы, нормированные условием

(10)

Составим матрицу , столбцами которой являются векторы :

(11)

тогда существует матрица , в которой векторы являются строками:

(12)

Вследствие ортогональности , как собственных векторов, соответствующих различным собственным значениям симметричной матрицы, получаем

(13)

т.е. - ортогональная матрица. Тогда действительно утверждение, что произведение матрицы спектральных коэффициентов и ортогональной матрицы имеет простую форму, когда столбцами матрицы-произведения будут векторы .

Далее, учитывая ортогональность векторов , получаем

(14)

На главной диагонали матрицы находятся собственные числа, а все остальные элементы равны нулю. Собственные числа (14) и векторы (11) могут быть использованы в качестве эффективных информативных признаков при распознавании объектов изображений в видеопотоке.

Список литературы

1. An introduction to video content analysis. Industry guide // British Security Industry Association. 2009. Issue 1. Form No. 262. P. 1_11.

2. Безрук В.М., Певцов Г.В. Теоретические основы проектирования систем распознавания сигналов для автоматизированного радиоконтроля. - Харьков: Коллегиум, 2007. - 430с.

3. Rui Y., Huang T. Image Retrieval: Current Techniques, Promising Directions, and Open Issues // Journal of Visual Communication and Image Representation. Issue 10. 1999. P. 39_62.

4. Sticker M., Orengo M. Similarity of Color Images // Storage and Retrieval for Image and Video Databases III. 1995. Volume 2420. P. 381-392.

5. Aarthy B., Tamilpavai G., Tamilselvi S. Multiple Representation of Perceptual Features for Texture Classification // International Conference in Recent trends in Computational Methods, Communication and Controls. Issue 1. 2012. P. 1-5.

6. Zhang D., Lu G. A Comparative Study on Shape Retrieval Using Fourier Descriptors with Different Shape Signatures // Journal of Visual Communication and Image Representation. Issue 14. 2003. P. 41_60.

7. Гонсалес Р., Вудс Р. Цифровая обработка изображений. - М. : Техносфера, 2005. - 1072с.

8. Беллман Р. Э. Введение в теорию матриц. - М. : Наука, 1969. - 368с.

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.