Способы параметризации движения в системах обработки мультимедийных данных
Описание методов, с помощью которых можно параметризировать движение в кадре, определять направление движения объектов в сцене и определять используемые при съемке кинематографические приемы. Пакеты компьютерного зрения с открытым исходным кодом.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 30.04.2018 |
Размер файла | 1,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
СПОСОБЫ ПАРАМЕТРИЗАЦИИ ДВИЖЕНИЯ В СИСТЕМАХ ОБРАБОТКИ МУЛЬТИМЕДИЙНЫХ ДАННЫХ
Вагнер А.В.1, Вагнер В.И.2, Тропченко А.А.3
1ORCID: 0000-0003-1757-3887, Студент, Университет ИТМО,
2ORCID: 0000-0001-5566-2421, Студент, Университет ИТМО,
3ORCID: 0000-0001-9812-7947, Доцент, Университет ИТМО
Аннотация
Предложены способы параметризации и классификации движения при анализе видеопоследовательностей на основе метода фазовой корреляции и анализе оптического потока. Описаны методы, с помощью которых можно параметризировать движение в кадре, определять направление движения объектов в сцене и определять используемые при съемке кинематографические приемы. Приведены результаты и анализ работы предложенных методов. Предложенные методы основаны на алгоритмах, которые можно найти в пакетах компьютерного зрения с открытым исходным кодом.
Ключевые слова: параметризация движения, оптический поток, компьютерное зрение, 4D.
движение кадр кинематографический компьютерный
The methods of parameterization and classification of motion for analysis of video sequences based on phase correlation method and analysis of optical flow are shown. Described the methods by which you can parameterize the movement in the frame, to determine the direction of movement of objects in the scene and determine the used cinematographic techniques. Shiwn results and analysis of the proposed methods. The proposed methods are based on algorithms that can be found in open source packages of computer vision.
Keywords: motion parameterization, optical flow, computer vision, 4D.
В последнее время заметна растущая популярность систем виртуальной реальности и глубокого погружения. Однако зачастую единственным источником информации является видеопоследовательность. Поэтому очень остро встает потребность в извлечении дополнительной информации из видео. Важной составляющей этой информации может стать информация о глобальном движении, перемещении объектов и определение кинематографических приемов.
Параметризировать видеопоследовательность предлагается по следующей схеме (рис 1.).
Рис. 1 - Алгоритм обработки видеопоследовательности модулем параметризации
На первом этапе получения извлекаются очередные кадры, причем желательно иметь настройку, какие по счету кадры обрабатывать (все, каждый второй, третий и т.д.). При кадровой частоте 30 кадров/сек рекомендуется обрабатывать каждый 5-10 кадр, чтобы различие между кадрами было достаточным и не избыточным для следующих шагов обработки.
На этапе преобразования цветового пространства происходит вычисление яркостной компоненты (Y) изображения кадра, которая может быть получена из трехкомпонентного (RGB) изображения следующим образом:
На следующем этапе происходит вычисление суммы абсолютных разностей (SAD) выбранных на первом этапе последовательных кадров. Данная метрика очень полезна для определения смены сцен в видеопоследовательности.
Далее применяется метод фазовых корреляций, основанный на представлении модуля преобразования Фурье в логарифмически-полярных координатах, что позволяет извлечь рассогласование кадров по углу, смещению и масштабу.
Далее идет вычисление и фильтрация оптического потока. В библиотеках компьютерного зрения с открытым исходным кодом можно найти реализации следующих методов вычисления оптического потока:
· Блочный метод (BM)
· Быстрый блочный метод (Fast BM)
· Пирамидальный метод Лукаса-Канаде (Lucas-Kanade) [1]
· Метод Фернебака (Farneback) [2]
· Метод Брокса (Brox) [3]
Было проведены сравнения данных методов (рис. 2), по результатам которых можно сказать, что методы Lucas-Kanade, BM, FastBM дают неудовлетворительные результаты на мелкозернистых текстурах. Метод Farneback нечувствителен к изменениям таких текстур. Для дальнейшей обработки предпочтительным является метод Brox, т.к. найденный этим методом оптический поток не «зашумлен» ошибочными векторами, векторное поле является «сглаженным и равномерным» и данный метод чувствителен ко слабым изменениям в мелкозернистых текстурах. Для устранения возможных векторов-выбросов рекомендуется провести медианную фильтрацию векторного поля оптического потока по длине векторов.
Далее следует этап расчета гистограмм векторов оптического потока. Полное поле векторов оптического потока имеет избыточную информацию, неудобную для анализа и хранения, поэтому было принято решение хранить информацию о векторном поле в массиве гистограмм.
Суть метода заключается в разбиении векторного поля на равные прямоугольные части и нахождении гистограмм количества векторов и их суммарной длины по диапазону направлений.
Рис. 2 - Сравнение результатов вычисления оптического потока. Исходные изображения (а). Результаты вычисления оптического потока методами: Lucas-Kanade (б), Fast BM (в), BM (г), Farneback (д), Brox (е)
Гистограммы состоят из столбцов, каждый из которых отражает количество или суммарную длину векторов, попавших в заданный диапазон значений направлений. Для удобства восприятия такие гистограммы показывают в виде векторов, исходящих из одной точки и имеющих направления, равные среднему значению диапазона направлений столбца и длины, пропорциональные столбцам.
Рис 3 - Пример представления гистограмм в виде векторов (б); поле, разбитое на 4 равные части (а)
Для более полного описания векторного поля на данном этапе рассчитывается пирамида гистограмм. Она представляет собой N массивов гистограмм, где N - количество уровней пирамиды. На каждом уровне векторное поле разбивается на n2 блоков, где n - номер уровня.
Гистограммы описывают общую картину движения в кадре, поэтому было принято решение использовать их для сравнения с гистограммами из заранее заданных наборов (шаблонов), для которых уже заданы направления изменения величин вертикального и горизонтального смещения.
Набор таких гистограмм был составлен для описания самых распространённых кинематографических приемов съемки, таких как наезд (Dolly) и отъезд (Track) камеры, вращение камеры вдоль горизонтальной оси (Panning left/right), вертикальной оси (Tilt up/down), вокруг продольной оси по и против часовой стрелки (Clockwise/Counter clockwise rotation).
Так как для пары кадров рассчитывается пирамида гистограмм, то в шаблонах можно задавать как один набор гистограмм (один уровень пирамиды), так и несколько (но для описания каждого из приведенных выше приемов использовалось только по одному набору гистограмм).
На следующем этапе происходит извлечение информации о движущихся объектах на основе оптического потока. Данный этап обработки состоит из нескольких последовательных шагов: пороговая фильтрация оптического потока, визуализация потока, выделение контуров, расчет параметров контуров. На первом шаге происходит пороговая фильтрация векторного поля по длине вектора.
Рис 4 - Шаблоны для кинематографических приемов съемки: а) наезд, б) отъезд, в, г) вращение вдоль гор. Оси, д) вращ. По часовой стрелке, е) вращение против часовой стрелки, ж, з) вращение вдоль вертикальной оси
На этапе визуализации оптического потока происходит представление векторного поля в цветовом пространстве[4]. Векторное поле представляется в виде цветного изображения, каждый пиксел которого обозначает вектор потока, где ориентация и величина вектора представлены в виде оттенка и насыщенности цвета пиксела.
На следующем этапе происходит поиск контуров (например, детектор границ Кенни [5]). Во время расчета параметров контуров вычисляются наиболее важные характеристики, например, количество точек внутри контура, площадь, периметр, центр масс.
После обработки каждой пары кадров результаты метода фазовой корреляции, нахождения гистограмм, параметров контуров записываются в файл для последующей обработки.
Для оценки работы предложенного способа были проанализированы результаты обработки более 1500 пар кадров. При анализе результатов параметризации глобального движения методом фазовых корреляций были получены следующие результаты погрешностей (смещение находилось пределах 10% от размера исходного изображения, значение угла поворота может изменяться в пределах ±30°, масштаба - в пределах 20%.): погрешность смещения - 0,2%, погрешность угла поворота - 3,1%, погрешность величины масштабирования - 4,3%.
Таблица 1 - Оценка определения кинематографических приемов методом анализа гистограмм оптического потока
Использование пирамиды гистограмм оптического потока подходит для сопоставления с заранее заданными шаблонами (сопоставление проводилось путем вычисления коэффициента пересечения гистограмм (Таблица 1). А метод параметризации движения объектов показывает приемлемые результаты при отсутствии глобального движения в кадре или при движении объектов в противоположных направлениях глобальному движению.
Список литературы / References
1. Jean-Yves Bouguet. Pyramidal Implementation of the Lucas Kanade Feature Tracker Description of the algorithm / J. Bouguet // Intel Corporation, Microprocessor Research Labs -- 2000
2. Gunnar Farneback. Two-Frame Motion Estimation Based on Polynomial Expansion / G. Farnebдck // 13th Scandinavian Conference -- Sweden --2002 -- p.363-370
3. Thomas Brox, Andres Bruhn, Nils Papenberg. High Accuracy Optical Flow Estimation Based on a Theory for Warping / T. Brox, A. Bruhn, N. Papenberg // European Conference on Computer Vision (ECCV) -- Czech Republic -- 2004 --3024 -- p.25-36
4. Ce Liu, Jenny Yuen, Antonio Torralba. SIFT Flow: Dense Correspondence across Scenes and its Applications / Liu, J. Yuen, A. Torralba // IEEE Transactions on Pattern Analysis and Machine Intelligence -- 2010 -- Vol. 33(5) -- p.4
5. Canny, J. A Computational Approach to Edge Detection / J. Canny // IEEE Transactions on pattern analysis and machine intelligence -- 1986 -- 6 -- p. 679.
Размещено на Allbest.ru
...Подобные документы
OpenCV – библиотека компьютерного зрения с открытым исходным кодом, предоставляющая набор типов данных, функций и численных алгоритмов для обработки изображений. Ее реализация на C/C++. Цели использования технологии. Основные модули библиотек 1-3.
презентация [121,8 K], добавлен 14.12.2013Задачи компьютерного зрения. Анализ, разработка и реализация алгоритмов поиска и определения движения объекта, его свойств и характеристик. Алгоритмы поиска и обработки найденных областей движения. Метод коррекции. Нахождение объекта по цветовому диапазон
статья [2,5 M], добавлен 29.09.2008Бесплатная среда разработки программного обеспечения с открытым исходным кодом для компилятора Free Pascal. Почему Lazarus такой популярный. Корректность введенных данных. Использование основных методов визуализации в среде программирования Lazarus.
курсовая работа [695,5 K], добавлен 19.04.2013Система управления базами данных как программное обеспечение, с помощью которого пользователи могут определять, создавать и поддерживать базу данных, осуществлять к ней контролируемый доступ. Методика ее создания в программе IBExpert, функциональность.
курсовая работа [1004,6 K], добавлен 11.11.2014Характеристика движения тела, брошенного под углом к горизонту, с точки зрения криволинейного движения. Пути разработки программы, реализующей модель движения тела. Основные требования к программному обеспечению, сообщения и тестирование системы.
курсовая работа [861,5 K], добавлен 17.03.2011Разработка базы данных, позволяющей определять месторасположение на полке и код товаров в магазинных складах, количество и качество товаров. Концепция баз данных. Модели данных, описание данных проектирования. Разработка программного приложения.
курсовая работа [1,1 M], добавлен 13.06.2014Разработка модели движения трёх видов судов: надводного корабля "Красный Кавказ", катера "Тритон" и корабля на подводных крыльях. Написание программной модели в среде Matlab и исследование с ее помощью динамических свойств моделируемых объектов.
курсовая работа [590,5 K], добавлен 08.03.2012Описание движения документов внутри организации. Описание входящих, исходящих, внешних и внутренних документов. Моделирование предметной области, первичные ключи. Описание сущностей, атрибутов, связей и доменов. Хранение, извлечение и обновление данных.
дипломная работа [1,3 M], добавлен 01.05.2015Разработка автоматизированной системы реализации модели движения тела переменной массы на примере движения одноступенчатой ракеты, расчет времени и скорости полета. Описание формы загрузки программы. Требование к программному и техническому обеспечению.
курсовая работа [255,0 K], добавлен 18.03.2012Сферы применения и возможности WordPress - CMS с открытым исходным кодом, распространяемой под GNU GPL. Уязвимости WordPress в плагинах Emaily, FeedList, WP Auctions и Old Post Spinner. Межсайтовый скриптинг WordPress в плагине Page Flip Image Gallery.
реферат [4,1 M], добавлен 12.07.2012Исследование процесса разработки базы данных, позволяющей определять состояние кафедр и факультетов Дагестанского государственного технического университета. Характеристика иерархической, сетевой, реляционной, даталогической и физической моделей данных.
курсовая работа [156,7 K], добавлен 08.02.2012Разработка математической модели и создание программного средства для составления маршрута движения детали по участкам механической обработки механосборочного цеха. Структура и алгоритм работы программного продукта. Программные средства разработки.
курсовая работа [65,4 K], добавлен 21.11.2013Фрагментарная обработка больших объектов в мультимедийных базах данных (прямой доступ к отдельным фрагментам хранимого объекта). Двухуровневое разбиение полей большого размера. Древовидное представление данных. Части объекта, определяемые поддеревом.
презентация [93,4 K], добавлен 11.10.2013Построение математической модели движения заряженных частиц, реализация на алгоритмическом языке с помощью ЭВМ. Описание предметной области. Имитация взаимодействия двух разноименно заряженных частиц. Результаты работы программы, руководство пользователя.
курсовая работа [824,0 K], добавлен 26.02.2015Проектирование и реализация мобильной версии приложения учета и движения товаров на базе платформы Android и языка программирования Java. Создание таблиц базы данных. Взаимодействие объектов и экранные формы. Способы идентификации классов анализа.
дипломная работа [1,8 M], добавлен 01.09.2016Понятие и ключевое отличие распределенной разработки программного обеспечения, его достоинства и недостатки. Концептуальное решение и выбор типа разработки. Особенности программного обеспечения с открытым исходным кодом. Идея и развитие Open Source.
курсовая работа [97,7 K], добавлен 14.12.2012Разработка базы данных "Учет движения товара в магазине", ее основные функции. Разработка инфологической, концептуальной и физической моделей, предметная область. Определение объектов и связей между объектами. Структура программного обеспечения.
курсовая работа [1023,7 K], добавлен 05.12.2012PHP (Hypertext Preprocessor) - технология с открытым кодом, позволяющая использовать скриптинг в документах, его специфические функции и методы. Использование базы данных в PHP: авторизация доступа, механизм сессии; форма сбора данных и запись в БД MySQL.
контрольная работа [1,3 M], добавлен 11.06.2013Разработка программного продукта "Железная дорога". Вид и классификация инструментальных средств, используемых для создания прикладного ПО. Организация взаимодействия клиентской программы с базой данных; реализация системы контроля движения поездов.
курсовая работа [895,0 K], добавлен 11.11.2010Требование к структуре данных в базе, описание ее вида, содержание объектов. Используемые форматы данных. Алгоритмы и их особенности. Функциональное описание разработки. Описание пользовательского интерфейса. Контрольные примеры, временные характеристики.
курсовая работа [1,5 M], добавлен 06.04.2016