Определение движения в видеопотоке
Видеопоток как цифровое видео множество технологий записи, обработки, хранения и воспроизведения визуального или аудиовизуального материала в цифровом представлении. Разработка программного обеспечения, способного определить движения в видеопотоке.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 09.10.2015 |
Размер файла | 1,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
«Омский государственный технический университет»
Кафедра «Автоматизированные системы обработки информации и управления»
Курсовой проект
на тему «Определение движения в видеопотоке»
по дисциплине «Информатика»
Выполнил:
студент группы ИВТ-340
В.М. Тюшин
Преподаватель:
Е.Р. Васильев
Омск - 2012
Содержание
- Введение
- 1. Постановка задачи курсового проектирования
- 2. Теоретический анализ
- 3. Описание алгоритмов
- 4. Описание разработанной системы
- 5. Результаты тестирования
- Заключение
- Список использованных источников
Введение
Целью данного курсового проекта по дисциплине «Информатика» является разработка программного обеспечения, способного определить движения в видео потоке. видеопоток цифровой программный
Задача распознавания движения имеет широкое применение в системах слежения, и. т. д.
1. Постановка задачи курсового проектирования
Для достижения поставленной задачи необходимо написать приложение, для распознавания движения.
Приложение должно выполнять следующие функции:
1. Получение видеопотока (с веб камеры)
2. Распознание в нем движения
Научиться работать с видеопотоком (вебкамера), распознать в нем движение (наличие движения)
2. Теоретический анализ
В данном курсовом проекте движение будет определяться через сравнение двух кадров. Для того, что бы ускорить сравнение кадров, изображение дробится на блоки (размер блоков определяет пользователь), из каждого блока берется несколько пикселей для анализа. Значения цвета выбранных пикселей складываются и присваивается блоку из которого были взяты пиксели, при сравнении разности значений для соответствующих блоков текущего и предыдущего изображения с пороговым значением (так же может определяться пользователем) будет сделан вывод о наличии движение в данном блоке.
3. Описание алгоритмов
Видеопоток.
Видеопоток получаем с камеры в виде картинок получаемых в данный момент времени.
Анализ.
Для анализа поступают два изображения предыдущий кадр, и текущий кадр. Изображения дробятся на блоки, в соответствии с выбранным размером блока, и для них считаются значения по цвету. Далее вычисляется разности для каждого блока (для текущего изображения и предыдущего). Значения разностей сравниваются с выбранным пороговым значением, и на основе этого определяется наличие движения в кадре.
Получение результатов.
На текущее изображение наносится штриховка на те блоки где было детектировано движение и выводится на экран.
4. Описание разработанной системы
Приложение написано на языке C#.
Изначально приложение записывает человеческий голос в формате Wave. Для записи использовалась библиотека NAudio.
Для конвертирования звука из формата Wave во FLAC использовалась библиотекой Cuetools .
Однако на файлы с высокой частотой дискретизации (44100) Google реагирует ошибкой 400. Необходимо использовать 8 и 16 кГц.
Далее производится запрос к сервису:
http://www.google.com/speech-api/v1/recognize?lang=ru&client=chromium
И десериализация JSON-ответа через DataContractJsonSerializer, результаты всегда приходят в виде:
{"status":0,"id":"4531050901df65542082eacfebf3bb1b-1","hypotheses":[{"utterance":"открыть новая папка", "confidence": 0.89697623}]}.
Извлекаем фразу и отправляем в класс обработки сообщений Action.
Класс разбивает фразу по словам, строит дерево и выполняет команду Windows.
Команды выполняются с помощью библиотеки user32.dll.
Разработанная система способна записывать человеческий голос на русском языке и выполнять команды диктора.
Приложение выполняет такое команды как:
1. Мой компьютер
2. Назад
3. Вперед
4. Открыть (имя папки с рабочего стола)
5. Закрыть (текущее окно)
6. Свернуть (текущее окно)
7. Развернуть (текущее окно)
5. Результаты тестирования
На рисунке 1 представлен интерфейс разработанной системы.
Рисунок 1 - Окно приложения
Запись команды начнется при нажатии кнопки Start до последующего нажатия.
После получения данных с сервиса Google в верхнем окне появляется произнесенная фраза. Нижнее окно отображает текущее окно Windows, на котором сфокусировано дано е приложение.
Командами “назад” и “вперед” пользователь может переключаться между окнами. Команды “закрыть” “открыть” “свернуть” “развернуть” применяются к текущему окну (отображенному в нижнем окне).
Например, выполнив команду “назад”, приложение сменит окно фокусировки (рис. 2)
Рисунок 2 - Выполнение команды
Заключение
В результате выполнения курсового проекта по дисциплине «Информатика» разработано программное обеспечение, способное управлять операционной системой Windows русским голосом при помощи Google Speech API.
Были изучены принципы работы с операционной системой Windows. Изучена технология Google Speech Application Programming Interface (SAPI), предназначенная для распознавания и синтеза речи.
В итоге получено приложение, написанное на языке высокого уровня C#. Данная программа лишь демонстрирует использование Google Speech API для выполнения некоторых команд на компьютере.
Список использованных источников
1. Свободная энциклопедия Википедия [Электронный ресурс] / Microsoft Speech API . - 2012 - Режим доступа: http://ru.wikipedia.org/wiki/Microsoft_Speech_API, свободный. -- Загл. с экрана.-- Яз. рус.
2. Хабрхабр: [Электронный ресурс]. ТМ., 2007-2012. URL:http://habrahabr.ru/. (Дата обращения: 9.01.2013).
Размещено на Allbest.ru
...Подобные документы
Искусственная нейронная сеть - математическая модель, представляющая собой систему соединённых, взаимодействующих между собой нейронов. Методы детектирования движения в видеопотоке. Обзор инструментальных средств для разработки программного продукта.
дипломная работа [2,0 M], добавлен 06.06.2017Обзор рекламного ролика Vodafone "Bubbles". Слежение за точками и плоскостью в двухмерном трекинге. Трехмерный трекинг: захват движения и системы, основанные на принципе фотограмметрии. Методика создания ролика в условиях малобюджетной видео-студии.
дипломная работа [8,6 M], добавлен 25.01.2012Movie Maker - простой в освоении и достаточно мощный редактор для обработки цифрового видео, лучшая программа для начинающих пользователей. Описание работы с программой, формат записи, монтаж фильма, наложение звука, видеоэффекты, название и титры.
реферат [36,1 K], добавлен 01.05.2010Разработка математической модели и создание программного средства для составления маршрута движения детали по участкам механической обработки механосборочного цеха. Структура и алгоритм работы программного продукта. Программные средства разработки.
курсовая работа [65,4 K], добавлен 21.11.2013Разработка базы данных "Учет движения товара в магазине", ее основные функции. Разработка инфологической, концептуальной и физической моделей, предметная область. Определение объектов и связей между объектами. Структура программного обеспечения.
курсовая работа [1023,7 K], добавлен 05.12.2012Разработка программного продукта для обеспечения стабильной работы заведующего складом Барановичского хлебозавода, обеспечивающего хранение и обработку информации складского учета, поиск объекта технических ресурсов, анализ и мониторинг его движения.
дипломная работа [2,5 M], добавлен 06.06.2012Процесс выбора технологий и инструментальных средств. Анализ требований и построения спецификаций создаваемого программного обеспечения. Контекстная и детализированная диаграмма "AS-IS". Разработка алгоритмов и структур данных для хранения информации.
курсовая работа [3,3 M], добавлен 04.06.2014Характерные особенности мультимедиа-технологий и их возможности. Применение мультимедиа-технологий в обучении. Объединение многокомпонентной информационной среды в однородном цифровом представлении, долговечное хранение и простота переработки информации.
курсовая работа [77,8 K], добавлен 15.07.2012Системы управления базами данных и их использование для решения задач автоматизации предприятия. Разработка информационного и программного обеспечения для автоматизации хранения и обработки информации при организации работы агропромышленного предприятия.
курсовая работа [607,1 K], добавлен 07.05.2011Основные понятия цифрового фото и видео. Достоинства и недостатки графических редакторов. Анализ школьных учебников по информатике по изучению работы с цифровым фото и видео. Анализ методических разработок. Планирование кружка "Компьютерная графика".
курсовая работа [52,1 K], добавлен 16.07.2013Анализ существующих алгоритмов фильтрации и сегментации изображений. Разработка алгоритмов обработки видеопотока на основе выделенных быстрых методов. Реализация принимающей части цепочки сервер-клиент, получающую видеопоток с мобильного устройства.
дипломная работа [337,5 K], добавлен 24.01.2016Определение вращательного движения твердого тела в среде системы MathCAD. Математическая модель объекта или процесса. Алгоритм решения задачи. Составление текста программы в среде Delphi. Таблица идентификаторов. Разработка программного приложения.
курсовая работа [547,4 K], добавлен 25.03.2015Выбор принципов проектирования устройства записи, хранения и передачи чисел. Разработка алгоритма выполнения операций, необходимых для обработки информации. Структурная схема устройства. Элементарная база, необходимая для разработки принципиальной схемы.
курсовая работа [1,3 M], добавлен 16.08.2012Разработка программы на платформе Microsoft Vusial С#, реализующая ряд задач: реализация движения 3D-модели и освещения сцены, изменение вида камеры с третьего на первый и обратно при помощи клавиатуры, запись работы с моделью в видео файл фомата *.avi.
курсовая работа [407,9 K], добавлен 07.07.2012Анализ программного обеспечения для работы с видео. Adobe After effects. Cinema 4D. Fusion. Nuke. Motion. Появление рекламы в Америке. Развитие видеорекламы. Разработка видеозаставки. Техническое задание заказчика. Цветовая схема. Анимация логотипа.
дипломная работа [1,6 M], добавлен 03.05.2018Понятие визуальной системы ввода информации, ее сущность и особенности, место и роль в современном развитии интерфейсов между человеком и компьютером. Развитие технологии автоматического обнаружения и распознавания лица, контуров губ в видеопотоке.
научная работа [94,3 K], добавлен 29.01.2009Обзор существующего программного обеспечения для автоматизации выделения границ на изображении. Разработка математической модели обработки изображений и выделения контуров в оттенках серого и программного обеспечения для алгоритмов обработки изображений.
дипломная работа [1,7 M], добавлен 27.03.2013Разработка интерфейса справочно-расчетного программного обеспечения. Расчетно-графический модуль. Решение задачи динамического моделирования в системе MATLAB/Simulink. Программная реализация, результаты моделирования системы на текстовых примерах.
курсовая работа [2,6 M], добавлен 01.12.2014Задачи компьютерного зрения. Анализ, разработка и реализация алгоритмов поиска и определения движения объекта, его свойств и характеристик. Алгоритмы поиска и обработки найденных областей движения. Метод коррекции. Нахождение объекта по цветовому диапазон
статья [2,5 M], добавлен 29.09.2008Создание информационной мультимедиа системы (медиа-плеера) для презентации аудио-видео информации о факультете КТАС, представленной в специально отснятых и смонтированных avi-файлах. Разработка модуля пользовательского интерфейса, выходные данные.
курсовая работа [41,5 K], добавлен 21.11.2014