Концепция звукового музыкального блокнота

Требования к музыкальному блокноту и устройствам автоматического распознавания нот. Алгоритмы обработки музыки в аналого-цифровых преобразователях. Влияние разрядности и частоты дискретизации звукового процессора на качество воспроизведения аудиофайлов.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 29.03.2014
Размер файла 79,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

Ижевский государственный технический университет

имени М.Т. Калашникова

Концепция звукового музыкального блокнота

Ю.В. Кружалова, студент

докт.техн.наук, профессор А.И. Нистюк

В данной статье рассматривается концепция звукового блокнота, который способен записывать, воспроизводить, а также преобразовывать звук в ноты - графическое обозначение звука музыкального произведения.

Задача распознавания музыкальных звуков на сегодняшний день является актуальной проблемой. Большинство современных методов, используемых для ее решения, требуют больших вычислительных ресурсов. Невозможность широкого применения многих алгоритмов сегодня, например, в мобильных устройствах заставляет исследователей искать эффективные методы. Для этого необходимо сформулировать основные требования к подобным устройствам. Данное исследование является актуальным в области музыки, так как может использоваться для быстрого создания музыкального произведения. Применение устройств автоматического распознавания особенно актуально для создания музыкальных произведений в нотной записи, идентификации музыкальных произведений, выявление заимствования (плагиат) и др.

Реализация систем распознавания сложна по той причине, что звуковые сигналы сильно зависят от громкости, акустических свойств окружающей среды. Существует целое множество различных факторов, которые могут оказывать негативное влияние на точность распознающей системы - шум окружающей среды, скорость «напевания», интонация и т. д.

Для распознавания музыки используются алгоритмы, основанные на математических методах.

Для осуществления обработки требуется аналоговый сигнал перевести в цифровой сигнал. Цифровая система обработки звукового сигнала предполагает представление аналогового речевого сигнала в цифровом виде. В результате аналого-цифрового преобразования (АЦП) непрерывный сигнал переводится в ряд дискретных временных отсчетов, каждый из которых представляет собой число. Точность представления зависит от ширины диапазона получаемых чисел, а, следовательно, от разрядности АЦП. Процесс извлечения из сигнала численных значений называется квантованием. Процесс разбиения сигнала на отсчеты - дискретизацией. Число отсчетов в секунду называется частотой дискретизации.

Для извлечения информации обычно используют фильтры тоновых частот (мел-скейл фильтры), которые усредняют спектральные составляющие в определенных диапазонах частот, тем самым делая сигнал менее зависимым от диктора. Такие фильтры являются основой технологии MFCC (Mel-Frequency Cepstral Coefficients), которая используется в распознающей системе. музыкальный аудиофайл процессор

Ещё один метод основан на векторе признаков. Происходит так называемая реализация слова, т. е. цифровая запись произнесения слова (звука) в виде последовательности отсчётов звукового сигнала.

Реализация слова (звука) в процессе цифровой обработки разбивается на последовательность кадров.

Кадром считается последовательность отсчетов звукового сигнала. Длина кадра фиксирована во времени. Каждому кадру сопоставляются некоторые данные, характеризующие звук наилучшим образом.

Такие данные формируют вектор свойств (или вектор признаков). С математической точки зрения это может быть как вектор из пространства , так и набор функций или одна функция. Задачей системы будет являться отождествление каждого слова, поступающего на вход, с заранее определенным классом.

В последнее время распространение получают алгоритмы, использующие нейронные сети. За счет своей простоты и небольшого количества операций на каждой итерации алгоритм стохастической аппроксимации (РАСА) может быть использован для распознавания речи в реальном времени.

Алгоритм основан на использовании пробных одновременных возмущений, которые являются искусственными воздействиями с заранее определенными статистическими свойствами, обеспечивающими состоятельность оценок алгоритма при почти произвольных помехах. В случае зашумленных измерений функции потерь алгоритм сохраняет состоятельность доставляемых оценок при почти произвольных помехах. В задаче распознавания отдельных музыкальных звуков такими помехами могут являться фазовые и спектральные сдвиги звукового сигнала, шум окружающей среды, настройки записывающего устройства и т.д. Алгоритм достаточно прост для реализации в виде электронного устройства.

Наилучшей, с нашей точки зрения, является программа WIDI Recognition System (одна из интерпретаций этого названия - Wave to mIDI) , поэтапно анализирующая музыкальную композицию и превращающая звуки в ноты. Нота (лат. «знак», «метка») в музыке -- это графическое обозначение звука музыкального произведения, один из основных символов современной музыкальной нотации.

Вариации в изображении ноты, а также сочетания с другими символами позволяют задать такие характеристики обозначаемого нотой звука, как высоту, длительность и порядок исполнения по отношению к другим звукам [1].

Чтобы получить в конечном варианте ноты, можно использовать различные источники звука. Это может быть звуковой файл, либо сигнал с внешнего источника - магнитофона, микрофона, иного источника звука. В программе есть собственный звукозаписывающий модуль, который обеспечивает запись звука от внешнего источника. Он обеспечивает как монофоническую, так и стереофоническую запись. Распознавание записи проводится в два этапа.

На первом вычисляются спектральные данные специального вида - в программе этот этап называется преобразованием "Звук-в-Тон". Для этого распознавания используются несколько различных алгоритмов. Какой из них подходит для выбранного произведения, лучше всего определить методом пробы.

Кроме распознавания музыки из файла, программа распознает музыку в реальном времени. Это означает, что можно играть или петь перед микрофоном, а программа будет в это же время распознавать и преобразовывать звуки в формат MIDI.

В состав программы включен специализированный редактор TrueTone для MIDI. Его уникальное отличие от других подобных редакторов заключается в том, что в окне редактирования одновременно отображаются как спектрограмма исходного произведения, так и распознанные ноты.

Ноты накладываются на спектрограмму и позволяют визуально сличать их. Для удобства редактор устроен по принципу Piano Roll, когда ноты располагаются на фоне нотного стана. Эти особенности позволяют редактировать распознанные записи даже тем людям, у которых отсутствует большой опыт работы с музыкой.

Редактор позволяет выполнять над нотами различные действия. Он позволяет "склеивать" ошибочно разделенные при распознавании ноты, проигрывать видимый фрагмент файла, сохранять промежуточные результаты в файл специального формата, содержащий как ноты, так и спектрограмму.

Возможно проигрывание фрагмента как с нормальной, так и с замедленной скоростью, а также синхронное проигрывание фрагмента и исходного файла. Ноты можно добавлять и стирать, изменять их высоту и длительность, назначать для исполнения любой выбранной ноты тот или иной инструмент [2].

Таким образом, во-первых, алгоритмы обработки звуковых сигналов проходят по одной схеме "аналоговый сигнал - преобразование в цифровой сигнал - обработка - нотная запись - воспроизведение нотной записи".

Во-вторых, наиболее перспективными алгоритмами для бытовых устройств, скорее всего, будут алгоритмы, основанные на нейронных сетях.

В-третьих, конструктивно подобные устройства должны выглядеть как блокнот со сменными страничками. Микрофон может представлять собой авторучку к блокноту.

Концептуальный вид музыкального блокнота представлен на рисунке.

Рис. Звуковой музыкальный блокнот

Предполагается, что звуковой блокнот будет способствовать быстрой записи музыкальных произведений с достаточной достоверностью, что является целью дальнейших исследований.

Список литературы

1. Википедия - свободная энциклопедия [Электронный ресурс]// Нота (музыка): [сайт].[2012]. URL:http://ru.wikipedia.org/wiki/Нота_(музыка) (дата обращения: 04.02.2013).

2. Брод М. Переложим музыку на ноты. [Электронный ресурс]// softkey.info: онлайновый журн. 2004. URL:http://softkey.info/reviews/review689.php (дата обращения: 04.02.2013).

3. Takashi Yamada.Yanko design [Электронный ресурс]// Gadgets portable audio technology. Compose music all high tech like: [сайт]. [2008]. URL:http://www.yankodesign.com/2008/08/18/compose-music-all-high-tech-like/ (дата обращения: 29.01.2013).

Размещено на Allbest.ru

...

Подобные документы

  • Разработка программного обеспечения, предназначенного для изменения характеристик исходного звукового сигнала с целью изменения характеристик его звучания. Алгоритмы обработки и фильтрации звукового сигнала, редактирование его, изменение темпа и уровня.

    дипломная работа [1,8 M], добавлен 08.07.2008

  • Создание оболочки для воспроизведения аудиофайлов. Аналитический обзор языков программирования, их сравнительные характеристики, описание предметной области и формата mp3. Алгоритм разработки инсталляционного пакета. Диаграмма деятельности объектов.

    курсовая работа [581,3 K], добавлен 30.01.2014

  • Формат звукового файла wav, способ его кодирования. Реализация возможностей воспроизведения звука в среде программирования MATLAB. Составление функциональной схемы программы. Апробирование информационной технологии воспроизведения звуковых файлов.

    курсовая работа [1,2 M], добавлен 13.02.2016

  • Анализ процесса оцифровки зависимости интенсивности звукового сигнала от времени. Характеристика технологии создания музыкальных звуков в современных электромузыкальных цифровых синтезаторах. Изучение основных звуковых форматов, способов обработки звука.

    курсовая работа [2,3 M], добавлен 23.11.2011

  • Характеристика периферийных устройств, преобразующих результаты обработки цифровых машинных кодов в удобную для человека форму. Основные характеристики матричных, струйных, лазерных и термических принтеров, виды плоттеров. Особенности звукового вывода.

    презентация [7,5 M], добавлен 25.09.2012

  • Ознакомление с комплектацией и классификацией звуковых карт; рассмотрение их основных характеристик - частоты дискретизации, разрядности, динамического диапазона, коэффициента нелинейных искажений, поддерживаемых спецэффектов. Диапазон цен на аудиоплаты.

    презентация [647,5 K], добавлен 17.11.2011

  • Генерирование и сохранение мелодии в виде звукового файла формата wav. Проведение частотного анализа полученного сигнала. Зависимость объема wav-файлов от разрядности кодирования сигнала. Спектр нот записанного wav-файла с заданной разрядностью.

    лабораторная работа [191,0 K], добавлен 30.03.2015

  • Появление технических систем автоматического распознавания. Человек как элемент или звено сложных автоматических систем. Возможности автоматических распознающих устройств. Этапы создания системы распознавания образов. Процессы измерения и кодирования.

    презентация [523,7 K], добавлен 14.08.2013

  • Понятие и способы дискретизации аналоговых сигналов. Ознакомление с примерами аналого-цифрового преобразование звука. Изучение способов кодирования цифровых изображений, видеоданных и текста. Рассмотрение теоремы Котельникова и теории информации.

    презентация [1,2 M], добавлен 15.04.2014

  • Процессы распознавания символов. Шаблонные и структурные алгоритмы распознавания. Процесс обработки поступающего документа. Обзор существующих приложений по оптическому распознаванию символов. Определение фиксированного шага и сегментация слов.

    дипломная работа [3,3 M], добавлен 11.02.2017

  • Визуальный компонент, используемый для создания главного меню на форме, создание закладки и добавление в список воспроизведения музыкального файла. Определение повторения воспроизведения и отображение списков строк, проигрывание аудио и видео файлов.

    лабораторная работа [128,7 K], добавлен 27.03.2012

  • Преобразование аналоговой формы первичных сигналов для их обработки с помощью ЭВМ в цифровой n-разрядный код, и обратное преобразование цифровой информации в аналоговую. Практическая реализация схем аналого-цифровых и цифро-аналоговых преобразователей.

    реферат [89,2 K], добавлен 02.08.2009

  • Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.

    презентация [469,2 K], добавлен 15.03.2015

  • Характеристика модернизируемого компьютера. Выбор материнской платы, процессора, памяти, видео- и звукового адаптера, блока питания, жесткого диска. Сравнение цен комплектующих старого и нового компьютеров. Инструменты, используемые для модернизации.

    курсовая работа [1,2 M], добавлен 29.04.2014

  • Условия применения и технические требования для работы программно-аппаратной платформы. Система распознавания лиц VOCORD Face Control. Система распознавания текста ABBYY FineReader. Алгоритмы и методы, применяемые в программе. Алгоритм хеширования MD5.

    дипломная работа [1,8 M], добавлен 19.01.2017

  • Методы предобработки изображений текстовых символов. Статистические распределения точек. Интегральные преобразования и структурный анализ. Реализация алгоритма распознавания букв. Анализ алгоритмов оптического распознавания символов. Сравнение с эталоном.

    курсовая работа [2,1 M], добавлен 20.09.2014

  • Обработка текстовых данных, хранящихся в файле. Задачи и алгоритмы обработки больших массивов действительных и натуральных чисел. Практические задачи по алгоритмам обработки данных. Решение задачи о пяти ферзях. Программа, которая реализует сортировку Шел

    курсовая работа [29,2 K], добавлен 09.02.2011

  • Оборудование и программное обеспечение сети и способы управления системой. Специализированные сетевые технологии передачи и распределения цифровых и аналоговых аудиосигналов. Построение технической модели сети. Опасные и вредные факторы в работе с ПЭВМ.

    дипломная работа [888,0 K], добавлен 03.03.2009

  • Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.

    дипломная работа [887,3 K], добавлен 26.11.2013

  • Системы стабилизации частоты синхронного генератора. Передаточные функции для разомкнутой и замкнутой системы. Переходная характеристика системы стабилизации частоты синхронного генератора. Качество непрерывных линейных систем автоматического управления.

    контрольная работа [1,0 M], добавлен 03.02.2022

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.