Обнаружение пауз в речевых сигналах
Обработка отрезка речи для указанной фразы одним из существующих детекторов активности речи, осуществляющих разделение на активные участки речи и паузы, посредством разделения входного акустического сигнала на интервалы. Осциллограмма тестовой фразы.
Рубрика | Иностранные языки и языкознание |
Вид | статья |
Язык | русский |
Дата добавления | 30.05.2017 |
Размер файла | 97,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Обнаружение пауз в речевых сигналах
В.А. Волченков
Обработка речевой информации является на сегодняшний момент достаточно актуальной задачей и находит применение в различных сферах инженерной деятельности [1,2]. В данной статье, хотелось бы рассмотреть тему обнаружения пауз в речевых сигналах.
Длительность пауз в речи колеблется в широких пределах и может доходить до 3 с и более, имеет случайный характер. Но все же вероятность появления пауз длительностью свыше 2 с мала. Как правило, паузы разделяют на короткие (примерно до 40 мс) между элементами речи (например, на смычных звуках) и более длинные, обусловленные смысловым содержанием речи и ее ритмической структурой [4]. До сих пор в системах сжатия речевой информации и системах связи практический интерес представляло статистическое распределение вторых.
Однако, если проанализировать общую статистику для пауз, то наибольшей плотность вероятности распределения (ПВР) пауз по длительности оказывается в интервале 5…50 мс и вне этого интервала быстро убывает [3]. речь детектор акустический
Очевидно, интерес только к длинным паузам был вызван подходом к реализации устройств, их обнаруживающих. Реализация существующих алгоритмов обнаружения пауз базируется на предположении, что речь - нестационарный сигнал, форма спектра речи изменяется обычно через короткие отрезки времени (около 20-30 мс). Фоновый шум считают стационарным на более длинном отрезке времени. Уровень фонового шума находится ниже уровня речевого сигнала [5]. Речь обычно делят на отрезки длительностью 16-32 мс, и анализируют уровень энергии сигнала на каждом интервале, а также количество переходов сигнала через ноль. В том случае, когда временной интервал определяется обнаружителем как пауза, перед окончательным принятием решения, что сигнал отсутствует, системе необходимо последовательно продетектировать ещё несколько фреймов (в системе GSM 5-6). Таким образом, существующие на сегодняшний день способы определения активности речи позволяют выявить паузы, длительность которых значительно превышает 40 мс.
Для проведения эксперимента была выбрана тестовая фраза: "Продолжение отладки устройства". На рис. 1 представлена осциллограмма данной фразы и результаты обработки отрезка речи для указанной выше фразы одним из существующих детекторов активности речи, осуществляющих разделение на активные участки речи и паузы посредством разделения входного акустического сигнала на интервалы по 20 мс и сравнения кратковременной энергии каждого окна с предварительно вычисленным пороговым значением [6,7]. Разделение на активные участки речи и паузы начинается при длине пауз больше 60 мс, первые 40 мс паузы детектируются как речь.
Рис. 1. Осциллограмма тестовой фразы и результаты обработки речевого сигнала одним из существующих детекторов активности речи
Таким образом, обнаружение коротких пауз и установление более точных границ для длинных пауз становятся важными задачами, решению которых и посвящена данная работа.
В настоящей работе предложен обнаружитель пауз в речевых сигналах, который обеспечивает "существенное повышение вероятности правильного разделения речевых сигналов на периоды активной речи и паузы" [10].
Структурная схема предлагаемого детектора изображена на рис. 2.
Рис. 2. Структурная схема предлагаемого детектора активности речи
Принцип работы предлагаемого детектора подробно описан в [8-10].
На рис. 3а представлена осциллограмма данной фразы и результаты обработки речевого сигнала для указанной последовательности слов.
Общее время записи сигнала - 5 с, а суммарное время активной речи составило 2,21 с (44,2 %). Правильное детектирование активных участков речи и пауз начинается при отношении сигнал-шум 7-10 дБ.
На рис. 3б показано определение пауз в начале слова "отладки". Пауза между звуками "о" и "т" 60 мс. Пауза между звуками "т" и "л" 6 мс.
а) б)
Рис. 3. Осциллограмма тестовой фразы и сигнала с выхода обнаружителя (а), определение пауз в начале слова "отладки" (б)
Был проведен эксперимент, где в интервалы, в которых находились паузы, записывался комфортный шум, параметры которого соответствовали параметрам шума, присутствовавшего в исходной записи. Качество полученного речевого сигнала практически не отличалось от исходного. Слова были хорошо различимы, речь легко воспринималась на слух.
Таким образом, в заключении можно сделать вывод, что разработан новый способ обнаружения пауз в речи, который позволяет существенно повысить точность разделения на активные участки речи и паузы. При этом качество восстанавливаемой речи остается практически на том же уровне.
Литература
1. Астапов К.А. Применение вейвлет-преобразования для сокращения области значения искусственных нейронных сетей на примере задачи распознавания речи [Электронный ресурс] // "Инженерный вестник Дона", 2009, №1. - Режим доступа: http://www.ivdon.ru/magazine/archive/n1y2009/105 (доступ свободный) - Загл. с экрана. - Яз. рус.
2. Марьев А.А. Метод интерпретации результатов измерений параметров речевого сигнала в задачах диагностики психоэмоционального состояния человека по его речи [Электронный ресурс] // "Инженерный вестник Дона", 2011, №4. - Режим доступа: http://www.ivdon.ru/magazine/archive/n4y2011/538 (доступ свободный) - Загл. с экрана. - Яз. рус.
3. Вахитов Ш.Я. Акустика: Учебник для вузов [Текст] / Ш.Я. Вахитов., Ю.А. Ковалгин, А.А. Фадеев, Ю.П. Щевьев; Под ред. профессора Ю.А. Ковалгина. - М.: Горячая линия-Телеком, 2009. - 660 с.: ил.
4. Михайлов В.Г. Измерение параметров речи [Текст] / В.Г. Михайлов, Л.В. Златоустова; Под ред. М.А. Сапожкова. - М.: Радио и связь, 1987. - 168 с.: ил.
5. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи [Текст] / Под ред. О.И. Шелухина. - М.: Радио и связь, 2000. - 456 с.
6. Sohn J. A voice activity detector employing soft decision based noise spectrum adaptation [Текст] / J. Sohn and W. Sung // Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing / Seattle, WA, 1998. - Vol. 1. - pp. 365-368.
7. Kondoz A.M. Digital Speech. Coding for Low Bit Rate Communication Systems. [Текст] - John Wiley & Sons, Ltd. 2004. - 442 p.
8. Пат. 2436173 Российская Федерация, МПК G10L 15/00, G10L 11/02, Способ обнаружения пауз в речевых сигналах и устройство его реализующее [Текст] / Витязев В.В., Розов В.И., Волченков В.А.; заявитель и патентообладатель Рязанский государственный радиотехнический университет. - № 2010124342/08, заяв. 15.06.10; опубл. 10.12.11, Бюл. 34.
9. Волченков В.А. Методы и алгоритмы детектирования активности речи [Текст] / Волченков В.А., Витязев В.В. // Цифровая обработка сигналов. 2013. №1. С. 54-60.
10. Волченков В.А. Детектор активности речи [Текст] / Волченков В.А., Витязев В.В. // Труды РНТОРЭС им. А.С. Попова. Серия: Цифровая обработка сигналов и её применение. Выпуск: XIII - 2. / Москва: РНТОРЭС им. А.С. Попова, 2011. С. 256 - 258.
Размещено на Allbest.ru
...Подобные документы
Аспекты культуры речи. Коммуникативный аспект культуры речи. Коммуникативные качества речи. Правильность речи как коммуникативное качество. Устранение речевых ошибок в приведенных предложениях. Лексическое значение и стилистическая окраска фразеологизмов.
контрольная работа [25,0 K], добавлен 18.06.2010Состояние культуры речи у представителей СМИ. Классификация речевых, стилистических и орфоэпических ошибок, звучащих в эфире. Анализ речевых фрагментов устной речи теле- и радиоведущих, её соответствие современным орфоэпическим и акцентологическим нормам.
курсовая работа [74,5 K], добавлен 01.07.2014Выделение частей речи по семантическому принципу. Синтаксическая функция как возможная субституция в линейной речевой цепи. Классификации частей речи немецкого языка. Разделение слов на части речи как предварительный этап их грамматического описания.
реферат [24,3 K], добавлен 03.04.2010Общие сведения об английском ударении по сравнению с русским. Мелодические особенности оформления английской речи (интонация, мелодика, тон). Нисходящий и восходящий тон в английском предложении в сравнении с русским в разговорной речи. Паузы в речи.
курсовая работа [49,2 K], добавлен 25.11.2010Цель развлекательной речи. Выражение почтения и уважения в похвальном слове. Основной принцип построения информационной речи. Основные жанры воодушевляющей речи. Цель дружеского послания. Призывающие к действию речи, их воздействие на поступки слушателей.
реферат [27,8 K], добавлен 22.01.2015Риторика как искусство слова. Виды публичной речи и этапы подготовки. Целевые установки этапов речи и способы их реализации. Прагматические средства воздействия, используемые оратором при произнесении речи. Качественные характеристики эффективной речи.
дипломная работа [170,0 K], добавлен 23.08.2014Общая характеристика форм речи. Сущность доказательства. Ораторское искусство. Эвристическая риторика. Логика речи. Стилистические приёмы ораторской речи. Лексические приёмы ораторской речи.
реферат [27,9 K], добавлен 10.09.2007Культура речи. Стили речи. Богатство русской речи. Вкус эпохи и мода. Слово, являясь это первоэлементом языка, играет многогранную роль в речи. Оно характеризует человека как личность, передает опыт поколений и меняется вместе с ними.
реферат [15,7 K], добавлен 12.10.2003Диалог и монолог в устной и письменной формах речи. Разновидности речи. Употребление устойчивых словосочетаний. Стандартизованный характер письменной речи. Случаи употребления языковых средств с точки зрения их принадлежности к устной или письменной речи.
контрольная работа [20,6 K], добавлен 15.07.2012Общая характеристика форм речи. Устная форма речи. Письменная форма речи. Специфика норм письменного кодифицированного языка. Сходства и различия между устной и письменной формами речи.
контрольная работа [22,5 K], добавлен 24.07.2007История изучения канцелярита и канцеляризмов. Особенности применения речевых штампов и избитых выражений. Обстоятельства использования официального стиля речи, сфера его применения. Практический анализ употребления канцеляризмов в публичной речи.
курсовая работа [29,3 K], добавлен 06.12.2015Цели обучения диалогической речи. Психолингвистические характеристики диалогической речи как вида речевой деятельности. Анализ учебно-методических комплектов в контексте обучения диалогической речи. Комплекс упражнений для обучения диалогической речи.
курсовая работа [47,0 K], добавлен 25.11.2014Соответствие, теме, условиям, аудитории как признак хорошей речи. Употребление слов в соответствии с их языковым значением. Выбор слов из синонимического ряда. Лексическое разнообразие речи. Отсутствие в речи элементов, чуждых литературному языку.
курсовая работа [34,1 K], добавлен 26.04.2010Особенности перевода устной речи кино- и видеопродукции на английском языке. Теория речевых актов в современной лингвистике. Нормативные аспекты устного перевода. Эквивалентность на уровне речи. Комментарий перевода диалогов кинофильма "Люди в чёрном".
дипломная работа [82,4 K], добавлен 05.05.2008Изучение видов, форм внутренней речи и роли внутренней речи в литературном тексте художественного произведения. Рассмотрение языковых средств, используемых для построения внутренней речи в художественном тексте. Рассмотрение изображенной внутренней речи.
дипломная работа [104,1 K], добавлен 16.07.2017Понятие ораторской речи как разновидности публичной речи, ее сущность и особенности. Элементарные принципы и приемы риторики, форма подачи речи. Применение выразительных приемов. Номинативная, коммуникативная и экспрессивная функции парламентской речи.
реферат [27,8 K], добавлен 06.11.2012Речевое поведение и необходимость его изучения. Сущность, признаки культуры речи и ее виды - понятийная и предметная. Синонимы, паронимы, плеоназм, тавтология и точность речи. Явление полисемии и омонимии. Точность речи в разных функциональных стилях.
презентация [357,2 K], добавлен 08.05.2013Понятие, признаки, языковые особенности разговорной речи, основная сфера ее реализации. Место разговорной речи в составе литературного и национального языка. Слоговая редукция, другие фонетические явления. Взаимодействие разговорной речи и книжных стилей.
реферат [36,5 K], добавлен 20.07.2013Понятие культуры речи и ее составляющие. Основные коммуникативные качества речи. Богатство русского языка, свойства его лексического состава и грамматического строя. Функции и свойства слова. Условия и средства выразительности речи отдельного человека.
реферат [20,9 K], добавлен 20.12.2012Стилевая манера и выразительность речи, ее основные качества. Изобразительно-выразительные средства эстетических качеств речи. Средства выразительности речи: метафора, эпитет, гипербола (преувеличение), сравнение, антитеза (противопоставление), градация.
реферат [30,8 K], добавлен 05.04.2014