Анализ факторов снижения разборчивости речи в системах громкоговорящей связи
Применение специальных коммуникационных систем в области связи. Проведение анализа убывающей оценки артикуляции в системах предупреждения. На основе полученных результатов разработка метода уменьшения влияния акустического шума на речевой сигнал.
Рубрика | Коммуникации, связь, цифровые приборы и радиоэлектроника |
Вид | статья |
Язык | русский |
Дата добавления | 22.08.2020 |
Размер файла | 362,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
анализ факторов снижения разборчивости речи в системах громкоговорящей связи
Кульков Я.Ю.
Кропотов Ю.А.
The analysis of the decreasing articulation score in warning systems is carried out. On the basis of the received results the method of reduction of influence of acoustic noise on a speech signal is offered.
Применение специальных коммуникационных систем в области связи на объектах промышленности и транспорта позволяет существенно повысить эффективность управления ими и обеспечить надежную связь на технологических участках, как правило, в тяжелых промышленных условиях, при атмосферном и климатическом воздействиях. От надежной работы этих систем во многом зависит безопасность на объектах, особенно в местах с повышенной опасностью возникновения аварий, пожаров, взрывов и химических выбросов. связь речь шум
Системы громкоговорящей связи _ это отдельный специализированный вид оборудования, в первую очередь предназначенный для решения задач информационного звукового обеспечения на объекте. Такие системы применяются как на промышленных, так и на военных объектах для передачи информационных речевых сообщений или специальных сигналов, например, объявлений, технологических и административных распоряжений, адресованных сотрудникам, экстренных сообщений в аварийных ситуациях и сигналов тревоги. Также, по требованиям международных стандартов подобные системы должны размещаться везде, где присутствует большое количество людей [3]. Требования к системам оповещения отличаются от требований к бытовому или профессиональному звуковому оборудованию. В первую очередь, необходимо достижение максимальной разборчивости речевого сигнала.
Разборчивость является некоторой интегральной оценкой речевого сигнала и в соответствии с международным стандартом ISO/TR 4870 определяется как «степень, с которой речь может быть понята (расшифрована) слушателями». Под этим понимается степень, с которой слушатели могут понять смысл фразы, идентифицировать слова, слоги и фонемы.
Разборчивость речи в системах оповещения должна оцениваться как "хорошая" или "отличная". Существующие методики расчета разборчивости речи или оценки качества системы, например, метод PESQ, очень часто дают результаты, значительно расходящиеся с реальной картиной. Это связано с тем, что разборчивость речи является результатом взаимодействия системы звукоусиления с акустическими условиями озвучиваемого объекта. Применение различных алгоритмов шумоочистки и постобработки сигналов в подобных случаях малоэффективны, так как в разных зонах оповещения на сигнал действуют различные акустические искажения.
Акустические шумы - это шумы в пределах озвучиваемой поверхности, создаваемые публикой, различными агрегатами и т. п., и шумы, попадающие извне, например, от транспорта.
По уровню акустические шумы в непроизводственных помещениях имеют диапазон от 55 до 80 дБ. Уровни в производственных помещениях имеют широкий диапазон - от 65 до 95 дБ и более.
Рассмотрим более подробно влияние различных акустических шумов на разборчивость речевого сигнала. Негативное влияние проявляется в виде эффекта маскирования - маскирование другими звуками, в том числе шумами в реверберирующем помещении и др. Шумы могут создаваться вентиляцией, внешними проникновениями, шумами аппаратуры, публикой, электронной аппаратурой и др.
Процент потери разборчивости зависит, прежде всего, от отношения уровня речевого сигнала к уровню шума, которое должно быть выше определенного уровня, чтобы можно было понять смысловое содержание речи. Степень маскировки шумом будет зависеть от отношения сигнал/шум SNR и от спектрального состава шума. Для широкополосного шума (20:4000 Гц) анализ индекса разборчивости RASTI от показателя SNR показывает, что индекс разборчивости будет больше 0.8 только при SNR более 12 дБ.
Сильное воздействие на разборчивость речи оказывает шум от других голосов (шум толпы). Поскольку этот шум сходен с речью по спектральному составу, то уровень словесной разборчивости резко снижается, особенно при увеличении числа мешающих голосов.
Влияние шумов на разборчивость речи зависит также от направления их прихода: если направления речевого сигнала и шума совпадают, то степень маскировки и, соответственно, процент потери разборчивости будет наибольшим. Слуховой системе трудно провести их разделение, но чем больше расстояние между ними, тем выше разборчивость.
Рассмотрим динамический диапазон восприятия чистых тонов. Пусть генерируется синусоидальный акустический сигнал с частотой f и уровнем звукового давления P. Субъективный уровень ощущения звукового давления обозначим как L. Уровень громкости L измеряется в фонах и вычисляется по формуле (1) [2].
, (1)
где p - уровень звукового давления на заданной частоте; po=20 мкПа - порог звукового восприятия на частоте 1 кГц.
Зависимость L от P приведена на рисунке 1. При значении P меньше порога восприятия сигнал не слышен. При превышении порога восприятия уровень громкости растет по квадратичному закону, а затем при достижении линейной зависимости, показанной на рисунке 1 пунктирной линией, начинает изменяться по линейному закону. При выделении синусоидального сигнала на фоне аддитивного шума при среднеквадратичном значении шума меньше амплитуды синусоиды слышен только шум, а при превышении амплитуды синусоиды среднеквадратичного уровня шума слышен только чистый тон, причем его громкость опять возрастает по квадратичному закону, и при пересечении линейной зависимости снова выходит на линейный режим. Такое поведение кривых громкости имеет простое физическое объяснение. Аналогичный динамический диапазон имеет и оптимальный приемник, выделяющий полезный сигнал с последующим накоплением на фоне аддитивного шума. Такую же зависимость можно получить и для оптимального приема случайного сигнала на фоне аддитивного шума для случая разных распределений вероятностей амплитуд сигнала и шума. Причем решение такой задачи получается именно для распределений вероятностей амплитуд человеческой речи.
При накоплении сигналов во времени в слуховой системе человека выделяют два типа маскировки для сигналов [2].
Первая маскировка называется маскировкой вперед. Данная маскировка проявляется в том, что короткая первая посылка сигнала длительностью до 2000 мс не слышна, если за ней следует более интенсивный звуковой сигнал длительностью более 150 мс. Время маскировки вперед зависит от амплитуды второго сигнала. При ее увеличении время маскировки вперед увеличивается, затем выходит на константу и далее остается постоянным. Экранировка происходит для случая близких частот первой и второй посылок. Если частоты посылок разнесены по частоте более, чем на один барк, то в случае первой посылки с частотой ниже основного сигнала маскировки вперед не происходит, а для более высокочастотной первой посылки маскировка вперед будет ослабевать с возрастанием несущей частоты первой посылки.
Рисунок 1 - Зависимость между уровнем интенсивности тона P и его уровнем громкости L в условиях, когда тон предъявляется на фоне шума
Второй тип маскировки называется маскировкой назад. Его суть состоит в том, что слуховая система человека запоминает уровень предшествующего сигнала большой амплитуды. Для меньших амплитуд первого сигнала это время будет меньше. Таким образом, время экранировки назад растет с амплитудой первого сигнала до 150 мс, а затем рост этого времени прекращается. Если последующий сигнал меньше уровня маскировки, то он не слышен. Если частота второго сигнала ниже первого, то эффект маскировки отсутствует. Если частота второго сигнала выше первого, то с увеличением частоты уровень маскировки уменьшается, однако для удвоенной и утроенной частоты второго сигнала эти уровни существенно возрастают. Причем маскировка второй и третьей гармоники наблюдается и при одновременном воздействии первого и второго сигнала. Если амплитуды второй и третьей гармоник выше первой, то такой экранировки не наблюдается. Таким образом, в нашей слуховой системе происходит интенсивное подавление нелинейных продуктов на второй и третьей гармониках. Для более высоких гармоник такой эффект отсутствует.
Рисунок 2 - Сдвиг пороговой слышимости после воздействия 1000 Гц
Маскировка назад связана с порогами адаптации при воздействии сложных акустических сигналов. На рисунке 2 приведены пороги адаптации, возникающие в слуховой системе при воздействии сосредоточенного сигнала. При малых уровнях сигнала, когда кривая громкости имеет квадратичную зависимость, порог адаптации сосредоточен в узкой полосе частот. Это приводит к тому, что синусоиды, находящиеся в частотном диапазоне адаптации с амплитудой меньше порога адаптации, не слышны. С увеличением интенсивности сосредоточенной помехи частотная зона адаптации расширяется.
Эффект адаптации при данном виде маскирования имеет ряд негативных моментов по отношению к разборчивости речи. Так, если среди акустических шумов имеется интенсивный сосредоточенный выброс и его частота совпадает с частотой основного тона человека, то вторая f1 и третья f2 форманты речевого сигнала будут в зоне маскировки. Как показали эксперименты, это приводит к падению разборчивости на 0.3 пункта по показателю RASTI.
Значения показателя RASTI соотносятся с субъективной оценкой разборчивости речи в соответствии со стандартизованной зависимостью, представленной в таблице 1.
Таблица 1 - Соотношение показателя RASTI и субъективной оценкой разборчивости
Значения RASTI |
Разборчивость речи |
|
0.75-1.00 |
Отличная |
|
06.-0.75 |
Хорошая |
|
0.45-0.60 |
Удовлетворительная |
|
0.30-0.45 |
Плохая |
|
0.00-0.30 |
Недопустимо плохая |
Рассмотренные маскировки позволяют сделать вывод, что наличие в сигнале всплесков высокой интенсивности приводят к появлению эффекта маскировки. Это приводит к потере человеком некоторых звуков слышимой речи, что неминуемо ведет к снижению разборчивости.
При таком снижении разборчивости мозгу человека требуется определенное время для разбора смысловой информации, произнесенной по системе оповещения. Работа систем громкоговорящей связи и оповещения связана с появлением критических ситуаций, если речь идет о гражданских и промышленных объектах, или в боевой ситуации, если система применена в военных объектах. И в том и в другом случае от скорости реакции человека на информацию зависит жизнь не только его самого, но и жизни других людей. Поэтому ослабление эффекта маскирования и, как следствие, повышение разборчивости речи, является одной из наиболее актуальных при построении систем громкоговорящей связи.
Предлагаемым способом снижения маскирующего влияния акустических шумов на разборчивость речевого сигнала является повышение относительной средней мощности излучаемого громкоговорителями сигнала. Причем простое повышение мощности, то есть увеличение максимальной амплитуды, не приведет к желаемому эффекту [1]. Увеличение громкости выше некоторого порога приводит, наоборот, к снижению разборчивости речи, так как порождает сдвиг кривой чувствительности в сторону уменьшения. При этом эффект маскирования становится еще более выраженным.
Необходимо применять методы нелинейной компрессии динамического диапазона сигнала. Предварительно подготовленный таким образом речевой сигнал при той же выходной мощности даст эффект увеличения громкости вследствие повышения относительной средней мощности сигнала при сохранении максимального значения амплитуды на исходном уровне. Это приводит к повышению звукового давления и к лучшей разборчивости речевого сообщения на фоне сильной зашумленности.
Литература
1. Звуковое вещание [Текст]: cправочник; под ред. Ю.А. Ковалгина. - М.: Радио и связь, 1993.
2. Ковалгин, Ю.А. Цифровое кодирование звуковых сигналов [Текст] / Ю.А. Ковалгин, Э.И. Вологдин. - СПб.: КОРОНА-принт, 2004.
3. Мишенков, С.Л. Системы звукового вещания и оповещения [Текст]: учебное пособие/ С.Л. Мишенков, А.М. Копылов, А.П. Ефимов. - М.: МТУСИ, 1995.
Размещено на Allbest.ru
...Подобные документы
Области применения измерительных процедур. Измерение ошибок в системах связи, на аналоговых и цифровых интерфейсах. Инсталляция s-соединений с базовой скоростью. Настройка компонентов синхронных систем. Тестирование сигнализации и коммуникационных путей.
презентация [6,3 M], добавлен 29.10.2013Оценка моделей радиоканалов в системах доступа четвертого поколения. Основные методы оценки каналов в системах связи с использованием технологии OFDM-MIMO, их влияние на эффективность функционирования таких систем. Технология многоантенной передачи.
дипломная работа [10,0 M], добавлен 02.02.2016Задачи при передаче речи и данных. Цифровая передача речи. Категории методов цифрового кодирования речи. Кодеры формы сигнала. Вид амплитудной характеристики компрессора. Дискретная модель речеобразования. Особенности метода кратковременного анализа.
контрольная работа [56,6 K], добавлен 18.12.2010Анализ современного состояния пропускной способности систем широкополосного беспроводного доступа. Математическая модель и методы модуляции сверхширокополосных сигналов, их помехоустойчивость и процедура радиоприема. Области применения данных сигналов.
контрольная работа [568,2 K], добавлен 09.05.2014Характеристика систем спутниковой связи. Принципы квадратурной амплитудной модуляции. Факторы, влияющие на помехоустойчивость передачи сигналов с М-КАМ. Исследование помехоустойчивости приема сигналов 16-КАМ. Применение визуального симулятора AWR VSS.
курсовая работа [2,2 M], добавлен 28.12.2014Анализ моделей радиоканалов в системах доступа четвертого поколения, способы их оценки. Методы оценки каналов в системах связи с использованием технологии OFDM–MIMO. Краткое описание технологии многоантенной передачи, ее достоинства и принципы работы.
дипломная работа [4,7 M], добавлен 18.10.2015Принципы расчета и построения систем беспроводной связи. Особенности распространения и затухания сигналов в системах радиосвязи с радиальной структурой. Определение максимального расстояния уверенного приема и посредственного, неуверенного приема.
курсовая работа [255,8 K], добавлен 08.10.2012Принципы работы существующего оборудования громкоговорящей связи. Технологические, инструментальные и методические способы подавления шумов и наводок в аудиотехнике. Дифференциальный метод подключения микрофонов. Автоматическая регулировка усиления.
курсовая работа [1,5 M], добавлен 21.02.2012Общие характеристики систем радиорелейной связи. Особенности построения радиорелейных линий связи прямой видимости. Классификация радиорелейных линий. Виды модуляции, применяемые в радиорелейных системах передачи. Тропосферные радиорелейные линии.
дипломная работа [1,1 M], добавлен 23.05.2016Преимущества радиоканальных охранных систем. Основные направления кодирования речи: кодирование формы (Waveform coding) и источника сигнала (Source coding). Структурная схема процесса обработки речи в стандарте GSM. Оценка качества кодирования речи.
реферат [46,8 K], добавлен 20.10.2011Тенденции развития систем безопасности с точки зрения использования различных каналов связи. Использование беспроводных каналов в системах охраны. Функции GSM каналов, используемые системами безопасности. Вопросы безопасности при эксплуатации систем.
дипломная работа [1,6 M], добавлен 22.07.2009Описание выявленных функциональных каналов утечки информации. Методологические подходы к оценке эффективности защиты речевой информации. Расчет возможности существования естественного акустического канала утечки информации по методу Н.Б. Покровского.
курсовая работа [3,6 M], добавлен 06.08.2013Принципы построения систем сотовой связи, структура многосотовой системы. Элементы сети подвижной связи и блок-схема базовой станции. Принцип работы центра коммутации. Классификация интерфейсов в системах стандарта GSM. Методы множественного доступа.
реферат [182,3 K], добавлен 16.10.2011Особенности распространения радиоволн в системах мобильной связи. Разработка и моделирование программного обеспечения для изучения моделей распространения радиоволн в радиотелефонных сетях для городских условий. Потери передачи в удаленных линиях.
дипломная работа [5,1 M], добавлен 20.10.2013Структурная схема системы связи и приемника. Выигрыш в отношении сигнал/шум при применении оптимального приемника. Применение импульсно-кодовой модуляции для передачи аналоговых сигналов. Расчет пропускной способности разработанной системы связи.
курсовая работа [1,1 M], добавлен 09.12.2014Передача цифровых данных по спутниковому каналу связи. Принципы построения спутниковых систем связи. Применение спутниковой ретрансляции для телевизионного вещания. Обзор системы множественного доступа. Схема цифрового тракта преобразования ТВ сигнала.
реферат [2,7 M], добавлен 23.10.2013Общие сведения о системах персональной спутниковой связи. Ознакомление с развитием российской государственной спутниковой группировки и программой запусков космических аппаратов. Характеристики космических и земных станций передачи и приема сигналов.
презентация [2,2 M], добавлен 16.03.2014Особенности построения цифровой сети ОАО РЖД с использованием волоконно-оптических линий связи. Выбор технологии широкополосного доступа. Алгоритм линейного кодирования в системах ADSL. Расчет пропускной способности для проектируемой сети доступа.
дипломная работа [5,9 M], добавлен 30.08.2010Параболические антенны, используемые в радиотехнических системах различного назначения (радиорелейные системы связи, радиолокация, спутниковые системы связи). Схема антенны. График амплитудного распределения по раскрыву и аппроксимирующей функции.
курсовая работа [246,5 K], добавлен 15.06.2011Принципы построения радиорелейной связи. Сравнительный анализ методов выбора высот антенн на интервалах цифровых радиорелейных линий. Анализ влияния замираний на показатели качества передачи. Расчет субрефракционных составляющих показателей качества.
дипломная работа [989,4 K], добавлен 06.12.2021