Синтез речеподобных сигналов на белорусском, казахском и русском языках
Разработка комбинированных маскирующих сигналов для систем защиты речевой информации, включающей "белый" шум и речеподобные сигналы для белорусского, казахского и русского языков. Методы создания базы структурных единиц речи для каждого из языков.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 03.05.2019 |
Размер файла | 22,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
СИНТЕЗ РЕЧЕПОДОБНЫХ СИГНАЛОВ НА БЕЛОРУССКОМ, КАЗАХСКОМ И РУССКОМ ЯЗЫКАХ
Е.Н. Сейткулов
Евразийский национальный университет
им. Л.Н. Гумилева, г. Астана,
А.В. Потапович, Г.В. Давыдов
Белорусский государственный университет
информатики и радиоэлектроники», г. Минск
Работа посвящена разработке комбинированных маскирующих сигналов для систем защиты речевой информации, включающие “белый” шум и речеподобные сигналы для языков организаций Таможенного союза: русского, белорусского и казахского. Применение комбинированных маскирующих сигналов позволят снизить уровень шума в защищаемом помещении, вызываемого работой устройств защиты речевой информации, при одновременном обеспечении защиты речевой информацию на русском, белорусском и казахском языках.
Предлагается маскирующие сигналы формировать из “белого” шума и речеподобных сигналов на белорусском, русском и казахском языках. Для обеспечения этого требования необходимо создать базы структурные единиц речи для каждого из языков и разработать алгоритмы синтеза речеподобных сигналов для белорусского, русского и казахского языков. При этом необходимо использовать данных о статистических характеристиках текстов на указанных языках (вероятности длины фоноабзаца, длины предложения, длины слова, вероятности появления аллофонов и определенных слогов для каждого из языков).
Такой подход к формированию маскирующих речь комбинированных сигналов обеспечивает более высокие показатели защищенности речевой информации, так как выделение и обработка любого сигнала тем более затруднительна, чем ближе помеха (комбинированные маскирующие сигналы, включающие речеподобные сигналы) по своей форме и частоте к защищаемому сигналу. Поэтому одним из перспективных вариантов формирования маскирующих речеподобных сигналов является формирование их по базе структурных единиц речи дикторов, речевые сигналы которых требуют повышенной степени защищенности. При этом форманты защищаемых речевых сигналов и форманты маскирующих речеподобных сигналов будут трудно различимы. Эффективность устройств защиты речевой информации весьма велика, когда в них сформированы речеподобные сигналы по базе аллофонов сотрудников, работающих в защищаемом помещении, и с учетом вероятностей длительностей слов, длительностей предложений и вероятностей появления фонем в русской речи. Такое решение применено в устройстве защиты речевой информации «Прибой-Р». В устройстве защиты речевой информации «Барон» используется также синтезатор речеподобные сигналы, но он формантного типа, что не позволяет полностью учесть особенности голоса сотрудников, работающих в защищаемом помещении. Когда речеподобные сигналы сформированы по базе аллофонов сотрудников, работающих в защищаемом помещении, то весьма трудно в перехваченном сигнале отделить форманты речи и частоту основного тона речеподобных сигналов и защищаемого речевого сигнала..
Важным требованием к маскирующим сигналам является требования, чтобы они формировались случайным образом, т. е. чтобы «белый» шум формировался за счет тепловых шумов полупроводниковых приборов или другой природы физических шумов. Это требование обусловлено необходимостью исключения какой-либо возможности очистки от шумов перехваченных акустических сигналов. Применение сформированных цифровым методом шумов вместо «белого» шума создает опасность того, что имеется возможность применения очистки сигналов от шумов. С другой стороны, и речеподобные сигналы, сформированные с использованием генератора случайных чисел, должны базироваться на тепловых шумах полупроводниковых приборов, а не на псевдослучайных последовательностях, сформированных цифровыми устройствами, что позволит повысить степень защищенности речевой информации.
По структуре комбинированные маскирующие сигналы должны состоять из «белого» шума с равномерной спектральной плотностью мощности в диапазоне частот от 100 до 10000 Гц и речеподобных сигналов на русском, белорусском и казахском языках
Синтез таких сигналов для каждого языка требует учета его специфики. Компиляция участков естественной речи широко используется в системах синтеза речи и в системах тестирования линий связи. Однако, для русского, белорусского и казахского языков сведения о методах формирования речеподобных сигналов для систем защиты речевой информации и алгоритмах их реализации слабо разработаны [1, 2].
При подготовке заданных текстов и создании речевых баз, учитывающих основные фонетические, лексические и грамматические особенности современных русского, белорусского и казахского языков. Помимо вышеуказанных этапов, весьма важным представляется выделение в языке так называемых фонем -- таких звуковых единиц речи, которые имеют смыслоразличительное значение, так как в потоке речи в силу разных обстоятельств можно получать тот или иной оттенок (варианты фонем). При создании речевых баз русского, белорусского и казахского языков необходимо также понимание работы речевого аппарата, который принимает участие в создании звуков. Алгоритмы синтеза речеподобных сигналов для систем защиты речевой информации для отдельных языков изложены в [3-6].
В одном из вариантов построения систем защиты речевой информации. предложено было речеподобные сигналы использовать в виде диалога участников переговоров на трех языках. Сценарии диалога могут быть следующие: говорит один из трех участников диалога в определенной последовательности, сменяя друг друга; говорит другой из участников диалога и реплику вставляет третий участник диалога или одновременно говорят два участника диалога; одновременно говорят три участника диалога.
С учетом языка участника диалога число возможных сценариев диалога определится
речеподобный сигнал маскирующий язык
,
где - число возможных сценариев диалога из трех человек; - число сочетаний один из трех; - число сочетаний два из трех; - число сочетаний три из трех.
В случае, когда участников диалога 6 человек, по 2 представителя (мужчина и женщина) для каждого из трех языков, число сценариев диалога определится
,
где - число возможных сценариев диалога из шести человек; - число сочетаний один из шести; - число сочетаний два из шести; - число сочетаний три из шести.
Распределения вероятностей сценариев по количеству одновременно говорящих и длительности таких сценариев представлены в таблице 1.
Таблица 1 - Распределения вероятностей сценариев по количеству одновременно говорящих и длительности таких сценариев
Вид сценария |
Распределение вероятностей % для сценариев |
Распределение вероятностей % для длительностей диалога в мин. |
||||||||||
5 |
4 |
3 |
2 |
1 |
0,5 |
0,4 |
0,3 |
0,2 |
0,1 |
|||
89 |
23 |
17 |
15 |
12 |
8 |
6 |
5 |
4 |
3 |
2 |
||
8 |
- |
- |
- |
- |
6 |
14 |
20 |
30 |
20 |
10 |
||
3 |
- |
- |
- |
- |
- |
6 |
19 |
35 |
25 |
15 |
Распределение вероятностей выбора дикторов для каждого из сценариев подчинено требованию равной вероятности. Например, для сценария , когда в диалоге участвует один из шести, то вероятность того, что будет выбран именно этот участник диалога, равна 16,7 %.
Список литературы
1. Сейткулов, Е.Н. Обоснование метода формирования комбинированных маскирующих речь сигналов / Е.Н. Сейткулов, Г.В. Давыдов, А. Потапович // Вестник КазНТУ, №2(102) - 2014. - С. 181 - 187.
2. Davydau, H.V. Method for protecting speech information // H.V. Davydau, V.A. Papou, A.V. Potapovich, Y.N. Seitkulov, Li Ye, Fan Yanhong, Jiang Jingsai, Bi Xiaoyan // Доклады БГУИР, 2015, № 6 С. 107 - 110.
3. Сейткулов, Е.Н. База аллофонов для компиляционного синтеза речеподобных сигналов на русском языке / Е.Н. Сейткулов, Г.В. Давыдов, А.В. Потапович // Современные средства связи: Материалы ХIХ Междунар. науч.-техн. конф. 14-15 окт. 2014 года, Минск: УО ВГКС, 2014 - С.193-195.
4.Сейткулов, Е.Н. База аллофонов для синтеза речеподобных сигналов на казахском языке / Е.Н. Сейткулов, Г.В. Давыдов, А.В. Потапович // Технические средства защиты информации: Тезисы докладов ХII Белорусско-российской научно-технической конференции (Минск 4-5 июня 2015г) Минск, БГУИР, 2015, С.18-19.
5. Сейткулов, Е.Н. Компиляционный синтез речеподобных сигналов с использованием сплайнов Е.Н. Сейткулов, Г.В. Давыдов, А.В., Потапович // Материалы XIX Международной научно-технической конференции «Современные средства связи», Минск 14 -15 октября 2014 г., С. 192 -193.
6. Давыдов, Г.В. Синтез речеподобных сигналов на белорусском языке Г.В. Давыдов, В.А. Попов, А.В. Потапович, Е.Н. Сейткулов, И.В. Савченко // Доклады БГУИР, 2015, №4, С. 27 - 32.
Размещено на Allbest.ru
...Подобные документы
Классификация языков программирования. Использование циклических конструкций и выполнение итерационных процессов. Алгоритмические структуры циклов языков C, C++, Java, C#. Особенности современных языков программирования высокого уровня и их применение.
курсовая работа [345,6 K], добавлен 13.11.2009Основы систематизации языков имитационного моделирования, моделирование систем и языки программирования. Особенности использования алгоритмических языков, подходы к их разработке. Анализ характеристик и эффективности языков имитационного моделирования.
курсовая работа [1,4 M], добавлен 15.03.2012Методы защиты речевой информации. Технические средства и системы защиты. Проведение оценки защищенности защищаемого помещения. Установка средств защиты информации, предотвращающих утечку информации по акустическому и виброакустическому каналу связи.
дипломная работа [3,4 M], добавлен 01.08.2015Основные концепции языков программирования, механизмы типизации данных. Описание языков программирования и методов трансляции. Конечные автоматы и преобразователи. Общие методы синтаксического анализа. Формальные методы описания языкового перевода.
курс лекций [5,5 M], добавлен 04.12.2013Ознакомление с методами анализа популярности языков программирования. Рассмотрение логической модели базы данных дистанционного практикума. Разработка листинга скрипта создания таблицы-справочника. Анализ статистики по применению языков программирования.
диссертация [1,4 M], добавлен 10.07.2017Проектирование системы голосового управления в автоматизированных жилых комплексах. Распознавание и порождение (синтез) речи компьютером. Синтез устной речи. Технология поиска ключевых слов. Нейросетевое сравнение на основе простых персептронов.
дипломная работа [4,3 M], добавлен 19.06.2011Использование электрических сигналов в технических системах. Классификация сигналов: непрерывные и дискретные, детерминированные и случайные, периодические, каузальные, финитные, когерентные и ортогональные. Длительность, ширина, объем и база сигнала.
реферат [59,9 K], добавлен 09.07.2009Понятия структурного программирования и алгоритма решения задачи. Краткая история развития языков программирования от машинных до языков ассемблера и языков высокого уровня. Процедурное программирование на C#. Методы и программы для моделирования.
учебное пособие [1,7 M], добавлен 26.10.2010Особенности и суть языков программирования, способы их задания, цепочки символов и операции над ними. Классификация языков и грамматик, форма Бэкуса-Наура. Определение и свойства регулярных выражений, конечные автоматы и грамматики, описание программы.
курсовая работа [231,5 K], добавлен 23.06.2011Распознавание слов в слитной речи, изолированных слов. Проблема автоматического распознавания речи. Структурная схема устройства выделения признаков речевых сигналов. Моделирование работы блока выделения начала и окончания слова количества звуков на ЭВМ.
дипломная работа [649,5 K], добавлен 13.11.2008Рассмотрение общих сведений и уровней языков программирования. Ознакомление с историей развития, использования языков программирования. Обзор достоинств и недостатков таких языков как Ассемблер, Паскаль, Си, Си++, Фортран, Кобол, Бейсик, SQL, HTML, Java.
курсовая работа [759,5 K], добавлен 04.11.2014Общая характеристика информационных систем, предназначенных для передачи, преобразования и хранения информации. Изучение форм представления детерминированных сигналов. Энтропия сложных сообщений. Рассмотрение основных элементов вычислительных машин.
лекция [1,5 M], добавлен 13.04.2014Понятия языка программирования, разновидности и характеристика языков. Исторический обзор их создания и применения. Классификация, примеры использования. Характеристики языков программирования с точки зрения элементов объектной модели, их популярность.
реферат [463,6 K], добавлен 07.09.2009Среднеквадратические значения напряжения и тока как одни из параметров периодических сигналов. Специфические особенности использования аппроксимационного подхода для определения квазидетерминированных сигналов и метрологического анализа результатов.
диссертация [3,7 M], добавлен 04.06.2017Виды языков программирования, их функциональные особенности и отличительные признаки, сферы практического применения. Язык для работы с базами данных SQL. Синтез компьютерной модели спроектированной базы данных, оценка ее эффективности и значение.
контрольная работа [365,4 K], добавлен 24.02.2015Характеристики и свойства языков программирования. Исследование эволюции объектно-ориентированных языков программирования. Построение эволюционной карты механизмов ООП. Разработка концептуальной модели функционирования пользовательского интерфейса.
курсовая работа [2,6 M], добавлен 17.11.2014Изучение математического описания дискретных детерминированных сигналов и овладеть программными средствами их моделирования в MatLab. Взаимосвязь между дискретным и дискретным нормированным временем. Линейная комбинация дискретных гармонических сигналов.
лабораторная работа [1,6 M], добавлен 16.10.2021Анализ нормативно-правовой базы, обоснование направлений создания обеспечения комплексной защиты информации в автоматизированных системах. Разработка методики оценки, выбор путей повышения эффективности защитных мероприятий в автоматизированных системах.
дипломная работа [368,5 K], добавлен 17.09.2009История создания языков С и С++. Разработка буквенного меню, посредством которого реализуются функции информационно-поискового справочника "Терморезисторы". Определение структуры данных, защита программы от ввода пользователем некорректных параметров.
курсовая работа [18,3 K], добавлен 16.02.2012Моделирование процесса обработки 500 сигналов, поступающих с датчиков. Определение среднего времени задержки сигналов в канале и линии-ЭВМ и вероятности переполнения входных накопителей. Разработка и описание алгоритма функционирования программной модели.
курсовая работа [140,7 K], добавлен 09.04.2013