Методи підвищення якості виділення мовних сигналів для голосової аутентифікації користувачів
Шляхи підвищення якості отримання мовного сигналу користувача на тлі зовнішніх просторово-анізотропних шумових завад. Аналіз методів аутентифікації користувачів телекомунікаційних систем. Визначення недоліків цих методів. Пропозиції по їх усуненню.
Рубрика | Коммуникации, связь, цифровые приборы и радиоэлектроника |
Вид | автореферат |
Язык | украинский |
Дата добавления | 19.06.2018 |
Размер файла | 921,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
ХАРКІВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ РАДІОЕЛЕКТРОНІКИ
УДК 057.087:621.391
Автореферат
дисертації на здобуття наукового ступеня
кандидата технічних наук
Методи підвищення якості виділення мовних сигналів для голосової аутентифікації користувачів
Спеціальність 05.12.13 - радіотехнічні пристрої та засоби телекомунікацій
Файзулаєва Ольга Миколаївна
Харків - 2015
Дисертацією є рукопис.
Робота виконана у Харківському національному університеті радіоелектроніки Міністерства освіти і науки України.
Науковий керівник:
Невлюдов Ігор Шакирович, доктор технічних наук, професор, Харківський національний університет радіоелектроніки, завідувач кафедри технології та автоматизації виробництва РЕЗ та ЕОЗ.
Офіційні опоненти:
Пономаренко Микола Миколайович, доктор технічних наук, доцент, Національний аерокосмічний університет імені М.Є. Жуковського "ХАІ", доцент кафедри прийому, передачі та обробки сигналів;
Худов Геннадій Володимирович, доктор технічних наук, професор, Харківський університет Повітряних Сил імені Івана Кожедуба, начальник кафедри тактики радіотехнічних військ факультету радіотехнічних військ протиповітряної оборони.
Захист відбудеться "__" ________ 2015 р. о ___ годині на засіданні спеціалізованої вченої ради Д 64.052.09 у Харківському національному університеті радіоелектроніки за адресою: Україна, 61166, м. Харків, пр. Леніна, 14.
З дисертацією можна ознайомитися в бібліотеці Харківського національного університету радіоелектроніки за адресою: Україна, 61166, м. Харків, пр. Леніна, 14.
Автореферат розісланий "__" ___________ 2015 р.
Вчений секретар спеціалізованої вченої ради Д 64.052.09 Є.В. Дуравкін.
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. В останні роки питання інформаційної безпеки телекомунікаційних систем та мереж стає більш актуальним не тільки для державних установ, але й для комерційних організацій і приватних осіб у всьому світі. Відповідно до оцінок комісії внутрішніх справ британського парламенту, втрати світової економіки від злочинів, які зроблені за допомогою Інтернету, досягли 388 млрд. доларів. Таким чином, кіберзлочинність обійшла за своїм розмахом світовий наркоринок, річний оберт якого оцінюється в 288 млрд. дол. Розмах кіберзлочинності обумовлений низькою якістю систем аутентифікації, удосконалювання яких пов'язують із використанням біометричних ознак користувача.
Питанням розвитку та впровадження біометричних систем аутентифікації сьогодні присвячені численні дослідження й розробки, окремі питання яких розглянуто в роботах Г. Фанта, Р.М. Болла, Г.С. Рамішвілі, Ф. Росе, В.Н. Сорокіна, Г. Холліена та ін. Головна перевага цих систем в тому, що біометричні характеристики унікальні й завжди перебувають із користувачем. Однак, надії, пов'язані з "більшими біометриками" (зображення особи, папілярний візерунок пальця й райдужна оболонка ока), до сьогодні частково зруйновані. Тому зараз велика увага приділяється дослідженням і розробкам систем голосової аутентифікації (СГА). Відомі переваги голосових систем: простота, компактність, дешевина тощо, доповнюються тим, що зазначені засоби аутентифікації більшою мірою залежать від відношення сигнал/шум (ВСШ) оброблюваних матеріалів реєстрації. Тут же слід зазначити, що мовний сигнал користувача (МСК), який реєструється на тлі просторово-анізотропних завадових та шумових послідовностей, може оперативно змінюватися й за необхідності підвищення ВСШ динамічно нарощуватися. Все це призводить до поліпшення якісних і кількісних характеристик СГА.
Оскільки відмітні ознаки користувача перебувають за межами стандартного телефонного каналу (СТК) у діапазонах 0.1-0.3 кГц; 4-5 кГц; 6.5-7.8 кГц, мовний сигнал у СГА має реєструватися в широкій смузі частот (від 0.1 до 8 кГц). Використання традиційних методів обробки акустичних сигналів, які реєструються на один мікрофон, при низькому відношенні сигнал/шум є недостатнім для забезпечення необхідних характеристик СГА. Тому в дисертаційній роботі досліджується гіпотеза більш повного використання можливостей сучасних комп'ютерних засобів (існуючих двох каналів реєстрації акустичного сигналу, що не використовуються) і просторово-часової обробки матеріалів реєстрації. При цьому особливу увагу необхідно приділити смузі частот вище 4 кГц, оскільки в цій області перебувають основні інформативні ділянки, що характеризують особистість користувача. Однак, у цьому діапазоні розміщені максимуми спектра завадових сигналів, обумовлених роботою комутаційної апаратури (комутатори, маршрутизатори), серверів та ін. (в області 3, 4.2 і 5 кГц), що викликає певні складності в ході реалізації процедур цифрової обробки сигналів (ЦОС). Оскільки цифрова послідовність, що містить корисний МСК, апріорі відома. Тому стосовно теорії оптимального прийому сигналів необхідно вирішити завдання виділення (фільтрації) повідомлень, а саме виділити МСК. В зв'язку з цим основні процедури ЦОС мають бути орієнтовані на підвищення ВСШ зареєстрованого мовного сигналу, що дозволить більш якісно виділити ознаки користувача (інакше, якісно сформувати шаблон), що дасть можливість отримати кращі характеристики СГА.
У зв'язку з цим, у дисертаційній роботі поставлена й вирішується актуальна науково-прикладна задача, суть якої полягає в удосконаленні та розробці методів виділення мовних сигналів користувача за рахунок застосування в СГА двохелементної мікрофонної решітки та просторово-часової обробки матеріалів реєстрації.
Зв'язок роботи з науковими програмами, планами, темами. Дисертаційна робота пов'язана з реалізацією основних положень "Концепції національної інформаційної політики", "Концепції Національної програми інформатизації", "Концепції конвергенції телефонних мереж і мереж з пакетною комутацією в Україні" та "Основні засади розвитку інформаційного суспільства в Україні на 2007-2015 роки". Результати дисертаційної роботи використані в ході виконання науково-дослідної роботи № 277 "Створення експериментальних зразків компонентів мікросистемної техніки для виробництва з інтелектуальними властивостями та їх впровадження", яка виконується за держзамовленням (№ ДР 0113U000358).
Мета дисертаційної роботи - підвищення якості виділення мовного сигналу користувача на тлі зовнішніх просторово-анізотропних шумових завад.
Задачами дослідження є:
- аналіз наукових праць в галузі голосової аутентифікації та визначення напрямку наукового дослідження, а також методів підвищення якості сучасних СГА користувачів телекомунікаційних систем і мереж;
- дослідження впливу частоти дискретизації коливань, які реєструються, на якість формування квадратурної (уявної) складової аналітичного сигналу;
- дослідження впливу першої модової функції перетворення Гільберта-Хуанга на якість обробки мовного сигналу користувача та розробка систематизованої сукупності кроків (дій, процедур), які необхідно здійснити щодо видалення з ЦОС зазначеної функції;
- уточнення структури й програмно-апаратних засобів, а також систематизованої сукупності процедур (дій) для підвищення якості вводу й виділення мовного сигналу користувача в СГА;
- створення макета програмно-апаратних засобів для проведення досліджень;
- натурні експериментальні дослідження з метою підтвердження адекватності, достовірності й ефективності запропонованих наукових результатів.
Об'єкт дослідження - процес виділення мовного сигналу користувача на тлі зовнішніх просторово-анізотропних шумових завад у системах голосової аутентифікації.
Предмет дослідження - методи й засоби виділення мовного сигналу користувача в СГА під час цифрової обробки даних з низьким ВСШ.
Методи дослідження. У ході виконання роботи використано основні методи емпіричного та теоретичного дослідження. Методи емпіричного дослідження (спостереження, порівняння, вимір) використовувалися в процесі аналізу та вибору основних напрямків роботи, а також в ході оцінки ефективності прийнятих технічних рішень. Теорія прийняття рішень - синтез процедур виділення мовного сигналу користувача. Математичне моделювання, натурний експеримент і математична статистика застосовувалися в ході дослідження адекватності, достовірності й оцінки ефективності наукових результатів.
Наукова новизна одержаних результатів. Під час розв'язання поставлених наукових задач було отримано наступні нові наукові результати:
1. За допомогою критерію ефективність/вартість уточнено вимоги щодо частоти дискретизації мовного сигналу користувача, яка на відміну від відомих вимог повинна в 5-7 разів перевищувати верхню частоту коливань. Виконання зазначених вимог дає можливість підвищити точність відновлення квадратурної (уявної) складової аналітичного сигналу під час обробки послідовностей з ВСШ менших за 10 дБ.
2. Для підвищення якості формування квадратурних складових просторово-часової обробки вперше запропоновано метод видалення першої модової функції перетворення Гільберта-Хуанга, який базується на аналізі спектральних характеристик зазначеної функції. Метод забезпечує енергетичний виграш до 3 дБ під час обробки даних з ВСШ до 10 дБ.
3. Набув подальшого розвитку метод виділення мовного сигналу користувача, який на відміну від відомих забезпечує адаптивну компенсацію просторово-анізотропних шумових завад з використанням цифрової двоканальної просторово-часової обробки та дозволяє знизити до 20 дБ спектральних характеристик завад у діапазоні частот від 4 до 8 кГц.
Практичне значення результатів роботи. Практична значущість дисертаційної роботи полягає в тому, що запропоновані в ній наукові результати дозволяють здійснювати розробку СГА з більш високими технічними характеристиками для телекомунікаційних мереж різного призначення.
Установлені вимоги до частоти дискретизації та метод видалення з обробки першої модової функції можуть знайти застосування в радіолокаційних, радіозв'язкових, сейсмічних та ін. системах, в яких реалізована ЦОС.
Запропонований метод вводу та виділення мовного сигналу користувача може знайти застосування в ході реалізації систем доступу різного призначення, криміналістиці, судовій експертизі та ін.
Матеріали дисертаційної роботи також використано в навчальному процесі в ході викладу дисципліни "Ідентифікація об'єктів та користувачів" на кафедрі телекомунікаційних систем Харківського національного університету радіоелектроніки. Крім того, окремі результати дисертаційної роботи використано під час виконання науково-дослідної роботи № 277 (№ ДР 0113U000358). Використання результатів дисертаційної роботи підтверджено відповідними актами впровадження.
Особистий внесок здобувача. Всі основні наукові результати, які висвітлено в дисертаційній роботі, отримано автором самостійно. Крім цього, у наукових працях, що виконані у співавторстві, дисертантові належать:
- в [1] проведений аналіз основних біометричних систем аутентифікації й визначено напрямки досліджень;
- в [2] виконаний синтез вирішального правила за критерієм мінімуму середнього ризику та аналіз якісних характеристик біометричних систем;
- в [3, 4] розроблено методику проведення досліджень і виконано імітаційне моделювання, обґрунтовано характеристики моделі часової дискретизації мовних сигналів;
- в [7] обґрунтовано метод побудови програмно-апаратних засобів вводу та виділення мовного сигналу користувача, а саме вибір відстані між мікрофонами системи вводу мовного сигналу, а також доцільність використання просторово-часової обробки, розроблено методику й виконано імітаційне моделювання, проведено дослідження впливу адаптивних процедур формування вагових коефіцієнтів;
- в [8] розроблено методику та схему проведення натурного експерименту, уточнено програмно-апаратні засоби експериментальної установки, виконано дослідження на експериментальній установці та узагальнено їхні результати.
Апробація результатів дисертації. Основні результати дисертації доповідалися на 7 наукових національних і міжнародних конференціях, форумах і семінарах, у тому числі на I-й Міжнародній науково-практичній конференції "Проблеми інфокомунікацій. Наука і технології (PIC S&T-2013)" (м. Харків, ХНУРЕ, 2013); XVII-му і XVIII-му Міжнародних молодіжних форумах "Радіоелектроніка та молодь у ХХІ сторіччі" (м. Харків, ХНУРЕ, 2013-2014); науково-практичних конференціях "Застосування інформаційних технологій у підготовці й діяльності сил охорони правопорядку" (м. Харків, Академія внутрішніх військ МВС України, 2013-2014); Міжнародній науково-практичній конференції, присвяченій до 50-річчю МРТІ-БДУІР (м. Мінськ, Білоруський державний університет інформатики й радіоелектроніки, 2014), науково-практичному семінарі "Актуальні питання матеріально-технічного забезпечення службово-бойової діяльності Національної гвардії України" (м. Харків, Національна академія Національної гвардії України, 2014).
Публікації. За матеріалами дисертації опубліковано 15 робіт, у тому числі 8 статей, серед яких 6 статей у наукових фахових виданнях України [1-6]та 2 статті у зарубіжних журналах [7, 8]. Результати дисертаційних досліджень опубліковано в 7 тезах доповідей та матеріалах наукових конференцій та форумів [9-15].
Обсяг та структура дисертації. Дисертація складається із вступу, чотирьох розділів, висновків, списку використаних джерел та двох додатків. Загальний обсяг роботи складає 166 сторінки друкарського тексту, із них 15 сторінок із рисунками. Список використаних джерел містить 86 найменувань на 9 сторінках. якість мовний аутентифікація телекомунікаційна
ОСНОВНИЙ ЗМІСТ РОБОТИ
У вступі розкрито стан досліджуваної проблеми, обґрунтовано актуальність теми роботи, сформульовано наукову задачу та визначено мету досліджень. Зазначено наукову новизну та практичне значення отриманих у роботі результатів. Наведено дані про публікації автора за темою дисертації.
У першому розділі виконано аналіз поточного стану систем аутентифікації користувачів сучасних телекомунікаційних систем та мереж. Виявлено основні напрямки їхнього розвитку й показано, що вдосконалення систем аутентифікації пов'язано з використанням біометричних характеристик користувачів. Проаналізовано роботи й дослідження в сфері застосування біометричних систем аутентифікації. Синтезовано вирішальне правило прийняття рішення про допуск користувача до ресурсів за критерієм мінімуму середнього ризику, яке зводиться до так званого вагового критерію
, (1)
де - умовна ймовірність правильного допуску користувача до ресурсів; - умовна ймовірність помилкового розпізнавання користувача-хакера; - ваговий множник, який залежить від відношення вартості плати за помилкові рішення та величин апріорних ймовірностей конкуруючих умов для рішень, що приймаються.
Аналіз цього критерію свідчить, що порівняльна характеристика EER (Equal Error Rate, рівний коефіцієнт помилок), яка часто використовується на практиці, не є оптимальною. Для збільшення "зваженої" різниці запропоновано збільшувати ВСШ як у процесі реєстрації біометричних характеристик, так і в процесі реалізації процедур їх цифрової обробки. Обґрунтовано доцільність використання систем голосової аутентифікації, яка з позицій критерію ефективність/вартість має значні переваги. Крім того, мовна фраза користувача може оперативно та динамічно нарощуватися для підвищення ВСШ. До сьогодні декілька мікрофонів у СГА розглядалися для компенсації характеристик каналу реєстрації за допомогою стереозапису або методом оцінки відстані до чотирьох мікрофонів, також досліджувалася просторово-часова обробка сигналів для малогабаритних систем звукозапису з метою локалізації джерела звуку. Таким чином, використання двох мікрофонів у засобах вводу та виділення мовного сигналу користувача у СГА не розглядалося та потребує дослідження. На основі аналізу відомих наукових робіт визначено, що мовний сигнал користувача необхідно реєструвати в області частот від 0.1 до 8 кГц. При цьому найбільш інформаційні ділянки знаходяться на частотах вище 4 кГц.
У другому розділі обґрунтовується вибір напряму та загальна характеристика основних задач досліджень. Кількісні характеристики СГА істотно визначаються якістю вирішення завдань на таких етапах: вводу мовного повідомлення на тлі просторово-анізотропних шумових завад; виділення мовного сигналу та формування на його основі шаблону; обробка сформованого шаблону та матеріалів бази користувачів, а також прийняття рішення щодо аутентифікації.
Рішення ряду з перерахованих завдань може бути досягнуто, в першу чергу, за рахунок удосконалення методів вводу та виділення мовного сигналу для підвищення ВСШ. Відомі рішення та створені пристрої голосової аутентифікації орієнтовані на реєстрацію голосу користувача за допомогою одного мікрофона. Зараз, стандартні системні пристрої запису звуку в термінальних засобах телекомунікації мають два канали, які здатні реєструвати мовний сигнал у широкому діапазоні (квантування за рівнем і дискретизацією за часом). Застосування двох мікрофонів, рознесених у просторі, дозволяє не тільки збільшити ВСШ реєстрованої часової послідовності, але й надалі дає можливість реалізувати схему просторово-часової обробки, що є кращою за наявності просторово-анізотропних завад (робота кондиціонера, вентилятора або потужних мережних джерел живлення). У ряді випадків просторово-часова обробка включає процедури формування та використання квадратурної (уявної) складової реєстрованого сигналу, яка базується на моделі аналітичного сигналу. Зазначена складова широко та продуктивно використовується в радіолокації, радіозв'язку, сейсмології.
При цьому, в першу чергу, необхідно уточнити характеристики моделі часової дискретизації мовного сигналу. У більшості відомих робіт з ЦОС автори дотримуються двох крайнощів: рекомендують вибирати частоту дискретизації () рівну (чи трохи більшу) , де - верхня (несуча) частота реєстрованого коливання, або , які не відповідають якості результатів обробки чи реалізованості ЦОС. Сьогодні для формування квадратурної складової використовуються алгоритмічні процедури на базі перетворення Гільберта (Hilbert transform, HT) або його реалізації у вигляді цифрових сигнальних процесорів.
З 1995 року для обробки нелінійних і нестаціонарних послідовностей, до яких відносяться акустичні сигнали, запропоновано перетворення Гільберта-Хуанга (Hilbert-Huang transform, HHT). ННТ - двоетапна ітераційна процедура, базис якої формується на основі даних, що обробляються. На першому етапі здійснюється декомпозиція даних, які обробляються, та формується адаптивний базис перетворення - істотні модові функції (Intrinsic mode function, IMF). На другому етапі за необхідності виключається з обробки перша модова функція, яка містить завадові складові сигналу, а до інших застосовується перетворення Гільберта.
Результати перетворення Гільберта підсумовуються. Застосування ННТ дозволяє отримати більш якісні результати ЦОС, особливо для низького ВСШ. Однак, зараз відсутній метод автоматичного прийняття рішень щодо видалення із подальшої обробки першої модової функції, що є наступною задачею, яка потребує дослідження.
Размещено на http://www.allbest.ru/
Чергова задача пов'язана з удосконаленням методу вводу та виділення мовного сигналу користувача, який реєструється на два мікрофони. Методика проведення дисертаційного дослідження викладена на прикладі уточнення характеристик моделі часової дискретизації мовних сигналів (рис. 1).
При цьому використовується модель аналітичного сигналу для фазоманіпульованих послідовностей, які для низького ВСШ будуть нелінійні та нестаціонарні, як і акустичні сигнали. Допустимість цього припущення перевірена в процесі натурного експерименту.
Оцінка якості відновлення уявної складової аналітичного сигналу, а також ефективність інших прийнятих рішень, виконувалася за допомогою показників: коефіцієнт взаємної кореляції та оцінка середнього квадрата "нев'язання". Обґрунтуванням прийняття таких показників може бути наступне. Кореляція досить давно й широко використовується в ЦОС для різних систем. Кореляція дозволяє математично виміряти ступінь незалежності одного часового процесу від іншого або встановити подібність одного набору даних з іншим (що й потрібно в нашому завданні). Для розрахунку коефіцієнта взаємної кореляції (КВК) використано відоме співвідношення для двох дискретних послідовностей
, (2)
де й - аналізовані цифрові послідовності, - номер відліку аналізованої послідовності, - кількість аналізованих відліків, - оцінки математичного очікування аналізованих послідовностей.
У деяких випадках коефіцієнт кореляції змінюється незначно (для малого й великого ВСШ), тому порівняння коефіцієнта кореляції не є показовим. У зв'язку з цим, у ряді випадків для оцінки якості використано ще один показник - середній "квадрат нев'язання" (СКН)
. (3)
В ході побудови деяких залежностей виконано відоме нормування середнього "квадрата нев'язань"
, (4)
де , - мінімальне й максимальне значення аналізованих показників. Зазначене нормування дозволить звести середній "квадрат нев'язань" до діапазону від 0 до 1 (нормоване "нев'язання", НН), що спрощує процес порівняльного аналізу отриманих результатів.
У третьому розділі викладено основні наукові результати, які отримано за допомогою імітаційного моделювання. Для уточнення вимог щодо частоти часової дискретизації оброблялась фазоманіпульована послідовність. В разі відсутності адитивного шуму отримані результати характеризуватимуть потенційні можливості аналізованих перетворень (рис. 2). При цьому по осі абсцис відкладено відношення . Аналіз наведених залежностей свідчить, що для випадку < 2.4 вказані перетворення (НТ та ННТ) формують квадратурну складову у протифазі. При = 3 коефіцієнт кореляції дорівнює приблизно 0.85, що є прийнятним для відновлення квадратурної складової в процесі ЦОС. Середній "квадрат нев'язання" у цьому випадку дорівнює 0.1555. Якість результатів відновлення для перетворення НТ й ННТ однакова.
Рис. 2. Залежності КВК та СКН за відсутності шуму
Для низького ВСШ є можливість використати фільтруючу властивість перетворення ННТ (видалення з обробки першої модової функції), яка дозволяє отримати більш якісні результати (рис. 3).
Рис. 3. Залежності КВК та НН, ВСШ дорівнює 1 дБ
При цьому, результат перетворення Гільберта наведений суцільною лінією, Гільберта-Хуанга, відповідно - штриховою. Аналогічні результати отримано й за наявності мультиплікативних завад. Для визначення вимог до частоти дискретизації був застосований критерій ефективність/вартість в залежності відношення частот дискретизації та несучої (рис. 4).
Рис. 4. Залежності критерію ефективність/вартість для ВСШ 20 дБ та 1дБ
Аналіз наведених залежностей свідчить, що для формування квадратурної складової МСК доцільно використовувати перетворення Гільберта-Хуанга. Частота дискретизації має перевищувати верхню частоту сигналу, який обробляється, у 5-7 разів. Зі зниженням ВСШ частота дискретизації має збільшуватися.
Наступне завдання пов'язане з розробкою методу видалення з обробки першої модової функції ННТ, яка при низькому ВСШ містить шумові складові. Слід зазначити, для сигналів з низьким ВСШ видалення першої модової функції дозволяє отримати енергетичний виграш до 3 дБ, а для сигналів з більшим ВСШ - ця операція призводить до зменшення відношення сигнал/шум і перекручування мовного сигналу в області високих частот. Цим обумовлена актуальність і важливість розробки даного методу.
На практиці зазначене завдання можна вирішити за допомогою критеріїв згоди (хі-квадрат, Колмогорова та ін.), які припускають використання табличних даних, що ускладнює процедури автоматизації ухвалення рішення. Також виявився не продуктивним і аналіз основних моментів розподілу першої модової функції. Тому в дослідженні запропоновано для автоматичного прийняття рішення, щодо видалення зазначеної функції, використовувати оцінку середнього значення рівня потужності спектра першої модової функції. Як свідчать результати досліджень, вказаний показник збільшуються зі зниженням ВСШ (зростанням інтенсивності шуму в модовій функції) та має монотонний характер (рис. 5).
Рис. 5. Залежність для автоматизації прийняття рішення щодо видалення модової функції
Залежність має лінію тренда та дозволяє визначити порогове значення для прийняття рішення (17 дБ). Метод видалення першої модової функції зводиться до наступного. Виділяється перша модова функція та оцінюється розглянутий показник. Якщо отримана оцінка перевищує порогове значення, з обробки видаляється перша модова функція, а до інших застосовується НТ, результати якого підсумовуються. У протилежному випадку - видалення зазначеної модової функції недоцільно. Необхідно застосовувати НТ до аналізованого сигналу, або враховувати в обробці всі модові функції (потребує більшого обчислювального ресурсу). Достовірність та ефективність вказаних процедур перевірена в процесі модельного експерименту. Запропоноване рішення також дозволяє приблизно на порядок зменшити обчислювальні витрати під час обробки сигналів зі значним ВСШ.
Схема удосконаленого методу вводу та виділення мовного сигналу користувача із використанням просторово-часової обробки наведена на рис. 6. На схемі використовуються позначення. М 1 і М 2 - мікрофони, рознесені в просторі на деяку відстань по осі мікрофонної решітки; ЗК - звукова карта; - програмні формувачі квадратурної складової; - вагові коефіцієнти; ; () - помножувачі, що реалізують вагову обробку; (+) - суматор.
Зробимо припущення, що мовний сигнал користувача надходить по нормалі до осі мікрофонної решітки, а завадові сигнали можуть надходити з довільних напрямків. Уточнимо окремі характеристики і процедури наведеної схеми. Перше завдання пов'язане з вибором відстані між мікрофонами, що істотно впливає на вид діаграми спрямованості (ДС) й процедури просторово-часової обробки. Діаграма спрямованості решітки визначається співвідношенням
, (5)
;
= 1 і 2 - номер мікрофона; - довжина хвилі, яка реєструється; - аргумент (кут приходу хвилі), що змінюється в розглянутому випадку в межах від до . Нормована діаграма спрямованості решітки із двох мікрофонів, що вимірюється в децибелах, визначається як
. (6)
Звернемо увагу на наступне. Вище було наведено, що необхідно якісно реєструвати мовний сигнал у діапазоні частот від 0.1 до 8 кГц. У зв'язку з цим, відстань між мікрофонами доцільно вибрати такою, щоб діаграма спрямованості мала одну (або головну) пелюстку (нулі при ) у процесі реєстрації хвиль акустичного сигналу. Така діаграма дозволить якісно реєструвати мовний сигнал користувача, що надходить по нормалі до осі решітки, і послабляти звукові хвилі, що заважають, з інших напрямків. Враховуючи просторові характеристики сучасних термінальних засобів і вимогу щодо наявності однієї пелюстки ДС у заданому діапазоні частот, відстань між мікрофонами має складати 10-20 мм. При цьому, дану відстань доцільно вибирати ближче до 20 мм, що дозволить простіше заглушувати високочастотні завадові сигнали. Результати розрахунку нормованої ДС для мм наведені на рис. 7. Аналіз рис. 7 свідчить про наявність одної пелюстки ДС, але для хвиль із меншою частотою значно змінюється коефіцієнт передачі. Наприклад, коефіцієнт передачі для діапазону частот 4-8 кГц змінюється вдвічі. При цьому властивості спрямування (напрямні здатності) мікрофонної решітки дозволяють в 2-3 рази знизити вплив сигналів, що заважають, які діють у діапазоні частот 4-8 кГц. Для частот нижче 4 кГц коефіцієнт передачі має значення від - 1 до - 0.1 дБ, що є недостатнім для заглушення завадових сигналів низької частоти (для частоти нижче 300 Гц, по суті, відсутні властивості спрямування ДС).
Поряд з перевагами (зручність розміщення мікрофонів на мобільних "гаджетах" і наявність одніє пелюстки в ДС для зазначеного діапазону) така відстань між мікрофонами має й істотні недоліки. Відомо, що для якісної обробки сигналів оптимальна відстань між елементами решітки має вибиратися з умови
,
де - довжина хвиль сигналів, які обробляються. У випадку, якщо відстань між елементами решітки , то не буде якісного заглушення сигналів, які надходять з інших напрямків.
Подальші процедури пов'язані з ЦОС, які обумовлені зареєстрованими звуковими хвилями. З метою підвищення якості заглушення завадових сигналів для СГА був досліджений вплив застосування адаптивного алгоритму розрахунку вагових коефіцієнтів (рис. 6). Відомо, що адаптація дозволяє перебороти апріорну невизначеність в ході вирішення завдань обробки інформації, у цьому випадку, за рахунок обчислювання вагових коефіцієнтів. Процедури розрахунку вагових коефіцієнтів зводилися до наступного. Сигнал помилки для -го каналу та -го такту обробки визначався як різниця між вхідним сигналом і виходом системи обробки, тобто
, (7)
де - вхідний сигнал -го каналу та -го такту обробки;
- вектор вхідних сигналів -го такту обробки;
- вектор вагових коефіцієнтів для-го такту обробки;
- вихідний сигнал системи обробки;
Т - знак транспонування. Кожний наступний ваговий коефіцієнт -го каналу дорівнює сумі попереднього коефіцієнта цього каналу й змінної складової, яка пропорційна значенням помилки в цьому каналі
, (8)
де - коефіцієнт, що визначає стійкість і збіжність процесу адаптації.
Наведені процедури адаптивного розрахунку вагових коефіцієнтів мають назву алгоритму мінімуму середньо квадратичного відхилення (СКВ) Уидроу-Хоффа. На величину коефіцієнта, що визначає стійкість і збіжність процесу адаптації, накладаються такі обмеження
, (9)
де - максимум власного значення кореляційної матриці вхідних сигналів.
Пропонується наступна технологія застосування розглянутих процедур під час аутентифікації користувача. На першому етапі (ідентифікації користувача, наприклад, з використанням пароля) виконується уточнення вагових коефіцієнтів з урахуванням поточної завадової обстановки в приміщенні. Тривалість уточнення величини коефіцієнтів залежить від величини коефіцієнта , меншому значенню коефіцієнта відповідає більший час адаптації. На другому етапі - під час вводу МСК використовуються коефіцієнти, отримані на попередньому етапі. При цьому доцільно реєструвати як вхідні сигнали, так і результати обробки. Вони можуть знадобитися в процесі наступної обробки.
На рис. 8,а наведено результат реєстрації адитивної суміші еталонного (500 Гц) і завадового (5000 Гц) сигналів на один мікрофон (штрихова лінія). Кут приходу завадового сигналу . Суцільною лінією на рис. 8, а, б, наведено еталонний сигнал. Штриховою лінією на рис. 8,б наведено результат виділення еталонного сигналу за допомогою запропонованої системи обробки. Критерієм оцінки якості цифрової обробки був КВК між еталонним сигналом і результатом реєстрації (обробки). У першому випадку це вихід одного мікрофона, а в другому - вихід системи обробки.
Величини коефіцієнта кореляції були рівні: 0,7 - на виході мікрофона; 0,99 - на виході запропонованої системи з адаптивними коефіцієнтами. Відомо, що коефіцієнт кореляції може бути перелічений у значення ВСШ, у першому випадку це 4 дБ. Запропонована схема виділення мовного сигналу дозволяє підвищити ВСШ до 20 дБ. При цьому якісна обробка сигналів забезпечується в більш широкому діапазоні кутів (до ). Зі зменшенням частоти завадового сигналу, знижуватиметься й виграш у значенні ВСШ. Наприклад, при впливі завадового сигналу із частотою 4 кГц величина ВСШ збільшується на 10 дБ.
Рис. 8. Результат реєстрації адитивної суміші мовного та завадового сигналу: на виході мікрофону(а); на виході системи обробки(б)
У четвертому розділі для перевірки адекватності, достовірності та ефективності наукових результатів було проведено натурний експеримент. Структурна схема програмно-апаратних засобів експериментальної установки наведено на рис. 9. До ноутбука підключався виносний пристрій із двома мікрофонами та схемою посилення коливань, які реєструються. Живлення виносного пристрою здійснювалося від USB порту ноутбука, а стереосигнали з виходу схеми посилення надходили на вхід його звукової карти. У ноутбуці були встановлені та використовувалися два класи програмних засобів - COOL EDIT і MATLAB. COOL EDIT - аудіо редактор, який виконував функції керування звуковою картою та формування звукового файлу. Цей файл надалі надходив на цифрову обробку, процедури якої були реалізовані в системі комп'ютерної математики MATLAB. Переваги системи MATLAB обумовлені тим, що її можна використовувати як алгоритмічну мову для реалізації унікальних процедур цифрової обробки даних, так і застосовувати готові до використання типові функції для вирішення завдань аналізу цифрових даних.
Рис. 9. Структурна схема програмно-апаратних засобів
Оцінка якості вводу та виділення МСК здійснювалася на тлі завадового впливу інтенсивних шумів вулиці, роботи комутаційної апаратури, сервера та ін. В якості корисного використовувався МСК цифри від 0 до 9. При цьому здійснювалося введення МСК по нормалі до осі мікрофонної решітки, відстань до мікрофонів становила 0.5-1 м. Завада, як правило, впливала на систему із двох мікрофонів під кутом. У більшості відомих робіт для розрізнення користувача використовуються переважно спектральні характеристики МСК. Тому в дослідженні піддавалися порівняльному аналізу спектральні характеристики мовного сигналу, зареєстрованого за допомогою одного каналу (мікрофону) і запропонованою системою вводу та виділення МСК на базі двох каналів (використання для реєстрації двох мікрофонів).
Виконано аналіз завадових сигналів для різних частот дискретизації (від 22 до 64 кГц). Зауважимо, що збільшення частоти дискретизації зміщує першу модову функцію в область високих частот та зменшує максимум рівня. Аналогічні висновки отримані під час аналізу мовних сигналів.
Результати експериментальних досліджень показали, що при частоті дискретизації менш 44 кГц запропонована схема обробки при низькому ВСШ є нестійкою, що обумовлено такими факторами: недостатньою якістю формування квадратурної складової; значним внеском перших модових функцій у результуючий мовний сигнал; неідентичністю характеристик каналів вводу мовного сигналу.
Нижче наведено результати досліджень вводу та виділення МСК цифри "1" та його "короткий" (менш 8кГц) спектр, які отримані при частоті дискретизації 44 кГц (рис. 10).
Рис. 10. Мовний сигнал цифри "1" та її спектр
На рис. 11 наведено спектр суміші МСК та шуму вулиці (зареєстрований одним мікрофоном) та результат ЦОС двох каналів, згідно з запропонованою схемою. Якісний аналіз спектрів МСК цифри "1" і суміші корисного сигналу й шуму вулиці свідчить, що в області високих частот (більше 4 кГц) спектральна щільність потужності для одного каналу реєстрації збільшується приблизно на 20 дБ. Водночас результати запропонованого методу виділення МСК свідчать про значне заглушення високочастотних складових, обумовлених впливом шуму.
Рис. 11. Спектр сигналу одного мікрофону та результатів ЦОС двох каналів
Для кількісного аналізу була проведена оцінка КВК та НН спектрів, яка наведена на рис. 12.
Рис. 12. Залежності КВК та НН від ВСШ
Аналогічні результати отримано при ЦОС інших цифр та інших завадових сигналів. Аналіз залежностей дозволяє зробити висновок, що запропонований метод вводу та виділення мовного сигналу користувача є більш ефективним по відношенню реєстрації на один мікрофон під час обробки послідовностей з ВСШ менш 10 дБ.
При ВСШ більше 10 дБ виникають проблеми в ході формування адаптивних вагових коефіцієнтів за слабким шумовим сигналом, а також позначається вплив неідентичності характеристик каналів реєстрації.
ВИСНОВКИ
У рамках дисертаційної роботи отримані нові науково обґрунтовані результати в сфері систем голосової аутентифікації, що в сукупності вирішують важливу науково-прикладну задачу, зміст якої полягає в удосконаленні та розробці методів виділення мовного сигналу користувача за рахунок застосування в СГА двоелементної мікрофонної решітки та просторово-часової обробки матеріалів реєстрації.
Виходячи з результатів, отриманих в ході вирішення поставленої задачі, можна сформулювати наступні висновки.
1. Установлено, що на сьогоднішній день в телекомунікаційних системах і мережах усе більш актуальними стають проблеми, пов'язані з надійністю систем аутентифікації. Певні надії були пов'язані з використанням "більших біометрик". Наступні дослідження та розробки показали недостатню ефективність зазначених систем. У цей час один з напрямків удосконалювання біометричних систем доступу пов'язують із голосовою аутентифікацією. СГА мають низьку вартість, компактність, простоту та ряд інших переваг і за критерієм ефективність/вартість їм слід віддавати перевагу. Особливо істотним є те, що якісні й кількісні характеристики цих систем більшою мірою залежать від ВСШ даних, які реєструються, що може оперативно змінюватися та нарощуватися в процесі вводу та обробки парольної фрази.
2. Досліджувана гіпотеза, що забезпечує підвищення ефективності методів вводу та виділення мовного сигналу користувача, пов'язана: з використанням двох мікрофонів; реалізацією просторово-часової обробки матеріалів реєстрації з адаптивними ваговими коефіцієнтами; формуванням і використанням квадратурної (уявної) складової послідовностей, які обробляються. Всі зазначені технічні рішення дозволяють підвищити ВСШ даних, які реєструються, що істотно впливає на кількісні показники якості СГА. Як основні показники оцінки якості вводу та виділення мовного сигналу користувача, використовувалися коефіцієнт взаємної кореляції та середній "квадрат нев'язання". Зазначені показники дозволили адекватно оцінити результати проведених досліджень.
3. Уточнено вимоги до частоти дискретизації матеріалів реєстрації з метою підвищення якості формування квадратурної складової аналітичного сигналу за допомогою перетворень Гільберта й Гільберта-Хуанга. Дослідження показали, що для якісного формування квадратурної складової частота дискретизації має в 5-7 разів перевищувати верхню частоту сигналу, який реєструється. У зв'язку з тим, що мовний сигнал має фіксуватися в діапазоні частот від 0.1 до 8 кГц, частота дискретизації має задаватися в межах від 40 до 60 кГц. Установлено області використання перетворення Гільберта-Хуанга, орієнтованого на обробку нестаціонарних послідовностей з нелінійними перекручуваннями. Ефективність перетворення Гільберта-Хуанга підвищується під час обробки послідовностей даних з низьким відношенням сигнал/шум. При цьому вимоги до частоти дискретизації збільшуються зі зменшенням ВСШ.
4. Уперше розроблено метод видалення з обробки першої модової функції перетворення Гільберта-Хуанга, який базується на оцінці математичного очікування складових спектра першої модової функції. Визначено граничне значення для оцінки математичного очікування спектра складає 17-19 дБ. Використання методу дозволяє отримати енергетичний виграш до 3 дБ під час обробки слабких сигналів та приблизно на порядок знизити вимоги до обчислювального ресурсу під час обробки сигналів з ВСШ більше 10 дБ.
5. Досліджено вплив відстані між мікрофонами на форму діаграми спрямованості в ході реєстрації мовного сигналу в діапазоні від 0.1 до 8 кГц. Для якісної реєстрації зазначеного мовного сигналу, що надходить по нормалі до осі мікрофонної решітки, відстань між мікрофонами має становити від 10 до 20 мм. У цьому випадку буде сформована одна пелюстка ДС і здійснюється заглушення завадових сигналів з інших напрямків. Ефективність заглушення завадових сигналів за допомогою ДС знижується зі зменшенням частоти оброблюваних сигналів.
6. Досліджено вплив просторово-часової обробки з урахуванням квадратурних складових послідовностей, які реєструються. Для формування квадратурної складової запропоновано використовувати перетворення Гільберта-Хуанга для обробки слабких сигналів. Досліджено вплив використання адаптивних процедур формування вагових коефіцієнтів за алгоритмом мінімуму СКВ Уидроу-Хоффа, що є ефективним під час обробки послідовностей даних з низьким відношенням сигнал/шум (менш 10 дБ). Уточнено технологію застосування програмно-апаратних засобів, що містить двоетапну процедуру. На першому етапі (ідентифікація користувача за допомогою пароля) - реєструється зовнішній завадовий шум і на його основі уточняються вагові коефіцієнти. На другому етапі - вводиться та виділяється мовний сигнал користувача за допомогою досліджених просторово-часових процедур.
7. У процесі натурного експерименту оцінена ефективність наукових результатів. Запропоновані технічні рішення дозволяють знизити вплив завад на спектральні характеристики мовних сигналів, які реєструються, у діапазоні частот 4-8 кГц до 20 дБ. Особливо ефективними запропоновані технічні рішення є під час обробки цифрових послідовностей сигналів при відношенні сигнал/шум менше 10 дБ.
8. Сформульовано рекомендації із практичного застосування розроблених технічних рішень. Набув подальшого розвитку метод вводу та виділення мовного сигналу користувача в СГА. Отримані результати можуть виявитися корисними й при вирішенні інших завдань, пов'язаних з обробкою мовних сигналів у комп'ютерах, наприклад, при розрізненні диктора, побудові систем фізичного доступу. Подальші дослідження пов'язані з розробкою процедур компенсації завадових сигналів в області низьких частот, а також уточненням адаптивних процедур формування вагових коефіцієнтів при великому ВСШ.
СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ
1. Невлюдов И.Ш. Анализ тенденций в развитии систем аутентификации пользователей вычислительных систем и сетей / И.Ш. Невлюдов, С.В. Пшеничных, О.Н. Пастушенко // Системи озброєння і військова техніка. Науковий журнал. - Харків: ХУПС, 2012. - Вип. 3(31). - С. 193-196.
2. Пастушенко О.Н. Анализ качественных показателей биометрических систем аутентификации пользователей / О.Н. Пастушенко, И.Ш. Невлюдов // Проблемы телекоммуникаций. - 2012. - № 4 (9). - С. 96-103 [Электронный ресурс]. - Режим доступа: http://pt.journal.kh.ua/2012/4/1/124_ pastushenko_biometric.pdf.
3. Белоусова Е.Э. Анализ частоты дискретизации на качество формирования квадратурной составляющей аналитического сигнала / Е.Э. Белоусова, Н.С. Пастушенко, О.Н. Пастушенко // Восточно-европейский журнал передовых технологий. - 2013. - Вип. 1/9(61). - С. 8-13.
4. Белоусова Е.Э. Анализ влияния частоты дискретизации на качество формирования квадратурной составляющей для некоторых сигналов / Е.Э. Белоусова, О.Н. Пастушенко // Радиотехника: Всеукр. межвед. науч.-техн. сб. - Харків: ХНУРЕ, 2013. - Вип. 172. - С. 141-146.
5. Файзулаева О.Н. Автоматизация процедур принятия решения об исключении из обработки первой модовой функции при использовании преобразования Гильберта-Хуанга / О.Н. Файзулаева - Радиотехника: Всеукр. межвед. науч. -техн. сб. - Харків: ХНУРЕ - 2013. - Вып. 175. С. 145-153.
6. Файзулаева О.Н. Технология ввода и выделения голосового сигнала пользователя в системах аутентификации / О.Н. Файзулаева - Збірник наукових праць Харківського університету Повітряних Сил. - 2013. - Вип. 4(37). - С. 137-143.
7. Файзулаева О.Н. Пути улучшения качества речевого сигнала пользователя систем голосовой аутентификации / О.Н. Файзулаева, И.Ш. Невлюдов // Научно-технический вестник информационных технологий, механики и оптики. - Санкт-Петербург: Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики. - 2014. - № 2 (90). - С. 118-123.
8. Файзулаева О.Н. Экспериментальные исследования программно-аппаратных средств ввода и выделения речевого сигнала пользователя систем голосовой аутентификации / О.Н. Файзулаева, И.Ш. Невлюдов // Научно-технический вестник информационных технологий, механики и оптики. - Санкт-Петербург: Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики. - 2014. - № 5 (93). - С. 77-82.
9. Белоусова Е.Э. Анализ частоты дискретизации на качество формирования квадратурной составляющей аналитического сигнала / Е.Э. Белоусова, Н.С. Пастушенко, О.Н. Пастушенко // Збірник тез доповідей науково-практичної конференції "Застосування інформаційних технологій у підготовці та діяльності сил охорони правопорядку". - Харків: Академія внутрішніх військ МВС України, 2013. - С. 26.
10. Пастушенко О.Н. Технологическое обеспечение средств голосовой аутентификации пользователей в вычислительных сетях / О.Н. Пастушенко // 17-й Международный молодежный форум "Радиоэлектроника и молодежь в ХХІ веке", 22-24 апреля 2013 г.: Сб. материалов форума. Том 4. - Харьков: ХНУРЭ, 2013. - С. 212-213.
11. Пастушенко О.Н. Анализ задач связанных с голосовой аутентификацией пользователей в вычислительных сетях / О.Н. Пастушенко, И.Ш. Невлюдов // Проблемы инфокоммуникаций. Наука и технологии (PIC S&T-2013): Сб. научных трудов первой международной научно-практической конференции. - Харьков: ХНУРЭ, 2013. - С. 79-80.
12. Невлюдов И.Ш. Обоснование и выбор расстояния между микрофонами для систем голосовой аутентификации / И.Ш. Невлюдов, О.Н. Файзулаева // Збірник тез доповідей науково-практичної конференції "Застосування інформаційних технологій у підготовці та діяльності сил охорони правопорядку". - Харків: Академія внутрішніх військ МВС України, 2014. - С. 34-36.
13. Файзулаева О.Н. Пути повышения эффективности систем голосовой аутентификации пользователей / О.Н. Файзулаева, И.Ш. Невлюдов // Сборник материалов Международной научно-практической конференции, приуроченной к 50-летию МРТИ - БГУИР. Часть 1. - Минск: БГУИР, 2014. - С. 213-214.
14. Файзулаева О.Н. Технологические аспекты голосовой аутентификации пользователей вычислительных систем и сетей. / О.Н. Файзулаева. - 18-й Международный молодежный форум "Радиоэлектроника и молодежь в ХХІ веке", 14-16 апреля 2014 г.: Сб. материалов форума. Том 4. - Харьков: ХНУРЭ, 2014. - С. 146-147.
15. Файзулаева О.Н. Методы повышения качества выделения речевого сигнала пользователя в системах голосовой аутентификации. / О.Н. Файзулаева. - Науково-практичний семінар "Актуальні питання матеріально-технічного забезпечення службово-бойової діяльності Національної гвардії України". Харків: Національна академія Національної гвардії України, 2014. - С. 89-92.
АНОТАЦІЯ
Файзулаєва О.М. Методи підвищення якості виділення мовних сигналів для голосової аутентифікації користувачів. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.12.13 - радіотехнічні пристрої та засоби телекомунікацій. - Харківський національний університет радіоелектроніки, Харків, 2015.
Дисертаційну роботу присвячено розв'язанню актуальної науково-прикладної задачі, суть якої полягає в удосконаленні методів виділення мовних сигналів користувача за рахунок застосування в системі голосової аутентифікації двоелементної мікрофонної решітки та просторово-часової обробки матеріалів реєстрації. В роботі проаналізовано методи аутентифікації користувачів телекомунікаційних систем і мереж та визначено їх основні недоліки. Запропоновано ряд рішень, які націлені на усунення встановлених недоліків систем аутентифікації, що пов'язані з використанням мовного сигналу користувача. Вперше для систем голосової аутентифікації досліджено можливості використання двох мікрофонів для вводу та виділення мовного сигналу користувача, а також просторово-часової обробки матеріалів реєстрації.
При цьому уточнено вимоги до частоти дискретизації матеріалів реєстрації для якісного формування квадратурної (уявної) складової аналітичного сигналу, яку запропоновано отримувати за допомогою перетворення Гільберта-Хуанга; уперше розроблено метод видалення з обробки першої модової функції перетворення Гільберта-Хуанга; удосконалений метод вводу та виділення мовного сигналу користувача.
Практична значущість дисертаційної роботи полягає в тому, що запропоновані в ній наукові результати дозволяють здійснювати розробку систем голосової аутентифікації з більш високими технічними характеристиками.
Ключові слова: адаптивні процедури, аутентифікація, мовний сигнал, діаграма спрямованості, просторово-часова обробка.
АННОТАЦИЯ
Файзулаева О.Н. Методы повышения качества выделения речевых сигналов для голосовой аутентификации пользователей. - Рукопись.
Диссертация на соискание ученой степени кандидата технических наук по специальности 05.12.13-радиотехнические устройства и средства телекоммуникаций. - Харьковский национальный университет радиоэлектроники, Харьков, 2015.
Диссертационная работа посвящена решению научно-прикладной задачи, суть которой состоит в совершенствовании методов выделения речевого сигнала пользователя за счет применения в системе голосовой аутентификации двухэлементной микрофонной решетки и пространственно-временной обработки материалов регистрации. В работе проанализированы известные методы аутентификации пользователей в телекоммуникационных системах и сетях. Проведено исследование существующих систем аутентификации пользователей, установлены их основные недостатки. Предложен ряд решений, которые нацелены на устранение установленных недостатков систем аутентификации, которые связаны с использованием речевого сигнала пользователя, а также совершенствованием программно-аппаратных средств ввода и выделения указанного сигнала, с целью повышения отношения сигнал/шум регистрируемой последовательности. Впервые для систем голосовой аутентификации исследованы возможности использования двух микрофонов для ввода речевого сигнала пользователя и пространственно-временной обработки материалов регистрации.
Уточнены требования к частоте дискретизации материалов регистрации для качественного формирования квадратурной (мнимой) составляющей аналитического сигнала, которую предложено получать с помощью преобразования Гильберта-Хуанга.
Впервые разработан метод исключения из обработки первой модовой функции преобразования Гильберта-Хуанга, который базируется на анализе спектральных характеристиках анализируемой функции. Метод позволяет получить энергетический выигрыш до 3 дБ при обработке цифровых последовательностей с малым отношением сигнал/шум или экономить вычислительный ресурс (повышать оперативность обработки) в противном случае.
Усовершенствован метод выделения речевого сигнала для голосовой аутентификации пользователя, позволяющие более эффективно бороться с помеховыми воздействиями в области высоких частот, за счет использования двухэлементной микрофонной решетки, пространственно-временной обработки материалов регистрации с учетом квадратурных составляющих и адаптивных весовых коэффициентов.
...Подобные документы
Обробка радіолокаційних сигналів, розсіяних складними об'єктами, на фоні нестаціонарних просторово-часових завад. Підвищення ефективності виявлення й оцінок статистичних характеристик просторово-протяжних об'єктів. Застосування вейвлет-перетворення.
автореферат [139,3 K], добавлен 11.04.2009Типи задач обробки сигналів: виявлення сигналу на фоні завад, розрізнення заданих сигналів. Показники якості вирішення задачі обробки сигналів. Критерії оптимальності рішень при перевірці гіпотез, оцінюванні параметрів та фільтруванні повідомлень.
реферат [131,8 K], добавлен 08.01.2011Порівняння якості алгоритмів компенсації шумової завади при використанні препроцесорів корекції мовленнєвого сигналу (алгоритм спектрального віднімання, MMSE, logMMSE) та оцінювання потенційних можливостей показників якості, що застосовуються при цьому.
статья [160,2 K], добавлен 15.08.2015Створення облікової інформації користувачів в мережі Windows NT утилітою User Manager для локального комп'ютера і User Manager for Domains для всіх комп'ютерів домену. Локальні, глобальні і спеціальні групи користувачів. Керування профілями користувачів.
реферат [49,2 K], добавлен 11.03.2010Моделі шуму та гармонічних сигналів. Особливості та основні характеристики рекурсивних та нерекурсивних цифрових фільтрів. Аналіз результатів виділення сигналів із сигнально-завадної суміші та порівняльний аналіз рекурсивних та нерекурсивних фільтрів.
курсовая работа [6,6 M], добавлен 20.04.2012Застосування OFDM сигналу на фізичному рівні мережі WIMAX. Введення станції користувачів в систему і ініціалізація. Виділення часу на можливість передачі. Пряме виправлення помилок. Методи боротьби із завмираннями. Адаптивна модуляція і Кодова залежність.
дипломная работа [1,6 M], добавлен 28.01.2015Аналіз якості лінійних безперервних систем автоматичного управління. Методи побудови перехідної функції, інтегральні оцінки якості. Перетворення структурної схеми, аналіз стійкості розімкнутої та замкнутої систем. Розрахунок часових та частотних функцій.
курсовая работа [1,1 M], добавлен 07.03.2014Вплив конструктивних рішень, вибору режимів роботи та матеріалів елементів електронних апаратів на підвищення надійності, впровадження мікроелектроніки. Узгодження конструкції пристроїв з можливостями технологічного процесу як основний параметр якості.
реферат [63,1 K], добавлен 01.05.2011Методи векторної та скалярної оптимізації широко використовуються при проектуванні систем і мереж зв’язку. Розгляд деяких прикладів, що іллюструють осбливості застосування методів оптимізації при отриманні оптимальної структури і параметрів даних систем.
реферат [125,2 K], добавлен 13.02.2011Загальні поняття та визначення щодо якості обслуговування. Класифікація показників якості обслуговування в телекомунікаційних системах. Поняття номінальної пропускної здатності середовища передачі інформації. Складові затримки під час передачі пакетів.
реферат [84,8 K], добавлен 27.03.2011Особливості мережі зв’язку; проектування автоматизованої системи: вибір глобального показника якості, ефективності; визначення структури мережі і числових значень параметрів. Етапи проектування технічних систем, застосування математичних методів.
реферат [58,6 K], добавлен 13.02.2011Визначення класичним, оперативним і спектральним методами реакції лінійного електричного кола на підключення джерела живлення. Використання цих методів при проектуванні нових телекомунікаційних пристроїв. Моделювання перехідного процесу за допомогою ЕОМ.
контрольная работа [419,6 K], добавлен 23.02.2012Спектральний аналіз детермінованого сигналу. Дискретизація сигналу Sv(t). Модуль спектра дискретного сигналу та періодична послідовність дельта-функцій. Модулювання носійного сигналу. Амплітудні та фазові спектри неперіодичних та періодичних сигналів.
курсовая работа [775,5 K], добавлен 05.01.2014Шляхи забезпечення захисту мовної інформації в каналі зв'язку, сучасні методи криптографічного захисту. Аналіз організації інформаційного обміну по мережах зв'язку загального користування. Основні методи перетворення мовного сигналу і їх взаємозв'язок.
контрольная работа [380,4 K], добавлен 13.10.2010Пропускна здатність лінійного тракту з ТDМ та WDM. Q-фактор - фактор якості передавання. Еталонні точки ВОСПІ. Опис моделі для розрахунку перехресних завад систем DWDM. Розрахунок рівня шумів системи. Врахування нелінійних ефектів оптичних компонентів.
реферат [3,0 M], добавлен 20.11.2010Перетворення сигналів і виділення інформації. Властивості оцінок, методи їх одержання. Характеристики оцінок початкових моментів. Заміна "усереднення по реалізаціях" "усередненням за часом". Оцінка математичного очікування по декількох реалізаціях.
курсовая работа [316,2 K], добавлен 24.06.2011Аналіз чинників, що впливають на рівень внутрішньо-системних завад систем мобільного зв’язку. Переваги технології цифрового діаграмоутворення. Закордонні концепції побудови систем мобільного зв’язку. Завадозахищеність телекомунікаційних магістралей.
реферат [9,4 M], добавлен 11.08.2009Методи й засоби комп'ютерної обробки зображень. Розгляд двох існуючих методів покращення якості зображень, основаних на суб’єктивному сприйнятті роздільної здатності і кількості кольорів. Порівняльна характеристика вейвлет-методу та градієнтського потоку.
реферат [317,1 K], добавлен 03.12.2009Технічна діагностика радіоелектронної апаратури. Розробка та обґрунтування процесу контролю якості. Дефекти, які можна виявити при контролі якості. Розробка методики досягнення запланованого рівня якості. Розробка статистичного методу контролю.
дипломная работа [9,3 M], добавлен 20.06.2012Огляд математичних моделей елементарних сигналів (функції Хевісайда, Дірака), сутність, поняття, способи їх отримання. Динамічний опис та енергетичні характеристики сигналів: енергія та потужність. Кореляційні характеристики детермінованих сигналів.
курсовая работа [227,5 K], добавлен 08.01.2011