Стохастична модель голосового сиґналу для задачі діаґностики ритміки серця людини

Аналітичний огляд і класифікація існуючих задач, принципів, моделей та методів опрацювання голосових сиґналів. Методи відшукання інформативних ознак як характеристик моделі для оцінювання стану ритміки серця. Способ визначення періоду корельованості.

Рубрика Математика
Вид автореферат
Язык украинский
Дата добавления 21.11.2013
Размер файла 287,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Міністерство освіти України

Тернопільський державний технічний університет імені Івана Пулюя

Чорна Леся Богданівна

УДК 681.3:519.24:303.725

Стохастична Модель голосового сиГналу для Задачі ДІАГНОСТИКи ритміки серця людини

Спеціальність 01.05.02 - Математичне моделювання та обчислювальні методи

Автореферат

дисертації на здобуття наукового ступеня

кандидата технічних наук

Тернопіль - 1999

Дисертацією є рукопис

Робота виконана у Тернопільському державному технічному університеті імені Івана Пулюя Міністерства освіти України

Науковий керівник доктор фізико-математичних наук, професор ДРАГАН Ярослав Петрович, Тернопільський державний технічний університет імені Івана Пулюя, професор кафедри біомедичних систем та апаратів.

Офіційні опоненти: доктор технічних наук, доцент РАШКЕВИЧ Юрій Михайлович, Державний університет "Львівська політехніка", завідувач кафедрою автоматизованих систем управління;

кандидат фізико-математичних наук, доцент Шинкарик микола Іванович, Тернопільська академія народного господарства, доцент кафедри економіко-математичних методів і моделей.

Провідна установа Державний науково-дослідний інститут інформаційної інфраструктури Національного агенства з питань інформатизації при Президентові України, відділ моделювання та прогнозування складних динамічних систем, м.Львів.

Захист відбудеться ”____” _________ 1999 р. о ___ годині на засіданні спеціалізованої вченої ради К 58.052.01 в Тернопільському державному технічному університеті імені Івана Пулюя, 282001, Тернопіль, вул. Руська, 56.

З дисертацією можна ознайомитись у науковій бібліотеці Тернопільського державного технічного університету імені Івана Пулюя, 282001, Тернопіль, вул. Руська, 56.

Автореферат розісланий “____” ________ 1999 р.

Вчений секретар спеціалізованої вченої ради Петрик М.Р.

загальна характеристика роботи

Актуальність теми. Математична модель сиґналу вирішальною мірою визначає ефективність функціонування інформаційно-вимірювальних систем, які забезпечують отримання відомостей про стан досліджуваного об'єкта. Тому центральним завданням є обґрунтування вибору такої математичної моделі, яка адекватна як об'єктові дослідження, так і класові розв'язуваних задач. Саме модель є основою створення алґоритмів опрацювання даних з метою виділення інформації, необхідної для прийняття рішень. Для об'єктивної діаґностики, експрес діаґностики в медицині, об'єктивного визначення психофізіологічних характеристик людини-оператора в ерґономіці, тренувального процесу в спорті та в криміналістиці необхідні опосередковані методи дослідження. Їх створюють на основі системно-сиґнальної концепції.

Серцево-судинна система є однією з найважливіших для людського організму; її стани характеризують ритмікою серця (РС). РС - це повторення в часі таких послідовних статистично-закономірних етапів: поступового охоплення збудженням обох шлуночків; поширення цього збудження по провідній системі серця і скоротливому міокарду; реакції м'язу серця скороченням на збудження (систоли); розслаблення (діастоли), слідом за яким, внаслідок автоматизму функції серця, знову виробляються імпульси збудження.

Відомі методи дослідження РС безпосередньо за сиґналами серця -електрокардіографія, фонокардіографія, балістокардіографія, полікардіографія - не забезпечують об'єктивності, бо вносять додаткові психологічні збурення від суб'єкта та об'єкта дослідження в процес вимірювання. Крім того, відбір відомостей про РС у цих діаґностичних методах здійснюють за допомогою електродних (контактних) засобів. Недоліком також є статичний спосіб відбору, що створює незручності для пацієнта. Застосування дистанційного (телеметричного) методу вимірювання, який полягає у реєстрації голосових сиґналів, дозволяє усунути ці недоліки. Але при цьому виникає задача визначення інформативних ознак голосового сиґналу, зумовлених РС.

Для обґрунтування алґоритмів вимірювання і опрацювання голосових сиґналів, інтерпретації отриманих результатів необхідна така їх модель, яка б містила інформативну характеристику - ознаку зміни РС.

У відомих математичних моделях голосових сиґналів, створених для задач розпізнавання та синтезу мови - заникній синусоїді, запропонованій Фантом; модульованій моделі Гауса; модульованій моделі Геннінга; кусково-постійній, запропонованій Т.Вінцюком - основну увагу приділено змістові мовного повідомлення, а інформацію про функціональний стан людини (в тому числі і РС) як надлишкову не враховано. Тому обґрунтування вибору такої математичної моделі голосового сиґналу, характеристики якої були б інформативними ознаками РС для її діаґностики, є актуальною задачею.

Зв'язок роботи з науковими програмами, планами, темами. Тема дисертаційної роботи пов'язана з такими держбюджетними темами, що виконувались в Тернопільському державному технічному університеті імені Івана Пулюя:

- ДІ 62-96, номер держреєстрації № 0196 U 012980 "Розробка методів та засобів високоякісного енергетичного забезпечення потреб високих та критичних технологій на основі використання нових матеріалів і сучасних інформаційних технологій";

- ДІ 72-97, номер №0197 U 004549 "Система екологічного і медичного моніторингу довкілля".

Мета і задачі дослідження. Метою роботи є розроблення такої математичної моделі голосового сиґналу, яка враховує характер РС, створення на її основі методики і алґоритмів пошуку та розрахунку інформативних характеристик моделі для діаґностики РС.

Для досягнення мети необхідно було вирішити такі задачі:

виконати аналітичний огляд і класифікацію існуючих задач, принципів, моделей та методів опрацювання голосових сиґналів з метою виявлення способів пристосування їх до використання як можливих засобів визначення таких характеристик, які можна пропонувати на роль носіїв відомостей про РС;

обґрунтувати вибір математичної моделі голосового сиґналу і її часово-інваріантної характеристики як можливого індикатора для медичної норми РС;

обґрунтувати вибір математичної моделі і можливої її інформативної характеристики, адекватних голосовому сиґналові для виявлення відхилень РС від норми;

сформулювати і розв'язати задачі: обґрунтування критерію встановлення значення інформативної характеристики; знаходження інтервалу існування цієї характеристики та її початкового наближення; вибору способу пошуку оцінки значення інформативної характеристики за цим критерієм;

розробити процедуру збору емпіричного матеріалу та здійснити верифікацію математичної моделі для різного характеру РС;

розробити методику розрахунку та пакети прикладних програм для аналізу голосових сиґналів з метою діаґностики (розпізнавання стану) РС.

Наукова новизна одержаних результатів:

зроблено змістовний опис сиґналу і показано, що його адекватне відображення та обґрунтований вибір часово-інваріантної та інформативної характеристик для задачі діаґностики РС можна провести на основі математичної моделі голосного звуку у вигляді стохастичного коливання;

вперше запропоновано математичну модель голосових сиґналів у вигляді полівузькосмугового періодично корельованого випадкового процесу (ПКВП) та показано, що його період корельованості є часово-інваріантною характеристикою для медичної норми РС та інформативною - для відхилень РС, і що це дає змогу на основі такої моделі розробити метод і засоби діаґностики РС за голосовим сиґналом;

вперше розроблено критерій вибору періоду корельованості із множини його можливих значень (максимум функціоналів варіацій оцінок статистичних характеристик моделі) та метод його знаходження (чисельний метод послідовного перебору), що стало підставою для розроблення способу визначення періоду корельованості;

показано, що часовий метод опрацювання голосових сиґналів - синфазний аналіз - є чутливим до змін періоду корельованості; це дає можливість створення простих обчислювальних алґоритмів для його визначення;

вперше шляхом експериментальної верифікації встановлено адекватність стохастичної моделі у вигляді полівузькосмугового ПКВП фізичній природі голосних звуків - притаманність їм властивостей випадковості, гармонізовності і періодичності статистичних характеристик: показано, що при спровокованому функціональними пробами порушенні РС змінюється період корельованості, а це дає можливість (у випадку його апріорного задання) визначати стан РС опосередкованими методами.

Практичне значення одержаних результатів. Вперше показано можливість використання голосних звуків для оцінювання РС опосередкованими методами. Отримані практичні результати розширюють область застосування статистичних методів при проектуванні технічних систем для медицини.

Розроблені методика і алґоритми визначення характеристик інформативних ознак голосового сиґналу на основі застосування стохастичної моделі голосного звуку як полівузькосмугового ПКВП, які можна використати для об'єктивної експрес діаґностики, криміналістики, при визначенні психофізіологічних характеристик людини-оператора в ерґономіці, під час тренувального процесу в спорті та в інших областях, де необхідно здійснювати надійний та оперативний контроль стану людини опосередкованими методами.

Отримані результати можуть стати основою для подальших досліджень моделі голосових сиґналів, відшукання в класі "не норми" РС інформативних ознак підкласів, які відповідали б певним симптомам чи конкретним захворюванням серця.

Розроблені в дисертації методи і рекомендації впроваджені у таких організаціях:

- Тернопільській державній медичній академії ім. І.Я. Горбачевського на кафедрі нормальної фізіології при експрес діаґностиці відхилень від норми частоти серцевих скорочень з використанням голосних звуків мови;

- діаґностичному центрі Тернопільської міської клінічної лікарні № 2 паралельно з класичними діаґностичними методами.

Особистий внесок здобувача в отриманні наукових результатів полягає в тому, що всі положення, які становлять суть дисертації, були сформульовані та вирішені самостійно. У публікаціях, написаних у співавторстві, здобувачеві належить: в роботі [1] - виконання чисельних експериментів на ЕОМ при розробленні алґоритму корекції мультиплікативних спотворень характеристик первинних вимірювальних перетворювачів та опрацювання їх результатів; в роботі [2] - специфікація алґоритмів статистичного аналізу даних; в роботі [3] - проведення чисельних експериментів на ЕОМ з дослідження функціоналів варіацій лінійної, квадратичної та кубічної функцій статистичних оцінок ПКВП моделі голосного звуку [a] та опрацювання їх результатів; в роботі [7] - обґрунтування доцільності використання алґоритму опрацювання сиґналу голосного звуку [а] синфазним методом та проведення евристичного пошуку інваріантних характеристик сиґналу для медичної норми РС; в роботі [8] - виконання аналітичного огляду можливих принципів класифікації моделей стохастичних сиґналів; в роботі [9] - обґрунтування вибору моделі голосного звуку у вигляді ПКВП (у рамках вже розробленої моделі в енергетичній теорії) як адекватної задачі пошуку інформативних ознак голосового сиґналу при діаґностиці стану РС; в роботі [10] - експериментальне опрацювання сиґналу [а] з наведенням результатів, висновків та рекомендацій щодо можливого використання синфазного аналізу голосних звуків [а] для медичної діаґностики РС.

Апробація результатів дисертації. Основні результати роботи доповідались і обговорювались на наукових семінарах кафедри біомедичних систем та апаратів ТДТУ імені Івана Пулюя (1995-1998), на міжнародній науковій конференції «The First European Conference on Signal Analysis and Prediction» - «ECSAP-97» (м.Прага, 1997), міжнародній науково-технічній конференції «Современные методы цифровой обработки сигналов в системах измерения, контроля, диагностики и управления» - «ОС-98» (м.Мінськ, 1998), міжнародній науковій конференції «Розробка та застосування математичних методів у науково-технічних дослідженнях» (м.Львів, 1998), міжнародній науковій конференції з комп'ютерних технологій друкарства «Друкотехн-98» (м.Львів, 1998), на першій Всеукраїнській конференції «Екологічний стрес і адаптація в біологічних системах» ТДПУ (м.Тернопіль, 1998), на третій науково-технічній конференції «Прогресивні матеріали, технології та обладнання в машино- і приладобудуванні» (м.Тернопіль, 1998).

Публікації. Результати дисертації опубліковано в 12 наукових працях, 5 з яких написані без співавторів, 6 - у наукових фахових виданнях України.

Структура та обсяг дисертації. Дисертаційна робота складається із вступу, чотирьох розділів, висновків, переліку використаних джерел та додатків. Загальний обсяг дисертаційної роботи (192 сторінки тексту) містить 160 сторінок основної текстової частини, включає 43 рисунки, 3 таблиці та 154 бібліографічні найменування на 13 сторінках, а також 8 додатків.

основний зміст РОБОТИ

У вступі обґрунтована актуальність задачі досліджень, сформульована мета, визначено основні завдання, показана наукова новизна та апробація матеріалів роботи, коротко викладено зміст дисертації.

У першому розділі зроблено стислий огляд стану і специфіки задачі діагностики РС за голосовим сигналом.

Проаналізовано відомі фізико-математичні моделі мовотвірного тракту: неоднорідної трубки із змінною в часі площею поперечного перерізу, однорідної трубки без втрат, електронну та цифрову моделі. Їх не можна використати для задачі діаґностики РС, оскільки в цих моделях немає компонентів, які б враховували вплив РС на систему мовотворення. Для задач, коли неможливо виміряти параметри системи (сформувати вектор стану), носієм інформації про таку систему є вихідний сиґнал. Основна трудність полягає в тому, щоб аналітично описати голосовий сиґнал через фізичні параметри системи, яка його породила. Такий напрям відомий під назвою сиґнальної концепції. Виконано аналітичний огляд стану досліджень голосових сиґналів та вибрано напрям досліджень. Ефективність діаґностування РС, як і у класичних задачах (ефективність розпізнавання та ідентифікації дикторів), визначається вдалим вибором ознак голосового сигналу, часово-інваріантних (з мінімальною дисперсією) для суб'єкта з медичною нормою РС, які відрізняються (дисперсія набагато більша) при відхиленнях РС. Формального підходу до вибору таких ознак немає, як немає і математичних моделей, які б містили такі ознаки. У працях Б.Атала, Дж.Волфа, М.Сондхі, Б.Юанг (IEEE, Journal of Acoustic Society of America, Signal processing, 1992-1998 рр.) вказано, що до числа розмежувальних ознак відносять: відношення сигнал/шум, амплітудно-частотні характеристики голосних звуків - амплітуди і частоти формант. Для подальшого опрацювання з різних голосових сиґналів вибрано голосний звук [а], оскільки такий звук є найбільш інформативним - відомо, що за голосними звуками визначають хвороби горла, легенів, захворювання нервової системи, тощо.

Голосні звуки мови творяться таким чином. Голосові зв'язки, модулюючи потік повітря, створюють послідовність імпульсів, близьких за формою до пилкоподібних. Частоту появи імпульсів називають частотою основного тону. Але при цьому голосові зв'язки не тільки модулюють потік повітря, а й вібрують, створюючи додаткові стохастичні коливання, які накладаються на основні імпульси. Врахувавши природу породження сиґналу голосного звуку, зробивши аналіз сучасних робіт з опису мовних сиґналів у вигляді коливання (суми періодичної та аперіодичної складових) G.Richard, С.Alessandro (1996); J.Laroche, Y.Stylianou, E.Moulines (1993); X. Serra, J.Smith III (1990); R.McAulay, T.Quatieri (1986), а також взявши до уваги відомі факти, що для задачі діаґностики хвороб за голосом необхідно враховувати фазову структуру сиґналу - запропоновано використати модель голосного звуку як стохастичного коливання. Такий підхід розвиває ідею про можливість і доцільність створення моделі звуків у вигляді коливного випадкового процесу (ВП).

Математичні методи спектрального аналізу коливаннь дав узагальнений гармонічний аналіз Н.Вінера. А.Хінчином (1937 р.) перенесено результат Н.Вінера на функції, значення яких є випадковими. Імовірнісний підхід до трактування гармонічного і спектрального аналізу було підсумовано А.М.Колмогоровим. Структуру нестаціонарних ВП у коливних системах виявляє введення М.Лоевом поняття гармонізовного ВП і його розширення Ю.А. Розановим. У розвинутій Я.Драганом стохастичній теорії ритміки на підставі моделі у вигляді ПКВП та споріднених з ним ВП поєднано часовий та спектральний опис складних стохастичних коливань. Ця теорія охоплює як часткові випадки відомі моделі: адитивну, мультиплікативну, їхнє поєднання та імпульсні моделі. В енерґетичній концепції, створеній Я.Драганом, розвинуто теорію нестаціонарних ВП, яка встановлює найзагальніші (математично - найменш обмежливі, а фізично - найприродніші) умови гармонізовності, а також дозволяє перенести на такі ВП належним чином узагальнені відомі факти із кореляційної теорії стаціонарних ВП. Отже, узагальнено теорію коливань на ситуації, коли разом із повторюваністю істотну роль відіграє нерегулярність, і обидві вони описуються імовірнісними законами. Енерґетичний підхід доповнює результати Л.І.Гудзенка, Л.Френкса, У.Гарднера, Г.Гарда, що дає можливість у припущенні -ерґодичності розробити і дослідити методи статистичного оцінювання характеристик часової зміни властивостей сиґналів - синфазний, компонентний чи фільтровий.

Таким чином, зроблено змістовний опис сиґналу і показано, що його адекватне відображення та обґрунтований вибір часово-інваріантної та інформативної характеристик для задачі діаґностики РС можна провести на основі математичної моделі голосного звуку у вигляді стохастичного коливання.

У другому розділі створено формалізований опис об'єкта дослідження РС людини у вигляді математичної моделі сигналів - голосних звуків [а]; обґрунтовано вибір їх моделі у вигляді ПКВП (клас Т) - ВП скінченної за період корельованості середньої потужності (клас ), тобто Т . За означенням ПКВП - це такі ВП, математичні сподівання та симетричні коваріації яких є періодичними функціями часу щодо сукупності часових зсувів їх аргументів

, , (1)

де Т>0 - період корельованості.

Математичне сподівання і зсувова коваріація (функція кореляції ) є періодичними з періодом Т:

, , .

Суттєвою властивістю ПКВП з класу є те, що основні задачі оцінювання їх характеристик можна розв'язувати зведенням до статистики стаціонарних ВП. Зокрема, в роботі використано той факт, що відліки через період корельованості творять векторну стаціонарну послідовність, тому синфазний метод оцінювання характеристик ПКВП є по суті варіантом статистики таких послідовностей. Але, крім того, ПКВП з класу є стаціонарними у гільбертовому просторі , тобто у гільбертовому просторі з метрикою Бора-Безиковича

абстрактних функцій на числовій осі зі значеннями в колмогорівському гільбертовому просторі К випадкових величин скінченної дисперсії, коли

де - символ математичного сподівання, а . Тоді

Застосовують той самий критерій що і в теорії звичайних, стаціонарних в колмогорівському гільбертовому просторі ВП, - досить швидке заникання кореляційних зв'язків при . Тому в припущенні -ерґодичності оцінка нульової кореляційної компоненти

має всі властивості оцінки кореляційної функції стаціонарних ВП. Її спектральна функція є оцінкою розподілу потужності ПКВП, але з виключеними завдяки усередненню кореляційними зв'язками між гармоніками. Крок реєстрації та точність наближення, що його дають відліки, також можна оцінити з цього розподілу потужності. Крок

є оберненою величиною до частоти зрізу. Точність наближення оцінюється як середньоквадратична похибка

, де .

З урахуванням сказаного проведено аналіз експериментальних даних при трактуванні їх у рамках детермінованого і стохастичного підходів. Результати аналізу методами періодичних, майже періодичних коливань у рамках детермінованого підходу приводять до висновку, що така модель не адекватна голосному звукові. Спектри, обчислені за часовими рядами голосного звуку [а], при зсувах початку відліку по часовій осі є нестійкими. Тому слід прийняти, що сиґнал породжується стохастичною системою і сам є випадковим.

Модель у вигляді стаціонарного ВП відображає складність сиґналу в спектральному розподілі потужності, але не відображає його часової структури. Це пояснюється тим, що голосні звуки при різній РС породжуються системою (серцем), що знаходиться в стані "пульсуючої" рівноваги. Оцінки, обчислені за експериментальними часовими рядами голосного звуку [а] в різні моменти часу, характеризуються відмінністю середніх значень, дисперсій, кореляційних функцій. Згідно з критеріями Фішера для дисперсій та Z0,95 гіпотеза про стаціонарність ВП відкидається; процес класифікується як нестаціонарний відносно критерію.

У результаті проведеного аналізу реєстрограм голосних звуків [а] показано, що адекватна їм модель повинна мати властивості випадковості, гармонізовності і періодичності статистичних характеристик. У рамках теорії другого порядку ці вимоги задовольняє модель у вигляді ПКВП, повну теорію яких розвинуто в рамках енергетичної теорії ВП.

ПКВП як стохастичне коливання відображає часово-фазову структуру голосового сиґналу, має засоби врахування як пов'язаності гармонічних складових, так і зміни імовірнісних характеристик сиґналу в часовій області. Для визначення стану РС відповідно до цієї обґрунтованої моделі голосного звуку необхідно було розробити методику експерименту.

У третьому розділі з урахуванням медичних методик розроблено методику проведення досліджень - методику пошуку в рамках обґрунтованої ПКВП-моделі часово-інваріантної для медичної норми РС характеристики - періоду корельованості та інформативної характеристики для відхилень РС.

В умовах експерименту зміни РС спровоковано дозованим подразником у вигляді функціональної проби (ФП) з фізичним навантаженням. Із відомих ФП вибрано пробу з 20-ма присіданнями як легку в застосуванні, маловитратну. Ця методика є загальноприйнятою для дослідження серцево-судинної системи у функціональній діаґностиці. Перед проведенням ФП визначали початкові дані - показники РС (частоту серцевих скорочень) та характеристики моделі голосового сиґналу (період корельованості, оцінки статистичних характеристик). Після ФП визначали характер і ступінь зміни цих показників.

Оскільки голосовий сиґнал є специфічною функцією конкретної людини, на етапі пошуку інформативних ознак проведено порівняння голосових сиґналів для однієї і тієї ж людини з медичною нормою РС та з відхиленнями РС (після ФП). Враховуючи результати аналогічних досліджень та відомі факти з задач розпізнавання мови і верифікації та ідентифікації дикторів, перевірено припущення, що порушення РС призведе до зміни величини періоду корельованості Т ПКВП-моделі голосового сиґналу.

Статистику ПКВП розвинуто за припущення, що Т - відоме. Однак, не існує прямих способів визначення періоду корельованості за реалізацією, оскільки періодичність є ознакою не ВП, а його характеристик (1). Період корельованості можна було б визначити з періодичності оцінок математичного сподівання та коваріаційної функції ПКВП, подібно до того як емпірично визначають період періодичної функції при виявленні прихованих періодичностей (відомий спосіб Б'юй-Балло). Але ці оцінки можна обчислювати тільки тоді, коли апріорно відомо період корельованості Т чи базову частоту ПКВП (1). Вихід з ситуації було отримано в результаті формулювання цієї задачі як поєднання задач оптимізації та перевірки в рамках статистики ПКВП складної гіпотези про пробний період. Для цього верифіковано складну гіпотезу, що період корельованості Т є якимось із значень у певному інтервалі за статистиками, обчисленими при різних фіксованих значеннях пробного періоду Тр із множини усіх його можливих значень . Інтервал оцінено з апріорних відомостей про частотний діапазон звуків мови (Мартинов (1965 р.)): у 95% жіночих голосів середня частота основного тону коливається від 195 до 320 Гц, у 95% чоловічих - від 97 до 195 Гц. Крок проходження інтервалу є точністю визначення періоду. Він пов'язаний з шириною спектру потужності ПКВП як -стаціонарного.

Розглянуто ефективність відомих способів визначення періоду основного тону, який є початковим значенням пробного періоду : 1) у часовій області за реєстрограмою сиґналу, усередненням інтервалів часу між його максимальними значеннями; 2) у часовій області шляхом визначення місцезнаходження першого максимуму кореляційної функції сиґналу; 3) у часовій області за мінімумом функції середнього значення абсолютної різниці; 4) у частотній області за амплітудним спектром сиґналу; 5) у частотній області за кепстром.

Із описаних способів обґрунтовано як маловитратний щодо кількості обчислень (для цілочислової системи числення) спосіб знаходження періоду основного тону голосового сиґналу за мінімумом функції середнього значення абсолютної різниці. Для уточнення значення періоду корельованості використано чисельний метод послідовного перебору можливих значень пробного періоду з кроком, рівним періоду дискретизації голосового сиґналу (910-5с).

Критерій вибору значення періоду корельованості із можливих вибрано в рамках енерґетичної теорії. ПКВП є континуальною сукупністю залежних від початкової фази стаціонарних (в широкому сенсі) і стаціонарно-пов'язаних випадкових послідовностей:

(2)

Формули, виведені з цієї властивості, тобто зведенням до теорії стаціонарних векторних послідовностей:

, (3)

дають слушні незсунуті оцінки характеристик ПКВП синфазним методом. Для скінченного відрізку ПКВП (довжиною = NT) формули оцінок (3) мають вигляд:

, (4)

Тому критерієм вибору оцінки періоду корельованості із пробних значень вибрано міру рельєфності кривих , , - відому в теорії функцій характеристику - варіацію функції:

(5)

(6)

де Dn([T1; T2]) - розбиття інтервалу [T1; T2]. Ця величина є невід'ємною і адитивною, тобто вона справді є мірою в математичному сенсі. Для підсилення рельєфності використано інші аналогічні характеристики - Ф-варіації за означенням:

(7)

При Ф(u) = u отримуємо клас Жордана (5)-(6), при Ф(u) = Up ( 1<p< ) - класи Вінера (7).

На рис. 1 зображено залежності та варіацій лінійної (Ф(u) = U), квадратичної (Ф(u) = U2) та кубічної (Ф(u) = U3) функцій статистичних оцінок при різних пробних значеннях базових частот як значень відповідних функціоналів.

Отже, за оцінку істинного значення - періоду корельованості - прийнято те значення, яке забезпечує максимум функціоналів варіацій:

, (8)

Значення для медичної норми РС однієї і тієї ж людини є однаковими. Тому його використано як часово-інваріантну характеристику.

Для перевірки припущення про зміну цієї характеристики при відхиленнях РС протягом перших 2-х секунд після ФП було зареєстровано голосні звуки [а]. Для них пораховано статистики (4) із тим самим значенням , яке визначено для медичної норми РС. Виявлено, що відповідні графіки мають на порядок менший розмах. Функціонали (5)-(7) досягли максимумів при інших значеннях , ніж для медичної норми РС для тієї ж людини.

Для підтвердження слушності припущення про період корельованості як інформативну характеристику стохастичної моделі сигналу та доцільності застосування розроблених алґоритмів у четвертому розділі проведено експериментальну верифікацію моделі.

У четвертому розділі наведено результати верифікації ПКВП як моделі голосних звуків, аналіз даних, висновки та інтерпретацію результатів.

Проведено верифікацію голосних звуків [а] з метою: 1) перевірки відповідності властивостей сиґналів голосного звуку [а] закономірностям класу випадкових функцій, вибраних за їх модель, - ПКВП, 2) підтвердження адекватності математичної моделі сиґналу для задачі діаґностики РС. Результати верифікації підтвердили адекватність вибраної моделі - полівузькосмугового ПКВП - реальним сиґналам: статистичні оцінки (математичне сподівання, дисперсія) флуктують біля періодичних функцій (рис. 1).

а)б)

Рис. 2. Графіки оцінок математичного сподівання (а) та дисперсії (б) голосного звуку [а] для медичної норми ритміки серця (криві 1) та після ФП (криві 2).

Показано, що період корельованості дійсно можна використати як інформативну ознаку. Порушення ритмічності серцевих скорочень внаслідок проведеної ФП спричинює зміну періоду статистичних характеристик (періоду корельованості) моделі голосних звуків у вигляді ПКВП.

Статистичні характеристики ПКВП-моделі сиґналів [а], отриманих від суб'єкта з відхиленнями РС від медичної норми, якщо обраховувати їх синфазно із тим самим значенням періоду, який був у нормальному стані, є згладженими (рис.2, криві 2). Спостерігається порушення ритміки статистичних характеристик голосового сиґналу, яке можна пояснити відхиленням періоду корельованості після проведеної ФП від його значення у нормі.

Зміна розмаху статистичних оцінок зумовлена тим, що при синфазному аналізі ПКВП трактується як континуальна сукупність залежних від початкової фази стаціонарних ВП (2). Тому при , визначеному для медичної норми РС як істинний, у статистичних оцінках, обрахованих до ФП, для усереднення будуть братися значення з цих стаціонарних послідовностей . Якщо ж період корельованості після ФП (TФП) зміниться, , то вже не буде спільною фазою для всіх відліків, і при усередненні будуть змішуватися значення різних стаціонарних послідовностей . За рахунок такого перемішування буде згладжуватися розмаїтість значень оцінок математичного сподівання , коваріаційної функції та дисперсії . Лише при умові криві , та в обох випадках мали б однакову амплітуду.

На графіках та (рис.1, криві 1, 2) видно суттєві відмінності в амплітудах оцінок. Оскільки відліки в обох випадках відбирались еквідистантно з періодом T, то лише зміна останнього могла привести до таких відмінностей оцінок. Кількісно ці відмінності було оцінено за формулами (5)-(7).

Для того, щоб оцінити чутливість періоду корельованості як характеристики при розділенні двох класів РС, використано узагальнену відстань - відстань Махаланобіса:

dT,i = (T - mi)Ci -1(T - mi) (9)

де T - значення періоду корельованості, обчислене для суб'єкта за реалізацією голосного звуку [а];

і - величина, що характерисує РС (i = 1 - клас медичної норми РС; i = 2 - клас всіх відхилень від норми РС);

m1 - значення T класу медичної норми РС для суб'єкта;

m2 - значення T класу всіх відхилень РС для суб'єкта;

Ci -1- загальна коваріаційна матриця класів 1 і 2.

Відстані обчислено для класів i=1 та i = 2; правилом розмежування класів є вибір класу, для якого dT,i менша.

Для значень відстаней dT,1 , dT,2 було досліджено імовірнісні міри Pi :

P1 = dT,1 /( dT,1 + dT,2); P2 = dT,2 /( dT,1 + dT,2) (10)

Міри P1 та P2 можна використовувати в медичній діаґностиці як апріорні імовірності того, що сиґнал відібрано від суб'єкта з нормою чи відхиленнями РС.Якщо ґрунтуватись на статистичних даних медичної норми, які відносяться до P1 розподілу, отриманих на основі аналізу 70 сиґналів, то можна вибрати відповідний довірчий інтервал параметра P1 для класифікації РС як норми/відхилення.

В даному випадку з інтервалом 0.6 отримано загальну кількість помилок діаґностики (розпізнавання стану) РС, яка наведена у табл. 1 для кожного класу (кількість суб'єктів - 7).

Таблиця 1. - Кількість помилок діаґностики РС

Суб'єкти

Кількість помилок

Медична норма (всього досліджень -10)

Після ФП (всього досліджень -10)

№1

1

-

№2

-

-

№3

1

1

№4

-

-

№5

-

-

№6

-

-

№7

-

-

Видно, що кількість помилок оцінювання є низькою. Таким чином, в роботі обґрунтовано можливість виділення двох класів (медичної норми та відхилень) РС, коли за інформативну ознаку взято період корельованості ПКВП-моделі голосних звуків.

При цьому не існує таких значень , при яких би розподіли значно перекривались. Проведені дослідження показали доцільність використання запропонованої моделі голосового сиґналу та методів діаґностики РС для об'єктивної експрес діаґностики, криміналістики, об'єктивного визначення психофізіологічних характеристик людини-оператора в ерґономіці, тренувального процесу в спорті.

висновки

У дисертаційній роботі обґрунтовано і теоретично проаналізовано моделі голосових сиґналів та розроблено математичне і програмно-апаратне забезпечення для їх дослідження з метою пошуку та визначення характеристик інформативних ознак голосового сиґналу для діаґностики РС. Зокрема:

На основі експериментальних досліджень голосових сиґналів показано неадекватність для задачі розпізнавання стану РС існуючої нуль-полюсної моделі мовотвірного тракту (як аналогу акустичної труби) і методів опрацювання голосових сиґналів, в основі яких лежить концепція спектру потужності як детермінованих моделей, так і стаціонарної моделі.

Розвинуто часовий метод аналізу голосових сиґналів, який враховує не тільки гармонічний склад та спектральний розподіл потужності сиґналу, але й часову зміну його властивостей.

Показано часову інваріантність оцінки періоду нестаціонарності - характеристики моделі голосового сиґналу.

Вперше запропоновано використання періоду корельованості як інформативної ознаки для діаґностики різного стану РС.

Обґрунтовано використання синфазного методу аналізу періодично корельованих випадкових процесів для визначення змін періоду корельованості, пов'язаних зі змінами РС.

Показано ефективність застосування запропонованих методів діаґностики РС у криміналістиці, об'єктивній експрес діаґностиці.

голосовий сиґнал модель корельованість

список опублікованих праць здобувача за темою дисертації

П.С.Євтух, Л.Б.Чорна. Про алгоритм автоматичної корекції характеристик первинних вимірювальних перетворювачів // Вісник Тернопільського державного технічного університету. - 1997. - Т. 2, число 2. - С. 63-66.

Я.П.Драґан, Л.С.Сікора, Л.Б.Чорна, Б.І.Яворський. Енергетична теорія - логічна підстава виокремлення класів стохастичних сигналів та специфікації алгоритмів їх опрацювання // Вісник Тернопільського державного технічного університету. - 1998. - Т. 3, число 1. - С. 71-79.

Я.П.Драган, Л.Б.Чорна, Б.І.Яворський. Алгоритм варіаційного визначення періоду корельованості періодично корельованого випадкового процесу як моделі голосних звуків // Вісник Державного університету «Львівська політехніка». - Львів: в-во Державного університету «Львівська політехніка». - 1998. - №337.- С. 166-169.

Л.Б.Чорна. Виявлення серцевої патології за характеристиками мовного сигналу // Відбір і обробка інформації. - 1998. - №12 (88). - С. 56-59.

Л.Б.Чорна. Модель голосного звуку як періодично корельованого випадкового процесу в задачі розпізнавання стану // Радиоэктроника и информатика. - 1998. - № 3. - С. 155-162.

Л.Б.Чорна. Інваріантні характеристики моделі періодично корельованих випадкових процесів в задачі розпізнавання стану // Вісник Тернопільського державного технічного університету. - 1998. - Т. 3, число 4. - С. 75-80.

Л.Чорна, Г.Осухівська. Статистична обробка акустичних сигналів методами енергетичної теорії стохастичних сигналів // Вісник Тернопільського державного технічного університету. - 1998. - Т. 3, число 4. - С. 80-85.

Dragan Ya., Yavors'kyi B., Chorna L., Sikora L. Energy theory of stochastic signals, separation of classes and specification of statistical processing algorithms // Proc.of Europ. Conf. of Signal Analysis and Prediction (ECSAP-97). - Prague (Czech Republic). - 1997. - P. 129-132.

Chorna L.B., Osukhivs'ka H.M. Statistical Estimators PCRP of Acoustic Signals // Материалы науч.-техн. конф. “Современные методы цифровой обработки сиґналов в системах измерения, контроля, диагностики и управления” (ОС-98). - Мн: Белгосуниверситет. - 1998. - С. 166-169.

Я.Драган, Г.Осухівська, Л.Сікора, Л.Чорна, Б.Яворський. Статистичний аналіз засобами енергетичної теорії стохастичних акустичних сигналів у проблемах меддіагностики // Комп'ютерні технології друкарства. - Львів: УАД. - 1998. - С. 111-113.

Л.Б.Чорна. Виявлення змін функціонального стану серця на основі аналізу голосних звуків мови // Матер. 1 Всеукр. наукової конф “Екологічний стрес і адаптація в біологічних системах”. - Тернопіль: в-во Тернопільського державного педагогічного університету. - 1998. - С. 90-91.

Л.Чорна. Тестування акустичних сигналів засобами теорії періодично корельованих випадкових процесів // Тези доповіді третьої наук.-техн. конф. ТДТУ ім.Івана Пулюя “Прогресивні матеріали, технології та обладнання в машино- і приладобудуванні”. - Тернопіль: в-во ТДТУ. - 1998. - С. 62.

АнотаціЇ

Чорна Л. Стохастична модель голосового сиґналу для задачі діаґностики ритміки серця людини. - Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 01.05.02 - математичне моделювання та обчислювальні методи. - Тернопільський державний технічний університет імені Івана Пулюя, Тернопіль, 1999.

Дисертація присвячена обґрунтуванню математичної моделі голосового сиґналу як періодично корельованого випадкового процесу та розробленню методів відшукання інформативних ознак як характеристик моделі для оцінювання стану ритміки серця. Обґрунтовано вибір алґоритму послідовного перебору значень пробного періоду для визначення інформативної ознаки моделі - періоду корельованості. Як критерій вибору значення періоду корельованості запропоновано використати максимуми функціоналів варіацій функцій статистичних оцінок моделі голосового сиґналу. На підставі запропонованих методів та алґоритмів проведено верифікацію моделі голосового сиґналу для різних станів РС - медичної норми та відхилення (не норми). Верифікація підтвердила адекватність математичної моделі сиґналу для задачі діаґностики ритміки серця та ефективність розроблених алґоритмів.

Ключові слова: модель голосового сигналу, період корельованості, алґоритм послідовного перебору, функціонал варіацій як критерій.

Чорная Л. Стохастическая модель голосового сигнала для задачи диагностики ритмики сердца человека. - Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по специальности 01.05.02 - математическое моделирование и вычислительные методы. - Тернопольский государственный технический университет имени Ивана Пулюя, Тернополь, 1999.

Диссертация посвящена обоснованию математической модели голосового сигнала в виде периодически коррелированного случайного процесса и разработке методов отыскания информативных признаков как характеристик модели для оценивания состояния ритмики сердца. Обоснован выбор алгоритма последовательного перебора значений пробного периода для нахождения информативного признака модели - периода коррелированности. В качестве критерия выбора значения периода коррелированности предложено использовать максимумы функционалов вариаций функций статистических оценок модели голосового сигнала. На основании предложенных методов и алгоритмов проведено верификацию модели голосового сигнала для различных состояний ритмики сердца - медицинской нормы и отклонения (не нормы). Верификация подтвердила адекватность математической модели сигнала для задачи диагностики ритмики сердца и эффективность разработанных алгоритмов.

Ключевые слова: модель голосового сигнала, период коррелированности, алгоритм последовательного перебора, функционал вариаций в качестве критерия.

Chorna L. Stochastic model of vocal signal for the problem of human heart rhythm diagnostics. - Manuscript.

Thesis for the Degree of Candidate of Technical Sciences in speciality 01.05.02 - Mathematical modelling and calculating methods. - Ivan Pul'uj Ternopil State Technical University, Ternopil, 1999.

In the thesis a stochastic model of the vocal signal as a poly-narrow-band periodically correlated random process and development of methods for selection information features as model characteristics for the heart rhythm diagnostics are well founded.

Presence of periodicity in temporal variability of the vocal signal is evident. Stochastic changes are represented in the form of randomly varying amplitudes and phases of harmonic components. The description of stochastic properties in terms of spectral density of a stationary random process gives a possibility to analyze distribution by frequencies of their power only. The latter is an average characteristic of oscillations and thereby their phase (temporal) structure remains unconsidered. At the same time, recycling properties of the oscillation form the basic feature of the vocal signals. Recycling is described in terms of temporal varying probabilistic characteristics from the class - it is a periodically correlated random process (PCRP), that is some type of non-stationarity. Selection of a stochastic model that includes recycling properties of the oscillations and which probabilistic characteristics are periodical functions of time is motivated.

The vocal signal used for the analysis is Ukrainian pronunciation of a steady vowel [a]. The signal was preliminary processed in the time domain - it was suitably filtered with a low-pass filter at 1000 Hz, sampled, and converted to a 8-bit format at sampling frequency 11,025 kHz.

The special technique to process the signal in the time domain - a co-phase analysis algorithm - is applied. The algorithm is based on a specific feature of the vocal signal model in the form of the poly-narrow-band PCRP namely - samples, which are picked out through the period of correlation, form series of related stationary sequences. In such a case, the PCRP is represented by stationary and stationary-related sequences. The co-phase algorithm is based on the same assumptions as algorithms for the statistical analysis of stationary sets. Thus the analysis of the probabilistic structure of the poly-narrow-band PCRP is reduced to its analysis by means of the theory of stationary processes. The simplest relationships for probabilistic characteristics are obtained, which turn into the already known formulas when PCRP is transformed into a stationary process.

The problem of determination of an unknown period of correlation, which is an inherent property of the PCRP model (it is a period of its probabilistic characteristics) is solved by the formulation of a hidden periodicity problem. A method of period estimation based on a well-known technique for extracting periodicity from random data - the superposed epoch analysis, which is also referred to discrete data as Buys-Ballot scheme, is developed. The selection of a sequential search algorithm of the trial period to determine the period of correlation is proposed. Then the period determination problem is reduced to the sequential search for trial values of the period. The maximum of a variation functional of statistical estimate functions of the voice signal model as a selection criterion for the period of correlation is used.

70 waveforms of the vowel [a] spoken by 7 subjects (3 women and 4 men) with medical norm of heart rhythms were studied. To provoke an arrhythmia the above-mentioned subjects were asked to do rough exercises (a well-established method of clinical investigation of the cardiovascular system to detect the exercise-induced arrhythmia). Immediately after that, waveforms of the vowel [a] spoken by the same subjects with the arrhythmia were recorded. The temporal features of the waveforms were studied and the results were analysed. Verification of the vocal signal model for different states of heart rhythm - medical norm and abnormal state was made. Adequacy of the mathematical model of the signal for heart rhythm diagnostics as well as efficiency of designed algorithms was proved by data verification. The number of errors appeared to be surprisingly low, and therefore the poly-narrow-band PCRP model was confirmed as a very reliable one.

The techniques and methods applied in experimental study of the vocal signals with the purpose of automatic extraction and evaluation of some physiologically meaningful parameters which are the characteristics of the mathematical model and can be used in a diagnostic two classes classifier for the heart rhythm disorders are presented.

The system was used in diagnostics at some medical institutions, and very good results were obtained. An advantage of the system is the possibility to process the signal only in the time domain. That is why system implementation is relatively inexpensive.

Key words: vocal signal model, period of correlation, sequential search algorithm, variation functional criterion.

Размещено на Allbest.ur

...

Подобные документы

  • Основні типи та види моделей. Основні методи складання початкового опорного плану. Поняття потенціалу й циклу. Критерій оптимальності базисного рішення транспортної задачі. Методи відшукання оптимального рішення. Задача, двоїста до транспортного.

    курсовая работа [171,2 K], добавлен 27.01.2011

  • Практична реалізація задачі Гамільтона про мандрівника методом гілок та меж. Математична модель задачі комівояжера, її вирішення за допомогою алгоритму Літтла. Програмне знаходження сумарних мінімальних характеристик (відстані, вартості проїзду).

    курсовая работа [112,5 K], добавлен 30.09.2014

  • Вивчення методів розв'язання лінійної крайової задачі комбінуванням двох задач Коші. Переваги та недоліки інших методів: прицілювання, колокацій, Гальоркіна, найменших квадратів та ін. Пошук єдиного розв'язку звичайного диференціального рівняння.

    курсовая работа [419,2 K], добавлен 29.08.2010

  • Ознайлення з базовими поняттями, фактами, методами та найпростішими застосуваннями рівняння Пфаффа. Виконання завдань щодо розв’язання рівнянь Пфаффа. Аналітичний запис задачі про відшукання інтегральних поверхонь максимально можливої вимірності.

    курсовая работа [489,2 K], добавлен 30.12.2013

  • Поняття диференціальних рівнянь. Задача Коші і крайова задача. Класифікація методів для задачі Коші. Похибка методу Ейлера. Модифікований метод Ейлера-Коші. Пошук рішення задачі однокроковим методом Ейлера. Порівняння чисельного рішення з точним рішенням.

    презентация [294,4 K], добавлен 06.02.2014

  • Розв'язання системи лінійних рівнянь методом повного виключення змінних (метод Гаусса) з використанням розрахункових таблиць. Будування математичної моделі задачі лінійного програмування. Умови для застосування симплекс-методу. Розв'язка спряженої задачі.

    практическая работа [42,3 K], добавлен 09.11.2009

  • Класифікація методів для задачі Коші. Лінійні багатокрокові методи. Походження формул Адамса. Різницевий вигляд методу Адамса. Метод Рунге-Кутта четвертого порядку. Підвищення точності обчислень методу за рахунок подвійного обчислення значення функції.

    презентация [1,6 M], добавлен 06.02.2014

  • Сучасна теорія портфельних інвестицій. Теорія портфеля цінних паперів У. Шарпа. Методи вирішення задач оптимізації портфеля цінних паперів з нерегульованою та регульованою(облігації) дохідністю. Класична модель Марковіца задачі портфельної оптимізації.

    дипломная работа [804,9 K], добавлен 20.06.2012

  • Використання методів розв’язування одновимірних оптимізаційних задач (метод дихотомії, золотого перерізу, Фібоначі) для визначення найменшого значення функції на відрізку. Задача мінімізації за допомогою методу Ньютона і методу найшвидшого спуску.

    курсовая работа [739,5 K], добавлен 05.05.2011

  • Сутність симплекс-методу у вирішенні задач лінійного програмування. Рішення задачі на відшукання максимуму або мінімуму лінійної функції за умови, що її змінні приймають невід'ємні значення і задовольняють деякій системі лінійних рівнянь або нерівностей.

    реферат [28,5 K], добавлен 26.02.2012

  • Поняття та методика визначення геометричного місця точки на площині. Правила та головні етапи процесу застосування даного математичного параметру до розв’язання задач на побудову. Вивчення прикладів задач на відшукання геометричного місця точки.

    курсовая работа [1,4 M], добавлен 12.06.2011

  • Суть принципу Діріхле та найпростіші задачі, пов’язані з ним. Використання методів розв’язування математичних задач олімпіадного характеру при вивченні окремих тем шкільного курсу математики та на факультативних заняттях. Індукція в геометричних задачах.

    дипломная работа [239,7 K], добавлен 15.03.2013

  • Етапи розв'язування інженерних задач на ЕОМ. Цілі, засоби й методи моделювання. Створення математичної моделі. Побудова обчислювальної моделі. Реалізація методу обчислень. Розв’язання нелінійних рівнянь методом дихотомії. Алгоритм метода дихотомії.

    контрольная работа [86,1 K], добавлен 06.08.2010

  • Складання плану виробництва при максимальному прибутку. Введення додаткових (фіктивних) змінних, які перетворюють нерівності на рівності. Розв’язування задачі лінійного програмування графічним методом та економічна інтерпретація отриманого розв’язку.

    контрольная работа [298,3 K], добавлен 20.11.2009

  • Модель Еванса встановлення рівноважної ціни. Побудова моделі зростання для постійного темпу приросту. Аналіз моделі росту в умовах конкуренції. Використання математичного апарату для побудови динамічної моделі Кейнса і неокласичної моделі росту.

    реферат [81,8 K], добавлен 25.05.2023

  • Дослідження предмету і сфери застосування математичного програмування в економіці. Класифікація задач цієї науки. Загальна задача лінійного програмування, деякі з методи її розв’язування. Економічна інтерпретація двоїстої задачі лінійного програмування.

    курс лекций [59,9 K], добавлен 06.05.2010

  • Випадок однорідної крайової задачі. Розв’язання виродженого крайового виразу. Теорема Коші, іі доведення. Означення узагальненої функції Гріна крайової задачі. Формулювання алгоритму відшукання узагальненої функції Гріна. Приклади роз'язання завдань.

    лекция [108,5 K], добавлен 24.01.2009

  • Розв'язання графічним методом математичної моделі задачі з організації випуску продукції. Розв'язання транспортної задачі методом потенціалів. Знаходження умовних екстремумів функцій методом множників Лагранжа. Розв'язання задач симплекс-методом.

    контрольная работа [48,5 K], добавлен 16.07.2010

  • Діагностика турбіни трьома основними методами — ММР, ММП, ММКПР, тобто визначення Хо для всіх випадків. Ідентифікація параметрів математичної моделі на основі авторегресії 2-го порядку для заданого часового ряду, оцінка адекватності отриманої моделі.

    контрольная работа [98,3 K], добавлен 16.08.2011

  • Послідовність графічного розв'язання задачі лінійного програмування. Сумісна система лінійних нерівностей, умови невід'ємності, визначення півплощини з граничними прямими. Графічний метод для визначення оптимального плану задачі лінійного програмування.

    задача [320,6 K], добавлен 31.05.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.