Нейромережеві методи побудови експертних систем з асоціативними моделями подання знань
Синтез та оптимізація нейромереж змінної архітектури з комутаційним елементом. Моделі аналізу нечітких даних, що описуються нечіткими алгоритмами. Експериментальний зразок діагностичної експертної системи Н-Гомеопат як підтримки процесів діагностики.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | автореферат |
Язык | украинский |
Дата добавления | 19.07.2015 |
Размер файла | 247,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Автореферат
дисертації на здобуття наукового ступеня
кандидата фізико-математичних наук
Нейромережеві методи побудови експертних систем з асоціативними моделями подання знань
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
нейромережа комутаційний алгоритм
Актуальність теми. Одним, із важливих напрямків застосування інформаційних технологій є розробка експертних систем (ЕС). Вона, як відомо, потребує використання значної кількості людських ресурсів, в тому числі програмістів та експертів у відповідних предметних областях. Ефективність роботи ЕС залежить як від структури знань експерта так і від моделювання процесу логічного виведення в певній предметній області. Сама предметна область може значно впливати як на структуру знань експерта на логічному та фізичному рівнях, так і на логічну модель виведення. Тому ефективність існуючих ЕС залежить як від вдало вибраних способів подання знань, так і від методів реалізації логічного виведення, розроблених у системі та від їх адекватності в широкому розумінні вибраним предметним областям.
Поряд з ефективністю, однією з найголовніших вимог при розробці ЕС є достовірність одержаних результатів. Особливої актуальності ця проблема набуває при створенні ЕС з нейромережевими методами реалізації нечітких логічних виведень. Саме це змушує розробників ЕС витрачати значні ресурси для розробки інтерпретаторів для логічних виведень, запропонованих ЕС.
Крім того, при побудові нейронних мереж (НМ) реалізації логічних виведень (в тому числі в нечітких логіках) в ЕС з асоціативними моделями подання знань (моделями, які будуються на основі асоціації понять) надзвичайно важливими і актуальними є питання, що стосуються методів їх розробки та навчання, оптимізації, перебудови архітектури.
Існуючі ЕС досить пристойно розв'язують поставлені перед ними задачі. Разом з тим вони використовують бази знань складної архітектури, що негативно впливає на процеси актуалізації останніх, а, отже, і на ефективність відповідних методів логічного виведення. Запропоновані методи побудови ЕС з нейромережевою архітектурою дозволяють оптимізувати асоціативні бази знань системи та значно спростити реалізацію логічного виведення в нечітких логіках.
Актуальність роботи зумовлена, також, відсутністю аналогічних систем, які дозволяють виконувати функції інформаційно-довідкового забезпечення в традиційних і нетрадиційних галузях медицини; діагностувати стан організму традиційними та комплементарними методами; формувати пакет гомеопатичних засобів для лікування.
Таким чином, актуальність роботи визначається розробкою та дослідженням методів побудови ефективних інформаційно-діагностичних ЕС сімейства Гомеопат з асоціативними моделями подання знань і нейромережевою реалізацією логічного виведення в нетрадиційних неформалізованих предметних областях.
Зв'язок роботи з науковими програмами, планами, темами. Дисертаційне дослідження пов'язане з науковою темою «Створення теоретичних основ, методів та засобів інтелектуалізаціїї інформаційно-комунікаційних технологій для розподілених комп'ютерних систем» (номер держреєстраціїї 0106U005860), що розробляється на кафедрі інформаційних систем факультету кібернетики Київського національного університету імені Тараса Шевченка.
Мета і завдання дослідження. Метою дисертаційної роботи є розробка методів побудови експертних систем з нейромережевою реалізацією логічного виведення в асоціативних базах знань.
Для досягнення поставленої мети в роботі розв'язувались наступні задачі:
аналіз базових елементів архітектури ЕС;
аналіз існуючих моделей подання знань та відповідних формалізмів;
розробка та дослідження нових формальних моделей подання асоціативних знань;
дослідження методів оптимізації нейромереж;
дослідження нейромереж змінної архітектури (з комутаційним елементом);
аналіз нечітких моделей діагностики;
побудова діагностичних експертних систем на основі розроблених методів.
Об'єкт дослідження. Нейронні мережі реалізаціії логічного виведення в ЕС з асоціативними моделями подання знань.
Предмет дослідження. Технологія розробки системи Н-Гомеопат, реалізованої на базі нейронних мереж.
Методи дослідження. Загальна методика досліджень ґрунтується на основних результатах теорії нейронних мереж, математичної логіки, теорії нечітких множин.
Наукова новизна одержаних результатів. В даній роботі отримано такі нові результати:
· Розроблена нейромережева архітектура нового типу (з комутаційним елементом) для реалізації логічного виведення в ЕС з асоціативними моделями подання знань і відповідні методи навчання.
· Запропоновані нові підходи до синтезу (на основі інформаційних гранул) та оптимізації нейромереж з комутаційним елементом.
· Запропоновані формальні моделі побудови нейромереж змінної архітектури (з комутаційним елементом).
· Запропоновані нові нейромережеві моделі аналізу нечітких даних.
· Реалізований експериментальний зразок діагностичної експертної системи Н-Гомеопат.
Практичне значення одержаних результатів. Результати роботи розширюють сферу застосування нейронних мереж. Запропонована в дисертації модель комутаційного елемента та нейронна мережа відповідної архітектури може використовуватись при розв'язуванні широкого класу практично важливих задач діагностики.
Розроблене програмне забезпечення може бути використане в установах Міністерства охорони здоров'я, АМН України, домашніх умовах як:
система попередньої діагностики;
інформаційно-довідкова система з гомеопатичних препаратів;
система призначення лікування гомеопатичними засобами.
Особистий внесок здобувача. В спільних публікаціях науковому керівнику О.І. Провотарю належать постановки задач та пропозиції щодо методів їх розв'язання. Авторові належить розробка, обґрунтування та реалізація системи Н-Гомеопат з нейромережевою архітектурою.
Апробація результатів дисертації. Результати дисертаційної роботи доповідались на XIII-й Міжнародній конференції “Knowledge Dialogue Solution” (June, 2007, Varna, Bulgaria), X Міжнародній конференції «Системний аналіз та інформаційні технології» (Київ, 2008), Міжнародній конференції «Теоретичні та прикладні аспекти побудови програмних систем» (Київ, 2009), VII Міжнародній науково-практичній конференції з програмування «УкрПРОГ”2010» (Київ, 2010).
Публікації. За темою дисертації опубліковано 6 наукових робіт (з них 3 у виданнях ВАК України), список яких наведений у кінці автореферату.
Структура та обсяг дисертації. Дана дисертаційна робота складається з вступу, 5 розділів, висновку, списку літератури. Її обсяг становить 110 сторінок. Робота містить 10 рисунків. Список використаних джерел складається з 75 найменувань.
ОСНОВНИЙ ЗМІСТ
У вступі обґрунтовано важливість та актуальність обраної проблематики, сформульовано мету роботи та розглянуто її зміст з висвітленням найважливіших результатів.
В першому розділі розглядаються питання побудови експертних систем як систем, заснованих на знаннях. Проаналізовані вимоги, які необхідно враховувати при побудові експертних систем. Велика увага приділяється відомим методам і моделям обробки, придбання та подання знань.
У другому розділі розглядаються основні проблемні питання нанофармакології, приводяться основні поняття та визначення теорії нейронних мереж, обговорюються деякі аспекти застосування нейронних мереж у задачах діагностики, зокрема у медицині. Аналізуються моделі існуючих архітектур нейронних мереж.
В третьому розділі розглядається (для порівняння) одна з моделей подання асоціативних знань - елементарні формальні системи (ЕФС). Перевага такої моделі полягає в тому, що при незначній модифікації до неї може бути застосований найпотужніший на сьогодні метод доведення теорем (в нашому випадку - це метод виведення) - правило резолюцій.
Крім того, описується задача вибору та алгоритми її розв'язку в умовах нечіткості.
В параграфі 3.1 вводиться формалізм подання асоціативних моделей подання знань.
Такий формалізм (система) визначається як сукупність наступних об'єктів:
1. Два скінчені алфавіти К1 і К2;
2. Символи х, у - змінні, які набувають значень із К1 і К2;
3. Два одномісні предикатні символи P, R і один двомісний - Q;
4. Знак імплікації “” і знак пунктуації “,”;
5. Скінчена послідовність А1, А2,…, Аk правильно побудованих формул відповідно до поданого нижче означення.
Елементи множин К1 і К2 позначаються с1, с2, …, сn і п1, п2, …, пm відповідно.
Термами системи над алфавітом К1 називаються символи алфавіту і змінна х. Термами системи над алфавітом К2 називаються символи алфавіту і змінна у.
Атомарною формулою системи називаються вирази вигляду P(t1), R(t2), Q(t1, t2), де t1, t2 - терми над алфавітами К1 и К2 відповідно.
Правильно побудованими формулами (ППФ) системи називаються атомарні формули і вирази вигляду:
P(t1) Q(t2, t1) R(t2);
R(t2) Q(t2, t1) P(t1).
ППФ без змінних називається твердженням. Вивідним твердженням системи називається будь-яка аксіома або формула без змінних, яку можна одержати із аксіом за рахунок скінченої кількості застосувань наступних правил, які назвемо правилами виведення:
1. Підстановка символів із К1 і К2 замість змінних х і у відповідно;
2. Виведення формули Х2 із формул Х1 і Х1 Х2 за умови, що Х1 - атомарна формула (правило МР).
Зрозуміло, що задавши інтерпретацію предикатів системи: P(x) - “у пацієнта є симптом х”; Q(y, x) - “у препарата у є симптом х”; R(y) - “препарат у призначити пацієнту” ми одержимо формальну систему, яка описує асоціативну модель подання знань і містить наступні аксіоми:
Q(x, y);
P(х) Q(y, x) R(y);
R(y) Q(y, x) P(x);
P(x).
За умови, що алфавіти К1 і К2 визначають множини препаратів і симптомів, фактичну модель знань системи можна описати цими аксіомами, підставляючи замість змінних х, у елементи відповідних алфавітів.
В параграфі 3.2 розглядаються загальні поняття подання знань за допомогою семантичних мереж, а також питання їх логічного опису. Наводяться деякі особливості методу резолюцій для доведення істинності тверджень на семантичних мережах.
Як відомо, базовим функціональним елементом семантичної мережі є структура, що складається з двох компонентів - вузлів і дуг, що їх пов'язують. Кожний вузол являє собою деяке поняття, а дуга - відношення між парами понять.
З позицій логіки базову структуру семантичної мережі можна розглядати як предикат з двома аргументами. Аргументи - це вузли, а предикат - напрямлена дуга, що пов'язує ці вузли. Таким чином, довільну мережеву модель знань такого типу можна описати за допомогою логічних формул, які містять ці предикати.
Якщо правильно (вдало) обрати позначення відношень, то за допомогою семантичної мережі можна описати досить складні сукупності фактів.
Наприклад, якщо асоціативна модель подання знань задає наступні факти: препарат П1 характеризується набором симптомів С1, С2, С3; препарат П2 - С2, С3, С4; препарат П3 - С1, С5, С6, С7 - то переконатися в істиності твердження “Якщо у пацієнта є симптом С2, то йому потрібно призначити препарати П1 і П2“ можна звівши фактичну модель знань (у формі ЕФС) до “нормального вигляду” і, додавши заперечення висновку, вивести пустий диз'юнкт, як показано нижче:
(1) P(C2);
(2) P(C2) Q(П1,С2) R(П1);
(3) P(С2) Q(П2,С2) R(П2);
(4) Q(П1,С2);
(5) Q(П2,С2);
(6) R(П1) R(П2)висновок.
(7) ~P(С2) ~Q(П1,С2) R(П1)із (2);
(8) ~P(С2) ~Q(П2,С2) R(П2)із (3);
(9) ~Q(П1,С2) R(П1)із (1) і (7);
(10) ~Q(П2,С2) R(П2)із (1) і (8);
(11) ~R(П1) ~R(П2)заперечення висновку;
(12) R(П1)із (4) і (9);
(13) R(П2)із (5) і (10);
(14) із (11), (12) і (13).
Отже, специфіка моделі предметної області системи дозволяє здійснити перехід від семантичної мережі до логічного подання предметної області з метою подальшого застосування методу резолюцій для виведення всіх істинних тверджень семантичної мережі.
Відомо, що в більшості задач штучного інтелекту використовуються нечіткі знання. Теорія нечітких множин застосовується в різних галузях комп'ютерних наук, зокрема в теорії подання знань, методах ідентифікації і розпізнання образів, теорії прийняття рішень, теорії оптимізації та ін. Це пов'язано з тим, що не завжди можна точно визначити належність об'єкта до деякого класу або точно визначити його властивості. Теорія нечітких множин дала можливість формалізувати неточні та інтуїтивні знання, що виявилося досить корисним при розробці основних принципів штучного інтелекту. Класифікація нечіткостей та типи логік для роботи з ними приводиться в параграфі 3.3.
В параграфі 3.4 в загальному вигляді сформульовано задачу вибору об'єкту (або об'єктів) із деякої множини об'єктів за вказаними їх характеристиками шляхом побудови рівневих множин і визначення міри належності об'єктів цим множинам.
Такі задачі виникають в різних експертних системах, зокрема, у зв'язку із визначенням діагнозу і призначенням лікувальних препаратів в умовах нечіткості.
Запропоновано два методи розв'язання цієї задачі з використанням елементів теорії нечітких множин. Ці методи відрізняються механізмами визначення ступенів належності елементів рівневим множинам.
Нехай існує деяка множина об'єктів Х = {X1, X2, …, Xk} і деяка множина їх характеристик С = {C1, C2,…, Cn}, причому між цими множинами існує відношення типу ( : ), тобто для кожного елемента множини Х може існувати декілька характеристик і навпаки, один і той же елемент множини С може бути характеристикою декількох об'єктів. Таке відношення між елементами вказаних множин можна подати у вигляді асоціативної мережі.
Така мережа може бути задана нечіткою підмножиною R декартового добутку XC, яка визначається як
R = R (x,c)/(x,c)(3.1)
де R(x, c) = 1, якщо об'єкт x має характеристику с і R(x, c) = 0 - в іншому випадку. Відповідно об'єкт Xi з множиною характеристик С можна визначити як
R= R (Xi,c)/(Xi,c). (3.2)
Нехай С, С' С - повна і нечітка множина характеристик об'єкта Хi Х. Покладемо (Xi,С) = 0, якщо у об'єкта Хi нема характеристики С і розглянемо дві нечіткі множини
R = 1/(Xi,c) і R1 = R1 (Xi,c)/(Xi,c), (3.3)
які визначають об'єкт Xi і деяке його наближення.
Визначення. Наближенням об'єкта відносно множини характеристик С' назвемо величину
(C') = (1 - (Xi,c)) 1/2. (3.4)
Задача полягає в тому, щоб по наявним нечітким характеристикам знайти об'єкт з мінімальним наближенням.
Твердження 1. Якщо для нечітких множин P і Q характеристик об'єкта Xi справедливе співвідношення P Q, то (Q) (P).
Твердження 2. Якщо для нечіткої множини P характеристик об'єкта Xi справедливе співвідношення
(Xi, c) (Xi, c)(3.5)
то
(1- (Xi, c)) 1/2 (1- (Xi, c)) 1/2.(3.6)
Доведені твердження дозволяють зробити висновок про те, що чим більше характеристик виявлено у об'єкта і чим більші міри належності у характеристик, тим точніше можна визначити об'єкт.
Четвертий розділ роботи присвячений методам побудови експертних систем з нейромережевою архітектурою.
Зокрема, для розв'язання задач діагностування в системі Н-Гомеопат використовується НМ наступної архітектури (рис. 4.1)(параграф 4.1):
Рис. 4.1. Архітектура НМ
Для навчання цієї нейромережі використовується так зване -правило, яке полягає в реалізації стратегії навчання “з учителем”. Якщо позначити через y* - потрібний вихід нейрона, а через y - реальний вихід, то помилка навчання обчислюється за такою формулою = y*- y в алгоритмі градієнтного спуску wi(k+1) = wi(k) - xi, >0, де коефіцієнт “посилення алгоритму”, xi i-й вхід синаптичного зв'язку нейрона.
Алгоритм навчання НМ задається наступною послідовністю кроків:
1. Будується вектор вхідних сигналів: x = (x1, x2, …, xn), де x1, x2, …, xn симптоми пацієнта.
2. Вектор, що відповідає правильним значенням (необхідним) y* = (y1, y2, …, yn), формується експертом предметної області.
3. Виконується алгоритм прямого розповсюдження сигналу x через мережу. В результаті виконання алгоритму визначаються вагові суми Sjn і активатори для кожного нейрону.
4. Виконується алгоритм зворотнього розповсюдження сигналу через нейрони вихідного і проміжного шарів. Обчислюються помилки 0 для вихідного нейрона і i для схованих нейронів.
5. Виконується оновлення ваг нейронів в мережі.
Навчання нейронної мережі відбувається на обмеженій кількості прикладів, потім їй дозволяють самостійно генерувати поведінку в інших ситуаціях. Здатність генерувати правильну реакцію на різні симптоми, що не входять в набір повчальних, є ключовим чинником при створенні НМ.
В параграфах 4.2-4.3 розглядається та досліджується поняття комутаційного елемента (КЕ), на який покладена функція взаємодії нейронних мереж, які вже навчені розв'язувати різні завдання з визначеної предметної області (ПО). Важливою властивістю систем з КЕ є можливість ідентифікації вузької проблеми або завдання, що дозволяє оптимально підбирати методи навчання всієї системи новими даними з урахуванням раніше придбаних знань.
Комутаційним елементом може виступати так звана “інформаційна гранула”, яка в загальному випадку може бути інтерпретована як “одна з численних маленьких частинок, що формують велику одиницю”.
Інформаційна гранула має свою семантику і синтаксис. Семантичний апарат відповідає за накопичення і відображення відповідної інформації. Синтаксичний апарат інформаційної гранули чітко відокремлений від семантичного. Він має свою архітектуру і формальні методи обробки представленої інформації. При чіткому розділенні, між компонентами гранули існує постійний зв'язок. Він забезпечує можливість контролю потоків інформації. У випадку системи Н-Гомеопат інформаційна гранула має наступні базові властивості: можливість класифікації вхідної і вихідної інформації, можливість перетворення вихідної інформації до оптимальної структури даних для подальшої обробки. М можна представити, як перетворення , де оператор зв'язку вхідних даних Х і виходів Y нейронної мережі, що схематично зображено на рис. 4.2.
Рис. 4.2. НМ (звичайна)
Архітектура нейромережі з КЕ може бути зображена схематично, як показано на рис. 4.3.
Рис. 4.3. НМ (з комутаційним елементом)
В цьому випадку нейромережа реалізує перетворення Y = F0(X,U), де U - деякий керуючий вплив. Виходячи з цього, систему керування S можна описати як сукупність чотирьох компонент
S = (Dx, Dy, X, Y),(4.1)
де Dx - вхідні дані до системи (перевіряються експертом);
Dy - вхідні дані до КЕ (вихідні данні НМ);
X = Dx(X) - структуровані вхідні дані експерта;
Y = Dy(Y) - структуровані вихідні дані до КЕ.
Таким чином, структуровані дані передаються до КЕ, який перетворює їх на керуючі впливи U. В результаті досягається реалізація цілей Z* в НМ.
Запропонований в роботі підхід до керування синтезом нейронних мереж з використанням комутаційного елемент дозволяє прискорити роботу систем з відповідною архітектурою мережі. Кожен з етапів вимагає ретельного аналізу з боку розробника, оскільки деякі етапи проектування вимагають не лише чіткого формального опису, а й чітко сформованої інформацію від експерта. Наприклад, простір цілей формується майже виключно або під контролем експерта предметної області для якої розробляється відповідна НМ. Таким чином, можна виділити наступну перевагу такого підходу: запропонована модель враховує різні чинники, що можуть впливати на стан нейронної мережі та комутаційного елемента. Зокрема, при формуванні цілей, враховується не лише загальна ціль для нейронної мережі, а й проміжні - для комутаційного елемента.
В параграфі 4.4 розглядаються деякі технологічні процеси розробки нейромережевих моделей діагностики в експертній системі Н-Гомеопат в звязку з можливістью їх автоматизації.
Найбільш поширеним прикладом задач діагностики є класифікація без учителя, загальна постановка якої полягає в наступному. Заданий набір об'єктів, кожному об'єкту зіставлений вектор значень ознак. Потрібно розбити ці об'єкти на класи еквівалентності. Віднесення об'єкту до класу проводиться шляхом його порівняння з типовими елементами різних класів і вибору найближчого.
Мережеві алгоритми класифікації без учителя будуються на основі ітераційного методу динамічних ядер, що полягає в наступному:
1. Задається вибірка наперед оброблених векторів даних {xp} (простір векторів даних позначається через E; кожному класу векторів відповідає деяке ядро а; простір ядер позначається через A).
2. Для кожних xE і aA визначається міра близькості d(x, a).
3. Для кожного набору з k ядер a1, ..., ak і будь-якого розбиття {xp} на k класів {xp} = P1P2 ... Pk визначається критерій якості
D = D(a1, a2, …, ak, P1, P2, …, Pk) = .(4.2)
Потрібно знайти набір a1, ..., ak і розбиття {xp} = P1P2 ... Pk, що мінімізують D.
Далі досліджуються два питання, що постають перед кожним, хто вирішив використовувати нейронні мережі: “Скільки нейронів необхідно для вирішення задачі?” і “Якою має бути структура нейронної мережі?”. Об'єднуючи ці два питання, ми отримуємо третій: “Як зробити роботу нейронної мережі зрозумілою для користувача (логічно прозорою) і які вигоди може принести таке розуміння?”.
Один із способів оцінки мінімального числа нейронів - використання модифікованої процедури контрастування, яка полягає в наступному.
Позначимо через wp, p = 1, …, n ваги всіх зв'язків. При зворотному функціонуванні мережі методом зворотного поширення помилки мережа обчислює вектор градієнта функції оцінки H по вагах зв'язків
.(4.3)
Нехай w0 - поточний набір ваг зв'язків, а оцінка поточного прикладу рівна H0. Тоді в лінійному наближенні можна записати функцію оцінки в точці w як
.(4.4)
Використовуючи це наближення можна оцінити зміну оцінки при заміні на як
,(4.5)
де q - номер прикладу навчаючої множини, для якої були обчислені оцінка і градієнт. Величину (p,q) називають показником чутливості до заміни wp на для прикладу q. Далі обчислюється показник чутливості, не залежний від номера прикладу. Для цього можна скористатися будь-якою нормою. Як правило, використовується рівномірна норма (максимум модуля):
.(4.6)
Уміючи обчислювати показники чутливості, можна застосувати процедуру контрастування. Приведемо простий варіант цієї процедури:
1. Обчислюємо показники чутливості.
2. Знаходимо мінімальний серед показників чутливості -
3. Замінюємо відповідну цьому показнику чутливості вагу на , і виключаємо її з процедури навчання.
4. Пред'являємо мережі всі приклади навчаючої множини. Якщо мережа не допустила жодної помилки, то переходимо до другого кроку процедури.
5. Намагаємося навчити відконтрастовану мережу. Якщо мережа навчилася безпомилковому розв'язанню задачі, то переходимо до першого кроку процедури, інакше переходимо до шостого кроку.
6. Повертаємо мережу в стан до останнього виконання третього кроку. Якщо в ході виконання кроків з другого по п'ятий була відконтрастована хоч би одна вага, то переходимо до першого кроку. Якщо жодна вага не була відконтрастована, то отримана мережа мінімальна.
Що стосується навчання, то якщо вибрано множину навчальних прикладів і спосіб обчислення функції помилки, то взагалі кажучи, навчання нейронної мережі є задачею багатокритеріальної оптимізації, що має дуже велику розмірність.
Нейророзмиті моделі діагностики розглядаються в параграфі 4.5.
Визначення. Під нечіткою специфікацією логічного виводу (алгоритмом) розуміють впорядковану множину нечітких інструкцій, які при виконанні дають наближене (нечітке) вирішення проблеми.
Зокрема, розглядаються нечіткі алгоритми виду
вхід (x);
якщо x є A1, то y є B1;
якщо x є A2, то y є B2;
. . .
якщо x є Am, то y є Bm;
вихід (y),
де Ai і Bi - нечіткі множини.
Існує два основні способи визначення виходу B. В обох використовується так зване поняття агрегації правил, тобто визначення сумарного ефекту від роботи всіх правил.
Перший спосіб визначення виходу полягає в попередній агрегації нечітких відношень R = Agg(R1, R2, ... , Rm). Результат B при заданому вході A визначається за допомогою композиційного правила: B = A ? R. Якщо оператор агрегації є операцією знаходження максимуму, то B визначається за формулою
B = A ? Ri.(4.7)
Другий спосіб полягає у визначенні виходів для кожного правила за допомогою використання композиції = A ? Ri, i = 1, …, m. Далі здійснюється агрегація отриманих виходів за правилом B = Agg(,, …, ), тобто
B = (A ? Ri) .(4.8)
Справедливе наступне твердження
Твердження 3. При використанні max-min композицій спільно з операцією максимуму в ролі оператора агрегації результати, отримані обома механізмами логічного виведення, будуть еквівалентними, тобто справедливе співвідношення
A ? Ri = (A ? Ri) .(4.9)
Аналогічне твердження справедливе для нечіткого алгоритму виду:
вхід (x1, x2, …, xn);
якщо x1 є A11 x2 є A12 … xn є A1n то y є B1;
якщо x1 є A21 x2 є A22 … xn є A2n то y є B2;
. . .
якщо x1 є Am1 x2 є Am2 … xn є Amn то y є Bm;
вихід (y).
Твердження 4. При використанні max-min композицій і логічного виведення з використанням рівнів істиності, результати будуть еквівалентними, тобто справедливе співвідношення
(A(x) R(x,y)) = (i Bi(y)),(4.10)
де бi - рівень істинності i-го правила (дійсне число, яке характеризує міру відповідності входу системи , , …, нечітким множинам Ai1, Ai2, …, Ain), Xj - множини визначення змінної xj, j = 1, …, n.
Для реалізації нечітких алгоритмів пропонується використовувати гібридні нейронечіткі системи (ГННС). Вони дозволяють якнайповніше використовувати сильні сторони нечітких систем і нейронних мереж. Характерною рисою ГННС є те, що вони завжди можуть розглядатися як системи нечітких правил, при цьому визначення функцій належності в передумовах і висновках правил на основі навчаючої множини виконується за допомогою НМ.
Приведений спосіб конструювання НМ для реалізації нечітких алгоритмів виду
вхід (x1, x2);
якщо x1 є A11 x2 є A12 то y = с11x1 + с12x2;
якщо x1 є A21 x2 є A22 то y = с21x1 + с22x2;
вихід (y).
Вихід цього алгоритму знаходиться за формулою y = (1y1 + 2y2)/ (1 + 2), де yi - вихід i-го правила.
Даний алгоритм може бути реалізований у вигляді нейроподібної структури, що складається з п'яти шарів:
· Шар 1. Виходами нейронів цього шару є міри належності вхідних значень нечітким множинам, що асоціюються з нейронами.
· Шар 2. Кожен нейрон цього шару обчислює рівень істиності правила по формулі i = Ai1(x1) Ai2(y0), i = 1,2, де для моделювання зв'язки може використовуватися t-норма, що диференціюється.
· Шар 3. На даному шарі виробляється нормалізація рівнів істинності кожного правила за формулами i = i / (1 + 2).
· Шар 4. Виходи нейронів представляють добуток нормалізованих значень рівнів істинності на відповідні виходи правил: yi = i (сi1x1 + сi2x2).
· Шар 5. Нейрон останнього (вихідного) шару виконує адаптивне підсумовування виходів нейронів попереднього шару.
Така нейронна структура має вигляд (рис. 4.4):
Шар 1 Шар 2 Шар 3 Шар 4 Шар 5
Рис. 4.4. Архітектура НМ
З останніх двох тверджень випливає, що в нейророзмитих моделях діагностики з КЕ композиції різних методів логічного виведення будуть еквівалентними.
Пятий розділ присвячено питанням реалізації експертной системи Н-Гомеопат. Розглядаються загальні принципи побудови ЕС, а також основні етапи та алгоритм функціонування системи.
В параграфі 5.1 приведені концептуальні вимого до системи та якісні характеристики її окремих вузлів, зокрема комутаційного елемента.
Параграф 5.2 присвячений основним етапам розробки ЕС Н-Гомеопат. Виділені такі етапи:
1. Постановка цілей і задач.
2. Створення БД, яка містить всю необхідну для діагностики інформацію.
3. Розробка стратегії діагностики.
4. Створення програмного забезпечення з використанням сучасних СУБД та інструментальних середовищ програмування
Основна увага приділяється вивченню предметної області, визначенню базових множин та взаємозв'язків між ними, а також вибору стратегії діагностики та методів її реалізації.
Базові множини, які визначають процес діагностики в системі є множини Симптоми і Препарати. Множина Симптоми - це опис відхилень від нормального стану організму. Множина Препарати містить лікувальні засоби. Кожному препарату відповідає конкретний набір симптомів, причому кожний симптом відповідає не менше ніж одному препарату.
Розробка стратегії полягає в аналізі зв'язків між базовими множинами та їх характеристиками з метою визначення відповідних відношень, характер яких впливає на процес діагностики.
Відповідно до обраної стратегії, спочатку визначається область прояву нездужання. Потім із запропонованого переліку ключових слів обирається слово, яке найкраще визначає відхилення від нормального стану організму. З цим словом пов'язана певна кількість симптомів, повний опис яких можна отримати, обравши ключове слово. В свою чергу, кожний симптом пов'язаний з одним або декількома препаратами, а, отже, і з іншими симптомами. В такий спосіб будується логічний ланцюжок за рахунок встановлених зв'язків між множинами Симптоми і Препарати. Так продовжується до тих пір, поки не буде встановлений діагноз пацієнта.
В параграфі 5.3 наводиться алгоритм функціонування ЕС Н-Гомеопат.
Особливість алгоритму полягає в тому, що відразу не можна визначити всі симптоми у пацієнта, оскільки існують симптоми явно виражені (які безпосередньо хвилюють пацієнта) і приховані (наявність яких можна визначити тільки в процесі діагностики). Саме в виявленні більшості симптомів (як наявних так і прихованих) і полягає основна задача системи Н-Гомеопат. Це досягається за рахунок врахування специфіки предметної області системи Н-Гомеопат: кожний явно виражений симптом породжує клас (класи) еквівалентності симптомів відносно тих препаратів, характеристикою яких він є. Отже, визначення деякого симптому породжує множину “можливих” симптомів, серед яких можуть бути приховані. Пацієнт повинен переглянути “можливі” симптоми і в разі необхідності визначити приховані, які в свою чергу породжують нову множину “можливих” симптомів і т. д. Цей алгоритм роботи системи реалізується за рахунок діалогового режиму діагностування, суть якого полягає в наступному. Спочатку пацієнт визначає явні симптоми, тобто ті, які хвилюють його безпосередньо, а потім в діалоговому режимі обирає з поданого набору симптомів, ті які вважає за потрібне.
Інша особливість алгоритму полягає у можливості його роботи з нечіткими даними шляхом побудови нечітких специфікацій (программ) та розробки методів їх реалізації.
ВИСНОВКИ
У дисертації розроблені методи побудови експертних систем з нейромережевою архітектурою, методи реалізації нечітких алгоритмів, в тому числі нейронними мережами з комутаційним елементом. Основними результатами дисертації є наступні:
· Розроблена нейромережева архітектура (з комутаційним елементом) реалізації логічного виведення в ЕС з асоціаттивними моделями подання знань і відповідні методи навчання.
· Запропоновані та обґрунтовані нові методи синтезу (на основі інформаційних гранул) та оптимізації нейромереж з комутаційним елементом.
· Побудовані формальні моделі нейромереж змінної архітектури з комутаційним елементом).
· Створені нейромережеві моделі аналізу нечітких даних.
· Реалізований експериментальний зразок діагностичної експертної системи Н-Гомеопат.
· Розроблені методи діагностування на нейромережах в системі Н-Гомеопат.
СПИСОК ОСНОВНИХ ПРАЦЬ АВТОРА ЗА ТЕМОЮ ДИСЕРТАЦІЙНОЇ РОБОТИ
1. Катеринич Л.О. Керування синтезом нейронних мереж //Проблеми програмування. 2009. Вип.1. С.5359.
2. Катеринич Л.О. О некоторых формальних моделях разработки нейросетевых алгоритмов в системе Гомеопат //Компьютерная математика. 2010. Вып. 1. С.102-109.
3. Провотарь А.И., Катеринич Л.А. Нейронечеткие модели диагностики в системе Н-Гомеопат //Проблеми програмування. 2010. Вип.2-3. С.636-641.
4. Катеринич Л.О. Синтез нейронных сетей на основе информационных гранул //International Journal “Information Technologies and Knowledge”. 2008. Vol.2. pp. 179-182.
5. L. Katerynych, А. Provotar. Neural networks diagnostics in Нomeopath system //International Journal “Information Theories & Applications”. 2008. Vol.15, Number 1. pp. 89-93.
6. А. Provotar, L. Katerynych. Homeopath: Diagnostic information system //Journal of Mathematics and Applications. 2010. №. 32, pp. 1-10.
7. Катеринич Л.О., Провотар А.И. Диагностирование на нейронных сетях в системе ГОМЕОПАТ // Proc. XIII International Conf. Knowledge-Dialogue-Solution. Varna (Bulgaria), 2007. Pp.64-68.
8. Катеринич Л.А. Построение объединенных нейроных сетей с использованием коммутационных елементов // Пр. X Міжнар. конф. «Системний аналіз та інформаційні технологіїї». Київ: НТУ «Київський політехнічний інститут», 2008.Т.1.С.203.
9. Катеринич Л.О. Архітектура та керування нейтронною мережею з комутаційним елементом // Пр. Міжнар. конф. «Современные проблемы и пути их решения науке, транспорте, производстве и образовании». Одесса: Одесский национальный университет, 2008.Т.21.С.28.
10. Катеринич Л.О. Спеціалізовані експертні системи // Пр. Міжнар. конф. «Теоретичні та прикладні аспекти побудови програмних систем». Київ: Інститут програмних систем НАН України, 2009.Т.1.С.168.
11. L. Katerynych. Switching element // Пр. VIII Міжнар. міждисциплінарна науково-практична конф. молодих вчених «Шевченківська весна». Київ: Київський національний університет імені Тараса Шевченка, 2010.С.70.
Размещено на Allbest.ru
...Подобные документы
Класифікація експертних систем. Представлення знань, переваги та слабкі місця. База знань як елемент експертної системи. Сфера застосувань та перспективи розвитку. Створення експертної системи для оцінки ступеня підготовленості студента до іспиту.
курсовая работа [1,4 M], добавлен 04.02.2014Поняття експертної системи, приклади сфер її використання. Класифікація та задачі експертних систем. Означення продукційної експертної системи, приклад її дії та опис програми. Побудова бази знань із чіткою логікою, що вирішує завдання класифікації.
лабораторная работа [712,5 K], добавлен 19.03.2011Живучість в комплексі властивостей складних систем. Моделі для аналізу живучості. Аналіз електромагнітної сумісності. Характер пошкоджень елементної бази інформаційно-обчислювальних систем. Розробка алгоритму, баз даних та модулів програми, її тестування.
дипломная работа [151,5 K], добавлен 11.03.2012Поняття та основна мета створення інформаційної системи, її різновиди та процедура побудови, підходи до обробки. Концепція баз даних та методи керування ними, предметна область і процес проектування. Структурована мова запитів SQL, елементи та оператори.
учебное пособие [1,7 M], добавлен 14.11.2009Розробка методів та моделей формування єдиного інформаційного простору (ЄІП) для підтримки процесів розроблення виробів авіаційної техніки. Удосконалення методу оцінювання якості засобів інформаційної підтримки. Аналіз складу програмного забезпечення ЄІП.
автореферат [506,3 K], добавлен 24.02.2015Засоби візуального моделювання об'єктно-орієнтованих інформаційних систем. Принципи прикладного системного аналізу. Принцип ієрархічної побудови моделей складних систем. Основні вимоги до системи. Розробка моделі програмної системи засобами UML.
курсовая работа [546,6 K], добавлен 28.02.2012Виявлення основних сутностей предметної області. Побудова схеми реляційної бази даних. Вбудовані процедури і тригери. Опис архітектури програмної системи і концептуальної моделі бази даних, програмної реалізації та інтерфейсу користувача додатку.
курсовая работа [4,3 M], добавлен 05.12.2012Методи використання традиційних файлових систем - набору програм, які виконують для користувачів деякі операції, наприклад, створення звітів. Системи керування баз даних. Основні поняття реляційної моделі даних. Реляційна алгебра і реляційне числення.
реферат [40,2 K], добавлен 13.06.2010Визначення вимог до програмного забезпечення. Проектування архітектури програми, структури даних та інтерфейсу. Програмування графічного редактора, специфікація його класів та алгоритм роботи. Зміна архітектури редактора згідно нових вимог замовника.
дипломная работа [1,2 M], добавлен 05.01.2014Побудова інформаційної системи, що буде слугувати для автоматизації процесу захисту персональних даних клієнтів банку. Вибір методу проектування архітектури та моделі функціонування системи. Перелік масивів, використовуваних під час розв’язання задачі.
дипломная работа [1,8 M], добавлен 02.06.2017Аналіз сучасних методів тестування та практичних особливостей проведення тестового контролю. Основи побудови інформаційно-математичної моделі. Алгоритм запису інформації в таблицю бази даних. Характеристика та шляхи розробки інтерфейсу редактора тестів.
курсовая работа [1,7 M], добавлен 08.10.2010Опис програми Grapher, призначеної для математичної і графічної обробки даних, що описуються одновимірною функцією. Процес побудови графіка. Запис файлу даних мовою програмування Pascal. Моделювання вигляду апроксимаційних кривих та дискретних точок.
лабораторная работа [539,4 K], добавлен 23.09.2009Аналіз відомих підходів до проектування баз даних. Моделі "сутність-зв'язок". Ієрархічна, мережева та реляційна моделі представлення даних. Організація обмежень посилальної цілісності. Нормалізація відносин. Властивості колонок таблиць фізичної моделі.
курсовая работа [417,6 K], добавлен 01.02.2013Проблема інформаційної обробки геологічних даних. Методи побудови розрізу з відомих елементів залягання. Підготовка даних для аналізу. Ієрархія об'єктів, що беруть участь в побудовах. Розрахунок витрат на розробку та впровадження проектного рішення.
магистерская работа [4,2 M], добавлен 17.12.2014Специфікація вимог для кожного з двох користувачів. Концептуальне проектування бази даних. Визначення типів сутностей та зв’язків, доменів. Перетворення концептуальної моделі даних у логічну, визначення набору відношень, підтримки цілісності даних.
курсовая работа [55,1 K], добавлен 15.03.2015Використання баз даних та інформаційних систем. Поняття реляційної моделі даних. Ключові особливості мови SQL. Агрегатні функції і угрупування даних. Загальний опис бази даних. Застосування технології систем управління базами даних в мережі Інтернет.
курсовая работа [633,3 K], добавлен 11.07.2015Вибір основної моделі задачі інформаційної підтримки автопаркінгів. Специфікація системи інформаційного обслуговування автопаркінгу. Здійснення замовлень в системі. Перевірка замовлених місць на парковці. Проектування інтерфейсу системи та бази даних.
дипломная работа [2,2 M], добавлен 21.06.2014Основні ознаки, що дозволяють здійснювати ідентифікацію складних об’єктів моніторингу на основі нечітких алгоритмів кластерного аналізу. Вибір доцільного алгоритму кластеризації складних об’єктів моніторингу та синтез математичної моделі кластеризації.
курсовая работа [1,2 M], добавлен 12.01.2016Створення інформаційної бази даних з нормативно-технологічних показників подання матеріальних, інформаційних процесів і об'єктів виробничої системи. Алгоритм організації транспортного обслуговування змінного завдання, мінімальні відхилення від термінів.
курсовая работа [833,9 K], добавлен 28.12.2014Проектування дієздатної демонстраційної моделі системи електронної комерції. Розробка сценарію купівлі з використанням мережі Інтернет. Архітектура механізму розповсюдження сертифікатів відкритих ключів. Підсистема асиметричної і симетричної криптографії.
дипломная работа [2,0 M], добавлен 10.08.2011