Моделі процесів аналізу даних із невизначеністю та надлишковістю

Узагальнена математична модель процесу аналізу даних із невизначеністю й надлишковістю та її адаптація для різних предметних областей. Принципи формування моделі процесу як послідовності підпроцесів. Побудова алгоритмів обчислення спеціальних функцій.

Рубрика Математика
Вид автореферат
Язык украинский
Дата добавления 20.07.2015
Размер файла 654,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ „ЛЬВІВСЬКА ПОЛІТЕХНІКА”

УДК 004.942:519.6

Моделі процесів аналізу даних із невизначеністю та надлишковістю

01.05.02 - математичне моделювання та обчислювальні методи

Автореферат

дисертації на здобуття наукового ступеня доктора технічних наук

Нікольський Юрій Володимирович

Львів 2010

Дисертацією є рукопис.

Робота виконана у Національному університеті "Львівська політехніка" Міністерства освіти і науки України, м. Львів

Науковий консультант: доктор технічних наук, професор, Лауреат державної премії України в галузі науки і техніки Пасічник Володимир Володимирович, Національний університет "Львівська політехніка", м. Львів, завідувач кафедри інформаційних систем та мереж.

Офіційні опоненти:

доктор технічних наук, професор, Лауреат державної премії України в галузі науки і техніки Томашевський Валентин Миколайович, Національний технічний університет України "Київський політехнічний інститут", м. Київ,

професор кафедри автоматизованих систем обробки інформації та управління; доктор технічних наук, професор Матвійчук Ярослав Миколайович,Інститут підприємництва та перспективних технологій Національного університету "Львівська політехніка", м. Львів, завідувач кафедри інформаційних систем та технологій;

доктор технічних наук, професор, Бомба Андрій Ярославович, Державний гуманітарний університет, м. Рівне, професор кафедри інформатики та прикладної математики.

Захист відбудеться 30 вересня 2010 р. о 13.00 на засіданні спеціалізованої вченої ради Д 35.052.05 у Національному університеті "Львівська політехніка" (79013, Львів-13, вул. С.Бандери, 12).

Із дисертацією можна ознайомитися у бібліотеці Національного університету "Львівська політехніка" (79013, Львів-13, вул. Професорська, 1)

Автореферат розіслано 26 серпня 2010 р.

Вчений секретар спеціалізованої Вченої ради, доктор технічних наук, професор Р. Бунь

математичний аналіз невизначеність надлишковість

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Стрімкий розвиток технологій, пов'язаних із дослідженням і впровадженням процесів аналізу даних; чітка тенденція до інтеграції різних поглядів на їх склад і структуру; широкий спектр математичних методів виявлення залежностей; різні погляди на поняття невизначеності, її вплив на результати аналізу та способи врахування; місце і походження надлишковості та способи її усунення спричинили органічний перехід від аналізу даних у конкретній предметній області до погляду на нього як на цілісний, логічно завершений, багатокроковий та однозначно зрозумілий процес.

Безпрецедентно великі обсяги даних, що використовують в аналізі даних для отримання нових знань про функціонування предметних областей та розв'язків нових задач, складність їх постановки й надзвичайно широка сфера застосування вимагають нових поглядів на аналіз даних та обумовлюють необхідність його системних досліджень.

Процес аналізу даних традиційно розуміють як послідовне застосування обчислювальних методів опрацювання даних з метою виявлення прихованих залежностей у множинах дискретних об'єктів скінченних потужностей. Такі залежності не описуються неперервними функціями, а їх значення вимагають інтерпретації. Важливою особливістю досліджуваних даних є те, що, здебільшого, неможливе їх повторне отримання, підтвердження або спростування. Невизначеність, яка характерна процесам аналізу даних, не пов'язана з властивостями окремих об'єктів, розумінням або трактуванням семантики лінгвістичних змінних, а викликана відсутністю значень властивостей об'єктів, їх нерозрізненністю або суб'єктивністю прийнятих щодо них рішень.

Становлення досліджень аналізу даних як цілісного процесу та формування основних понять пов'язують із роботами G. Piaretski-Shapiro, U. Fayyad, K. Cios, J. Han, H. Mannila, P. Smyth, P. Cabena, S. Anand та ін.

Інтерпретацію невизначеності та надлишковості як невід'ємних і природних властивостей опису об'єктів предметної області, питання, які пов'язані з трансформацією цих понять та різним їх трактуванням досліджували О. Наконечний, М. Загоруйко, Ю. Зайченко, L. Zadeh, J. Grzymajlo-Busse, T. Hastie, Z. Pawlak, A. Skowron, M. Sugeno, C. Komorowski, J. Polkowski, K. Slowinski та ін.

Побудова й дослідження математичних методів і обчислювальних процедур для виявлення залежностей у даних є традиційним напрямом, який називають машинним навчанням. Важливий внесок у його розвиток вклали Ю.Журавльов, О. Івахненко, В. Вапнік, О. Червоненкіс, В. Донской, М. Мошков, М. Шлезінгер, J. Quinlan, T. Mitchell, S. Haykin, T. Kohonen, T. Jaakkola, R. Agraval, R. Duda, C. Bishop, L. Breiman, W. McCulloch, W. Pitts, J. Hopfild та ін.

Розроблення процесів аналізу даних перетворилось останнім часом в індустрію з побудови закінчених рішень для бізнесу, фінансів, медицини тощо, великих програмних комплексів з розвинутими сервісами і застосуванням різних інструментів аналізу (зокрема, фірм Microsoft, IBM, Oracle та ін.), використанням універсальних програмних систем (SAS, SPSS, MathLab, Statistica та ін.), пропозиціями методик та інструментів аналізу від фірм і колективів дослідників (See5, WizWhy, Weka, PolyAnalyst, Almaden та ін.), розробленням стандартів (CWM, CRISP, PMML, SQL/MM, Microsoft DMX та ін.). Основним недоліком переважної більшості пропонованих систем є відсутність опису алгоритмів, які в них закладено, та закритість програмного коду.

Наявні структурні моделі процесів аналізу, які розроблено для широкого кола предметних областей, відрізняються кількістю та складом методів опрацювання даних і виявлення залежностей. Це ускладнює їх порівняння, застосування, аналіз і поширення. Недостатньо висвітлено методологічні, методичні та технічні питання організації процедур підготовки й оцінювання масивів даних на предмет виявлення в них невизначеності й надлишковості. Також не розвинутий формальний опис структур предметних областей на основі моделей онтологій у складі процесів аналізу для обмеження суб'єктивного вибору об'єктів предметної області та їх властивостей. Формулювання моделей процесу аналізу для нових предметних областей вимагає ґрунтовних досліджень з побудови формальних моделей аналізу. У науковій літературі відсутні публікації за проблематикою формування та дослідження математичного опису процесів аналізу як відповідної послідовності відображень. Тому їх математичне моделювання з врахуванням невизначеності й надлишковості є актуальним і важливим об'єктом наукових досліджень.

Процес аналізу даних полягає у застосування цілісної системи математичних методів, елементи якої перебувають у тісній взаємодії між собою. Ці методи є універсальними, а їх запровадження вимагає постановки задач у формальному вигляді та дослідження їх розв'язків. Основою вимогою цього є використання математичних формалізмів із вживанням термінології та проблематики конкретної предметної області або її задач лише для інтерпретації отриманих результатів. Відомі моделі не пропонують універсальних формалізмів, які можна використати як мову опису процесу аналізу даних. Це породжує актуальну проблему - побудову загальної математичної моделі процесу аналізу даних. Актуальність проблеми підтверджена спробами узагальнення процесу аналізу даних шляхом пошуку спільних кроків, які можна застосувати у різних предметних областях і описати спільною мовою. Створення математичної моделі процесу аналізу даних дозволяє уникнути неоднозначності у постановках задач, виборі та обґрунтуванні методів виявлення прихованих залежностей в даних та усунення їх невизначеності й надлишковості.

Отже, в дисертаційній роботі вирішується важлива науково-прикладна проблема розроблення загальної моделі процесу аналізу даних, для яких характерні невизначеність і надлишковість. Внаслідок структурної та змістовної складності об'єкту досліджень та істотності впливу результатів на практичну реалізацію запропонованих моделей, комплекс досліджень має проблемний характер і значне прикладне значення, особливо відчутне при розробленні реальних процесів аналізу даних у різних предметних областях.

Зв'язок роботи з науковими програмами, планами, темами.

Дисертаційна робота виконувалася в межах пріоритетного наукового напряму, затвердженого серед актуальних проблем Міністерством освіти і науки України "Нові комп'ютерні засоби та технології інформатизації суспільства"; відповідно до постанови Президії НАН України № 164 від 27.06.2003 р. і концепції програми інформатизації НАН України, затвердженої розпорядженням №146 від 27.02.2004 р. і визначеної серед основних завдань і пріоритетних напрямів інформатизації НАН України; за науковими програмами Львівського державного природознавчого музею НАН України по роботах із фондами як об'єктами національного надбання; за поданими далі держбюджетними темами кафедри "Інформаційні системи та мережі" Національного університету "Львівська політехніка".

1. Держбюджетна тема "Математичне моделювання та програмна реалізація системи перекладу з жестової мови" (номер державного реєстру 0107U001116) у частині розроблення моделі процесу аналізу даних для задач ідентифікації елементів жестової мови на основі динамічних зображень реального часу та побудови тренажера жестової мови. У цій темі здобувач був відповідальним виконавцем.

2. Держбюджетна тема "Моделі та методи побудови інтелектуальних систем бізнес-аналітики на основі інтегрованих інформаційних ресурсів" (номер державного реєстру 0110U001102). Загальну модель процесу аналізу адаптовано для розроблення моделей і методів у системах бізнес-аналітики у частині виявлення та застосування прихованих залежностей в інтеґрованих інформаційних ресурсах.

3. Держбюджетна тема "Історія бібліотечної справи на західноукраїнських землях (кінець ХІІ ст. - 1939 р.)" (номер державного реєстру 0110U005028) в частині розроблення принципів створення інтеґрованих баз знань на основі адаптації моделі процесу аналізу даних для дослідження проблематики бібліотечної справи.

4. Роботи з науковими фондами і музейною експозицією Державного природознавчого музею НАН України (м. Львів), які внесені до Державного реєстру наукових об'єктів, що становлять національне надбання (постанова Кабінету міністрів України №527 від 01.04.99 та №1709 від 19.12.01) у частині створення математичної моделі структури даних про колекції музею на основі інтеграції знань про музейні предмети і змістовні зв'язки між ними з метою розроблення інформаційної системи музею.

Мета і завдання дослідження. Метою роботи є створення узагальненої математичної моделі процесу аналізу даних із невизначеністю й надлишковістю та її адаптації для різних предметних областей.

Мета дисертаційної роботи визначила необхідність виконання таких завдань:

- системного аналізу розвитку процесів аналізу даних, розроблення принципів формування моделі процесу як послідовності підпроцесів і визначення основних задач, які постають у зв'язку з розширенням кола предметних областей для аналізу даних;

- дослідження проблематики, пов'язаної із введенням, формулюванням і використанням понять невизначеності й надлишковості, що дозволить їх виявляти, оцінювати, усувати, а також враховувати вплив на результати розв'язування задач аналізу;

- розроблення математичних моделей процесу та підпроцесів як сукупності формалізованих дій на основі побудови та застосування алгоритмів обчислення спеціальних функцій, що дозволить досліджувати підпроцеси як чисельні методи опрацювання даних;

- розроблення формального опису невизначеності та надлишковості на основі дослідження різних типів відношень на множині об'єктів предметної області, що уможливить виявлення та усунення невизначеності та надлишковості, зменшення розмірності даних і підвищення ефективності застосування методів аналізу;

- дослідження методів опрацювання даних, виявлення в них залежностей, усунення невизначеності та надлишковості для вибору ефективного обчислювального методу й налаштування його параметрів на специфіку прикладної задачі;

- аналізу реальних предметних областей та практичної перевірки отриманих теоретичних результатів із розроблення моделей процесів аналізу, що підтвердить універсальність загального принципу формування процесу аналізу;

- розроблення нових модифікацій чисельних методів мінімізації функцій багатьох змінних для використання їх при побудові моделей процесів аналізу, забезпечення високої швидкості збіжності та можливості налаштування на специфіку функцій;

- розроблення методів аналізу та перетворення структури предметних областей на основі апріорних знань про них для зменшення невизначеності й надлишковості, пов'язаних із суб'єктивністю описів цих областей.

Об'єктом дослідження є процеси аналізу даних.

Предметом дослідження є моделі процесів аналізу даних із невизначеністю й надлишковістю, модифікації обчислювальних методів, які використано при виявленні залежностей у даних.

Методи дослідження. Для вирішення проблеми моделювання процесу аналізу даних використано методи на основі теорій систем і системного аналізу, прийняття рішень, класифікації, кластерного аналізу, машинного навчання, наближених множин, нейронних мереж, що самоорганізуються. Для побудови функцій у складі підпроцесів попереднього опрацювання даних використано метод k-найближчих сусідів, нейронних мереж прямого поширення сигналу на основі методу зворотного поширення похибки, метод найменших квадратів, чисельні методи мінімізації функцій багатьох змінних. У задачах психофізіологічного тестування для аналізу й опрацювання відсутніх значень використано методи математичної логіки, видалення об'єктів з невідомими значеннями атрибутів та глобального доповнення, ROC-кривих. Для формулювання задач оцінювання та підвищення ефективності ідентифікації елементів української жестової мови використано методи оптимізації, розпізнавання образів, штучного зору, динамічного програмування. Для формального опису предметних областей використано методи на основі теорії графів і дерев, онтологій, багаторівневих ієрархічних систем, формальних граматик.

Наукова новизна одержаних результатів. Наукова новизна одержаних результатів полягає в науковому обґрунтуванні та вирішенні проблеми побудови моделей процесів аналізу даних із невизначеністю й надлишковістю. При цьому отримано такі наукові результати:

– вперше розроблено узагальнену математичну модель процесу аналізу даних, що дозволило використати її як основу для поширення досліджень з виявлення залежностей в описах об'єктів на конкретні предметні області;

– вперше запропоновано і використано явне формулювання невизначеності й надлишковості даних у складі процесу аналізу, що дало можливість застосовувати універсальні процедури їх виявлення, оцінювання й усунення;

– отримали подальший розвиток дослідження із побудови, отримання умов та оцінок швидкості збіжності модифікацій методів мінімізації функцій багатьох змінних у складі процесів аналізу даних, що забезпечило налаштування оптимізаційного процесу до властивостей функції;

– отримали подальший розвиток дослідження якості навчання мереж, що самоорганізуються, що дозволило побудувати ефективні класифікаційні процедури у складі процесів аналізу даних;

– вперше проблема забезпечення безпеки функціонування складної технічної системи сформульована та досліджена як модель процесу аналізу даних;

– удосконалено формальний опис моделі онтології предметної області та введено її у модель процесу аналізу даних, що надало можливість зменшувати надлишковість даних врахуванням суб'єктивного впливу на вибір об'єктів та їх опис;

– вперше модель процесу аналізу використано для ідентифікації елементів української жестової мови, що заклало основу для розроблення ефективних обчислювальних процедур при створенні засобів спілкування з людьми із вадами слуху.

Практичне значення одержаних результатів. Отримані результати досліджень покладено в основу програмного комплексу „Імуноскрин”, на який отримано свідоцтво про реєстрацію авторського права на твір № 23285 від 25.12.2007 р. (Департамент інтелектуальної власності Міністерства науки та освіти України). Програма апробована і використовується у клінічній практиці кафедри клінічної імунології та алергології Львівського національного медичного університету імені Данила Галицького та Західноукраїнського науково-дослідного центру клінічної імунології та алергології, на кафедрі медичної інформатики з фізикою Тернопільського державного медичного університету імені І.Я. Горбачевського, у лікувально-діагностичному центрі ТОВ "Десна" ЛТД (м. Тернопіль). Результати досліджень покладено в основу створення інформаційної системи обліку музейних колекцій, яка використовується в наукових дослідженнях Державного природознавчого музею НАН України (м. Львів), Львівського історичного музею, Львівської галереї мистецтв, Національного музею у Львові, Золочівського та Олеського замків. Результати досліджень процесів виникнення й поширення аварійних ситуацій на енергоблоках запроваджено в розробленнях ВАТ "ЛьвівОРГРЕС" для ОКБ державного підприємства "Харківський приладобудівний завод ім. Т.Г.Шевченка" Міністерства промполітики України. Результати досліджень реалізовано у тренажері української жестової мови, який впроваджено у Львівському дитячому дистанційному навчально-консультаційному центрі дітей з особливими потребами на базі НВК "Школа-гімназія "Сихівська", Львівській спеціальній загальноосвітній школі-інтернаті Марії Покрови для глухих дітей, Львівському інформаційно-методичному центрі освіти. Результати досліджень використано при створенні експонатів для експозиції наукових розроблень Національного університету "Львівська політехніка" від кафедри "Інформаційні системи та мережі" на виставковому стенді України на Міжнародній виставці інформаційних технологій та телекомунікацій ЦеБІТ 2006-2008 (м. Ганновер, Німеччина).

На основі виконаних досліджень здобувачем розроблено методичне забезпечення, яке використане при написанні трьох підручників і навчального посібника із грифом Міністерства освіти і науки України, в навчальному процесі в Національному університеті "Львівська політехніка" при викладанні дисциплін "Дискретна математика", "Системи штучного інтелекту", "Прикладні системи штучного інтелекту та інженерія знань", "Теорія алгоритмів та представлення знань", "Математична лінгвістика".

За підручник "Дискретна математика" одержано Державну премію України в галузі науки і техніки.

Особистий внесок здобувача. Усі наукові результати дисертаційної роботи отримані автором самостійно. У друкованих працях, опублікованих у співавторстві, автору належать: [1, 62] - побудова онтології предметної області, зокрема, на основі даних про колекції музею; [2] - формулювання задач з ідентифікації елементів жесту на основі загальної моделі процесу аналізу даних; [3] - розділи, в яких розглядається логіка, логічне виведенню, відношення, теорія графів і дерев, нечітка логіка й нечітке логічне виведенню, застосування дискретної математики у штучному інтелекті; [4,5] - розділи, в яких розглядається логіка, логічне виведення, відношення, теорія графів і дерев; [6] - розділи, в яких розглядається проектування інтелектуальних систем, вибір й обґрунтування методів вирішення проблем у штучному інтелекті; [7, 68] - побудова алгоритмів навчання мереж Кохонена, вибір та оцінювання параметрів і аналіз отриманих результатів; [8, 51, 56] - постановка задачі сегментації зображень у складі задачі аналізу даних, формулювання алгоритму на основі застосування нейромереж Кохонена; [9, 22] - побудова методів опрацювання зображень на основі моделі процесу аналізу даних і оцінювання результатів їх застосування; [10-12] - формулювання задачі дослідження, вибір критеріїв оцінювання якісних характеристик, аналіз результатів експериментів; [14, 19, 59] - формулювання змісту й інструментальних засобів для побудови програмного тренажера, його структура та функціональне наповнення; [20, 58] - принцип створення математичного опису моделі тексту природною мовою на основі дистрибутивного методу; [21, 24, 67] - формулювання задачі дослідження, зокрема, із врахуванням специфіки поняття суб'єктивної оцінки, аналіз результатів експериментів; [26] - оцінювання ефективності методу розпізнавання на основі порівняння методів оптимізації; [27, 52] - побудова нейромережі прямого поширення сигналу як класифікатора, побудова алгоритму модифікованого методу мінімізації функції та критерію ефективності; [29, 30, 44, 45] - постановка задач досліджень з аналізу даних і методів їх розв'язання; [31, 33] - формування моделі процесу аналізу даних на основі наближених множин, аналіз результатів; [32, 53-55, 60, 71] - формулювання задачі дослідження і загальної методики оцінювання отриманих результатів на ефективність; [34] - побудова методів ідентифікації жесту на основі моделі процесу аналізу даних; [35, 64, 65, 69, 70] - формулювання завдання дослідження як задачі аналізу даних із явною невизначеністю й надлишковістю; [36, 37, 40, 46, 66, 50] - принципи створення системи прийняття рішень, побудова структури інформаційної системи і баз даних; [39, 74] - формування алгоритму й оцінювання його ефективності; [41] - формування алгоритму опрацювання даних і побудова математичної моделі; [42] - постановка задачі з дослідження ефективності методів на основі дерев рішень; [43] - побудова класифікатора; [47, 48, 86] - доведення збіжності методу й отримання оцінок швидкості збіжності; [49, 82] - формулювання задачі із застосування уніфікованої мови моделювання; [57] - вибір інформаційних технологій для виконання прогнозування; [77-80] - побудова й аналіз процесу аналізу даних, його структури і вибору програмних засобів; [81] - формулювання проблеми і задач пошуку знань.

Апробація роботи. Основні результати наукових досліджень неодноразово доповідалися на міжнародних та всеукраїнських наукових конференціях, демонструвалися на міжнародних виставках, зокрема, на Міжнар. виставках інформ. технологій та телекомунікацій ЦеБІТ (м. Ганновер, Німеччина, 2006-2008); Third International United Information Systems Conf. "Information Systems: Modeling, Development, and Integration" (UNISCON 2009) (Sydney, Australia, 2009); First and Second International Conf. on Inductive Modelling (ICIM 2002, 2008) (м. Львів, 2002; Київ, 2008); International Conf. "Nuclear Energy for New Europe-2004" (м. Порторож, Словенія, 2004); International Conf. on Information Systems Technology and its Applications (ISTA'2007) (м. Харків, 2007); The IX-th International Conference "The Experience of Designing and Application of CAD Systems in Microelectronics" (CADSM'2007) (м.Львів, Поляна, 2007); First Central European Student Conference in Linguistics (Budapest, Hungary, 2006); VII та IX Міжн. конф. "Інтелектуальний аналіз інформації" (ІАІ 2007, 2009) (м. Київ, 2007, 2009); IX, X та ХІ Міжнар. наук.-техн. конф. "Системний аналіз та інформаційні технології" (САІТ 2007-2009) (м. Київ, 2007-2009); Fourth International Conferences on Computer Science and Information Technologies "CSIT-2009" (Львів, 2009); Int. Conf. and Workshop "Problems of Decision Making Under Uncertainties (PDMU-2009)" (с. Східниця та м. Кам'янець-Подільський, 2009); International Conferences on Intellectual systems of decisison-making and problems of computational intelligence (ISDMCI 2008-2010) (м.Євпаторія, 2008-2010); Міжнар. науково-практичній конференції "Знання-діалог-рішення" (KDS) (м. Санкт-Петербург, Росія, 2001); п'ятій Міжнар. конф. "Інтернет-Освіта-Наука-2006" (ІОН-2006) (м. Вінниця, 2006); III Міжнар. наук.-практ. конф. "Проблеми впровадження інформаційних технологій в економіці" (м. Ірпінь, 2002); Міжнар. наук.-практ. конф. "Інтелектуальні системи прийняття рішень та інформаційні технології" (м. Чернівці, 2006); шостій, сьомій, восьмій та десятій Всеукр. наук. конф. "Застосування обчислювальної техніки, математичного моделювання та математичних методів у наукових дослідженнях" (м. Львів, 1999-2001, 2003); XVІ Всеукр. наук. конф. "Сучасні проблеми прикладної математики та інформатики", присвяченій 50-річчю створення обч. центру Львів. ун-ту (м.Львів, 2009); третій Всесоюзній конференції з оптимального керування в механічних системах (м. Київ, 1979); четвертій Всесоюзній школі-семінарі "Розпаралелювання обробки інформації" (м. Львів, 1983); шостій Всесоюзній конф. з оптимального керування в механічних системах (м. Львів, 1988); другій Всесоюзній конф. "Нові підходи до розв'язування диференційних рівнянь" (м. Дрогобич, 1989); ІІ Всеукр. наук.-метод. семінарі "Науково-методичні засади впровадження української жестової мови у навчальний процес" (м.Київ, 2010); міжвуз. наук.-техн. конф. наук.-пед. працівників (м. Львів, 2006); науково-практичні семінари Міжн. виставок "Комп'ютер+бізнес" та "Комп'ютер+офіс" (2002-2004); наук. семінарі держ. природознавчого музею НАН України (м. Львів, 2009).

Результати дисертаційних досліджень регулярно доповідалися на наукових семінарах кафедри "Інформаційні системи та мережі" Національного університету "Львівська політехніка" (1998-2010).

Публікації. За результатами дисертаційних досліджень опубліковано 88 наукових праць, з них - 2 монографії, 3 підручники та 1 навчальний посібник з грифом МОН України, 31 публікація - у фахових наукових виданнях.

Структура та обсяг роботи. Дисертаційна робота складається зі вступу, семи розділів, висновків, списку використаних джерел із 296 найменувань на 33 сторінках та 6 додатків. Загальний обсяг дисертації становить 416 сторінок, з них 295 сторінок основного тексту, 97 рисунків та 70 таблиць.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовано актуальність теми, сформульовано мету й основні завдання досліджень, показано зв'язок з науковими програмами, планами, темами, сформульовано наукову новизну. Розглянуто практичну цінність, реалізацію й впровадження результатів роботи. Наведено дані про особистий внесок здобувача, апробацію роботи та публікації.

У першому розділі подано загальний огляд стану проблематики у галузі моделювання процесів аналізу даних. На основі вивчення й узагальнення інформації з наукових джерел оцінено сучасний стан проблематики, пов'язаної з побудовою моделей процесів аналізу даних, основні ідеї та принципи, які покладено в їх основу. Це дозволило сформулювати основну передумову виникнення досліджуваної проблеми у невідповідності між реалізацією процесу аналізу даних як багатокроковим обчислювальним процесом й відсутністю його опису як сукупності формалізованих дій для складання ефективних математичних описів.

Виконаний аналіз проблематики пояснює відсутність математичного формулювання процесу аналізу такими обставинами. По-перше, широким спектром предметних областей, для яких побудовано процеси аналізу. Задача аналізу даних для кожної з них не є тривіальною і вимагає залучення великої кількості фахівців вузької спеціалізації. Оскільки аналіз предметної області вимагає значних зусиль, то задача виявлення залежностей відсувається на другий план. По-друге, процес аналізу розглядають як послідовність обчислювальних алгоритмів, а не постановок задач. Тому формулювання складових процесу визначають специфікою предметної області та вимогами алгоритмів. Це обумовило появу великої кількості процесів аналізу даних, які не порівняльні між собою, складаються з етапів різної кількості та змісту, не пристосовані до перенесення в інші предметні області, складні у перепроектуванні у разі виникнення нових властивостей об'єктів предметних областей або задач, що в них розв'язуються. Виконане дослідження показало, що процеси аналізу мають спільні елементи, які можна розглядати абстрактно, а задачі опрацювання даних розв'язувати без врахування специфіки предметної області.

Аналіз даних розуміють як цілісний процес, а виявлені залежності як приховані знання про функціонування предметної області й головну мету процесу аналізу. Моделі процесів аналізу розглядають як послідовність кроків, визначених експертом, а кожна модель визначає алгоритм опрацювання даних на кожному з них. Наявна невизначеність й надлишковість не виділені в окрему проблему, а їх врахування виконується, здебільшого, побудовою спеціальних обчислювальних методів.

Результати вивчення проблематики моделювання процесів аналізу даних із невизначеністю й надлишковістю дозволяють констатувати, що побудова та дослідження процесів аналізу даних для реальних систем потребує їх попереднього математичного опису.

Центральним елементом наявних моделей процесів аналізу даних є методи машинного навчання з виявлення залежностей у даних. Математичне моделювання процесу аналізу повинно вирішити проблему узгодження постановок задач у підпроцесах із методами їх розв'язування.

У другому розділі побудована модель процесу аналізу даних вигляду у складі таких моделей підпроцесів: - формування опису предметної області, - попереднього опрацювання даних, - виявлення залежностей, - оцінювання й інтерпретації результатів аналізу. Кожний підпроцес має свою специфіку та є композицією визначених множин функцій.

Побудова процесу аналізу даних полягає в знаходженні відображення , яке на заданій множині об'єктів предметної області обчислює значення , де - множина класів, елементами якої є булеві або лінґвістичні сталі, чи цілі числа. Процес з моделлю заданий множиною функцій, з допомогою яких відображення визначає клас об'єкту .

Кожний об'єкт , , задано кортежем його властивостей зі значеннями , де елементи визначені специфікою опису об'єктів предметної області. Множину властивостей об'єктів визначаємо за правилами або , що породжує невизначеність або надлишковість при формування опису предметної області. Кожний об'єкт , має властивість , , яка є його класифікаційною ознакою, або класом.

Інформаційний опис предметної області подано таблицею прийняття рішень

Модель підпроцесу формування опису предметної області розглядається у такому вигляді

де - модель онтології предметної області. Функції у (2) визначимо так: : - функція, яка обчислює множину значень атрибуту таблиці за відповідними властивостями об'єкту ; - множина значень функції ; : - функція, яка обчислює значення атрибуту прийняття рішень об'єкту ; - множина значень функції . Модель вигляду (2) встановлює відповідність множині об'єктів предметної області її опис вигляду (1).

Невизначеність в описі предметної області (1) розглядаємо двох типів - явну та приховану. Визначимо їх у такий спосіб, відповідно.

1. Функція має невідоме значення "*", тобто для певних та .

2. У множині існують об'єкти та , , для яких та . Така невизначеність пов'язана із повною або частковою нерозрізненністю об'єктів, визначеною на основі відношень

для , відповідно.

Надлишковість у моделях також розглядаємо двох типів - явну та приховану, які визначимо, відповідно, у такий спосіб.

1. Об'єкт у таблиці є надлишковим, якщо існує такий об'єкт , , що та . Аналогічно, атрибут у таблиці є надлишковим, якщо існує атрибут , , що , .

2. Атрибут таблиці (1) є надлишковим, якщо кожному елементу таблиці (1) поставлено у відповідність об'єкт таблиці , де та .

Функції та усувають явну надлишковість та визначені так: , де - підмножина об'єктів, яка отримана усуненням з об'єктів у кількості ; , де - підмножина атрибутів, яка отримана усуненням надлишкових атрибутів з множини у кількості .

Модель підпроцесу попереднього опрацювання даних розглянемо у вигляді

У моделі невизначеність явного типу для функція усуває обчисленням таких атрибутів , що Функція виконує дискретизацію неперервних значень атрибуту і формує атрибут , де , якщо , де , , - елемент розбиття . Для усунення надлишковості, яка виникла внаслідок застосування функції , використано функцію , а функція усуває приховану надлишковість. Результатом обчислення функцій підпроцесу попереднього опрацювання даних є таблиця прийняття рішень (1), в якій дискретизовано неперервні атрибути та усунуто явні та приховані невизначеність та надлишковість.

Модель підпроцесу виявлення залежностей розглядається у вигляді

Шаблон , де - вектор параметрів, - вектор базисних функцій, визначає задану множину функцій, з допомогою яких апроксимують залежність у даних. Конкретну функцію для таблиці прийняття рішень (1) знаходять методами машинного навчання шляхом обчислення вектора параметрів . Для застосування цих методів функція формує множину навчальних об'єктів , а значення параметрів обчислює функція .

Модель підпроцесу оцінювання та інтерпретації розглядається у вигляді

Перевіряють отриману залежність на тестових об'єктах , множину яких формує функція . Функція , яка побудована за шаблоном , обчислює оцінку на множині тестових об'єктів . Отримане значення підлягає інтерпретації обчисленням класифікаційної ознаки , яка є значенням функції , . Оцінку якості побудованого класифікатора обчислює функція .

Досліджено джерела походження невизначеності й надлишковості у таблицях прийняття рішень. Сформульовано алгоритми усунення явної невизначеності та причини виникнення надлишковості в разі застосування деяких з них. Введено оцінки величини явної й прихованої невизначеності й надлишковості.

Процес аналізу даних обумовлено обчислювальною процедурою у просторі параметрів , значення яких впливають на його якість. Отримання цих параметрів у деяких методах машинного навчання пов'язане із застосуванням чисельних методів оптимізації.

Здебільшого функція багатьох змінних , , яку необхідно мінімізувати у задачах аналізу даних, є багатоекстремальною з погано обумовленою матрицею других похідних. Також вона не володіє локальними властивостями для забезпечення умов збіжності відомих методів оптимізації. Тому виникає необхідність у побудові спеціальних методів, які адаптуються до локальних властивостей функцій, що мінімізуються. Для цього побудовано й досліджено на предмет отримання умов збіжності й оцінок швидкості збіжності низку модифікацій методів ґрадієнтного та квазіґрадієнтного типу, в обчислювальні формули яких уведено спеціальні параметри.

Першим побудовано та досліджено ґрадієнтно-параметричний метод з обчислювальними формулами вигляду

,

, ,

як модифікацію методів ґрадієнтного типу, а також його аналог вигляду

,

, .

Також досліджено модифікації методу двоїстих напрямків вигляду

, ,

з новими обчислювальними формулами для матриць , які відрізняються від відомих способом перерахунку на кожній ітерації двох стовпців матриці замість одного, а та обчислено за формулами

де для парного або для непарного, або

де для парного або для непарного. Доведено умови, при виконанні яких можна отримати такі оцінки швидкості збіжності

для парного,

для непарного,

які вищі за відомі оцінки для методів цього класу.

Побудовано й досліджено новий клас методів квазіградієнтного типу - методів спряжених напрямків

, ,

в яких матриці задовольняють умови

, , ,

а для їх обчислення побудовано нові формули. Вони містять параметри, вибір яких дозволяє побудувати низку модифікацій методів, забезпечити умови збіжності й отримати оцінки швидкості вигляду

.

Ці оцінки є найвищими у вказаному класі методів.

У третьому розділі побудовано й досліджено модель процесу аналізу для даних про обстеження групи пацієнтів з метою діагностування одного кардіозахворювання. Ці дані мають приховані невизначеність і надлишковість. Модель підпроцесу формування опису предметної області розглядається у вигляді

Формування опису предметної області полягало у визначенні множини об'єктів - пацієнтів, яких обстежували, - властивостей об'єктів, які є симптомами захворювання, - результатів діагностування та функцій , , які використано для обчислення значень атрибутів таблиці (1) розмірів та .

Дослідження даних на предмет виявлення та оцінювання в них проявів невизначеності та надлишковості виконане у підпроцесі

.

Тут функції , яка виконує дискретизацію неперервного атрибуту , відповідає множина функцій . У підпроцесі в результаті дискретизації таблицю (1) перетворено до вигляду

.

Модель підпроцесу виявлення залежностей набула такого вигляду

Вона містить функцію , яка формує залежності у даних кластеризацією з побудовою двох кластерів на кожному кроці алгоритму методу медіани. Розподіл атрибутів об'єктів у кластерах описано спеціальними правилами, які дозволили оцінити надлишковість даних. Також виявлено невизначеність у підготовці даних і атрибути, які є визначальними при встановленні діагнозу.

Також досліджено інший спосіб формування підпроцесу виявлення залежностей на основі дерев рішень. Цей підпроцес визначено його моделлю (4), в якій функція будує навчальну множину об'єктів, на яких функція формує множину правил як логічних функцій за заданим шаблоном .

Модель підпроцесу оцінювання та інтерпретації розглядалася у вигляді

де функція створює тестову множину об'єктів , на яких обчислено оцінки їх значень . Для оцінювання якості класифікації побудовано функцію .

В експериментах досліджено вплив різних способів дискретизації атрибута age () та формування множини на значення . Це дозволило виявити залежності у даних, яка викликані суб'єктивним підходом до підготовки даних. Зокрема, на рис. 1 показано залежність значень функції , коефіцієнта успішності, від для навчальних множин , використаних при побудові функції для різних способів дискретизації. Тут спадання значення коефіцієнта успішності при зростанні аргументу є проявом вказаної невизначеності. Дослідження впливу способів формування множини на значення функції дозволило позбутися такої невизначеності (рис.2) для тих самих даних.

Рис.1 Залежність коефіцієнтів успішності від відносної кількості навчальних об'єктів у разі прояву невизначеності в даних

Рис.2 Залежність середнього значення коефіцієнта успішності від відносної кількості навчальних об'єктів після усунення невизначеності

Для виявлення прихованої невизначеності у даних для моделі (4) використано мережі, що самоорганізуються, де шаблон визначає топологію мережі, функція задає множини навчальних прикладів, - метод навчання мережі. Досліджено вплив на якість класифікації вибору параметрів при навчанні таких мереж методами Кохонена, нейронного газу та стохастичної релаксації.

Отримані теоретичні оцінки параметрів методів підтверджені результатами експериментів, що дозволило виробити рекомендації щодо їх вибору. У моделі для навченої мережі Кохонена виконано візуалізацію результатів експериментів, що дозволило побудувати оцінку якості навчання мережі за значеннями середньоквадратичного відхилення і топографічної помилки. Побудований класифікатор для мережі з 2665 нейронами забезпечив досягнення значень 0,973 та 0,979 якості класифікації для множин та , відповідно.

Для врахування прихованої невизначеності у даних також побудовано під процес із функцією для усунення несуттєвих атрибутів на основі формування редуктів. Виконано серію експериментів з побудови редуктів та правил на їх основі з обчисленням коефіцієнта успішності (КУ) та площі під ROC-кривою як значень функції оцінки якості класифікації . Для побудованих редуктів отримано високі значення коефіцієнта успішності та площі під кривою (див. табл. 1 та табл. 2) для різної кількості вікових груп при дискретизації атрибута age.

Таблиця 1 Оцінки ефективності класифікації для редуктів

Серія експери-ментів

Кількість вікових груп

Номер класифікатора

Ступінь підтримки редукта

Кількість атрибутів редукта

Кількість правил

Коеф. успішності

Площа

1

10

1

1.0

11

114

0.836

0.904

2

0.92

5

57

0.806

0.854

2

2

3

1.0

11

79

0.844

0.904

4

0.91

5

27

0.813

0.853

Таблиця 2

Результати експериментів з побудови редуктів

Ступінь підтримки редукта

К-ть атрибутів редукта

Атрибути редукта

К-сть правил

КУ

1

1

11

age, gender, pik, kv, sk, ua, aa, be, oh, rew, gh

114

0,836

2

0,98

7

age, gender, pik, kv, ua, rew, gh

88

0,832

3

0,96

6

age, gender, pik, kv, rew, gh

73

0,826

4

0,92

5

age, gender, pik, kv, gh

57

0,806

5

0,75

4

age, pik, kv, gh

38

0,813

6

0,58

3

age, pik, gh

29

0,78

Наведені результати підтверджують наявність прихованої надлишковості й можливість її усунення за рахунок зменшення кількості атрибутів у редукті і кількості правил без суттєвого зменшення якості класифікації.

У четвертому розділі модель процесу аналізу даних побудовано й досліджено в умовах прояву явної невизначеності та прихованої надлишковості у даних, отриманих у результаті тестувань персоналу на предмет їх допуску до роботи операторами енергетичних мереж. Поява вказаного типу невизначеності пов'язана з наявністю невідомих значень властивостей та суб'єктивними особливостями формування множини властивостей об'єктів, якими є тестовані особи.

Модель підпроцесу має вигляд (6) і формує таблицю прийняття рішень

,

де = "надійність", = "успішність", = "профпридатність". Суб'єктивність проявляється у використанні проміжних оцінок при прийнятті рішень. Специфіка організації досліджень вимагає розбиття множини властивостей та побудови підпроцесів, які враховують вказані особливості формування опису предметної області.

У моделі підпроцесу попереднього опрацювання даних вигляду

функцією усунуто явну невизначеність методами видалення об'єктів з невідомими значеннями атрибутів і глобального доповнення, а функцією перетворено неперервну шкалу у бінарну для атрибутів "вік" та "стаж" у у "вікова група" та "група/стаж", відповідно.

У двох групах експериментів досліджено вплив різних підмножин атрибутів на отримання значень у моделях вигляду (4) та (7). Експерименти показали, що введення проміжних оцінок не впливає на якість класифікації. При цьому багато атрибутів є надлишковими, а прийняття рішень можливе на незначній їх кількості. Надлишкові атрибути у моделі (8) усуває функція , яка визначає їх множинами правил, побудованих на основі наближених редуктів.

У п'ятому розділі побудовано й досліджено модель процесу аналізу даних про об'єкти, опис яких містить явні невизначеність і надлишковість. На основі побудови і дослідження цієї моделі запропоновано новий принцип оцінювання безпеки роботи складного технічного обладнання. Для досліджень використано дані про розвиток ситуацій, які спричинили спрацювання захистів енергоблоку.

Даними є дискретні сиґнали, які кожні 100 мс повідомляють про факти виконання дій різними пристроями й отримані з 10504 сенсорів. У системі визначено біля 12 тис. типів сиґналів.

Всі дані про роботу обладнання архівують в системі реєстрації, а дані з описом аварійних ситуацій - у відповідному архіві. Об'єктами моделі є множина ситуацій , де , , значення відповідає ситуації, яка закінчилась спрацюванням захисту, а - 15-хвилинному проміжку, під час якого не відбулося таких спрацювань. Для опрацювання використано всі наявні об'єкти з архіву реєстрації аварійних ситуацій у кількості , а також окремі об'єкти з системи реєстрації у кількості .

Підпроцес подано у вигляді (6), де основну увагу приділено обчисленню функції , , . Дані про роботу пристроїв енергоблоку надходять у систему реєстрації у моменти часу , з інтервалом у мс, де - момент початку спостережень. У кожний такий момент надходить невелика кількість сиґналів. Тому у моменти часу , , де - фіксований параметр, , обчислена інтегральна характеристика - функція зі значеннями , , . Значенням функції є кількість сиґналів, які зареєстровано за час . Функція обчислена в момент часу за проміжок , який йому передує, та має зміст густини сигналів.

Для побудови таблиці прийняття рішень у підпроцесі введено інтегральну характеристику, яка визначає швидкість зміни густини сигналів у 15-хвилинному проміжку та обчислена в момент як значення функції за такою формулою

,

де , - заданий параметр. Момент досягнення функцією певних критичних значень відповідає початку розвитку аварійної ситуації.

Аналіз спрацювань захистів дозволив виділити три основні типи об'єктів за виглядом функції , які виконують розбиття множини . Об'єкти множини є надлишковими і в процесах аналізу не розглядаються. Тепер з архівів реєстрації аварійних ситуацій відібрано об'єкти , = 69 та утворено множину . Ці об'єкти використано при пошуку залежностей для прийняття рішень про спрацювання захистів.

Таблиця прийняття рішень розглядається у вигляді (1), де , є розбиттям множини за технологічними особливостями сигналів. При виявленні залежностей окремо розглядаються множини , де , , .

У таблиці з допомогою функції = обчислено її елементи для кожного об'єкту та , , де значення залежить від вибору параметрів та . На рис. 3 показано функцію для об'єкту = 03_05_2001_10_47_10, , с, = 4 та =10.

Модель підпроцесу виявлення залежностей розглядається у вигляді , де функція обчислює об'єкти множини за методом - найближчих сусідів (-) у вибраній метриці як найближчі до кожного за заданим значенням - кількістю таких об'єктів. Модель підпроцесу у разі застосування методу - подано у вигляді (5). Тоді оцінку значень функції на основі об'єктів з множини , найближчих до , обчислено за формулою

,

де = , , - відстань, яка обчислена у вибраній метриці, для , та - у всіх інших випадках. Функція формує множину тестових прикладів, для яких класифікатор за заданим обчислюється як функція Хевісайда. Оцінка якості класифікатора є його коефіцієнтом успішності.

Рис.3 Залежність швидкості зміни густини від часу

На рис. 4 показано залежність значень оцінки від кількості сусідів для об'єкту = 02_02_2001_21_26_13 з архіву реєстрації аварійних ситуацій.

Рис. 4 Залежність значень оцінки для об'єкту = 02_02_2001_21_26_13 від кількості найближчих сусідів

Аналогічно, на рис. 5 показано залежність значень оцінки від кількості сусідів для об'єкту = good10 з системи реєстрації.

Рис. 5 Залежність значень оцінки для об'єкту x = good10 від кількості найближчих сусідів

Обидва рисунки показують можливість якісної класифікації об'єктів на основі методу найближчих сусідів для та .

Для виявлення ситуацій, які можуть привести до спрацювання захистів, також використано класифікатор на основі нейромережі прямого поширення сигналу. У цьому випадку модель підпроцесу розглядається у вигляді (4), а - у вигляді (5).

Дослідження показали, що вибір топології нейронних мереж у підпроцесі дозволяє з високим рівнем достовірності ідентифікувати ситуації, що можуть призвести до спрацювання захистів. На рис. 6 показані значення оцінки для всіх об'єктів у моделі підпроцесу (5), які обчислені у двох експериментах нейромережами топологій 2-3-3 та 2-10-10, відповідно, для 129 ситуацій. У першому з них навчання виконане за методом зворотного поширення похибки і сигмоїдою з параметром 0,1 як активаційною функцією; у другому - за методом Левенберґа -Марквадта і гіперболічним танґенсом. Для всіх об'єктів обрано . У разі використання нейромережі з топологією 1-10 усі об'єкти правильно класифіковано для .

Рис. 6 Результати класифікації всіх об'єктів за допомогою нейромереж

У шостому розділі побудовано модель процесу аналізу даних із прихованою невизначеністю та явною надлишковістю, яку використано для розв'язування задачі ідентифікації елементів жестової мови. Досліджено вплив на ефективність реалізації моделей процесів аналізу результатів усунення її надлишковості й невизначеності. Побудовано моделі двох процесів, які покладено в основу досліджень з розпізнавання кінців пальців руки на зображенні й ідентифікації жесту за формою кисті руки.

Модель для обох задач подано у вигляді (2). Множина об'єктів створюється з кадрів відеозображення з елементами жесту. У задачі розпізнавання кінців пальців об'єктами , є піксели зображення, функція задає значення властивості об'єкту як характеристику піксела, для якого , де - задана функція відстані та - радіус околу піксела . Значення вводиться інтерактивно для об'єктів , які належать кінцям пальців на зображенні та - для решти об'єктів. Функції та усувають явну надлишковість, яка пов'язана з особливостями кодування елементів зображень, уведенням фраґментів, які не несуть змістовної інформації або призводять до виникнення невизначеності за рахунок елементів тла, способів освітлення, додаткових елементів на зображенні, що унеможливлює ідентифікацію елементів жесту.

Модель підпроцесу виявлення залежностей розглядається у вигляді .

Функція обчислює вектор значень синаптичних ваг нейромережі з векторами активаційних функцій . Оцінювання якості результатів ідентифікації виконано відповідно до моделі (5). Навчена нейромережа обчислює оцінку як ступінь належності піксела до кінця пальця для множини тестових зображень, сформованих функцією .

У задачі ідентифікації жесту за формою кисті руки утворено множину основних форм зображення кисті, а жест розглядається як послідовність форм, які подібні до основних. Тепер об'єктами множини в (1) є еталони основних форм, а атрибутами - характеристики елементів зображення еталону. Зменшення надлишковості опису жесту за формою кисті руки досягнуто за рахунок мінімізації потужності множини еталонів основних форм у моделі підпроцесу попереднього опрацювання даних вигляду ,

а пошук за еталоном - у знаходженні на досліджуваному зображенні прямокутної області, яка найподібніша до одного з еталонів. Для обчислення міри подібності як характеристики близькості зображень побудовано алгоритм, в основу якого покладено метод навчання з підкріпленням. Еталон з найбільшим значенням міри подібності вважаємо основною формою кисті. Розроблений алгоритм зводить до однієї основної форми кілька зображень, які отримано невеликою деформацією одного з них та зміною кольорів окремих елементів. Перевірку якості класифікації виконано функціями моделі вигляду (5).

У сьомому розділі роботи досліджено методи усунення невизначеності на основі врахування апріорних знань експерта про структуру предметної області при формуванні її опису та введенні у множину таблиці прийняття рішень (1) таких атрибутів, які призводять до появи значної кількості значень типу "*". Побудовано метод опису структури таких атрибутів і спеціальні функції, які використано для її трансформації з метою усунення вказаної невизначеності.

Першим джерелом невизначеності є наявність альтернативних атрибутів, що призводить до появи значної кількості даних зі значенням "*". Інший тип невизначеності виникає у випадку надмірної деталізації атрибутів, що може викликати проблеми в отриманні значень деяких з них і появі даних зі значенням "*". Усувати такі види невизначеності пропонується шляхом аналізу структури відношень на множині атрибутів та їх ґранулюванням.

Аналіз предметної області, який дозволив виявляти вказані структури, виконаний на основі побудови моделі онтології предметної області вигляду , де - множина об'єктів, - множина відношень на об'єктах або атрибутах об'єктів, - інтерпретація об'єктів, - множина функцій опрацювання онтології.

Побудовано метод, який базується на формуванні структури предметної області, в основу якого покладено анкетування, побудова ієрархічної моделі предметної області у вигляді кореневого дерева і введення спеціальних функцій опрацювання онтології, які реалізовано для різних способів подання опису цього дерева. Функції Inc, AddList, Del, Dec, AddTree, Init, List призначено для розвитку онтології, Ren - для опрацювання даних, а Pop, Rad, And, Empty - для формування й опрацювання інтерфейсу. Застосовано різні способи опису ієрархічної структури атрибутів чи об'єктів та обчислення введених функцій. Запропонований метод покладено в основу створення програмного комплексу "Імуноскрин".

...

Подобные документы

  • Побудова графіків реалізацій вхідного та вихідного процесів, розрахунок функцій розподілу, математичного сподівання, кореляційної функції. Поняття та принципи вивчення одномірної функції розподілу відгуку, порядок конструювання математичної моделі.

    контрольная работа [316,2 K], добавлен 08.11.2014

  • Модель Еванса встановлення рівноважної ціни. Побудова моделі зростання для постійного темпу приросту. Аналіз моделі росту в умовах конкуренції. Використання математичного апарату для побудови динамічної моделі Кейнса і неокласичної моделі росту.

    реферат [81,8 K], добавлен 25.05.2023

  • Теорія межі послідовності й межі функції як один з розділів математичного аналізу. Поняття межі послідовності, огляд характерних прикладів обчислення меж послідовності з докладним розбором рішення, специфіка теореми Штольца й приклади її застосування.

    курсовая работа [118,6 K], добавлен 17.01.2011

  • Основні поняття логлінійного аналізу - статистичного аналізу зв’язку таблиць спряженості за допомогою логлінійних моделей. Аналіз зв’язку категоризованих змінних. Канонічна кореляція при аналізі таблиць спряженості ознак. Побудова логарифмічної моделі.

    контрольная работа [87,4 K], добавлен 12.08.2010

  • Етапи розв'язування інженерних задач на ЕОМ. Цілі, засоби й методи моделювання. Створення математичної моделі. Побудова обчислювальної моделі. Реалізація методу обчислень. Розв’язання нелінійних рівнянь методом дихотомії. Алгоритм метода дихотомії.

    контрольная работа [86,1 K], добавлен 06.08.2010

  • Лінійна багатовимірна регресія, довірчі інтервали регресії та похибка прогнозу. Лінійний регресійний аналіз інтервальних даних, методи найменших квадратів для інтервальних даних і лінійної моделі. Програмний продукт "Інтервальне значення параметрів".

    дипломная работа [1,1 M], добавлен 12.08.2010

  • Ознайомлення із символікою та апаратом логіки висловлень. Сутність алгебри Жегалкіна. Дослідження питань несуперечності, повноти та незалежності логічних та спеціальних аксіом числення предикатів. Визначення поняття та характерних рис алгоритмів.

    курс лекций [538,2 K], добавлен 02.04.2011

  • Складання плану виробництва при максимальному прибутку. Введення додаткових (фіктивних) змінних, які перетворюють нерівності на рівності. Розв’язування задачі лінійного програмування графічним методом та економічна інтерпретація отриманого розв’язку.

    контрольная работа [298,3 K], добавлен 20.11.2009

  • Діяльнісний підхід до організації навчального процесу в педагогічному університеті. Змістове наповнення та методика використання історичного матеріалу на лекціях з математичного аналізу. Історичні задачі як засіб створення проблемних ситуацій на лекціях.

    курсовая работа [195,5 K], добавлен 21.04.2015

  • Основні принципи і елементи комбінаторики. Теорія ймовірностей: закономірності масових випадкових подій, дослідження і узагальнення статистичних даних, здійснення математичного і статистичного аналізу. Постановка і вирішення задач економічного характеру.

    курс лекций [5,5 M], добавлен 21.11.2010

  • Визначення основних понять і вивчення методів аналізу безкінечно малих величин. Техніка диференціального і інтегрального числення і вирішення прикладних завдань. Визначення меж числової послідовності і функції аргументу. Обчислення інтегралів.

    курс лекций [570,1 K], добавлен 14.03.2011

  • Характеристика, поняття, сутність, положення і особливості методів математичної статистики (дисперсійний, кореляційний і регресійний аналіз) в дослідженнях для обробки експериментальних даних. Розрахунки для обчислення дисперсії, кореляції і регресії.

    реферат [140,6 K], добавлен 25.12.2010

  • Методи рішення задач математичної статистики, яка вивчає статистичні закономірності методами теорії ймовірностей за статистичними даними - результатами спостережень, опитувань або наукових експериментів. Способи збирання та групування статистичних даних.

    реферат [220,7 K], добавлен 13.06.2010

  • Діагностика турбіни трьома основними методами — ММР, ММП, ММКПР, тобто визначення Хо для всіх випадків. Ідентифікація параметрів математичної моделі на основі авторегресії 2-го порядку для заданого часового ряду, оцінка адекватності отриманої моделі.

    контрольная работа [98,3 K], добавлен 16.08.2011

  • Застосування методів математичного аналізу для знаходження центрів мас кривих, плоских фігур та поверхонь з використанням інтегральних числень функцій однієї та кількох змінних. Поняття визначеного, подвійного, криволінійного та поверхневого інтегралів.

    курсовая работа [515,3 K], добавлен 29.06.2011

  • Розв'язання задач з теорії множин та математичної логіки. Визначення основних характеристик графа г (Х,W). Розклад функцій дискретного аргументу в ряди по базисним функціям. Побудова та доведення діаграми Ейлера-Вена. Побудова матриці інцидентності графа.

    курсовая работа [988,5 K], добавлен 20.04.2012

  • Неперервність функцій в точці, області, на відрізку. Властивості неперервних функцій. Точки розриву, їх класифікація. Знаходження множини значень функції та нулів функції. Розв’язування рівнянь. Дослідження функції на знак. Розв’язування нерівностей.

    контрольная работа [179,7 K], добавлен 04.04.2012

  • Деякі відомості математичного аналізу. Виховне значення самостійної навчальної роботи. Короткий огляд та аналіз сучасних систем комп'ютерної математики. Відомості про систему Wolfram Mathematica. Обчислення границь функції, похідних та інтегралів.

    курсовая работа [1,0 M], добавлен 10.05.2011

  • Характерні особливості застосування визначених і подвійних інтегралів, криволінійних і поверхневих інтегралів першого роду для обчислення статичних моментів, моментів сили та моментів матеріальної поверхні. Приклади знаходження вказаних фізичних величин.

    реферат [694,9 K], добавлен 29.06.2011

  • Застосування систем рівнянь хемотаксису в математичній біології. Виведення системи визначальних рівнянь, розв'язання отриманої системи визначальних рівнянь (симетрій Лі). Побудова анзаців максимальних алгебр інваріантності математичної моделі хемотаксису.

    дипломная работа [1,9 M], добавлен 09.09.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.