Метод довизначення для розв’язання задач моделювання та прогнозування на основі методу групового урахування аргументів
Опис порівняльного аналізу методів моделювання та прогнозування, їх використання в задачах моніторингу. Значення комп’ютерних технологій для побудови моделей на основі методу групового урахування аргументів. Застосування критерію незміщеності помилок.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | автореферат |
Язык | украинский |
Дата добавления | 27.08.2015 |
Размер файла | 98,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Національна академія Міністерство освіти
наук України і науки України
МІЖНАРОДНИЙ НАУКОВО-НАВЧАЛЬНИЙ ЦЕНТР
ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ ТА СИСТЕМ
Автореферат
Метод довизначення для розв'язання задач моделювання та прогнозування на основі методу групового урахування аргументів
05.13.06 - інформаційні технології
Савченко Євгенія Анатоліївна
Київ - 2009
Дисертацією є рукопис.
Робота виконана у Міжнародному науково-навчальному центрі інформаційних технологій та систем НАН та МОН України
Наукові керівники - Заслужений діяч науки України, академік НАН України, доктор технічних наук, професор
- доктор технічних наук, старший науковий співробітник
Степашко Володимир Семенович,
Міжнародний науково-навчальний центр інформаційних технологій та систем НАН та МОН України,
завідувач відділу
Офіційні опоненти - доктор технічних наук, професор Зубов Дмитро Анатолійович, Київський міжнародний університет, професор кафедри міжнародної інформації та інформатики
- кандидат технічних наук Ревунова Олена Георгіївна, Міжнародний науково-навчальний центр інформаційних технологій та систем НАН та МОН України, науковий співробітник
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. Задача побудови моделей, які описують або прогнозують поведінку спостережуваного об'єкта чи процесу, є невід'ємною складовою частиною розв'язання задач керування та прийняття рішень. Для побудови математичної моделі в загальному випадку слід визначити її структуру та оцінити параметри, тобто розв'язати задачу структурно-параметричної ідентифікації, або моделювання за вибіркою статистичних чи експериментальних даних. На практиці, як правило, вибірка є обмеженою, а задача моделювання розв'язується в умовах неточності даних та неповноти апріорної інформації.
Для задач прийняття рішень особливо важливо будувати прогнозні моделі, що дозволяє зменшити негативні наслідки помилкових рішень. Серед методів моделювання в умовах неповноти інформації вирізняється метод групового урахування аргументів (МГУА), автором якого є академік О.Г.Івахненко. Це ефективний метод автоматичного синтезу прогнозних моделей за даними спостережень, розроблений у працях автора та учнів його школи індуктивного моделювання.
МГУА має широке світове визнання, постійно удосконалюється, розширюється сфера його застосування. Вагомий внесок у формування теорії та практики індуктивного моделювання зробили В.М.Висоцький, Ю.П.Зайченко, Т.Кондо, П.Кордік, Ю.В.Коппа, Ф.Лемке, Й.-А.Мюллер, О.П.Саричев, В.С.Степашко, Ю.В.Юрачковський та інші українські й закордонні вчені.
В процесі розширення спектру прикладних застосувань методу часом встановлюються нові потреби в глибшому розробленні деяких аспектів алгоритмічних реалізацій цього методу. Зокрема, в реальних задачах моделювання в умовах невизначеності виявлено проблему неоднозначності вибору оптимальної моделі за одним критерієм: часто обираються декілька моделей різної складності, які мають близькі значення критерію. У таких випадках використовують двокритеріальний пошук моделі, але він має низку недоліків: час розрахунку значно збільшується, необхідно задавати вагові коефіцієнти комбінованого критерію тощо.
Перші дослідження вибору оптимальної моделі на основі застосування двокритеріального підходу виконувались ще в кінці 1970-х - на початку 1980-х років, коли було показано його доцільність, але не проводилось порівняльного аналізу ефективності різних комбінацій критеріїв МГУА для пошуку оптимальної моделі та не було розроблено чіткі рекомендації й технології його застосування.
Тому актуальною є науково-прикладна задача підвищення ефективності алгоритмів МГУА та побудови комп'ютерної технології моделювання і прогнозування за експериментальними даними на основі МГУА в умовах невизначеності та неповноти інформації.
Зв'язок роботи з науковими програмами, планами, темами. Робота виконувалась відповідно до планів наукових досліджень відділу Інформаційних технологій індуктивного моделювання Міжнародного науково-навчального центру інформаційних технологій та систем НАН і МОН України. Матеріали дисертації отримано в рамках досліджень за такими темами відділу:
„Розроблення інформаційних технологій індуктивного моделювання і прогнозування для задач моніторингу складних процесів” (№ держреєстрації 0100U002677, 2000-2003 рр.);
Науково-дослідна робота 2М/199-2000 „Здобуття знань в складних економічних системах за допомогою індуктивного методу самоорганізації” (№ держреєстрації 0100U002666, 2000-2003 рр.) в рамках угоди між урядами України та Угорської республіки про співробітництво у сфері науки та технологій;
“Дослідження і розробка інформаційних технологій прогнозування і пошуку закономірностей складних процесів в умовах невизначеності та неповноти інформації” (№ держреєстрації 0102U002072, 2002-2006 рр.);
„Дослідження і розробка нових інформаційних технологій аналізу та виявлення закономірностей нестаціонарних динамічних процесів в умовах невизначеності та неповноти інформації” (№ держреєстрації 0107U003270, 2007-2011 рр.).
Мета і задачі досліджень. Метою роботи є підвищення ефективності побудови моделей на основі комбінаторного алгоритму МГУА та розроблення технології аналізу даних, моделювання та прогнозування в задачах моніторингу складних процесів, а також застосування їх для розв'язання реальних задач.
Для досягнення вказаної мети в роботі слід розв'язати такі задачі:
– виконати порівняльний аналіз методів моделювання та прогнозування, що застосовуються в задачах моніторингу;
– розробити ефективний метод пошуку оптимальної моделі - метод довизначення із застосуванням критерію незміщеності помилок;
– розробити методику та комп'ютерну технологію для побудови моделей на основі МГУА та методу довизначення в задачах моніторингу;
– застосувати розроблені засоби для розв'язання прикладних задач моделювання та прогнозування.
Об'єктом дослідження є процес моделювання та прогнозування складних систем за даними спостережень.
Предметом дослідження є підвищення ефективності побудови моделей на основі комбінаторного алгоритму МГУА.
Методи дослідження. Метод групового урахування аргументів, інші методи моделювання та прогнозування процесів, матричний аналіз, математична статистика, комп'ютерне тестування, метод аналогів.
Наукова новизна одержаних результатів. Основні результати роботи, які визначають наукову новизну та виносяться на захист, такі:
Запропоновано новий зовнішній критерій МГУА на основі поділу вибірки на дві частини - критерій незміщеності помилок, аналітично та чисельно показано його зв'язок з іншими критеріями МГУА, виконано порівняння з відомим критерієм незміщеності рішень.
Теоретично та чисельно досліджено основні властивості критерію незміщеності помилок як зовнішнього критерію МГУА і встановлено, що він є адекватним критерієм селекції оптимальної моделі.
Вперше розроблено метод довизначення, який полягає у послідовному використанні двох критеріїв оптимізації складності моделі: спочатку за критерієм регулярності знаходиться підмножина найбільш точних моделей, серед яких за критерієм незміщеності помилок визначається оптимальна модель.
Удосконалено методику аналізу даних на основі комбінаторного алгоритму МГУА та методу довизначення, яка містить етапи попередньої обробки вибірки даних, моделювання та прогнозування.
Практичне значення одержаних результатів:
Запропоновано методику попередньої обробки вибірки даних на основі МГУА, яка розв'язує задачі відновлення пропущених даних з оптимізацією шаблону зчитування, розширення складу аргументів та пошуку найбільш інформативних з них, оптимізації розміру вибірки.
Розроблено комп'ютерну технологію автоматизованого розв'язання задач аналізу даних, моделювання та прогнозування на основі МГУА та методу довизначення.
За допомогою розробленої технології розв'язано такі прикладні задачі:
– відновлення пропусків у даних та короткострокове прогнозування рівня глюкози в крові хворого на діабет;
– моделювання залежності валового внутрішнього продукту (ВВП) від макроекономічних показників для двох груп країн за даними соціально-економічного моніторингу;
– побудовано моделі взаємодії іонів з поверхнею матеріалів для вибору матеріалу покриття поверхні літального апарату.
Розробки автора використані в Московському авіаційному інституті для підвищення ефективності моделювання залежності коефіцієнту розпилення матеріалів від їх властивостей, про що отримано акт впровадження.
При виконанні науково-технічної роботи в рамках україно-угорського співробітництва спільно з Лабораторією прикладної логіки (Будапешт, Угорщина), використовуючи розроблену технологію, побудовано моделі залежності ВВП від макроекономічних показників двох груп країн, до яких входять Україна та Угорщина. Крім того, в рамках цього договору розв'язано задачі медичного моніторингу хворого на діабет: побудовано моделі для відновлення пропусків у даних та короткострокового прогнозу рівня глюкози в крові.
Особистий внесок здобувача у працях зі співавторами. Всі теоретичні дослідження, розробка алгоритмічного та програмного забезпечення виконані автором самостійно. В працях, написаних у співавторстві, автору дисертації належать: дослідження побудови математичних моделей для відновлення пропущених даних в задачі медичного моніторингу діабету [1], дослідження застосування додаткового критерію для вибору оптимальної моделі [8], алгоритм вибору оптимальної моделі залежності коефіцієнта розпилення матеріалів від їх фізичних властивостей [2], застосування методу довизначення вибору моделі та методу аналогів для моделювання задачі соціально-економічного моніторингу країн світу [10], застосування методу довизначення для побудови моделей залежності взаємодії іонів з поверхнею матеріалів [9], результати розрахунку доз ін'єкцій інсуліну в задачі надомного моніторингу діабету [7], прогнозування рівня глюкози в крові хворого на діабет із застосуванням комбінаторного алгоритму МГУА [3], розроблення методики застосування методу довизначення вибору моделі та її чисельне дослідження [14], чисельне дослідження ефективності методу довизначення вибору моделі [5], чисельне дослідження ефективності послідовного застосування критерії МГУА: регулярності та незміщеності помилок [13], аналітичне дослідження зовнішніх критерії МГУА при їх послідовному застосуванні, порівняння методу довизначення вибору моделі та застосування комбінованих критеріїв [6], чисельне дослідження завадостійкості критерію незміщеності помилок при різних рівнях шуму [15].
Апробація наукових результатів. Основні результати дисертаційної роботи оприлюднені та обговорювалися на: Міжнародних конференціях і семінарах з індуктивного моделювання (Львів, 2002; Київ, 2005; Прага, 2007; Київ, 2008); 6-й міжнародній конференції «Распознавание образов и анализ изображений: новые информационные технологии» (Великий Новгород, Росія, 2002); 11-й міжнародній конференції з автоматичного управління «Автоматика-2004» (Київ); Міжнародній конференції „Інтелектуальні системи прийняття рішень та проблеми обчислювального інтелекту” (Євпаторія, 2008 та 2009).
Публікації. Результати дисертаційних досліджень опубліковані у 16 наукових працях, з яких 6 у наукових фахових виданнях за переліком ВАК, 7 доповідей та 1 тези у матеріалах конференцій, 5 праць опубліковано у зарубіжних наукових виданнях.
Структура і обсяг дисертаційної роботи. Дисертація складається зі вступу, чотирьох розділів, висновків, списку використаних джерел, що містить 112 бібліографічних посилань та 2 додатків. Повний обсяг дисертації становить 147 сторінок друкованого тексту, з них 139 сторінок основного тексту, містить 36 рисунків та 19 таблиць.
Основний зміст роботи
У вступі обґрунтовано актуальність теми дисертаційної роботи, сформульовано мету і задачі дослідження, визначено наукову новизну та практичне значення одержаних результатів, зазначено особистий внесок здобувача та викладено короткий зміст дисертаційної роботи.
У першому розділі роботи проаналізовано існуючі підходи до моделювання та прогнозування за експериментальними даними, зокрема в задачах моніторингу складних процесів. Обґрунтовано актуальність задачі моделювання та прогнозування за вибіркою експериментальних даних моніторингу складного процесу, особливо в умовах невизначеності та неповноти інформації, наведено постановку задачі моніторингу, його мету та основні задачі. Подано огляд сучасних методів розв'язання задач моделювання та прогнозування, наведено їх переваги та недоліки.
На сьогоднішній день існує багато методів, що використовуються в задачах моделювання та прогнозування. Проте процеси, які зустрічаються на практиці, є значно складнішими, ніж ті, на які орієнтовані розроблені методи, крім того, дані можуть містити неоднорідні спостереження та взаємозв'язки між змінними. Все це призводить до того, що теорія не дає однозначних відповідей на питання вибору найкращого методу моделювання та прогнозування.
Серед недоліків відомих методів моделювання та прогнозування можна назвати такі. Регресійний аналіз вимагає виконання багатьох передумов, які важко перевірити, дає переускладнені моделі, прогноз за цим методом потребує великої кількості даних і є задовільним тільки для невеликого інтервалу випередження. Метод експоненційного згладжування оперує тільки часовими рядами, крім того, він потребує задання параметру згладжування, початкових умов та степеня полінома. Метод імовірнісного моделювання вимагає великої кількості спостережень, а також знання початкового розподілу. Метод адаптивного згладжування також потребує великої вибірки, крім того, є ризик отримати велику помилку прогнозу. Проблема нейронних мереж у перенавчанні та необхідності визначення числа шарів та кількості елементів у шарі. У генетичних алгоритмах існує проблема кодування інформації.
Тому в роботі для моделювання і прогнозування складних процесів застосовується МГУА як метод, який дозволяє покращити точність моделювання за рахунок автоматичного виявлення залежностей та взаємозв'язків, що існують у вибірці даних. Перевагою комбінаторного алгоритму МГУА є повний перебір моделей, який дає можливість об'єктивно знайти оптимальну модель. Проте в реальних задачах моделювання в умовах невизначеності існує проблема неоднозначності вибору моделі за одним критерієм. Як правило, у таких випадках для знаходження оптимальної моделі використовують двокритеріальний підхід. Але він має свої недоліки: для обчислення комбінованого критерію значення двох критеріїв мають бути розраховані для всіх моделей, що перебираються алгоритмом, тому час моделювання значно збільшується. Крім того, для розрахунку сумарного критерію необхідно задавати вагові коефіцієнти. Щоб уникнути цих недоліків, слід розробити ефективний метод, який підвищить ефективність побудови моделей на основі комбінаторного алгоритму МГУА за рахунок послідовного застосування зовнішніх критерії МГУА.
Другий розділ роботи присвячено розробці методу довизначення як двокритеріального методу побудови моделей на основі МГУА. В основі методу довизначення вибору моделі лежить послідовне застосування двох критерії МГУА: регулярності та незміщеності.
Для розрахунку критеріїв уся вибірка даних спостережень , , ділиться принаймні на дві частини та довжиною та , де - навчальна підвибірка, - перевірочна, , .
Критерій регулярності розраховується для заданої складності моделі як помилка на частині цієї моделі з параметрами, обчисленими на :
, (1.1)
де - оцінка вектора параметрів моделі за МНК на підвибірці .
Критерій регулярності, розрахований на тій самій вибірці, на якій отримана модель, є залишковою сумою квадратів (RSS): ; . моделювання прогнозування комп'ютерний помилка
. (1.2)
В роботі запропоновано і досліджено новий критерій незміщеності помилок, який, як і , відноситься до групи критеріїв узгодженості, оскільки виражає вимогу мінімізації розузгодження помилок моделі:
, (1.3)
де і - сумарні помилки на вибірці моделі однакової структури складності із параметрами, оціненими на та відповідно.
В результаті проведеного аналітичного порівняння критерію незміщеності помилок з відомими критеріями МГУА встановлено, що значення критерію незміщеності помилок завжди менше значень критерію незміщеності рішень :
, (1.4)
оскільки завжди виконується нерівність .
Чисельні приклади показали, що критерій незміщеності помилок має більшу чутливість при зміні складності моделі, ніж критерій незміщеності рішень.
У результаті проведеного аналітичного дослідження селекційних властивостей критерію незміщеності помилок доведено, що він є адекватним критерієм МГУА, оскільки має мінімум на множині всіх структур.
Щоб дослідити властивості нового критерію незміщеності помилок, знайдено його математичне сподівання, яке може бути записане так:
(1.5)
де Е - оператор математичного сподівання. В цьому виразі через
(1.6)
позначено структурну складову критерію незміщеності помилок, а через
(1.7)
- шумову складову цього критерію.
Структурна складова чисельно характеризує втрати від зміщення (спрощення) структури моделі у порівнянні з істинною. Шумова складова чисельно характеризує втрати від наявності шуму в даних, рівень якого пропорційний дисперсії шуму . Для того, щоб критерій незміщеності помилок був адекватним критерієм МГУА, необхідно, щоб структурна складова була спадною, а шумова - зростаючою функцією складності моделі . Оскільки при сумарна структурна складова , а , ця складова є немонотонно спадною функцією дискретного аргументу .
З виразу (1.7) очевидно, що необхідною умовою зростання шумової складової є перш за все виконання нерівності (для всіх )
. (1.8)
Оскільки з самої формули (1.7) не можна сказати, як буде себе вести складова у загальному випадку, досліджено деякі окремі випадки та показано, що:
1) при плані повторного експерименту, коли, шумова складова для всіх s, оскільки не виконується (1.8);
2) при лінійно залежному (-пропорційному) плані, коли , де , складова буде монотонно зростаючою, якщо або ;
3) при -пропорційному плані, коли , , ця складова буде монотонно зростаючою, якщо ;
4) при ортогональному плані експерименту, коли та - діагональні матриці, умовою монотонного зростання цієї шумової складової є нерівність власних чисел інформаційних матриць та : .
Отже, аналітичне дослідження показало, що критерій незміщеності помилок є адекватним критерієм МГУА, оскільки має мінімум на множині всіх структур за виконання необхідної умови відмінності матриць та , що в реальних задачах виконується практично завжди.
На основі критерію регулярності та запропонованого критерію незміщеності помилок розроблено метод довизначення вибору моделі або просто метод довизначення, який містить два етапи: спочатку за допомогою комбінаторного алгоритму МГУА знаходимо підмножину моделей, що містить найкращі моделі за зовнішнім критерієм регулярності з близькими мінімальними значеннями цього критерію (рис. 1).
Рис. 1. Залежність критерію регулярності від складності моделі
Для всіх моделей з цієї множини розраховуємо значення критерію незміщеності помилок за формулою (1.3). Оптимальна модель визначається за мінімумом критерію незміщеності помилок, приклад його залежності від складності моделі показано на рис. 2.
Рис. 2. Залежність критерію незміщеності помилок від складності моделі
Ефективність методу довизначення за критерієм незміщеності помилок доведено чисельними прикладами, які показали, що отримана в результаті цієї процедури модель є найбільш точною не тільки на навчальній та тестовій частинах вибірки, але і на третій, незалежній екзаменаційній частині.
Третій розділ роботи присвячено розробці методики та технології аналізу даних, моделювання та прогнозування в задачах моніторингу на основі МГУА. Ця технологія розв'язує задачі попередньої обробки вибірки даних та побудови моделі для ідентифікації або прогнозування. Як ядро розробленої технології застосовується комбінаторний алгоритм МГУА, який удосконалено процедурою довизначення для пошуку оптимальної прогнозної моделі.
Задачі моніторингу характеризуються значною кількістю оновлюваних спостережень, тому технологія має забезпечувати оперативну обробку даних з метою побудови оптимальних прогнозних моделей.
Вибірка даних моніторингу подається на блок попередньої обробки, який розв'язує такі задачі: відновлення пропущених даних спостережень; розширення складу аргументів за допомогою додання нових аргументів, що розраховуються як прості функції вхідних аргументів; вибір інформативних аргументів; оптимізація розміру вибірки за рахунок пошуку аналогів у передісторії.
Для відновлення пропущених даних у вибірці застосовується підхід на основі побудови інтерполяційної моделі за комбінаторним алгоритмом МГУА. За заданим шаблоном зчитування вхідних даних формується розширена вибірка і будується найкраща модель, за якою розраховується значення пропущеного елемента. Для кожного пропуску в даних розраховується своя модель.
Відбір інформативних аргументів здійснюється за допомогою розрахунку модуля коефіцієнта кореляції кожного аргументу з вихідною змінною. Змінні, які мають мале значення модуля, можуть бути виключені з множини вхідних змінних (наприклад, менше 0,1).
Оптимізація розміру вибірки здійснюється так: розраховується значення евклідової відстані поточного спостереження (останнього рядка таблиці даних) з усіма попередніми спостереженнями вибірки, а потім з упорядкованої за евклідовою відстанню множини спостережень відбирається певна їх кількість, найближчих до поточного спостереження. Отримана вибірка використовується для моделювання на основі комбінаторного алгоритму МГУА з використанням методу довизначення..
Розроблено комплекс програм для розв'язання задач попередньої обробки даних, моделювання і прогнозування, ядром якого є комбінаторний алгоритм МГУА з методом довизначення. Комплекс реалізовано на мові програмування С++.
Наведено чисельний приклад застосування методу довизначення для пошуку оптимальної моделі та показано його ефективність при різних рівнях шуму в даних.
Четвертий розділ роботи присвячено розв'язанню трьох прикладних задач моделювання та прогнозування на основі МГУА та методу довизначення.
Перший приклад стосується моделювання в задачі лікування діабету за даними надомного моніторингу. Наведено результати розв'язання задачі відновлення відсутніх значень, короткострокового прогнозу рівня глюкози в крові за часовим і аналоговим рядами даних. Робота проводилась в рамках угоди між урядами України та Угорської республіки про співробітництво. Вибірку даних надомного моніторингу хворих на діабет було надано науковцями Угорщини.
При надомному моніторингу вимірювання рівня глюкози в крові (РГК) чотири рази на день в заданий час (о 6.00, 12.00, 17.15 та 22.00 годині) проводить сам хворий у домашніх умовах за допомогою спеціального пристрою - глюкометру і записує отримані значення РГК та дози ін'єкцій інсуліну, введені у ті ж годити. Оскільки спостереження ведуться в домашній умовах самим хворим, вибірка даних містить багато пропусків.
Часовий ряд даних перетворено до форми дворівневої вибірки, що містить вісім змінних: по чотири РГК та доз інсуліну, що реєструвались упродовж дня. За такою вибіркою розв'язувалися задачі відновлення та прогнозування.
Для відновлення пропущених значень використано комбінаторний алгоритм МГУА з урахуванням різних шаблонів зчитування даних початкової вибірки: хрестоподібного, діагонального і квадратного, які дають змогу обирати різну множину аргументів-кандидатів. Приклад відновлення за різними шаблонами показав, що найбільш точними для відновлення одиничних пропусків є хрестоподібний та квадратний шаблони. Виконано порівняння результатів відновлення за МГУА та за методом експоненційного згладжування і показано ефективність першого методу.
В задачі короткострокового прогнозування РГК порівнювались три варіанти прогнозу РГК: за часовим рядом, за часовим рядом з розширенням вибірки та з оптимізацією розміру вибірки за методом аналогів. Найкращий результат отримано при моделюванні за рядом аналогів. З вибірки, що мала 60 спостережень вимірювання РГК, було відібрано 40 спостережень - аналогів вихідного спостереження, тобто найближчих за евклідовою відстанню в просторі всіх змінних Середня помилка прогнозу для покрокового прогнозу на чотири дні склала 19,4%.
Другим прикладом є побудова моделей залежності ВВП від показників, що описують рівень соціального розвитку країн світу за даними соціально-економічного моніторингу, який проводить ЮНЕСКО щорічно. Цей приклад є застосуванням розробленої технології для розв'язання задачі ідентифікації за даними соціально-економічного моніторингу.
Дані містять 18 змінних для 173 країн світу і характеризують їх соціально-економічний розвиток: валовий внутрішній продукт (ВВП), значення індексу соціального розвитку людини, індекс рівня освіти, індекс очікуваної тривалості життя тощо. Ця робота теж виконувалася спільно з угорськими вченими, тому побудовано моделі залежності ВВП від соціально-економічних показників для двох країн - України та Угорщини. Ці країни різняться за рівнем розвитку, і моделі побудовано окремо для кожної з країн. З усіх даних моніторингу відібрано 20 країн-аналогів кожної них, тобто країн, найближчих до України та Угорщини у просторі всіх змінних, і складено дві вибірки даних, за якими отримано моделі залежності ВВП від інших соціально-економічних показників. Було побудовано як лінійні, так і нелінійні моделі. Найкраща точність отримана для моделей, що містили нелінійну залежність ВВП від оптимальної підмножини аргументів, були включаючи змішані добутки початкових аргументів.
Можна зробити висновок, що розроблена технологія може бути застосована для подібних задач, а отримані моделі можуть бути використані для аналізу залежності рівня ВВП в Україні та Угорщині від соціально-економічних показників.
Третій приклад пов'язаний з моделюванням взаємодії іонів струменя газів з поверхнею матеріалів. Поверхня космічного апарату руйнується під дією потоку вихлопних газів, тобто розпилюється. Задача полягала в підборі матеріалу покриття поверхні космічного апарату, який мав би найменший коефіцієнт розпилення. Робота виконана спільно з ученими Московського авіаційного інституту, які надали вибірку експериментальних даних. Вибірка містила значення коефіцієнту розпилення низки матеріалів іонами ксенону при фіксованих параметрах газу, що розпиляє поверхню. Потрібно було знайти залежність коефіцієнта розпилення від характеристик цих матеріалів. Вибірка даних містила 6 змінних, які описують властивості 20 матеріалів, такі як масова густина, молекулярна вага, температура сублімації, теплоємність і енергія зв'язку, а також значення коефіцієнта розпилення цих матеріалів. Потрібно було побудувати залежність коефіцієнта розпилення від властивостей матеріалів. Ця задача досліджується близько 100 років, але й досі залишається актуальною, оскільки фізичні моделі, які застосовуються для розрахунку значень коефіцієнта розпилення, можуть давати дуже велику помилку. В цій задачі метою була побудова залежності за допомогою МГУА, яка б давала меншу помилку. В результаті застосування розробленого методу довизначення було отримано таку модель:
. (1.9)
Показники моделі: AR=0,0002728; BS=3,55. Залежності критерію регулярності та незміщеності від складності моделі було показано на рис. 1.
Отримана модель має поліноміальну структуру, і хоча вона обрана не з фізичних міркувань, а за допомогою самоорганізації моделі за зовнішнім критерієм, виявилося, що вона потенційно здатна описати систему точніше, ніж традиційні моделі з фізичною параметризацією.
Помилка отриманої моделі близько 20-40%, на відміну від моделей з фізичною параметризацією, які можуть давати помилку до 100-200 %.
ВИСНОВКИ
У дисертаційній роботі отримала подальший розвиток теорія МГУА за рахунок розроблення та обґрунтування методу довизначення вибору моделі, удосконалено технологію аналізу даних, моделювання та прогнозування на основі МГУА та методу довизначення.
Сукупність отриманих у дисертації результатів забезпечує розв'язання актуальної науково-прикладної задачі підвищення ефективності МГУА та розробки комп'ютерної технології аналізу даних, моделювання і прогнозування на основі МГУА в задачах моніторингу складних процесів.
Методи реалізовано в програмних засобах. Ефективність розробленої комп'ютерної технології досліджено чисельними експериментами та на реальних прикладних задачах моделювання та прогнозування.
За результатами проведених досліджень можна зробити такі основні висновки:
1. Виконано порівняльний аналіз методів моделювання та прогнозування, що застосовуються в задачах моніторингу складних процесів. Аналіз показав, що для розв'язання задачі моделювання та прогнозування за наявності шуму в даних доцільно застосовувати індуктивні методи, засновані на автоматичній побудові моделей за експериментальними даними.
2. Запропоновано новий критерій незміщеності помилок, виконано його порівняння з класичним критерієм незміщеності рішень та на чисельних прикладах показано, що критерій незміщеності помилок є більш чутливим до зміни складності моделі.
3. Розроблено новий метод довизначення з використанням критерію незміщеності помилок, який дозволяє усунути неоднозначність вибору моделі у реальних задачах моделювання за рахунок застосування доцільної послідовності критеріїв селекції.
4. Розроблено і програмно реалізовано комп'ютерну технологію моделювання та прогнозування на основі МГУА та методу довизначення, яка дозволяє розв'язувати задачі аналізу вибірки даних, моделювання та прогнозування. Аналіз вибірки даних включає задачі відновлення пропущених даних, розширення вибірки даних, пошуку інформативних аргументів та оптимізації розміру вибірки даних на основі методу аналогів.
5. Розроблено комп'ютерну технологію, яка забезпечує ефективне розв'язання задач моделювання та прогнозування за експериментальними даними, що показано на тестових прикладах. Ця технологія забезпечує підвищення завадостійкості моделей за рахунок послідовного застосування критеріїв МГУА: критерію регулярності та незміщеності помилок.
6. За допомогою комбінаторного алгоритму та методу довизначення вперше розв'язано задачу побудови моделей взаємодії іонів з поверхнею матеріалів. Отримані моделі дозволяють розрахувати значення коефіцієнту розпилення матеріалу залежно від його властивостей, що дає можливість обирати кращий матеріал для покриття поверхні літальних апаратів.
7. Застосування розробленої технології на основі МГУА та методу довизначення в задачах медичного та соціального-економічного моніторингу показало ефективність її використання задачах для розв'язання задач ідентифікації та прогнозування за даними моніторингу складних процесів.
Список опублікованих праць за темою дисертації
1. Ивахненко А.Г. Применение алгоритмов МГУА для восстановления пропущенных данных и прогноза уровня глюкозы в крови при надомном мониторинге диабета / А.Г.Ивахненко, Е.А.Савченко, Г.А.Ивахненко, Т.Гергей // Проблемы управления и информатики.- 2002.-№3.- С.123-133.
2. Ивахненко А.Г. Обнаружение закономерностей взаимодействия ионов с поверхностью по комбинаторному алгоритму МГУА / А.Г.Ивахненко, Е.А.Савченко, Г.А.Ивахненко, А.Б.Надирадзе, А.О.Рогов // Проблемы управления и информатики. - 2003. - № 2. - C.80-89.
3. Савченко Е.А. Экспресс-прогноз уровня глюкозы в крови с учетом аналоговых и временных характеристик // Управляющие системы и машины. - 2003. - №2. - C. 107-112.
4. Савченко Є. А. Індуктивне моделювання на основі МГУА в задачах моніторингу складних об'єктів і процесів // Вісник ЧДТУ. - 2005. - №4. - C. 81- 87.
5. Ивахненко А.Г. Исследование эффективности метода доопределения выбора модели в задачах моделированием с применением МГУА / А.Г.Ивахненко, Е.А.Савченко // Проблемы управления и информатики. - 2008.- №2.- C. 65 - 76.
6. Савченко Е.А. Анализ селективных свойств критериев МГУА при их последовательном применении / Е.А.Савченко, В.С.Степашко // Моделювання та керування станом еколого-економічних систем регіону. Збірник праць. - К.: МННЦ ІТС, 2008. - С. 199-210.
7. Савченко Є.А. Інтерполяційні моделі МГУА для відновлення пропущених даних в задачах медичного моніторингу // Праці Міжнар. конф. з індуктивного моделювання в 4-х томах (МКІМ-2002). - Т.1., Ч.1.- Львів: Державний НДІ інформаційної інфраструктури. - 2002. - С.134 - 138.
8. Ivakhnenko A.G. GMDH Algorithm for Optimal Model Choice by the External Error Criterion with the Extension of Definition by Model Bias and its Applications to the Committees and Neural Networks / A.G.Ivakhnenko, G.A.Ivakhnenko, E.A.Savchenko // Pattern Recognition and Image Analysis. - 2002. - Vol.12, № 4. - P.347-353.
9. Ивахненко А.Г. Индуктивный метод выбора модели с минимальной ошибкой и наименьшим смещением для решения интерполяционных задач искусственного интеллекта / А.Г.Ивахненко, Е.А.Савченко, Г.А.Ивахненко, А.Б.Надирадзе, А.О.Рогов // Тр. 6-я Международой конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-6-2002) в 2-х томах. - Великий Новгород: НовГУ им. Ярослава Мудрого. - 2002. - Т. 1. - C. 240-245.
10. Ивахненко А.Г. Самоорганизация моделей социального развития стран по данным мониторинга / А.Г.Ивахненко, Е.А.Савченко, Г.А.Ивахненко, А.Б.Надирадзе, В.Г.Тоценко // Нейрокомпьютеры: разработка и применение. - 2003. - №2. - C. 39-47.
11. Ивахненко А.Г. Индуктивное моделирование в задаче мониторинга лечения диабета / А.Г.Ивахненко, Е.А.Савченко // Праці міжнародного семінару з індуктивного моделювання (МСІМ-2005). - К.: МННЦ ІТС, 2005. - С.136-139.
12. Ivakhnenko A.G. Inductive Method of Optimal Model Selection by External Error Criterion with Additional Determination Using Bias / A.G.Ivakhnenko, E.A.Savchenko, L.P.Somina // Proceedings of International Workshop of Inductive Modelling (IWIM'2007).- Prague: Czech technical university in Prague, 2007.- P. 128 - 133.
13. Савченко Е.А. Исследование эффективности двухкритериального выбора модели в индуктивных алгоритмах МГУА / Е.А.Савченко, Л.П.Семина // Матеріали міжнар. конф. „Інтелектуальні системи прийняття рішень та проблеми обчислювального інтелекту” (ISDMCI'2008), Євпаторія.- Херсон: Видавництво ХНТУ, 2008.- Т.3, Ч.2.- С.79-82.
14. Savchenko I. Double-criterion Choice of an Optimal Model in GMDH Algorithms // Proceedings of 2nd International Conference on Inductive Modelling (IСIM'2008). - K.: IRTC, 2008.-P. 23-27.
15. Савченко Є.А. Чисельне дослідження селективних властивостей критерію незміщеності помилок / Є.А.Савченко, В.С.Степашко, Л.П.Сьоміна // Матеріали міжнар. конф. „Інтелектуальні системи прийняття рішень та проблеми обчислювального інтелекту” (ISDMCI'2009), Євпаторія. - Херсон: Видавництво ХНТУ, 2009.- Т.2.- С.426-430.
16. Ивахненко А.Г. Учет внешних дополнений при решении проблемы построения интеллектуального комп'ютера / А.Г.Ивахненко, Е.А.Савченко, Г.А.Ивахненко // Матеріали 11-ої міжнародної конференції по автоматичному управлінню «Автоматика-2004». - Київ: Національний університет харчових технологій, 2004. - C. 50.
АнотаціЯ
Савченко Є.А. Метод довизначення для розв'язання задач моделювання та прогнозування на основі МГУА. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 - інформаційні технології. - Міжнародний науково-навчальний центр інформаційних технологій та систем НАН та МОН України, Київ, 2009.
Дисертаційна робота присвячена підвищенню ефективності методів моделювання та прогнозування складних процесів на основі МГУА в задачах моніторингу. Запропоновано метод довизначення вибору моделі, який дає можливість обрати оптимальну модель у разі неоднозначності вибору моделі за одним критерієм регулярності. Для довизначення розраховується значення додаткового критерію незміщеності помилок. Новий критерій незміщеності помилок є більш чутливим до зміни складності моделі, ніж відомий критерій незміщеності рішень. Проведено аналітичне та чисельне дослідження нового критерію, показано, що він є адекватним і ефективним критерієм МГУА.
Розроблено методику та технологію на основі комбінаторного алгоритму МГУА і методу довизначення для аналізу даних, моделювання та прогнозування. Чисельні приклади показали ефективність запропонованої методики.
Цю методику та комп'ютерну технологію застосовано для розв'язання прикладних задач моделювання і прогнозування: медичного моніторингу, соціально-економічного моніторингу та моделювання залежності взаємодії іонів з поверхнею матеріалів.
Ключові слова: математична модель, прогнозування, критерій регулярності, критерій незміщеності помилок, моніторинг.
Савченко Е.А. Метод доопределения для решения задач моделирования и прогнозирования на основе МГУА. - Рукопись.
Диссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06 - информационные технологии. - Международный научно-учебный центр информационных технологий и систем НАН и МОН Украины, Киев, 2009.
Диссертационная работа посвящена повышению эффективности методов моделирования и прогнозирования сложных процессов на основе МГУА в задачах мониторинга. В реальных задачах построения моделей не всегда удается найти оптимальную модель по одному критерию. Обычно в таких случаях используют двухкритериальный выбор модели. Но такой подход имеет ряд недостатков: время счета возрастает, поскольку для всех моделей требуется вычислить значения двух критериев одновременно, кроме того, необходимо задать весовые коэффициенты при вычислении комбинированного критерия.
Чтобы избежать этих недостатков, предложен двухэтапный метод выбора наилучших моделей. Сначала по одному критерию выбирается некоторое множество наиболее точных моделей, которое определяется по отклонению от наименьшего значения критерия точности. Из полученного множества наиболее точных моделей по минимуму второго критерия выбирается оптимальная модель. Такая процедура названа методом доопределения выбора модели, или просто методом доопределения.
Для доопределения выбора модели в качестве дополнительного предложен новый критерий несмещенности ошибок, который более чувствителен к изменению сложности модели, чем известный критерий несмещенности решений. Проведено аналитическое и численное исследование нового критерия селекции, которое показало, что критерий несмещенности ошибок является адекватным и эффективным критерием МГУА.
Выполнено численное исследование нового критерия, которое показало, что предложенный критерий несмещенности ошибок обладает свойством помехоустойчивости.
Разработана и программно реализована методика и технология анализа данных, моделирования и прогнозирования на основе комбинаторного алгоритма МГУА и метода доопределения. Численные примеры показали эффективность предложенной методики. Разработанная компьютерная технология применена для решения прикладных задач моделирования и прогнозирования: медицинского мониторинга, социально-экономического мониторинга и моделирования зависимости взаимодействия ионов с поверхностью материалов.
В задаче моделирования взаимодействия ионов с поверхностью материалов построена модель зависимости коэффициента распыления материалов от их свойств. Данная модель может быть использована для расчета значений коэффициента распыления материала в зависимости от известных его свойств при заданных параметрах ионизированного газа, который распыляет поверхность. Разработанная на основе МГУА модель оказалась точнее, чем обычно используемые классические модели с физической параметризацией, что подтверждено актом внедрения.
Ключевые слова: математическая модель, прогнозирование, критерий регулярности, критерий несмещенности ошибок, мониторинг сложных процессов.
Savchenko E.A. Method of after-determination for solution of modelling and forecasting problems using GMDH. - Manuscript.
Thesis for a candidate degree in technical sciences by specialty 05.13.06 - information technologies. - International Research and Training Centre for Information Technologies and Systems of NAS and MES of Ukraine, Kyiv, 2009.
The thesis is dedicated to enhancing efficiency of methods of modelling and forecasting of complex systems using GMDH in the monitoring tasks. The method of after-determination of model choice is offered, which enables to find an optimum model in the case of ambiguousness of choice of model by one criterion. For after-determination the value of bias criterion is calculated. A new criterion of error bias is proposed which is more sensible to the change of model complexity than the known solution bias criterion. Analytical and numeral research of a new criterion was conducted and it was shown that it is an adequate GMDH criterion.
A procedure and technology on the basis of the combinatorial GMDH algorithm and the after-determination method for the data analysis, modelling and forecasting was developed. Numerical examples demonstrate efficiency of the proposed method. The procedure and computer technology was applied to the solution of real-world tasks of modelling and forecasting: medical monitoring, socio-economic monitoring and modelling of dependence of the ions interaction with the surface of materials.
Keywords: mathematical model, forecasting, regularity criterion, error bias criterion, monitoring of complex processes.
Размещено на Allbest.ru
...Подобные документы
Системи автоматичного керування. Описання методу стикування розв'язків на основі теореми по n-інтервалів. Застосування методу динамічного програмування (рівняння Р. Белмана). Моделювання задачі синтезу та аналізу на електронній обчислювальній машині.
контрольная работа [632,5 K], добавлен 31.03.2014Політичне прогнозування як процес розробки науково обгрунтованого судження про ймовірносний розвиток політичних подій, шляхи і терміни його здійснення. Можливості комп'ютерного моделювання - системний підхід. Моделі та методи моделювання, їх використання.
контрольная работа [26,0 K], добавлен 13.03.2013Метод розв’язків рівнянь більш високих порядків. Вибір методу розв'язання задачі Коші. Методи розв'язання крайових задач розглядаються на прикладі звичайного диференціального рівняння другого порядку. Вибір методу інструментальних засобів вирішення задач.
курсовая работа [132,0 K], добавлен 03.12.2009Аналіз предметної галузі задачі моделювання пострілу балісти через стіну по мішені. Структури даних та діаграми класів для розв'язання задачі. Схеми взаємодії об’єктів та алгоритми виконання їх методів. Опис розробленої програми, інструкція користувача.
курсовая работа [1,0 M], добавлен 18.05.2014Розробка математичної моделі, методів обробки, визначення діагностичних ознак та методу імітаційного моделювання кардіоінтервалограми для моніторингу адаптивно-регулятивних можливостей організму людини з захворюваннями серця при фізичних навантаженнях.
автореферат [74,9 K], добавлен 29.03.2009Огляд та варіантний аналіз чисельних методів моделювання, основні поняття і визначення. Опис методів моделювання на ЕОМ, метод прямокутників і трапецій. Планування вхідних та вихідних даних, аналіз задач, які вирішуються при дослідженні об’єкта на ЕОМ.
курсовая работа [373,6 K], добавлен 30.11.2009Характеристика основних методів сучасного викладання фізики. Моделювання як процес дослідження об’єктів пізнання за допомогою їх моделей. Розгляд особливостей використання табличного процесора EXCEL для обробки результатів лабораторних робіт з фізики.
лабораторная работа [1,6 M], добавлен 22.12.2012Дослідження застосування різницевого методу для розв’язання крайової задачі. Дослідження проводиться на прикладі заданого диференційного рівняння. Дається опис методу та задачі в цілому. Застосування при обчисленні формули Чебишева і формули Гаусса.
курсовая работа [157,2 K], добавлен 03.12.2009Проектування офісу за допомогою системи 3D Home Architect 8, його зовнішнього та внутрішнього виду, устаткування. Підготовка інженерів-педагогів в галузі комп'ютерних технологій для моделювання об'єктів у різних системах автоматизованого проектування.
курсовая работа [4,7 M], добавлен 01.07.2010Розвиток виробництва і широке використання промислових роботів. Алгоритми методів, блок-схеми алгоритмів розв'язку даного диференційного рівняння. Аналіз результатів моделювання, прямий метод Ейлера, розв’язок диференціального рівняння в Mathcad.
контрольная работа [59,1 K], добавлен 30.11.2009Впровадження інформаційно-комунікаційних технологій в освітню практику. Комп'ютерне використання моделювання при вивченні хімії за програмою "Органічна хімія. Транспортні системи". Застосування моделі NetLogo для вивчення теми "Реакції йонного обміну".
курсовая работа [11,0 M], добавлен 15.03.2014Використання графічного методу і симплекс-методу при вирішенні задач лінейного програмування. Сутність двоякого симплекс-методу і М-методу, приклади використання. Аналіз методу динамичного програмування. Специфіка вирішення матричної, антагоністичної гри.
контрольная работа [1,1 M], добавлен 02.07.2011Засоби візуального моделювання об'єктно-орієнтованих інформаційних систем. Принципи прикладного системного аналізу. Принцип ієрархічної побудови моделей складних систем. Основні вимоги до системи. Розробка моделі програмної системи засобами UML.
курсовая работа [546,6 K], добавлен 28.02.2012Принципи побудови тривимірних зображень у ГІС засобами комп’ютерної графіки. Інформативність та точність моделей, створених на основі растрових і векторних програм. Технологія побудови 3D-карт за допомогою "ArcGIS/3D Analyst" та "MapInfo"/"Поверхность".
дипломная работа [700,6 K], добавлен 10.05.2015Застосування симплекс-методу для розв’язання оптимізаційних задач лінійного програмування, що містять три змінні. Функції ітераційної обчислювальної процедури, що виконують приведення до зручного для розв’язання оптимального вигляду ЗЛП за кілька кроків.
курсовая работа [359,5 K], добавлен 18.09.2013Особливості архітектури комп'ютерних мереж. Апаратні та програмні засоби комп'ютерних мереж, їх класифікація та характеристика. Структура та основні складові комунікаційних технологій мереж. Концепції побудови та типи функціонування комп'ютерних мереж.
отчет по практике [1,2 M], добавлен 12.06.2015Аспекти технологізації навчального процесу в середній школі. Проблема наочності при викладанні шкільного курсу фізики. Навчальний фізичний експеримент і комп’ютерне моделювання. Поєднання традиційних та інформаційних технологій при вивченні фізики.
дипломная работа [7,7 M], добавлен 24.09.2014Сутність та особливості параметричного, воксельного, полігонального моделювання, моделювання сплайнами та скульптингу. Застосування 3D моделювання в науці, техніці, рекламі, маркетингу, дизайні інтер'єру, архітектурі, анімаці, кіно та медицині.
доклад [873,9 K], добавлен 04.05.2022Комп’ютерне моделювання системи сегментації та розпізнавання облич на зображеннях. Підвищення швидкодії моделювання за кольором шкіри та покращення якості розпізнавання при застосуванні робастних boosting-методів. Розробка алгоритмів функціонування.
дипломная работа [1,6 M], добавлен 02.07.2014Графічне зображення методу половинного ділення. Вибір методу інструментальних засобів вирішення задач. Розробка логічної частини програми для розв’язання нелінійного рівняння методами половинного ділення та січних. Особливість кодування на мові Паскаль.
курсовая работа [135,5 K], добавлен 30.11.2009