Інструментальні засоби для дослідження та застосування методів моделювання за статистичними даними

Розроблення рекурентних алгоритмів оцінювання методів створення за статистичними даними. Порівняльне тестування видів конструювання та їх компонентів за допомогою системного комплексу. Програмні способи для розв’язання практичних задач моделювання.

Рубрика Программирование, компьютеры и кибернетика
Вид автореферат
Язык украинский
Дата добавления 25.08.2015
Размер файла 71,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Національна академія наук України

Міністерство освіти і науки України

Міжнародний науково-навчальний центр інформаційних технологій та систем НАН України та МОН України

Спеціальність 05.13.06 - інформаційні технології

УДК 681.513

Автореферат

дисертації на здобуття наукового ступеня кандидата технічних наук

ІНСТРУМЕНТАЛЬНІ ЗАСОБИ ДЛЯ ДОСЛІДЖЕННЯ ТА ЗАСТОСУВАННЯ МЕТОДІВ МОДЕЛЮВАННЯ ЗА СТАТИСТИЧНИМИ ДАНИМИ

Єфіменко Сергій
Миколайович
Київ-2009

Дисертацією є рукопис.

Робота виконана в Міжнародному науково-навчальному центрі інформаційних технологій та систем НАН та МОН України.

Науковий керівник: доктор технічних наук, старший науковий співробітник Степашко Володимир Семенович, Міжнародний науково-навчальний центр інформаційних технологій та систем НАН та МОН України, завідувач відділу

Офіційні опоненти: доктор технічних наук, старший науковий співробітник Файнзільберг Леонід Соломонович, Міжнародний науково-навчальний центр інформаційних технологій та систем НАН та МОН України, провідний науковий співробітник

кандидат технічних наук Павлов Володимир Анатолійович, Відкритий міжнародний університет розвитку людини «Україна», доцент кафедри комп'ютерного еколого-економічного моніторингу

Захист відбудеться 9 грудня 2009 р. о 12 годині на засіданні Спеціалізованої вченої ради Д 26.171.01 у Міжнародному науково-навчальному центрі інформаційних технологій та систем НАН та МОН України за адресою: 03680, м. Київ, проспект Академіка Глушкова, 40.

З дисертацією можна ознайомитись у бібліотеці Міжнародного науково-навчального центру інформаційних технологій та систем НАН та МОН України.

Автореферат розісланий 6 листопада 2009 р.

Вчений секретар

Спеціалізованої вченої ради кандидат технічних наук, доцент О.В.Бабак

1. ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність роботи. Задача моделювання за експериментальними даними полягає в побудові залежності між вхідними і вихідними змінними модельованого об'єкта або процесу. Визначення структури та оцінювання параметрів є обов'язковими етапами задачі побудови моделей, або структурно-параметричної ідентифікації.

Теоретичним аспектам побудови моделей за даними спостережень присвятили свої праці багато вітчизняних та закордонних вчених: С.А.Айвазян, Х.Акаіке, В.М.Вапнік, П.Ейкхоф, М.Г.Загоруйко, О.Г.Івахненко, Л.Льюнг, С.Л.Маллоуз, Л.С.Райбман, Дж.Тьюкі, Я.З.Ципкін та інші.

У зв'язку з наявністю великої кількості різноманітних методів моделювання виникає проблема вибору найбільш адекватного з них для кожної конкретної практичної задачі, а після такого вибору - проблема найбільш ефективної програмної реалізації обраного методу.

Задачею аналітичного вивчення ефективності методів моделювання займалися І.І.Перельман, Дж.Ріссанен, В.С.Степашко, М.Стоун, С.Шибата та інші. Проте їхні дослідження містять істотні результати лише для певних обмежених припущень або для асимптотики і не відображають усе розмаїття практичних потреб.

Широкі можливості для аналізу ефективності методів моделювання та їх компонентів надають експериментальні дослідження за допомогою комп'ютерного моделювання, які часто є єдино можливим і надійним засобом отримання знань про переваги та недоліки методів. У працях А.М.Ґерцберг, П.Кордіка, Е.А.Логінова, А.І.Міхальського, І.Ш.Пінскера, М.П.Стадніка, О.В.Цуканова тощо за допомогою чисельних експериментів досліджуються критерії структурної ідентифікації, оптимальні плани експериментів, методи оцінювання параметрів, окремі алгоритми.

Однак ці дослідження загалом не носять систематизованого характеру, стосуються переважно порівняння окремих методів або виявлення певних їх особливостей, не орієнтовані на розроблення спеціальних засобів для проведення комп'ютерних експериментів і не охоплюють всебічно проблематику ефективності методів моделювання, особливо в умовах вибірок обмеженого обсягу.

У зв'язку з цим актуальною є проблема розроблення комплексної методики проведення тестових комп'ютерних випробувань, а також побудови на її основі комплексу інструментальних засобів для дослідження та застосування методів моделювання за статистичними даними.

Зв'язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконана в Міжнародному науково-навчальному центрі інформаційних технологій та систем та відповідно до планів держбюджетних тем:

1. «Розроблення інформаційних технологій індуктивного моделювання і прогнозування для задач моніторингу складних процесів» ((№ держреєстрації 0100U002677, 2000-2003 рр.).

2. «Розроблення методів та засобів інтелектуалізації інформаційних технологій індуктивного моделювання» (№ держреєстрації 0104U000336, 2004-2006 рр.).

3. «Інтелектуальні технології інформаційно-аналітичної підтримки оперативних управлінських рішень» (№ держреєстрації 0107U004902, 2007-2009 рр.).

4. «Розроблення та дослідження інтелектуальних інформаційних технологій індуктивного моделювання складних процесів і систем» (№ держреєстрації 0107U000567, 2007-2011 рр.).

Мета і задачі дослідження. Мета роботи полягає у розробленні методів, методик та інформаційних технологій дослідження і застосування методів моделювання за даними спостережень для знаходження шляхів підвищення їх ефективності та апробації запропонованих підходів на прикладах розв'язання практичних задач моделювання.

Для досягнення цієї мети в дисертації розв'язуються такі задачі:

- аналіз задачі моделювання за даними спостережень, дослідження та узагальнення наявних підходів до проведення експериментів з чисельного тестування методів моделювання та їх компонентів;

- розроблення рекурентних алгоритмів оцінювання параметрів з метою підвищення ефективності методів моделювання;

- конструювання та реалізація комплексу інструментальних засобів для дослідження та застосування методів моделювання за даними спостережень;

- виконання порівняльного тестування методів моделювання та їх компонентів за допомогою інструментального комплексу;

- використання розроблених програмних засобів для розв'язання практичних задач моделювання.

Об'єктом дослідження є процес побудови моделей за експериментальними даними.

Предметом дослідження є ефективність методів побудови моделей (структурно-параметричної ідентифікації).

Методами дослідження є методи математичного моделювання, матричної алгебри, математичної статистики та статистичного експерименту.

Наукова новизна. У дисертаційній роботі отримано такі основні результати, що виносяться на захист:

- узагальнено наявні підходи до експериментального тестування ефективності методів моделювання за даними спостережень і розроблено комплексну методику дослідження таких методів та їх компонентів за допомогою статистичного комп'ютерного експерименту;

- вперше розроблено рекурентні модифікації відомих методів Гауса та Грама-Шмідта розв'язування систем лінійних рівнянь, які дозволяють значно зменшити затрати часу на оцінювання параметрів при послідовному ускладненні структур моделей;

- розроблено і реалізовано оригінальний комплекс інструментальних засобів, в основі роботи якого лежать запропонована методика дослідження методів моделювання та рекурентні методи оцінювання параметрів. Комплекс призначений для експериментального отримання знань про порівняльні переваги та недоліки окремих методів моделювання та їхніх складових елементів.

Практичне значення отриманих результатів. Розроблені в роботі загальна методика проведення статистичних випробувань методів моделювання та програмний інструментарій дозволяють, по-перше, виконувати комплексні дослідження наявних методів моделювання та їх компонентів, по-друге, ефективно розв'язувати прикладні задачі структурно-параметричної ідентифікації.

Практична ефективність розроблених інструментальних засобів показана на прикладах розв'язання реальних задач: моделювання процесів зміни ціни на феромолібден на світовому ринку; моделювання густини верхнього осадового шару морського дна за результатами гідроакустичних експериментів; моделювання та прогнозування взаємозв'язаних показників енергетичної сфери України.

Ефективність отриманих результатів підтверджена документами про впровадження та застосування в таких організаціях:

- в Інституті космічних досліджень природних ресурсів Азербайджанського Національного аерокосмічного агентства та Азербайджанській Національній академії авіації при моделюванні густини верхнього осадового шару дна за результатами гідроакустичного моніторингу природних і техногенних аномалій Каспійського моря;

- у Комерційному управлінні ЗАТ “Новокраматорський машинобудівний завод” для моделювання процесу зміни ціни на феромолібден на світовому ринкові за даними про закупівлі.

Особистий внесок здобувача. Усі результати, що складають основний зміст роботи, отримані автором самостійно.

Особистий внесок здобувача у працях зі співавторами такий: в роботі [1] автору належить експериментальне дослідження ефективності використання рекурентного алгоритму обрамлення при структурно-параметричній ідентифікації з різним порядком включення аргументів, [3] - опис рекурентних алгоритмів оцінювання параметрів та результати експериментів з порівняння рекурентних і нерекурентних алгоритмів та рекурентних алгоритмів між собою, [4] - розроблення схеми розпаралелювання комбінаторного алгоритму, [5] - дослідження ефективності різних критеріїв якості моделей за допомогою статистичного експерименту, [6] - аналіз сучасних підходів до застосування статистичних випробувань для вивчення ефективності методів моделювання, опис задачі тестування методів моделювання, розроблення структури комплексу інструментальних засобів та результати порівняльного тестування компонентів методів моделювання, [7] - експериментальне дослідження ефективності оцінювання параметрів при застосуванні рекурентного алгоритму обрамлення, [8] - конструювання імітаційного комплексу для проведення випробувань методів моделювання за даними спостережень, [10] - побудова моделі для оцінювання густини верхнього осадового шару дна, [11] - теоретичні оцінки трудомісткості розрахунку коефіцієнтів при використанні рекурентних алгоритмів оцінювання параметрів, порівняльне тестування методів оцінювання параметрів і критеріїв селекції моделей, [12] - розроблення модифікації методів Гауса та Грама-Шмідта для рекурентного обчислення параметрів та порівняльне тестування цих алгоритмів з алгоритмом обрамлення, [13] - опис інструментальних засобів для дослідження методів моделювання та результати тестових експериментів.

Апробація наукових результатів. Основні результати дисертаційної роботи доповідались та обговорювались на: Третьому міжнародному семінарі з інтелектуального аналізу інформації - Київ, 2003; Науково-практичних конференціях „Інтелектуальні системи прийняття рішень та прикладні аспекти інформаційних технологій” (Євпаторія, 2005, 2006); Сьомій міжнародній конференції „Системний аналіз та інформаційні технології” - Київ, 2005; Міжнародних конференціях і семінарах з індуктивного моделювання (Київ, 2005; Прага, 2007; Київ, 2008); Міжнародних конференціях з автоматичного управління «Автоматика» (Київ, 2004; Харків, 2005; Вінниця, 2006); Третій міжнародній конференції з проблем енергетики - Анкара, Туреччина, 2006; Міжнародних наукових конференціях «Обчислювальні проблеми електротехніки» (CPEE'03, Язлівець, 2003; CPEE'06, Одеса, 2006); П'ятій міжнародній науково-практичній конференції з програмування «УкрПрог'2006» (Київ, 2006); Міжнародній науковій конференції «Сучасні проблеми радіоелектроніки, телекомунікацій та комп'ютерної інженерії» TCSET'2008 (Львів, 2008); Міжнародній науковій конференції «Інтелектуальні системи прийняття рішень і проблеми обчислювального інтелекту» ISDMCI'2008 (Євпаторія, 2008).

Публікації. Результати дисертації висвітлені в 13 публікаціях, у тому числі в 6 наукових статтях в журналах та збірниках наукових праць з переліку фахових видань ВАК України, а також у матеріалах конференцій.

Структура і обсяг дисертаційної роботи. Дисертаційна робота складається зі вступу, п'яти розділів, висновків, списку використаних джерел з 110 найменувань та 2 додатків. Повний обсяг дисертації становить 145 сторінок, з них 142 сторінки основного тексту, 81 рисунок та 13 таблиць.

2. ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі наведено загальну характеристику роботи, обґрунтовано її актуальність, визначено мету, задачі, об'єкт та предмет дослідження, а також сформульовано наукову новизну роботи і практичну значущість отриманих результатів.

У першому розділі дисертаційної роботи розглядається задача моделювання за даними спостережень, аналізуються відомі підходи до дослідження ефективності методів моделювання.

Виконано постановку задачі тестування методів моделювання. Для цього введено такі позначення:

K - множина класів моделей, ;

G - множина генераторів структур моделей, ;

М - множина методів оцінювання параметрів структур,

;

CR - множина критеріїв якості моделей, .

Множину методів структурної ідентифікації L представлено як прямий добуток множин

L =KЧGЧМЧCR.

Алгоритмом вважається певний елемент множини L:

.

Задачу тестування методів моделювання сформульовано таким чином.

Нехай ефективність кожного алгоритму lL характеризується значенням деякого критерію С(l). Тоді найкращим алгоритмом (у розумінні критерію С) буде той, що визначається з умови:

.

Можливими критеріями ефективності обчислювального алгоритму визначено: швидкодію алгоритму, економію машинної пам'яті, помилку моделі на незалежних даних, ефективність використання отриманої моделі при прийнятті рішень тощо.

Розроблено загальну методику дослідження методів моделювання за даними спостережень та їх компонентів за допомогою статистичного експерименту.

Метою тестування класів моделей визначено дослідження залежності апроксимаційної або екстраполяційної здатностей моделей від рівня шуму, обраних критерію селекції та генератора структур моделей, як в істинному класі моделей, так і в класі, відмінному від істинного.

При тестуванні генераторів структур моделей (комбінаторного типу) критерієм ефективності обрано швидкодію алгоритмів (при використанні різних схем та програмних реалізацій послідовності станів структурного вектора).

Метою тестування методів оцінювання параметрів визначено дослідження залежності швидкодії від таких параметрів, як:

- кількість аргументів;

- кількість точок спостережень;

- способи нарощування складності моделей, що будуються;

- обчислювальна потужність ЕОМ тощо.

Метою тестування критеріїв селекції моделей обрано:

- визначення характеру зміни складності оптимальних моделей, отриманих за мінімумом заданого критерію, зі зростанням дисперсії шуму;

- дослідження ефективності (точності на контрольній частині вибірки) моделей, отриманих за різними критеріями, при варіюванні кількості точок навчальної частини вибірки та рівня шуму.

У другому розділі з метою підвищення ефективності методів моделювання розроблено рекурентні алгоритми розв'язування систем лінійних рівнянь для задачі оцінювання параметрів за допомогою МНК.

Показано, що для оцінювання параметрів послідовно ускладнюваних структур моделей в задачі структурної ідентифікації доцільно використовувати рекурентні за числом параметрів алгоритми. Неефективність нерекурентних методів пояснюється необхідністю кожного разу при додаванні нового регресора перераховувати заново розширену матрицю нормальної системи (у методі Гауса) або ортогоналізувати нову матрицю плану (у методі Грама-Шмідта).

Традиційним рекурентним методом є метод обрамлення. Ідея алгоритму МНК з обрамленням полягає в покроковому уточненні оцінок параметрів з використанням у процесі оцінювання рекурентного обчислення елементів оберненої матриці. Алгоритм МНКО, розроблений В.С.Степашком, має низку корисних властивостей, які дають можливість додатково використовувати інформацію, отриману без жодних додаткових обчислень.

Попри переваги, метод має суттєвий недолік - він не є чисельно стійким у задачах з погано обумовленою матрицею плану.

У зв'язку з цим розроблено рекурентні модифікації алгоритмів Гауса і Грама-Шмідта, що ґрунтуються на класичних точних методах і є чисельно стійкими.

Модифікація алгоритму Грама-Шмідта виглядає таким чином.

Нехай маємо систему n умовних рівнянь з m невідомими:

.

Вважаємо, що на кроці s-1 ми отримали систему векторів vi, i=1, 2, …, s-1 (стовпчиків матриці V, отриманої шляхом ортогоналізації матриці X). На s-му кроці за рекурентною процедурою отримуємо вектор vs :

, .

Після цього перераховуємо оцінку коефіцієнтів нової системи (з урахуванням s-го аргумента):

.

Модифікація алгоритму полягає у тому, що на s-му кроці при додаванні до моделі нового аргумента (тобто при розв'язанні системи рівнянь, що містить s аргументів) ми не ортогоналізуємо заново матрицю Xs, а використовуємо ортогоналізовану матрицю та для отримання вектора vs.

Модифікація алгоритму Гауса зводиться до такого.

Від системи умовних рівнянь переходимо до відповідної їй нормальної системи

,

з елементами матриці

та .

Нехай на (s-1)-му кроці ми додали (s-1)-й аргумент і отримали розв'язок. Обчислювальні формули на s-му кроці матимуть такий вигляд.

Для прямого ходу:

,

.

Для зворотного ходу:

.

Особливістю запропонованої модифікації є те, що інформація, необхідна для включення наступного аргумента, зберігається в тій же матриці H нормальної системи, тобто метод не потребує використання додаткової оперативної пам'яті комп'ютера.

Підрахуємо тепер трудомісткість (кількість елементарних арифметичних операцій) розрахунку параметрів моделі при включенні s-го аргумента в модель, що містить s аргументів.

Так, під час прямого ходу вона становить , під час зворотного - . Таким чином, загальна трудомісткість становить , тобто пропорційна квадрату складності моделі (ця пропорційність справедлива і для рекурентного методу Грама-Шмдіта та МНКО). Трудомісткість розрахунку параметрів при використанні класичного (нерекурентного) алгоритму, як відомо, пропорційна третьому степеню складності моделі.

Порівняння показників трудомісткості обчислення параметрів у графічному вигляді представлено на рисунку 1.

У третьому розділі описується розроблений комплекс інструментальних засобів, що реалізує загальну методику проведення тестових експериментів.

Комплекс дає можливість користувачу:

- самостійно конструювати методи моделювання за даними спостережень;

- порівнювати наявні методи за певними критеріями;

- тестувати різні методи моделювання та їхні компоненти;

- розробляти методики і планувати статистичні випробування;

- розв'язувати задачі моделювання;

- проводити імітаційні експерименти (екстраполяцію, прогнозування) з моделями, побудованими за різними методами моделювання;

- поповнювати свої знання про методи моделювання під час роботи з імітаційним комплексом.

В інструментальному комплексі реалізовані можливості описаної методики проведення тестових експериментів.

На рисунку 2 подано структурну схему комплексу, де показано його основні функціональні блоки.

,

де - точне значення вихідної величини;

- рівень шуму (у відсотках);

- рівномірно розподілена випадкова величина на проміжку [0; 1].

Для моделювання було обрано комбінаторний алгоритм та такі класи моделей:

- авторегресійні моделі ;

- поліноміальні функції ;

- тригонометричні функції .

Таблиця 1. Точність кращих моделей

Клас моделей

Точність кращої моделі на навчальній підвибірці

Точність кращої моделі на екзаменаційній підвибірці

Авторегресійні

ДW=0,374

ДC=0,237

Поліноміальні

ДW=0,15

ДC= 22,8

Тригонометричні

ДW=0,186

ДC= 0,125

Згідно з результатами експериментів, представленими в таблиці 1, всі обрані для тестування класи моделей придатні для апроксимації коливальних процесів. Авторегресійні та тригонометричні функції, на відміну від поліноміальних, мають високі екстраполяційні властивості.

При тестуванні комбінаторного генератора структур вимірювався час генерації двійкового структурного вектора всіх можливих структур моделей при варіюванні кількості аргументів від 20 до 25. Використано такі генератори:

- стандартний двійковий;

- модифікований двійковий;

- стандартний послідовний;

- оптимізований послідовний;

- лічильник Ґарсайда.

Як показують результати тестування, представлені на рисунку 3, оптимізований послідовний генератор є найбільш швидкодіючим.

Для перевірки ефективності використання рекурентних алгоритмів при послідовному ускладненні структур під час структурно-параметричної ідентифікації було проведено порівняльне тестування рекурентних алгоритмів Грама-Шмідта та Гауса із відповідними класичними нерекурентними методами. Матриця плану X генерувалась розміром 450500 (500 рівнянь з 450 невідомими). Вимірювався час структурно-параметричної ідентифікації для моделі, що містить перші 50 аргументів, потом перші 100 аргументів, і т.д. до моделі, що містить всі 450 аргументів

На рисунку 4 (в логарифмічній шкалі) представлені результати тестування рекурентного та нерекурентного алгоритмів Грама-Шмідта при переборі в класі вкладених структур.

Результати цього та інших експериментів, виконаних для різних способів включення регресорів у модель, підтверджують теоретичні оцінки трудомісткості розрахунку параметрів при використанні рекурентних і нерекурентних алгоритмів та доводять ефективність рекурентного оцінювання параметрів у разі послідовного ускладнення структур моделей.

Порівняльне тестування рекурентних алгоритмів МНКО, Гауса і Грама-Шмідта.

Матриця плану X генерувалася розміром 280300. При переборі регресорів використано метод включення, при якому на s-му кроці (, m - кількість аргументів, що варіювалася від 40 до 280 із кроком 40) до моделі, що містить s-1 аргумент, додається той із m-s+1 можливих, який найбільше мінімізує значення заданого критерію. В якості критерію використовувався FPE, обчислювальну формулу якого представлено нижче. Графік залежності часу виконання відповідного алгоритму від кількості регресорів зображено.

Згідно з результатами, розроблені рекурентні методи є дещо “повільнішими” у порівнянні з методом обрамлення при переборі аргументів за методом включення, однак метод Гауса за часом виконання наближається до МНКО.

Порівняльне тестування критеріїв якості моделей.

Для тестування використовувались такі критерії:

– регулярності ,

– де s - складність моделі, або кількість оцінюваних параметрів, A і B - відповідно навчальна і перевірочна частини вибірки;

Cp-статистика Маллоуза у спрощеному вигляді , де - залишкова сума квадратів, n - кількість точок, - оцінка дисперсії шуму;

– „фінальна помилка передбачення” Акаіке .

Тестування завадостійкості критерію регулярності.

На рисунку 6 показана залежність значення критерію від складності моделі (кількості аргументів, що входять у модель) при різних значеннях дисперсії шуму. Якщо при відсутності шуму (нижня крива) мінімум критерію дає модель, яка містить всі 5 істинних регресорів, то зі зростанням дисперсії шуму мінімум критерію зміщується у бік простіших моделей, які містять меншу кількість аргументів, аніж істинна модель. При рівні шуму, що становить 100% від рівня сигналу, найкращою за значенням критерію є модель, що містить один істинний аргумент.

Порівняльне тестування ефективності критеріїв регулярності, Маллоуза та Акаіке.

Вектор виходу y формувався як лінійна комбінація перших десяти регресорів з додаванням шуму. В класі вкладених структур виконано відбір кращої моделі з 500 повтореннями і усередненням результатів. Оскільки критерій Маллоуза у цьому експерименті містить істинне значення дисперсії шуму, його слід вважати ідеальним: його значення дорівнює теоретичній дисперсії помилки моделі. Отже, два інших критерії в експерименті можна порівнювати стосовно цього критерію, який показує, яким чином повинна змінюватися складність моделі зі зростанням рівня шуму. Згідно з результатами, представленими на рисунку 7, критерій регулярності можна вважати ефективним, оскільки він не переускладнює модель (крива, що відповідає цьому критерію знаходиться нижче від кривої, що відповідає критерію Маллоуза). Критерій FPE ефективним вважати не можна через переускладнення моделей зі зростанням шуму.

Порівняльне тестування прогнозних властивостей критеріїв регулярності та Маллоуза.

В експерименті ефективність моделей, отриманих за критеріями регулярності та Маллоуза, порівнювалась за кількості точок для оцінювання параметрів від 10 до 40 та рівня шуму від 0 до 80%. Точність моделей визначалась за помилкою на контрольній вибірці з десяти точок:

.

Згідно з результатами, представленими в таблиці 2, за малого рівня шуму і великої кількості точок оптимальні моделі, отримані за критеріями Маллоуза і регулярності, мають приблизно однакову точність. У разі зменшення кількості точок та/або підвищення рівня шуму критерій регулярності дає дедалі більш точні моделі.

Таблиця 2. Результати тестування критеріїв регулярності та Маллоуза

Рівень шуму, %

Число точок вибірки

10

20

30

40

Cp

AR

Cp

AR

Cp

AR

Cp

AR

0

0,0013

0,0013

0,0012

0,0012

0,0011

0,0012

0,0008

0,001

40

94,2

75,7

80,6

69,98

59,6

60,9

45,9

50,6

80

189,6

121,3

166,6

105,4

118,9

82,3

80,6

62,99

Порівняльне тестування алгоритмів структурної ідентифікації.

У цьому експерименті досліджувались алгоритми структурної ідентифікації з оцінюванням параметрів за рекурентним методом обрамлення та різним порядком включення аргументів, зокрема:

1) з фіксованим порядком включення аргументів (клас вкладених структур);

2) ;

3) зі включенням аргументів за мінімумом коефіцієнта множинної кореляції між аргументом та (значення якого отримується під час роботи методу обрамлення);

4) зі включенням аргументів за спаданням коефіцієнта парної кореляції аргумента з вихідною змінною.

Генерувалась регресія . Координати векторів матриці плану X розміром 520 утворювалися за допомогою генератора випадкових чисел з рівномірним розподілом у проміжку [-1; 1]. Координати двох додаткових аргументів обчислювались так: . Результати роботи алгоритмів представлено у таблиці 3. Тут CR(s), - значення критерію Акаіке FPE для моделі складності s.

Таблиця 3. Результати порівняльного тестування алгоритмів моделювання

Алго-ритм

Порядок включення

CR(1)

CR(2)

CR(3)

CR(4)

CR(5)

1

92.2

77.1

1.8e-022

1.9e-022

2.2e-022

2

44.3

8.1

1.8e-022

1.9e-022

2.2e-022

3

44.3

8.1

1.8e-022

2e-022

2.2e-022

4

44.3

8.1

8.8

1.9e-022

2.2e-022

У наступному експерименті матриця плану формувалась аналогічно до попереднього. Генерована регресія мала вигляд: . Результати порівняльного тестування представлено в таблиці 4.

Проаналізувавши результати, можна зробити висновок, що парний коефіцієнт кореляції не дає достатньої інформації щодо порядку включення аргументів у модель, адже не всі істинні аргументи включались першими. При включенні ж за зростанням коефіцієнта множинної кореляції істинні аргументи включаються у модель першими. При цьому не виникають додаткові обчислювальні затрати, адже значення цього коефіцієнта отримуються в результаті роботи алгоритму. З порівняння результатів таблиць 3 та 4 видно, що алгоритм з фіксованим порядком включення аргументів дає вірний результат лише за умови знання правильного порядку додавання аргументів, натомість алгоритм зі включенням аргументів за мінімумом FPE повністю відображає ступінь інформативності аргументів.

Таблиця 4. Результати порівняльного тестування алгоритмів моделювання

Алго-ритм

Порядок включення

CR(1)

CR(2)

CR(3)

CR(4)

CR(5)

1

53.6

58.6

62.7

64.2

3.2e-022

2

17.4

2.6

2.6e-022

2.8e-022

3.2e-022

3

42.8

20.6

2.6e-022

2.9e-022

3.2e-022

4

17.4

10.4

2.7

2.8e-022

3.2e-022

П'ятий розділ присвячено розв'язанню практичних задач моделювання за допомогою комплексу інструментальних засобів.

Зокрема, виконано моделювання густини верхнього осадового шару дна за результатами гідроакустичного моніторингу природних і техногенних аномалій Каспійського моря, що має важливе значення з точки зору пошуку родовищ нафти. При моделюванні застосовано рекурентний алгоритм обрамлення. Для включення аргументів у модель використовувалося значення коефіцієнта множинної кореляції аргументу, що додається в модель на s-му кроці, від s-1 аргументів, включених в модель на попередніх кроках. Аргументи включалися в модель за мінімальним значенням цього коефіцієнта. У результаті моделювання отримано досить просту математичну залежність густини від одного із загалом п'яти факторів - інтенсивності ехосигналу. Отримана модель має високу точність і наочну інтерпретацію.

Розв'язувалась також задача побудови моделі для прогнозування процесу зміни ціни на феромолібден на світовому ринкові. Важливість прогнозування його ціни пов'язана з тим, що вартість феромолібдену для кожного машинобудівного заводу становить майже третину від сумарної вартості всіх замовлень. Із застосуванням різних підходів побудовано лінійні та нелінійні моделі залежності ціни на феромолібден від дев'яти вхідних змінних, які характеризують його виробництво і споживання. Модель, побудована з використанням критерію регулярності, показала вищу точність на контрольній частині вибірки у порівнянні з моделлю, отриманою за критерієм Акаіке. рекурентний статистичний конструювання моделювання

Комплекс інструментальних засобів використано також для моделювання ще одного реального багатовимірного економічного процесу - побудовано моделі для 11 взаємозв'язаних показників енергетичної сфери України (використано дані Міністерства економіки за 1996-2005 роки). Моделювання виконувалось із використанням комбінаторного алгоритму в класах авторегресійних моделей, моделей множинної авторегресії, адаптивних моделей.

Згідно з результатами експериментів, авторегресійні моделі погано описують експериментальні дані й не можуть бути використані для отримання прогнозу. Причиною низької точності таких моделей може бути недостатня кількість експериментальних даних та істотний взаємозв'язок показників енергетичної сфери. Більшість моделей множинної авторегресії мають достатню точність як в навчальних точках, так і в екзаменаційних, для яких вже отримано реальні дані (2006-2008 роки). Використання адаптивних моделей є альтернативним способом отримання більш точних прогнозних значень показників.

ОСНОВНІ РЕЗУЛЬТАТИ ТА ВИСНОВКИ

1. Виконано аналіз сучасних підходів до використання методу статистичних випробувань для вивчення ефективності методів моделювання за даними спостережень та їх компонентів.

2. Виконано формальну постановку задачі тестування методів моделювання та їх елементів як задачу мінімізації значення заданого критерію ефективності кожного методу. Для цього множину методів структурно-параметричної ідентифікації представлено у вигляді прямого добутку множин класів моделей, генераторів структур моделей, методів оцінювання параметрів структур та критеріїв селекції моделей, а також визначено можливі критерії ефективності методів моделювання.

3. Розроблено загальну методику дослідження методів моделювання за даними спостережень та їх компонентів за допомогою статистичного експерименту.

4. Вперше розроблено рекурентні модифікації класичних алгоритмів Гауса та Грама-Шмідта для розв'язування систем лінійних рівнянь у задачі оцінювання параметрів за МНК, які істотно зменшують затрати часу на оцінювання параметрів структур моделей, що послідовно ускладнюються.

5. Розроблено функціональну та діалогову структуру комп'ютерного комплексу інструментальних засобів для дослідження та застосування методів моделювання за даними спостережень, який реалізує запропоновану загальну методику дослідження. В інструментальному комплексі з метою підвищення ефективності методів моделювання передбачено використання рекурентних методів розв'язування систем рівнянь для задачі оцінювання параметрів.

6. Розроблений програмний комплекс використано для тестування таких основних компонентів методів моделювання: класів моделей, генераторів структур моделей, методів оцінювання параметрів, критеріїв якості моделей. Отримані результати проведених експериментів дають можливість сформувати рекомендації щодо більш ефективного використання методів моделювання та їх елементів.

7. За допомогою інструментального комплексу розв'язано такі практичні задачі: моделювання процесів зміни ціни на феромолібден на світовому ринку; моделювання густини верхнього осадового шару морського дна за результатами гідроакустичних експериментів; моделювання та прогнозування взаємозв'язаних показників енергетичної сфери України.

СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ

1. Степашко В.С. Аналіз особливостей рекурентного методу послідовного оцінювання параметрів моделей / В.С. Степашко, С.М. Єфіменко // Відбір і обробка інформації. - 2004. - № 21. - С. 91-96.

2. Єфіменко С.М. Розроблення імітаційного комплексу для статистичних випробувань методів моделювання за даними спостережень // Автоматизовані системи управління і нові інформаційні технології. Збірник наукових праць. Вип. 3. - Київ: Міжнародний науково-навчальний центр інформаційних технологій та систем НАН та МОН України. - 2005. - С. 75-81.

3. Степашко В.С. О последовательном оценивании параметров регрессионных моделей / В.С. Степашко, С.Н. Ефименко // Кибернетика и системный анализ. - 2005. - № 4. - С. 184-187.

4. Степашко В.С. Про застосування паралельних обчислень в задачах моделювання на основі індуктивного підходу / В.С. Степашко, С.М. Єфіменко, О.П. Розенблат, А.І. Черняк // Проблеми програмування. - 2006. - № 2-3. - С. 170-177.

5. Степашко В.С. Порівняння ефективності критеріїв структурної ідентифікації за допомогою тестових випробувань / В.С. Степашко, С.М. Єфіменко // Моделювання та керування станом еколого-економічних систем регіону. Зб. наук. праць, вип. 3. - К.: Міжнародний науково-навчальний центр інформаційних технологій та систем НАН та МОН України, 2006. - С. 267-274.

6. Ефименко С.Н. Имитационный эксперимент как средство для исследования эффективности методов моделирования по данным наблюдений / С.Н. Ефименко, В.С. Степашко // УСИМ. - №1. - 2009. - 69-78.

7. Stepashko V. S. On the Effectiveness of Recurrent Methods of Parameter Estimation in Macromodeling Problems / V.S. Stepashko, S.M. Yefimenko // Proceedings of V International Workshop "Computational Problems of Electrical Engineering", Jazleevets, Ukraine, August 26-29, 2003. - P.106-107.

8. Степашко В.С. Проблема інтелектуалізації прийняття рішень у задачах ідентифікації моделей / В.С. Степашко, Т.Ф. Зворигіна, С.М.Єфіменко // Матеріали науково-практичної конференції „Інтелектуальні системи прийняття рішень та прикладні аспекти інформаційних технологій”, Євпаторія, 18-21 травня 2005 р.: в 5-ти т. - Херсон: вид-во Херсонського морського інституту, 2005. - Том 1. - С.127-131.

9. Єфіменко С.М. Інструментальний комплекс для дослідження методів емпіричного моделювання // Праці Міжнародного семінару з індуктивного моделювання МСІМ-2005, Київ, 11-14 липня 2005. - Київ: вид-во МННЦ ІТС, 2005. - С. 137-142.

10. Nizamov T.I. Hydro-acoustic monitoring of water environment / T.I. Nizamov, S.R. Ibrahimova, R.K. Quluzade, A.I. Isayev, V.S. Stepashko, S.N. Yefimenko // Proceedings of Third International Conference on Technical and Physical Problems in Power Engineering, Ankara, Turkey, May 29-31, 2006. - P.1108-1110.

11. Yefimenko, S.M. Computer tests as an instrument for effectiveness investigation of modeling algorithms / S.M. Yefimenko, V.S. Stepashko // Proceedings of International Workshop of Inductive Modelling (IWIM'2007).- Prague: Czech Technical University in Prague, 2007.- P. 123 - 127.

12. Степашко В.С. Рекурентні модифікації алгоритмів Грама-Шмідта і Гауса для задач структурної ідентифікації моделей / В.С. Степашко, С.М. Єфіменко // Матеріали 11-ої міжнародної конференції з автоматичного управління „Автоматика - 2004”. - Том 1. - Київ: Вид-во НУХТ, 2004. - С. 103.

13. Єфіменко С.М. Задача розробки інструментальних засобів структурної ідентифікації моделей / С.М. Єфіменко, В.С. Степашко // Матеріали 12-ї Міжнар. конф. з автоматичного управління „Автоматика - 2005”, Харків, 30 травня - 3 червня 2005 р.: в 3-х т. - Харків: Вид-во НТУ „ХПІ”, 2005

АНОТАЦІЇ

Єфіменко С.М. Інструментальні засоби для дослідження та застосування методів моделювання за статистичними даними. - Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 - інформаційні технології - Міжнародний науково-навчальний центр інформаційних технологій та систем НАН та МОН України, м. Київ, 2009 р.

Дисертацію присвячено проблемі дослідження шляхів підвищення ефективності методів моделювання за даними спостережень.

В роботі вперше розроблено рекурентні модифікації методів Гауса та Грама-Шмідта розв'язування систем лінійних рівнянь. За допомогою тестових випробувань та теоретично показано ефективність використання запропонованих модифікацій в задачі оцінювання параметрів послідовно ускладнюваних структур моделей.

Розроблено загальну методику комплексного дослідження методів моделювання за даними спостережень та їх компонентів за допомогою чисельних експериментів. Розроблено інтегрований комплекс інструментальних засобів, який передбачає використання рекурентних алгоритмів оцінювання параметрів та ґрунтується на запропонованій методиці дослідження методів моделювання.

Інструментальні засоби застосовувалися в Інституті космічних досліджень природних ресурсів Азербайджанського Національного аерокосмічного агентства та ЗАТ “Новокраматорським машинобудівним заводом”.

Виконано порівняльне тестування методів моделювання та їх компонентів. Запропоновано рекомендації щодо їх ефективного використання при моделюванні за даними спостережень. За допомогою комплексу інструментальних засобів розв'язано практичні задачі моделювання, що мають важливе економічне значення.

Ключові слова: моделювання за даними спостережень, інструментальні засоби, комп'ютерні випробування, рекурентне оцінювання параметрів, МГУА, комбінаторний алгоритм.

Ефименко С.Н. Инструментальные средства для исследования и применения методов моделирования по статистическим данным. - Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по специальности 05.13.06 - информационные технологии - Международный научно-учебный центр информационных технологий и систем НАН и МОН Украины, г. Киев, 2009 г.

Диссертация посвящена проблеме исследования способов повышения эффективности методов моделирования по данным наблюдений.

В работе впервые разработаны рекуррентные модификации методов Гаусса и Грамма-Шмидта решения систем линейных уравнений. С помощью тестовых испытаний и теоретически показана эффективность использования предложенных модификаций в задаче оценивания параметров последовательно усложняемых структур моделей.

Разработана общая методика комплексного исследования методов моделирования по данным наблюдений и их компонентов с помощью численных экспериментов. Разработан интегрированный комплекс инструментальных средств, в основе работы которого лежит предложенная методика исследования методов моделирования и который предусматривает использование рекуррентных алгоритмов оценивания параметров.

Инструментальные средства применялись в Институте космических исследований природных ресурсов Азербайджанского Национального аэрокосмического агентства и ЗАО “Новокраматорским машиностроительным заводом”.

Выполнено сравнительное тестирование методов моделирования и их компонентов. Предложены рекомендации относительно их эффективного использования при моделировании по данным наблюдений. С помощью комплекса инструментальных средств решены практические задачи моделирования, имеющие важное экономическое значение.

Ключевые слова: моделирование по данным наблюдений, инструментальные средства, компьютерные испытания, рекуррентное оценивание параметров, МГУА, комбинаторный алгоритм.

Yefimenko S.М. Software toolkit for investigation and application of methods of modelling from statistical data. - Manuscript.

Thesis for the candidate's degree in technical sciences by the specialty 05.13.06 - information technologies - International Research and Training Centre for Information Technologies and Systems of NAS and MES of Ukraine, Kyiv, 2009.

Thesis is devoted to the problem of investigations of ways for efficiency increasing of modeling methods from data observed.

The analysis of state-of-the-art approaches to the use of the method of statistical testing for efficiency investigation of modelling methods from data observed and its components is carried out. The formal definition of the problem of testing of modelling methods and its components as the problem of minimization of value of the given efficiency criterion is executed.

Recurrent modifications of Gauss and Gram-Schmidt methods for solving of the linear equations systems are for the first time developed in the work. The modifications allow to considerably decrease the computation time for parameters estimation stage in case of successive complication of models structures.

General procedure of complex investigation of modelling methods and its components with the use of statistical experiments is developed.

The functional and dialogue structures of integrated complex of tools for investigation and application of modeling methods from data observed on the basis of proposed methodology are developed and realized. The computer toolkit is designed for experimental knowledge discovery on comparative advantages and disadvantages of modeling methods and its components. The computer complex has ability to use recurrent parameters estimation for the purpose of efficiency increasing of modeling methods.

The complex enables for user to:

- self-construct data-based modeling methods;

- compare existing methods using the given efficiency criteria;

- test different modelling methods and its components;

- develop different testing techniques and plan statistical tests;

- solve real-world modeling problems;

- carry out simulation experiments (extrapolation, forecasting) with models built by the different modelling methods;

- increase his knowledge on modelling methods using the computer complex.

The testing of main components of modeling methods such as classes of models, generators of models structures, methods of parameters estimation, and criteria of models selection with the use of the integrated computer toolkit was carried out. The obtained results of conducted experiments give a possibility to form recommendations on effective application of modeling methods and its elements. Some of them are the followings:

– the use of recurrent algorithms is effective for parameters estimation in the problem of modeling from observation data because of their considerably higher computation speed comparing to nonrecurrent algorithms;

– comparative testing of criteria of models structure identification demonstrates simplification of optimal models with increasing of noise level and the higher effectiveness of the regularity criterion etc.

The applied efficiency of the integrated toolkit was shown by solving such real-world problems:

– forecasting the ferromolybdenum market price;

– modelling of a density of the upper sedimentary layer of sea-bottom after the results of hydroacoustic monitoring of natural and man-caused anomalies of the Caspian sea;

– modelling and forecasting of interdependent indices of power sphere of Ukraine.

Efficiency of the obtained results is proved by documents on application and using in the following organizations:

– Institute of space exploration of natural resources of the National aerospace agency and National academy of aviation of Azerbaijani Republic;

– business management of joint-stock company of engineering plant of Novokramatorsk.

Keywords: modeling from data observed, integrated toolkit, computer testing, recurrent parameters estimation, GMDH, combinatorial algorithm.

Размещено на Allbest.ru

...

Подобные документы

  • Розвиток виробництва і широке використання промислових роботів. Алгоритми методів, блок-схеми алгоритмів розв'язку даного диференційного рівняння. Аналіз результатів моделювання, прямий метод Ейлера, розв’язок диференціального рівняння в Mathcad.

    контрольная работа [59,1 K], добавлен 30.11.2009

  • Огляд та аналіз методів розв’язання системи диференціальних рівнянь та вибір методів рішення. Алгоритми методів Ейлера. Вибір методу рішення задачі Коші. Рішення диференціальних рівнянь. Отримання практичних навиків програмування на мові Паскаль.

    курсовая работа [174,3 K], добавлен 06.03.2010

  • Огляд та варіантний аналіз чисельних методів моделювання, основні поняття і визначення. Опис методів моделювання на ЕОМ, метод прямокутників і трапецій. Планування вхідних та вихідних даних, аналіз задач, які вирішуються при дослідженні об’єкта на ЕОМ.

    курсовая работа [373,6 K], добавлен 30.11.2009

  • Характеристика основних методів сучасного викладання фізики. Моделювання як процес дослідження об’єктів пізнання за допомогою їх моделей. Розгляд особливостей використання табличного процесора EXCEL для обробки результатів лабораторних робіт з фізики.

    лабораторная работа [1,6 M], добавлен 22.12.2012

  • В роботі розглянуто наближені методи розв'язку нелінійних рівнянь для методів Ньютона та хорд, складено блок-схеми та написано програму, за допомогою якої розв'язується задане рівняння. Аналіз рівняння, методів його розв'язання і результатів обрахунку.

    курсовая работа [380,9 K], добавлен 30.11.2009

  • Комп’ютерне моделювання системи сегментації та розпізнавання облич на зображеннях. Підвищення швидкодії моделювання за кольором шкіри та покращення якості розпізнавання при застосуванні робастних boosting-методів. Розробка алгоритмів функціонування.

    дипломная работа [1,6 M], добавлен 02.07.2014

  • Оцифровування карти за допомогою програмного продукту ArcGis. Порівняння методів інтерполяції за допомогою програмних продуктів Surfer та ArcGis. Згладжування отриманих сіткових даних за допомогою сплайнів і фільтрації. Застосування сіткових чисел.

    курсовая работа [2,1 M], добавлен 31.01.2014

  • Висвітлення та розкриття поняття 3д-моделювання, його видів та особливостей. Аналіз основних видів моделювання, їхнє практичне використання, переваги та недоліки кожного виду. Розгляд найпоширеніших програм для створення 3-д зображень та їх функції.

    статья [801,7 K], добавлен 18.08.2017

  • Варіантний аналіз чисельних методів моделювання зміни температури термопари. Основні сучасні вимоги до інтерфейсу та логічної структури програми. Суть сплайн-інтерполяції, лістинг програми та оцінка похибок результатів експериментальних досліджень.

    курсовая работа [698,4 K], добавлен 03.12.2009

  • Аналіз предметної галузі задачі моделювання пострілу балісти через стіну по мішені. Структури даних та діаграми класів для розв'язання задачі. Схеми взаємодії об’єктів та алгоритми виконання їх методів. Опис розробленої програми, інструкція користувача.

    курсовая работа [1,0 M], добавлен 18.05.2014

  • Створення програмного забезпечення управління сучасним текстильним виробництвом. Застосування промислової мережи CANopen. Моделювання системи у середовищі Tracemode6 та Twidosuite. Застосування на підприємстві мікроконтролерів. Асинхронний обмін даними.

    контрольная работа [268,3 K], добавлен 23.01.2016

  • Загальна характеристика існуючих методів обміну даними між компонентами MS Office, їх властивості та напрямки використання. Формат даних, що вставляються з буфера обміну. Відмінності у властивостях створених, впроваджених та вставлених даних.

    курсовая работа [190,2 K], добавлен 07.02.2003

  • Мова VHDL. Створення проекту для моделювання цифрових і аналогових схем. Синтез і моделювання комбінаційних пристроїв, заданих в табличній формі, за допомогою системи Active-HDL 6.1. Створення ієрархічних структур при проектуванні складних пристроїв.

    реферат [287,3 K], добавлен 14.02.2009

  • Дослідження застосування різницевого методу для розв’язання крайової задачі. Дослідження проводиться на прикладі заданого диференційного рівняння. Дається опис методу та задачі в цілому. Застосування при обчисленні формули Чебишева і формули Гаусса.

    курсовая работа [157,2 K], добавлен 03.12.2009

  • Розробка інформаційної системи зберігання, обробки та моделювання алгоритмів обчислення статистичних даних для змагань з плавання і з інших видів спорту. Зміст бази даних, реалізація БД засобами MySQL, створення клієнтського додатка в середовищі PHP.

    дипломная работа [4,5 M], добавлен 17.09.2011

  • Поняття моделювання як процесу, що полягає у відтворенні властивостей тих чи інших предметів і явищ за допомогою абстрактних об’єктів та описів у вигляді зображень, планів, алгоритмів. Системи масового обслуговування. Модель роботи видавничого центру.

    курсовая работа [255,8 K], добавлен 15.09.2014

  • Сутність та особливості параметричного, воксельного, полігонального моделювання, моделювання сплайнами та скульптингу. Застосування 3D моделювання в науці, техніці, рекламі, маркетингу, дизайні інтер'єру, архітектурі, анімаці, кіно та медицині.

    доклад [873,9 K], добавлен 04.05.2022

  • Розробка, дослідження та реалізація методів вирішення завдань аналізу, розпізнавання і оцінювання зображень як один із провідних напрямків інформатики. Класифікація та аналіз існуючих методів розпізнавання образів, переваги та недоліки їх застосування.

    статья [525,8 K], добавлен 19.09.2017

  • Огляд методів голосування та їх характеристика. Правило Кондорсе. Основні аксіоми та теореми, узагальнена порівняльна характеристика методів голосування. Метод паралельного виключення та метод Борда. Розрахунки щодо визначення переможця у програмі.

    курсовая работа [333,7 K], добавлен 29.03.2012

  • Засоби візуального моделювання об'єктно-орієнтованих інформаційних систем. Принципи прикладного системного аналізу. Принцип ієрархічної побудови моделей складних систем. Основні вимоги до системи. Розробка моделі програмної системи засобами UML.

    курсовая работа [546,6 K], добавлен 28.02.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.