Синтез нейронних контролерів для керування динамічними об’єктами другого порядку
Побудова контролерів та емуляторів на базі динамічних нейронних мереж, що забезпечують керування процесами в об’єктах другого порядку. Обґрунтування їх переваг у порівнянні з контролерами із застосуванням методів лінійної теорії автоматичного керування.
Рубрика | Коммуникации, связь, цифровые приборы и радиоэлектроника |
Вид | автореферат |
Язык | украинский |
Дата добавления | 28.08.2014 |
Размер файла | 82,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ “ЛЬВІВСЬКА ПОЛІТЕХНІКА”
Автореферат
дисертації на здобуття наукового ступеня кандидата технічних наук
05.13.05 - елементи та пристрої обчислювальної техніки та систем керування
СИНТЕЗ НЕЙРОННИХ КОНТРОЛЕРІВ ДЛЯ КЕРУВАННЯ ОБ'ЄКТАМИ ДРУГОГО ПОРЯДКУ
Виконав Наконечний Юрій Маркіянович
Львів - 2006
АНОТАЦІЯ
Наконечний Ю.М. Синтез нейронних контролерів для керування динамічними об'єктами другого порядку. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.05 - Елементи та пристрої обчислювальної техніки та систем керування. - Національний університет “Львівська політехніка”, Львів, 2006
Проведено аналіз шляхів побудови динамічних нейронних мереж і способів їх використання в системах автоматичного керування. Розглянуто принципи функціонування нейронних мереж і проаналізовано алгоритми їх навчання. Запропоновано шляхи побудови структури динамічної нейронної мережі на основі інформації про вид і порядок диференціального рівняння, розв'язання якого визначає бажані характеристики мережі. Показано спосіб переходу від лінійного диференціального рівняння до структури нейронної мережі, а також розглянуто шляхи побудови нейронної мережі для відтворення функціональних залежностей, що описуються нелінійними диференціальними рівняннями.
Розглянуто архітектуру динамічної нейронної мережі, яка використовується для реалізації пропорціонально-інтегрально-диференціального закону керування, а також модифікований варіант такої мережі з розділеними входами.
Вказано шляхи визначення стійкості системи автоматичного керування з використанням синтезованого нейронного контролера, проведено порівняльний аналіз системи керування, виконаної на базі нейронного контролера, з системами керування, які реалізовані методом кореневого годографа та за допомогою частотних характеристик. Розглянуто методи навчання нейронних контролерів (з використанням нейронної моделі об'єкта, нейронних моделей оберненого об'єкта та оберненого еталона, а також з використанням нейронної моделі оберненого еталона за наявності збурень) та проведено порівняння результатів їх навчання.
контролер емулятор нейронний
1. ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. Здебільшого системи автоматичного керування складаються з нелінійних елементів, які охоплені складними оберненими зв'язками, а на роботу таких систем в реальних умовах впливають різноманітні шуми, завади та інші збурюючі фактори, що суттєво обмежують використання можливостей сучасної і класичної теорії керування при побудові контролерів. Протягом останніх десятиріч при реалізації стратегій керування використовувалися теорії, які базуються на ідеї лінеаризації системи, що не повною мірою відображають її фізичні властивості, а в ряді випадків, навіть при точному відтворенні залежностей між входами і виходами системи, їх використання неспроможне забезпечити адекватне керування об'єктом. Тому дедалі частіше при синтезуванні алгоритмів керування використовуються штучні нейронні мережі, що враховують особливості об'єкта, який повинна відтворити мережа, а її навчання проводиться на основі вхідних і вихідних даних, які характеризують процеси, що протікають в даному об'єкті. Оскільки нейронні мережі в своїй основі є нелінійними, їх можна використовувати для ідентифікації як лінійних, так і нелінійних об'єктів, а також для реалізації алгоритмів керування в таких об'єктах. Тому розробка методів побудови і алгоритмів навчання нейронних мереж для керування об'єктами автоматики є актуальною.
Мета і задачі досліджень. Метою дисертаційної роботи є побудова контролерів на базі динамічних нейронних мереж, що забезпечують керування процесами в об'єктах другого порядку та обґрунтування їх переваг у порівнянні з контролерами, які реалізовані із застосуванням методів лінійної теорії автоматичного керування.
Наукова новизна результатів дисертаційної роботи полягає в тому, що:
· вперше, виходячи з особливостей математичної моделі об'єкта, запропоновано процедуру визначення архітектури вхідних кіл скритого шару динамічної нейронної мережі, яка створюється на базі цього об'єкта, що забезпечило адекватність динамічних характеристик моделі та об'єкта;
· вперше запропоновано реалізацію законів керування на базі динамічних нейронних мереж з використанням даних, які одержані при експериментальному дослідженні або математичному моделюванні еталонів і об'єктів керування, що дало можливість синтезувати контролер без використання математичної моделі об'єкта та забезпечило одержання бажаної динамічної характеристики замкненої системи керування процесом в об'єкті;
· вперше запропоновано структуру нейронного контролера з розділеними входами, що забезпечило після його навчання можливість дослідити стійкість систем автоматичного керування із застосуванням методів теорії автоматичного керування.
Об'єкт дослідження - моделі лінійних і нелінійних об'єктів, що функціонують при дії факторів зовнішнього середовища.
Предмет дослідження - нейронні емулятори і нейронні контролери, побудовані на основі динамічних нейронних мереж.
Методи дослідження - класична і сучасна теорія керування, що дозволила обґрунтувати вибір структури вхідних кіл моделей емулятора та контролера, а також дослідити стійкість систем керування, реалізованих на базі синтезованих контролерів; теорія оптимізації, на основі якої обґрунтовано вибір алгоритму навчання динамічної нейронної мережі; теорія нейронних мереж, що дозволила синтезувати динамічні нейронні мережі з різною архітектурою і здійснювати їх навчання; візуальне моделювання в середовищі MATLAB, що дозволило оцінити якісне функціонування синтезованих нейронних контролерів і сформулювати рекомендації щодо їх практичного використання.
Практичне значення отриманих результатів. Розроблено, досліджено і експортовано в пакеті Simulink контролери для керування процесами в об'єктах другого порядку, виконані на базі динамічних нейронних мереж. Використання результатів проведених досліджень і запропонованого програмного продукту дозволяє синтезувати нейронні контролери для керування процесами у нелінійних об'єктах другого порядку, або в об'єктах, математичні моделі яких є надто складними з огляду на ефективність використання загальновідомих методів аналізу лінійної теорії автоматичного керування, а також для тих випадків, коли інформація про об'єкт керування є неповною.
2. ОСНОВНИЙ ЗМІСТ РОБОТИ
У вступі обґрунтовано актуальність теми дисертаційної роботи, сформульовано мету і задачі досліджень, відображені наукова новизна і практична цінність одержаних результатів.
У першому розділі наведено класифікацію електроприводів за критеріями функціонування та будови електричної машини, умовами її експлуатації, розглянуто особливості побудови математичної моделі електроприводу з врахуванням впливу різних типів навантажень, на підставі чого сформульовано та промодельовано в середовищі Simulink систему диференціальних рівнянь двигуна постійного струму при різних способах його збудження. Показано, що двигуни постійного струму без врахування змінного навантаження в першому наближенні описуються лінійними диференціальними рівняннями другого порядку, моделювання яких здійснено в пакеті Simulink. Розглянуто особливості побудови математичної моделі двигуна постійного струму з незалежним збудженням при його навантаженні моментом в'язкого тертя і позиційним моментом типу повороту руки робота й показано, що врахування впливу додаткових факторів на роботу двигуна, зокрема, дії моменту типу повороту руки робота, описується математичною моделлю електроприводу у вигляді нелінійного диференціального рівняння другого порядку. Це суттєво обмежує можливість використання методів лінійної теорії автоматичного керування при синтезуванні контролерів, функціонування яких повинно забезпечувати задані динамічні і статичні параметри процесу в електроприводі й відкриває можливості вирішення цієї актуальної задачі з використанням теорії нейронних мереж.
У другому розділі розглянуто способи побудови контролерів з використанням методу кореневого годографа і методу частотних характеристик.
У разі використання методу кореневого годографа синтез контролера здійснюється у два етапи. На першому етапі для заданих динамічних показників системи (перерегулювання і тривалість встановлення) на комплексній площині визначається область допустимого розташування коренів характеристичного рівняння замкненої лінеаризованої системи. Оскільки швидкодія системи визначається полюсами, які розташовані найближче до уявної осі (домінуючі корені), то корені характеристичного рівняння замкненої системи повинні бути лівіше від лінії, що проходить на комплексній площині паралельно до уявної осі через точку, положення якої визначається заданою тривалістю встановлення (для системи другого порядку
,
де - безрозмірний коефіцієнт погасання, - власна частота коливань, - коефіцієнт пропорціональності, для ланок другого порядку ). Крім того, кожна ланка виду вносить перегулювання
,
тому, встановлюючи обмеження на перерегулювання, необхідно задати ще й додаткове обмеження на розміщення коренів, а саме: корені повинні перебувати лівіше від ліній, що проходять через центр координат під кутами .
Отже, корені характеристичного рівняння системи повинні міститися в допустимій заштрихованій області та якомога ближче до її меж, хоча навіть і в цьому випадку в системі можуть з'являтися викиди та спотворення перехідного процесу. Якщо структура контролера задана, тоді за умови зазначеного вище розташування коренів необхідно обчислити його коефіцієнти. При цьому вибирається певний коефіцієнт, зміні якого, на комплексній площині відповідають траєкторії руху коренів характеристичного рівняння. Тобто за траєкторією руху коренів визначається, як повинен змінюватися цей коефіцієнт, щоби корені потрапили в допустиму область. Таким параметром для побудови кореневого годографа в систему вводиться додатковий коефіцієнт , у вигляді окремого структурного елемента.
Коефіцієнт є дійсним додатнім числом, оскільки в системі використовується від'ємний обернений зв'язок. Отже, для будь-якої точки, що належить кореневому годографу справедливе дотримання співвідношення:
(1)
Вираз (1) дозволяє не тільки підбирати значення для заданої структури, але й змінювати форму та конфігурацію годографа через вплив на архітектуру контролера.
Одержане значення у вигляді одного із параметрів вводиться у вираз, реалізованого в системі закону керування. Так наприклад, для передавальної функції об'єкта:
(2)
Одержано кореневі годографи, що відповідають пропорціональному, пропорціонально - диференціальному, пропорціонально - інтегрально - диференціальному законам керування.
Аналіз одержаних годографів показує, що при реалізації пропорціонального способу керування навіть невелике значення обумовлює таке розташування коренів, при якому має місце значне перерегулювання, а збільшення викликає суттєве погіршення динамічних характеристик системи. Введення диференціальної складової в передавальну функцію контролера з метою покращання динамічних характеристик системи обумовлює можливість вибору коефіцієнта , при якому уявна частина коренів характеристичного рівняння є мінімальною та одночасно обидва корені максимально віддалені від уявної осі (), однак в цьому випадку система характеризується неприпустимо високою статичною похибкою, а саме: 0.625.
Реалізація пропорціонально - інтегрально - диференціального закону керування забезпечує усунення статичної похибки замкненої системи та бажану стійкість. Так, вибравши значення коефіцієнтів передавальної функції контролера за умови розширення області дійсних коренів замкненої системи, побудуємо кореневий годограф, за яким, виходячи з умов забезпечення заданих динамічних характеристик системи, можна вибрати значення (в нашому випадку ). Аналіз перехідної характеристики одержаної системи показує, що, незважаючи на те, що всі корені є від'ємними і дійсними, в системі спостерігається перерегулювання. Хоча найповільніша погасаюча складова процесу й зумовлена домінуючим коренем характеристичного рівняння, все ж на амплітуду перехідного процесу найсуттєвіше впливає не він, а найвіддаленіший від уявної осі корінь.
При використанні методу частотних характеристик вимоги щодо динамічних характеристик системи задаються в частотній області, а для визначення стійкості використовується критерій Найквіста з додатковими умовами до необхідних її запасів за модулем і фазою. Основна перевага цього методу полягає в тому, що для синтезу контролера властивості об'єкта задаються у вигляді частотних характеристик, які на реальному об'єкті можна одержати експериментально. Синтезування контролера здійснюється для вищезазначеного об'єкта, який описується передавальною функцією (2). Коефіцієнт підсилення розімкненої системи при синтезуванні пропорціонального контролера вибирається за умови забезпечення мінімального значення статичної похибки системи, тобто його значення повинні бути великими ( вибрано рівним 200). Проте, як випливає з діаграми Боде, при цьому запас стійкості за фазою для розімкненої системи є недостатнім (), а тому в замкненій системі наявне значне перерегулювання. Для забезпечення достатнього запасу стійкості за фазою в закон керування введено диференціальну ланку, значення коефіцієнту диференціювання якої не повинно бути надто великим. Так, при запас стійкості за фазою набуває більшого значення (), що однозначно покращує динаміку системи з огляду на зменшення перерегулювання. Для усунення ж статичної похибки в рівняння контролера введено інтегральну складову, значення коефіцієнта якої з огляду на забезпечення потрібної швидкодії системи з одночасним збереженням запасу стійкості за фазою вибрано рівним 1200. В цьому випадку рівняння контролера має вигляд: (30s2+200s+1200)/s, а перехідна характеристика замкненої системи з синтезованим контролером характеризується значним перерегулюванням.
Усі вище перелічені задачі оптимально виконуються з використанням нейромережевої структури контролера.
В третьому розділі на основі функціональної схеми багатошарової нейронної мережі показано, що її можна описати векторною функцією у вигляді суперпозиції лінійних комбінацій функцій активації шарів. Так, для тришарової мережі вона матиме вигляд:
, (4)
тут - вектор входів мережі; - вектори зміщень шарів мережі, , , - матриці вагових коефіцієнтів шарів, , , - вектори функцій активації шарів мережі; - вектор виходів мережі.
При побудові нейронної мережі щонайповніше відтворення об'єкту забезпечується правильним вибором як архітектури мережі, так і здійсненням її навчання, при якому обчислюються вагові коефіцієнти мережі. При вирішенні першої задачі з врахуванням особливостей об'єкта визначається кількість шарів мережі і зв'язки між ними, види функцій активації і кількість нейронів в кожному шарі, що дає змогу виявити всі характерні для даного об'єкта залежності. Зокрема, при навчанні порівнянням заданих і поточних виходів останнього шару обчислюються вагові коефіцієнти і зміщення у всіх шарах. Залежно від природи об'єкта-прототипу нейронна мережа може бути статичною або динамічною (для відтворення динаміки процесу використовуються елементи затримки).
Якщо об'єкт (в загальному випадку нелінійний) описується диференціальним рівнянням виду:
, (5)
то при реалізації динамічної нейронної мережі необхідно передбачити наявність блоку відтворення похідних (це динамічна частина, в якій з використанням ліній затримок на входах нейронів першого шару відтворюються вихідні рівняння) та блоку реалізації функціональних залежностей (де обчислюються вагові коефіцієнти мережі), тут nx - максимальний порядок похідних від входів; ny - максимальний порядок похідних від виходів.
Об'єкт, який описується лінійним диференціальним рівнянням із сталими коефіцієнтами:
, (6)
за яким формується структура рекурентного цифрового фільтра і однозначно визначається схема побудови нейронної мережі на одному нейроні з лінійною функцією активації.
Якщо динаміка процесу описується нелінійним диференціальним рівнянням, то при побудові нейронної мережі необхідно враховувати не лише динаміку моделі, але й наявні в ній нелінійності, зокрема, через впровадження в нейронну мережу нелінійних функцій активації і збільшення кількості її шарів. Мінімальні вимоги відносно кількості ліній затримок на вході мережі визначаються порядками похідних правої і лівої частин диференціального рівняння.
Оскільки інформація щодо динаміки відтворюваного об'єкта, а, отже, й про диференціальне рівняння, яким вона описується є неточною, характер наявних нелінійностей невідомий, то єдиним джерелом вірогідної інформації про відтворюваний процес є навчальні послідовності, а тому доцільно спершу задатися початковою кількістю шарів і нейронів в кожному шарі, а потім, аналізуючи ефективність навчання мережі з вибраною структурою, модифікувати її.
В багатошаровій нейронній мережі для кожного окремого шару вибирається певна функція активації, через яку кожен нейрон цього шару передає зважену суму своїх входів на вихід. При використанні градієнтних та квазіньютонових методів ця функція повинна бути неперервною та диференційованою, (при методі Ньютона - навіть подвійно диференційованою). Для відтворення гладких функцій найдоцільніше застосовувати функції активації tansig і logsig. Зокрема, при відтворенні об'єкта, який описується лінійним диференціальним рівнянням другого порядку:
(7)
відповідне йому рівняння в скінчених різницях має вигляд
,
що, по суті, є рівнянням лінійної нейронної мережі, вагові коефіцієнти якої визначаються із співвідношень:
, , , (8)
При відтворенні нелінійного об'єкта другого порядку першим наближенням є архітектура одношарової нейронної мережі, яка відповідає лінійному диференціальному рівнянню, а для врахування нелінійності об'єкта мережу необхідно доповнити нелінійними елементами. Цим викликана потреба використання двошарової нейронної мережі, в першому шарі якої розташовано нейрони з нелінійними функціями активації, а в другому - на базі одного нейрона з лінійною функцією активації здійснюється зважене підсумовування вихідних сигналів першого шару.
При навчанні динамічної нейронної мережі поточні значення вагових коефіцієнтів та зміщень одержуємо, опрацьовуючи сигнали, сформовані при порівнянні заданих значень вихідних сигналів із сигналами , одержаними на виході мережі при подачі на її вхід вхідних векторів . Оскільки навчання динамічної нейронної мережі по суті є процесом параметричної оптимізації, то для оцінки якості навчання з погляду реалізації алгоритму навчання найдоцільніше використовувати квадратичний критерій оптимальності
, (9)
тут Q - кількість вибірок; q - номер вибірки (від 1 до Q); SM- кількість нейронів останнього шару; ti,q - i-а компонента q-го цільового вектора; aMi,q - i-а компонента q-го вихідного вектора мережі.
При порівняльному аналізі алгоритмів навчання нейронних мереж, які базуються на використанні методів оптимізації функцій багатьох змінних встановлено, що для навчання нейронних мереж найдоцільніше використовувати градієнтні методи, як такі, що визначаються найбільшою продуктивністю. При неперервній функції мети градієнтні методи використовують інформацію про часткові похідні функції мети за настроюваними параметрами. Оскільки в динамічних нейронних мережах для керування неперервними процесами використовуються неперервні функції активації і, відповідно, функціонал функції мети є неперервним, то в подальшому зосередимось лише на градієнтних методах. В процедурі навчання нейронної мережі з використанням заданих значень її входів і виходів можна виділити дві складові - знаходження похідних функціоналу похибки за настроюваними параметрами (власне backpropagation) та процедуру оптимізації, при реалізації якої на основі одержаних числових значень функціоналу похибки здійснюється таке коригування вагових коефіцієнтів і зміщень, яке забезпечує мінімізування функціоналу похибки (9).
Коли на вхід мережі подається Q відліків, то часткові похідні функціоналу похибки за настроюваними параметрами визначаються у вигляді суми часткових похідних, які одержані для кожного окремого відліку. А саме:
.
матриця Якобі від векторної функції на q-му відліку.
При реалізації одного з найефективніших методів навчання - алгоритму Левенберга-Марквардта використовується наближене обчислення матриці Гессе, а для обчислення градієнту (або матриці Якобі) застосовано алгоритм оберненого розповсюдження похибки (backpropagation), який легко реалізувати програмно з використанням однотипних матричних операцій. При використанні нейронних мереж з великою кількістю настроюваних коефіцієнтів навчання мережі доцільно проводити із застосуванням методів спряжених градієнтів.
В четвертому розділі розглянуто особливості ідентифікації об'єктів другого порядку, способи побудови та навчання контролерів на базі динамічних нейронних мереж.
При ідентифікації об'єктів другого порядку навчання нейронної мережі можна реалізувати із замкненим (рекурентна нейронна мережа) або із розімкненим зворотним зв'язком (нерекурентна нейронна мережа). При навчанні рекурентної мережі обчислення градієнта ускладнене тим, що на поверхні цільової функції з'являються додаткові локальні мінімуми, оскільки вхідні сигнали певного відліку залежать не тільки від поточного сигналу входів, але й від попередніх значень на виході самої мережі. Процес навчання мережі в нерекурентному вигляді значно ефективніший, оскільки при обчисленні градієнта використовується алгоритм зворотнього розповсюдження (backpropagation), який не використовує зворотнього зв'язку в мережі, а тому затримані значення входів - це окрема вхідна послідовність. Порівняння цих двох методів показало, що навчання рекурентної мережі тривало біля 30 хвилин, що відповідає проходженню тільки 27 епох і було припинене при досягненні параметром налагодження максимально допустимого значення. Середньоквадратична похибка при тому набула значення . Нерекурентна мережа навчалася протягом 10 хвилин, при цьому кількість епох складала 2019, що вказує на суттєве скорочення тривалості однієї епохи, і при тому середньоквадратична похибка зменшилася до . Результати моделювання в Simulink нейронних мереж, які навчалися в рекурентному і нерекурентному виглядах, однозначно підтвердили суттєву перевагу способу навчання мережі з розімкненим зворотним зв'язком (в нерекурентному вигляді).
Дослідження системи автоматичного керування з використанням пропорціонально-інтегрально-диференціального нейронного контролера, вхідним сигналом якого є похибка розузгодження (контролер з нерозділеними входами), показало, що така система є неефективною, оскільки не забезпечує заданих динамічних показників процесу керування.
Для покращання динаміки системи подачу сигналів на вхід нейронного контролера розділено і формування його вхідних кіл проводилось на основі виразу:
(10)
Порівняння результатів моделювання систем керування, виконаних на базі нейронних контролерів з нерозділеними і розділеними входами, показало, що використання контролера з розділеними входами суттєво покращує динамічні властивості системи, а саме: перехідна характеристика системи, керованої контролером, набуває характеру, який визначається виходом еталона.
Для аналізу системи керування, виконаної на базі нейронного контролера з розділеними входами з використанням методів лінійної теорії керування об'єкт лінеаризовано в точці найбільшого нахилу його статичної характеристики (саме тут система є найменш стійкою), а структуру контролера подано у вигляді двох лінійних нейронних мереж, які реалізовано на основі співвідношень:
(11)
Перехід від наведених співвідношень до неперервних еквівалентів нейронних мереж і використання передавальної функції лінеаризованого об'єкта дозволили отримати вираз передавальної функції замкненої системи, за яким проаналізовано утворену систему, як неперервну. При дослідженні системи побудовано кореневий годограф, з якого випливає, що траєкторії коренів характеристичного рівняння замкненої системи лежать у лівій півплощині, а це, в свою чергу, вказує на те, що утворена замкнена система є стійкою при будь-яких змінах коефіцієнта передачі.
Аналіз частотних характеристик системи в розімкненому виді теж підтверджує, що замкнена система є стійкою (запас стійкості становить ). Вищенаведені методи досліджень систем керування з використанням лінійних нейронних контролерів можна узагальнити і на системи з нелінійними контролерами, якщо для побудови кореневого годографа або частотних характеристик системи скористатися числовими значеннями вагових коефіцієнтів навченого нелінійного нейронного контролера.
В узагальненій схемі системи автоматичного керування нейронний контролер так доповнює нелінійний об'єкт, щоби при подачі будь-якої реально допустимої послідовності rk утворена система максимально відповідала еталону (в ідеалі yrk =yk). Оскільки для навчання нейронної мережі необхідно знати її вхідні та вихідні сигнали, то нейронний контролер можна навчити, якщо одночасно відомі: задаючий сигнал на вході нейронного контролера (послідовність rk); сигнал оберненого зв'язку з виходу об'єкта (послідовність yk); вихідний сигнал нейронного контролера (послідовність uk, що подається на вхід об'єкта). До початку навчання всі три вказані послідовності одночасно невідомі. Якщо задатися вхідним сигналом (послідовність rk), то в припущенні, що yk=yrk, на основі математичної моделі еталона можна знайти послідовність yk , проте тоді невідомою залишається послідовність uk. Якщо ж подати на об'єкт тестову послідовність , то на його виході одержимо yk, однак при тому невідомою залишиться послідовність rk.
Розгляд різних підходів до навчання динамічних нейронних мереж, особливостей їх застосування при реалізації нейронних контролерів та результати їх моделювання дозволили обґрунтувати ефективність використання нейронних мереж з погляду забезпечення необхідних динамічних і статичних характеристик процесу керування. Так, один із способів реалізації нейронного контролера полягає в тому, що на основі послідовностей, які виміряні на вході і виході об'єкта ( та ), через навчання нейронної мережі створюється нейронна модель об'єкта, яка доповнюється нейронним контролером і замикається оберненим зв'язком, що відповідає реальній системі. Утворена нейронна мережа відтворює модель поєднання контролера та об'єкта. Щоби ця модель була еквівалентна еталону, коефіцієнти контролера можна отримати навчанням цієї об'єднаної мережі послідовностями з входу і виходу еталона (rk та yk), при цьому значення тих коефіцієнтів мережі, які відповідають підмережі об'єкта повинні бути фіксованими, тобто в процесі навчання змінюються тільки коефіцієнти контролера. В даному випадку нейронна модель об'єкта використовується для того, щоб через неї похибка “обернено поширилась” до мережі контролера. Після навчання з об'єднаної мережі можна виділити ту частину, що відповідає контролеру і використати її для керування реальним об'єктом. Такий метод має ту перевагу, що навчання контролера відбувається тільки на вхідній і вихідній послідовностях еталона, без використання вхідної послідовності об'єкта, проте в даному випадку всередині мережі наявний обернений зв'язок, а навчання мережі утруднене через наявність додаткових мінімумів, викликаних наявністю оберненого зв'язку. Тривалість навчання мережі в залежності від початкових даних коливається в межах від 20 до 40 хвилин. Порівняння сигналів на виходах еталона і об'єкта, керованого синтезованим контролером, вказує на суттєву розбіжність між ними, і чим більше відхилення керуючого сигналу від нуля, тим більше неспівпадіння вихідних сигналів еталона та керованого об'єкта. Значення середньоквадратичної похибки при моделюванні системи склало 0,023.
Інший метод реалізації нейронного контролера базується на використанні для навчання контролера вхідної і вихідної послідовностей еталона (rk та yk) та вхідної послідовності об'єкта . При цьому вхідна послідовність об'єкта обчислюється на основі значень вихідної послідовності еталона, яка отримана при подачі на його вхід заданої числової послідовності. Фактично цей метод вимагає використання оберненої моделі, реалізація якої не завжди можлива. Тому для формування вхідної послідовності об'єкта на основі значень вихідної послідовності еталона, використовується нейронна мережа оберненого об'єкта, навчання якої здійснюється на підставі експериментально одержаних вхідної і вихідної послідовностей об'єкта.
Для порівняння побудовано два нейронні контролери: при побудові першого використовувалася двошарова нейронна мережа оберненого об'єкта з використанням 12 нейронів і функції активації tansig у першому шарі і одного нейрона з функцією активації purelin у другому шарі, а при побудові другого у першому шарі використовувалось лише 5 нейронів.
Незважаючи на задовільні показники процесу навчання в обох випадках (тривалість навчання становила приблизно 20 секунд, мала кількість ітерацій, невелике значення середньоквадратичної похибки - ), все ж нейронний контролер, виконаний із використанням нейронної мережі оберненого об'єкта за другою схемою є ефективнішим (значення середньоквадратичної похибки при використанні першого контролера складає 0,876, а другого - 0,0108). Очевидно, перша нейронна модель оберненого об'єкта і, відповідно, перший нейронний контролер не спромоглися на етапі навчання виявити специфіку нелінійного об'єкта і відповідним чином відреагувати на неї при коригуванні вагових коефіцієнтів мережі, що обумовило низьку ефективність процесу керування. В другому випадку навчання виявилося ефективнішим і різниця між значеннями сигналів керованого об'єкта та еталона не перевищує сотих часток.
Аналіз підходів до навчання нейронних контролерів показав, що одним із найперспективніших з погляду простоти одержання навчальних послідовностей є навчання з використанням оберненого еталона. В цьому випадку навчання проводиться на основі вхідної і вихідної послідовностей об'єкта, а також вхідної послідовності еталона (rk), яка одержана на виході моделі оберненого еталона, при подачі на її вхід вихідної послідовності об'єкта. Обернення еталона можна здійснювати розв'язуванням рівняння еталона відносно вхідної змінної або побудовою оберненої моделі на основі нейронної мережі. Зреалізовано ряд нейронних контролерів, для навчання яких використовувалися різні тестові послідовності вхідних сигналів (зокрема, частото-модульовані сигнали і послідовності у вигляді стрибків) та різні способи обернення еталона.
Аналіз результатів моделювання систем керування, в яких використовувалися реалізовані контролери, показав, що нейронний контролер, навчання якого здійснювалося з використанням оберненої моделі еталона на основі нейронної мережі, а в процесі навчання на вхід мережі подавалися тестові сигнали у вигляді частото-модульованої синусоїди, виявився найефективнішим. При цьому значення середньоквадратичної похибки при моделюванні системи з його використанням склало .
Для виявлення динамічних можливостей системи і покращення її швидкодії реалізація і навчання нейронних контролерів проводилося для прискорених і сповільнених варіантів еталона. Аналіз одержаних результатів показав, що в усіх випадках одержано коректні контролери, однак якість керування процесами в об'єкті за допомогою синтезованих контролерів тим гірша, чим більше ітеративно підібрані коефіцієнти рівняння еталона відрізняються від початкових.
При навчанні нейронного контролера з використанням моделі оберненого еталона для одержання послідовності, яка подається на вхід контролера (послідовність rk) можна застосувати різні засоби: неперервну чи дискретну модель оберненого еталона, або ж нейронну мережу оберненого еталона. Проте найточнішим є обернення, що здійснюється через обернену конволюцію, яка базується на тому, що вихідну послідовність оберненого еталона можна подати у вигляді зваженої суми:
, (12)
де hi= (i=1,…,N) - імпульсна характеристика еталона.
Таким чином, при заданих вихідних сигналах еталона yk і його відомій імпульсній характеристиці, можна, розв'язавши систему рівнянь, обчислити вхідну послідовність rk , тобто здійснити обернену конволюцію. Порівняння методів обернення, які реалізовані з використанням експериментально визначених вхідній і вихідній послідовностях еталона показує, що при здійсненні обернення дослідно одержаної вихідної послідовності еталона саме метод оберненої конволюції відтворює таку вхідну послідовність, що найточніше наближена до дослідно знятої вхідної послідовності еталона. Проте робота системи, реалізованої на базі нейронного контролера, навчання якого здійснювалося за допомогою оберненої конволюції виявилася неякісною (система нестійка).
Очевидно, що робота нейронного контролера буде ефективнішою, якщо при його навчанні із застосуванням розглянутих методів будуть використовуватися навчальні послідовності, які не тільки відтворюють роботу системи щодо забезпечення відповідних значень вихідної величини, але і враховують її дії, спрямовані на компенсації збурень, що виникають в реальному об'єкті.
Так, порівняння виходів еталона та об'єкта, керованого нейронним контролером, який синтезовано з врахуванням впливу збурень на об'єкт показало, що навчання контролера з використанням еталона кола збурення виявилося досить успішним (значення середньоквадратичної похибки при моделюванні системи склало , та порівняно з попередніми методами навчання нейронного контролера є менш критичне до входів навчальних послідовностей).
ВИСНОВКИ
Проведені в дисертаційній роботі дослідження дозволяють зробити такі висновки:
1. На основі аналізу динамічних режимів роботи двигунів постійного струму запропоновано їх лінеаризовані моделі в системі Simulink і встановлено, що при врахуванні дії моменту повороту руки робота, двигун описується нелінійним диференціальним рівнянням другого порядку.
2. На підставі розгляду можливостей використання методів кореневого годографа і частотних характеристик для синтезування контролера системи автоматичного керування лінеаризованим об'єктом показано, що в процесі функціонування систем автоматичного керування, виконаних на базі контролерів, синтезованих вказаними методами, не забезпечується адекватність між бажаними і реальними значеннями регульованих величин.
Оскільки застосування класичних методів лінійної теорії автоматичного керування не забезпечує адекватність динамічних характеристик еталона та системи керування, то доцільне використання динамічних нейронних мереж для ідентифікації лінійних і нелінійних динамічних об'єктів, а також побудова на їх основі контролерів для керування процесами в таких об'єктах.
З метою оптимального синтезування нейронного контролера розглянуто особливості побудови, способи математичного подання і алгоритми навчання нейронних мереж і обґрунтовано доцільність використання градієнтних методів для навчання динамічних нейронних мереж, зокрема, методу оберненого розповсюдження похибки з використанням алгоритму Левенберга - Марквардта.
5. На підставі теоретично обґрунтованої процедури визначення архітектури вхідних кіл динамічної нейронної мережі доцільно синтезувати нейронні контролери з використанням даних, які одержані при експериментальних дослідженнях динамічних об'єктів і еталонів або при дослідженні їх математичних моделей.
6. На основі результатів моделювання системи автоматичного керування з лінеаризованою моделлю об'єкта із використанням контролера, що побудований на базі динамічної нейронної мережі з розділеними входами встановлено, що такий синтезований контролер забезпечує ефективне керування процесами в моделях, як лінійних, так і нелінійних об'єктів.
СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ
1. Наконечний Ю.М. Методи навчання нейронних мереж. - // Міжвідомчий науково-технічний збірник Національного університету "Львівська політехніка" "Вимірювальна техніка та метрологія". 2002. № 61 с. 114-118
2. Наконечний Ю.М. Застосування штучних нейронних мереж в задачах ідентифікації і керування // Збірник наукових праць Української академії друкарства "Комп'ютерні технології друкарства" №9, 2002 с. 150-157.
3. Наконечний Ю.М. Використання градієнтних алгоритмів для навчання нейронних мереж // Збірник наукових праць Української академії друкарства “Комп'ютерні технології друкарства”. № 10, 2003 с. 89-98.
4. Наконечний М.В., Наконечний Ю.М. Аналіз математичної моделі двофазного керованого генератора в системі регулювання швидкістю обертання вала асинхронного двофазного двигуна // Вісник НУ “Львівська політехніка” “Автоматика, вимірювання та керування” № 475, 2003 ст. 164-170.
5. Наконечний Ю.М. Способи керування асинхронним двофазним двигуном // Вісник НУ “Львівська політехніка” “Автоматика, вимірювання та керування” № 445, 2002 ст. 114-120
6. Наконечний М.В., Наконечний Ю.М. Про можливість застосування алгоритму Левенберга-Марквардта для навчання динамічних нейронних мереж // Збірник наукових праць Української Академії друкарства “Комп'ютерні технології друкарства” №14 , 2005р. 121-127c.
7. Наконечний Ю.М. Особливості використання алгоритму оберненого розповсюдження похибки для навчання динамічних нейронних мереж // Вісник “Методи та прилади контролю якості” м. Івано-Франківськ № 15 2005р. 28-31с.
8. Наконечний М.В., Муравчук П.В., Наконечний Ю.М. Аналіз шляхів побудови нейроконтролерів для систем автоматичного керування динамічними об'єктами // Збірник наукових праць VIII Міжнародної конференції “Контроль і управління в складних системах” (КУСС-2005) м. Вінниця
Размещено на Allbest.ru
...Подобные документы
Основні властивості й функціональне призначення елементів системи автоматичного керування (САК). Принцип дії та структурна схема САК. Дослідження стійкості початкової САК. Синтез коректувального пристрою методом логарифмічних частотних характеристик.
контрольная работа [937,5 K], добавлен 19.05.2014Лінійна система автоматичного керування температурним режимом. Корекція параметрів якості, моделювання і дослідження імпульсної системи: побудова графіка усталеної похибки; розрахунок логарифмічних псевдочастотних характеристик коректуючого пристрою.
курсовая работа [396,0 K], добавлен 26.01.2011Опис роботи системи автоматичного керування (САК). Аналіз лінійної та дискретної САК. Визначення стійкості системи по критерію Гурвіца. Побудова амплітудно-фазової та логарифмічної частотної характеристики. Моделювання в програмному модулі Simulink.
курсовая работа [744,8 K], добавлен 19.11.2010Опис роботи, аналіз та синтез лінійної неперервної системи автоматичного керування. Особливості її структурної схеми, виконуваних функцій, критерії стійкості та її запаси. Аналіз дискретної системи автокерування: визначення її показників, оцінка якості.
курсовая работа [482,1 K], добавлен 19.11.2010Математичний опис лінійних неперервних систем автоматичного керування (САК). Інерційні й не інерційні САК, їх часові та частотні характеристики. Елементарні ланки та їх характеристики. Перетворення схеми математичної моделі САК до стандартного вигляду.
курсовая работа [444,8 K], добавлен 10.04.2013Визначення стійкості систем автоматичного керування за алгебраїчними критеріями методом Гурвіца та розрахунок критичного коефіцієнту підсилення замкнутої САК. Алгоритм перевірки вірності всіх обрахунків на графіках, які побудовані за допомогою ЦЕОМ.
лабораторная работа [859,6 K], добавлен 28.12.2011Функції чутливості системи за параметром адаптації. Синтез блоку адаптації, який забезпечив би відповідну корекцію коефіцієнта зворотного зв'язку з метою компенсації зміни вихідної величини. Моделювання адаптивної системи керування градієнтним методом.
контрольная работа [3,1 M], добавлен 31.03.2014Огляд математичних моделей для системи керування мобільними об'єктами. Постановка задачі керування радіокерованим візком. Розробка структури нечіткої системи керування рухом та алгоритму програмного модуля. Аналіз результатів тестування програми.
курсовая работа [903,9 K], добавлен 03.07.2014Обґрунтування вибору функціональної схеми системи підпорядкованого керування електроприводом. Призначення і склад приводу ЕТ-6. Розрахунок основних параметрів електродвигуна. Аналіз статичних характеристик. Моделювання контуру швидкості електропривода.
курсовая работа [2,3 M], добавлен 10.04.2013Поняття, цілі, завдання робастного управління. Схема замкнутої структури керування. Метод синтезу за допомогою Н-теорії, який отримав розвиток та поширення в останні десятиліття. Вирішення стандартної задачі даної теорії за допомогою "2-Ріккаті підходу".
курсовая работа [369,0 K], добавлен 25.12.2014Теорія оптимального керування; об’єкт як система, що функціонує під впливом певного фактора, здатного регулювати її еволюцію. Крайові умови задачі оптимального детермінованого керування. Числові характеристики критеріїв якості. Задачі з дискретним часом.
реферат [107,8 K], добавлен 25.11.2010Задача оптимального керування системою. Критерії якості в детермінованих дискретних задачах. Види функцій керування стохастичною системою. Еволюція стохастичної системи. Марковські та напівмарковські позиційні стратегії. Алгоритм розв’язання задачі.
реферат [130,8 K], добавлен 28.11.2010Поняття та властивості зовнішнього інтегралу. Математичні сподівання випадкової величини. Припущення монотонності. Аналіз основних задач послідовної оптимізації, що становлять практичний інтерес. Детерміноване оптимальне керування, його функції.
реферат [133,9 K], добавлен 25.11.2010Конструкція та принцип роботи холодильної камери. Структурна схема автоматизованої системи керування, її проектування на основі мікроконтролера за допомогою сучасних програмно-інструментальних засобів розробки та налагодження мікропроцесорних систем.
курсовая работа [4,5 M], добавлен 08.07.2012Автоматична система як сукупність пристроїв, що забезпечують процес керування; основні елементи: об'єкт, керуючий пристрій. Класифікація систем радіоавтоматики, математичний опис, диференціальні рівняння елементів АС, статичні і динамічні властивості.
реферат [209,4 K], добавлен 25.11.2010Структурна схема неперервної системи автоматичного керування. Визначення стійкості системи за критерієм Найквіста. Графіки перехідної характеристики скорегованої САК, її логарифмічні псевдочастотні характеристики. Визначення періоду дискретизації.
курсовая работа [1,1 M], добавлен 27.08.2012Методи діагностування мікропроцесорних систем керування у вигляді інформаційної структури. Кваліфікація оператора-діагноста, етапи процесу діагностування. Поглиблена локалізація несправності та підтвердження діагнозу. Карти симптомів несправностей.
контрольная работа [80,1 K], добавлен 03.10.2010Розробка схем розпізнавання бінарних та напівтонових зображень, електро-функціонального блоку керування, аналізатора симетричності та алгоритму блока первинного центрування з метою оптимізації пристрою керування для системи ідентифікації зображень.
курсовая работа [1,0 M], добавлен 19.01.2010Визначення перехідної функції об’єкта керування. Побудова кривої розгону об’єкта. Обчислення і побудова комплексно-частотної характеристики (КЧХ) об’єкта. Побудова КЧХ розімкнутої автоматичної системи регулювання. Запас сталості за модулем і фазою.
курсовая работа [158,4 K], добавлен 23.06.2010Розробка сенсорного вимикача з пультом дистанційного керування, призначенного для сенсорного вмикання та вимикання освітлення. Визначення основних обмежень на проектування. Підготовка схеми випромінювача коротких імпульсів. Обґрунтування конструкції.
дипломная работа [2,7 M], добавлен 28.09.2010