Нечеткий контроллер с правилами самомодификации
Использование нейросетей для управления динамическими объектами в недетерминированной среде. Реализация мягкого управления на базе топологии "Внутренний учитель", используя нечеткую логику, повышающую адаптационные свойства СУ для некритических задач.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 12.05.2017 |
Размер файла | 171,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Кубанский Государственный Технологический Университет
НЕЧЕТКИЙ КОНТРОЛЛЕР С ПРАВИЛАМИ САМОМОДИФИКАЦИИ
Ключко Владимир Игнатьевич, д.т.н., профессор
Шумков Евгений Александрович, к.т.н.
Карнизьян Роман Оганесович, аспирант
г. Краснодар, Россия
Аннотация
В статье предложена нейро-нечеткая реализация нейросетевой топологии "Внутренний учитель"
Ключевые слова: гибридная нейронечеткая сеть, нейронная сеть, обучение с подкреплением, политика самообучения, ANFIS, адаптивный критик
The article proposes the implementation of neuro-fuzzy neural network topology of "Internal Teacher"
Keywords: hybrid neural-network, neural network, reinforcement learning, ANFIS, self-learning policy, adaptive critic
Введение
В настоящее время стали популярны реализации систем управления объектами на базе топологий с подкреплением [2], в частности все большее развитие получают адаптивные критики [8,9], а также системы с различными реализациями Q - обучения [11]. При этом существует большое количество топологий на все случаи жизни, как адаптивных критиков, так и систем на базе Q - обучения, в частности приведем следующий список: DHP, GDHP, ADHPD, ADGDHP, GIFACL, FACL, Q - Хемминг, Dyna - Q, Q - Kohonen network, CMLP, HQ и т.д.[6, 8,9,10,11,12]. Каждая из топологий имеет свою область применения и нет ни одной универсальной [2,6]. Также у каждой топологии имеется свои достоинства и недостатки. Одной из попыток создать универсальную топологию для создания систем управления на основе обучения с подкреплением, является разработка нейросетевой топологии "Внутренний учитель" [2,3,6]. Рассмотрим дальнейшее развитие данной топологии.
Классическая топология "Внутренний учитель"
Для топологии "Внутренний учитель" используются две основные компоненты - Решатель и Учитель. Подобную функциональную схему можно найти еще в работе 1971 года [1]. Предложенная в [3] топология "Внутренний учитель" состоит из нескольких структурных компонент (см. Рисунок 1). Управляющая компонента системы - "Решатель". Она получает вектор состояния объекта и среды и формирует на выходе управляющий вектор. Вектор состояния среды формируется сенсорной компонентой. Вектор управляющего воздействия отрабатывает моторная компонента. Наиболее важная часть системы - "Учитель", компонента обучения. Компонента обучения оценивает состояние среды на предмет изменения характера воздействия на объект, и если это имеет место быть, то Учитель вмешивается в управление, перенастраивая правила управления или же вообще изменяя их. При этом Учитель в режиме первоначального обучения формирует специального вида управляющие воздействия, позволяющие быстро и полно изучить среду. Таким способом система управления (далее СУ) на базе данной топологии меняет стратегию управления. На вход Учитель получает данные обратной связи от внешней среды и историю управления объекта управления.
В качестве компоненты обратной связи используется коэффициент эффективности (далее КЭ По сути - модифицированное подкрепление.):
,
где i - номер кванта времени (итерации, одного законченного цикла управления), для которого вычисляется коэффициент; - безразмерный показатель полезной деятельности, произведенной объектом; - безразмерный показатель затраченных ресурсов.
КЭ записан в обобщенном виде и вычисляется по вектору состояния среды и состояния объекта управления. Для использования описываемой топологии в конкретных применениях КЭ должен записываться в частном виде. КЭ обрабатывается и вычисляется в компоненте обратной связи (БКЭ - блок коэффициента эффективности на Рисунке 1).
СУ должна максимизировать коэффициент эффективности, реализуя цели управления. КЭ используется для выявления изменения стратегии поведения улучшившего или ухудшившего общую оценку работы. КЭ является основным источником информации для построения эффективной схемы самообучения. При этом КЭ вычисляется на основе обработки сведений о внешней среде, объекте, и о характере взаимодействия объекта со средой.
Также для СУ на базе "Внутреннего учителя" вводятся адаптационные параметры - АП (один или несколько), регулируя которые можно добиться изменения работы Решателя. АП либо непосредственно входят в вектор подаваемый на вход Решателя, либо влияют на изменение обучающей выборки для Решателя.
В общем случае количество правил самообучения Учителя определяется по формуле:
где - глубина временного погружения по КЭ и - глубина временного погружения по АП, то есть за сколько предыдущих временных итераций учитывать КЭ и АП.
Правила самообучения Обычно трактуются, как "политика самообучения" (англ. self-modifying policies - SMP). учителя изменяют адаптационные параметры и сформулированы следующим образом:
· если снизилось значение КЭ, то изменяем АП в противоположном направлении от предыдущих изменений;
· если значение КЭ выросло, то продолжаем изменять АП в направлении от предыдущих изменений;
· если значение не изменилось, то в зависимости от КЭ, либо оставляем текущие правила (если КЭ устраивает), либо хаотически изменяем применяемое правило.
Рисунок 1. Топология "Внутренний учитель"
Подробно со стандартной топологии "Внутренний учитель" ознакомится в работах [2,6], а также в патенте РФ G 06 F 9/00 № 2266558.
Нейро-нечеткая топология "Внутренний учитель"
Предложим нейро-нечеткую реализацию компоненты Учитель. Пусть характеристики работы системы - коэффициент эффективности и адаптационный параметр рассматриваются, как нечеткие переменные с лингвистическими значениями: снизился, не_изменился и увеличился Ничто не мешает увеличить количество лингвистических значений, например, использовать такие: сильно снизился, снизился, не изменился, увеличился, сильно увеличился.. Тогда нечеткие правила работы Учителя будут следующими (для и ):
ЕСЛИ = снизился И = снизился И = снизился, ТО = увеличить
ЕСЛИ = снизился И = не изменился И = снизился, ТО = увеличить
ЕСЛИ = снизился И = увеличился И = снизился, ТО = снизить
и т.д. (в данном случае 27 правил).
Функции формы для правил можно задавать несколькими способами, но предпочтительней использовать трапециевидную или гауссовую функции принадлежности.
Пусть и . Входными переменными будут значения , и . Выходом компоненты Учитель будет переменная .
Обозначим через - - функцию формы для выражения = снизился, - для = снизился, - для = снизился. Аналогично введем функцию : для = не изменился, для = не изменился и для = не изменился. Также введем функцию : для = увеличился, для = увеличился и для = увеличился.
Для выхода введем функции = снизился, = не изменился, = увеличился. Система нечеткого вывода по Цукамото будет следующая. Для четких значений , и определим релевантность правил :
….
Выходы по каждому правил определяются с помощью обратных функций принадлежности правых частей правил:
…
Тогда общий выход системы нечетких правил будет
Реализуем приведенные правила самообучения Учителя с помощью нейро - нечеткой топологии ANFIS [7]. Схема приведена на Рисунке 2.
Слой 1 предназначен для вычисления степени на узлах, с которыми заданные входы удовлетворяют функциям принадлежности, ассоциированных с этими узлами.
Слой 2 предназначен для вычисления силы правил для каждого узла. При этом выход верхнего нейрона равен , второго сверху и т.д. Все узлы обозначены как , так как можно выбрать любую -норму для моделирования логического И [7].
Слой 3 предназначен для нормализации силы правил:
Рисунок 2. Учитель на базе ANFIS
Слой 4 вычисляет произведение нормализованной силы правил и индивидуального выхода соответствующего правила:
…..
Слой 5 вычисляет выход сети (на единственном нейроне):
Следующим шагом является обучение созданной сети. Дл обучения гибридной сети ANFIS используют алгоритм обратного распространения ошибки [7]. Обычно число правил жестко задается сверху. Пусть будет правил и будем использовать нечеткий вывод по Цукамото (Tsukamoto). При этом обучение разбивается на следующие этапы:
1. назначить начальные значения весов и параметров;
2. на вход ANFIS подать входные сигналы из обучающей выборки. При этом выбирается случайным образом;
3. рассчитать выходные значения во всех слоях;
4. рассчитать ошибку на выходе ANFIS как
(после некоторого числа итераций необходимо считать также ошибку по пакетному способу и если ошибка меньше заданной, то остановить обучение);
5. модифицировать параметры функций формы по формулам:
для выходных переменных
и т.д.
Для обучения можно использовать также алгоритм RProp [4].
Заключение
нейросеть управление топология логика
Таким образом, используя нечеткую логику можно реализовать мягкое (нечеткое) управление на базе топологии "Внутренний учитель". Использование нечеткой логики в данном случае позволяет для некритических задач повысить адаптационные свойства СУ. Предложенная топология сочетает в себе преимущества, как нейронных, так и нечетких систем. Возможность использования нечеткой логики в топологии "Внутренний учитель" также говорит об универсальности топологии.
Литература
1. Мкртчян С.О. Нейроны и нейронные сети. - М.: Энергия, 1971. - 232 с.
2. Стасевич В.П. Анализ и адаптивное управление в недетерминированных средах на основе самообучения. 2007. 170 с.
3. Стасевич В.П., Воротников С.А. Использование нейросетевых структур для управления динамическими объектами в недетерминированной среде // Экстремальная робототехника: Материалы XII Научно-технической конференции. - Санкт-Петербург: СПбГТУ, 2002.
4. Хайкин С. Нейронные сети: полный курс. 2-е изд.: Пер. с. англ. - М.: Издательский дом "Вильямс", 2006 - 1104 с.
5. Шумков Е.А. Обучение и самообучение в адаптивных системах управления / Е.А. Шумков, В.П. Стасевич, В.Н. Зуева / / Известия вузов Северо-Кавказский регион. Технические науки. Новочеркасск, 2006. - №2. - с. 84 - 86.
6. Шумков Е.А. Система поддержки принятия решений предприятия на основе нейросетевых технологий. 2004. 158 с.
7. Ярушкина Н.Г. Основы теории нечетких и гибридных систем: Учеб. Пособие. - М.: Финансы и статистика. 2004. 320 с.
8. Balakrishnan S.N. and Biega V. "Adaptive Critic Based Neural Networks for Control," in Proc. Am. Contr. Conf., Seattle, WA, June 1995, pp. 335-339.
9. Prokhorov D., Wanch D. Adaptive critic designs. IEEE transactions on Neural Networks, September 1997, pp. 997-1007.
10. Sutton R.S., Reinforcement Learning. Boston: MA: Kluwer Academic, 1996.
11. Watkins C., Dayan P. Q - learning. // Machine Learning, vol. 8, pp. 279 - 292. 1992.
12. Wiering M, Schmidhuber J. HQ - learning. Adaptive behavior, 6(2):219 - 246, 1998.
Размещено на Allbest.ru
...Подобные документы
Разработка программы управления однофазным однополупериодным выпрямителем в среде LabVIAW и AVRstudio. Контроллер как средство измерения и управления схемой, применение компьютера в качестве управляющего устройства для расчета параметров и индикации.
курсовая работа [295,6 K], добавлен 09.06.2013Синтез и реализация процедур управления объектами как главная идея интеллектуального управления. Основные определения, степени интеллектуальности. Свойства интеллектуальных систем управления (ИСУ) с "интеллектуальностью в целом", принципы их организации.
презентация [51,8 K], добавлен 25.06.2013Проект автоматизации системы энергосбережения на базе концепции Smart Grid. Анализ объекта управления, выбор оборудования. Реализация человеко-машинного интерфейса: центральный сервер, автоматизированные рабочие места, контроллеры активно-адаптивной сети.
курсовая работа [1,0 M], добавлен 02.10.2013Проект программы, имитирующей автоматизированную систему управления светофором. Установка QNX 6.5 на виртуальную машину, ее графические возможности. Описание виджетов приложения; разработка GUI. Алгоритм функционирования программы контроллера управления.
курсовая работа [823,2 K], добавлен 24.05.2015Разработка программы в STEP7, которая реализует логику работы объекта управления, согласно заданному варианту. Графический дизайнер WinCC. Катушки установки и сброса. Программный интерфейс Message Passing Interface. Добавление тегов и значений в WinCC.
курсовая работа [1,3 M], добавлен 10.01.2015Устройство и назначение однокристальных микроконтроллеров, сферы их применения. Разработка контроллера для управления домашней метеостанцией: расчет принципиальной схемы и характеристика ее элементов, выбор датчиков. Описание программы управления.
курсовая работа [280,3 K], добавлен 28.12.2012Изучение вопросов, связанных с проектированием и эксплуатацией автоматизированных систем управления технологическими объектами. Разработка оптимального управления технологическим объектом управления - парогенератором. Выбор закона регулирования.
курсовая работа [5,2 M], добавлен 18.01.2015Устройство и назначение однокристальных микроконтроллеров, сферы их применения. Разработка контроллера для управления роботизированной платформой, ориентированной на движение по напольной линии. Расчет функциональной и принципиальной схемы управления.
курсовая работа [540,6 K], добавлен 28.12.2012Синтез и анализ систем автоматического управления (САУ) техническими объектами на базе современных методов и с помощью вычислительной техники. Система модального управления электроприводом постоянного тока. Основные элементы САУ и расчет их параметров.
курсовая работа [1,9 M], добавлен 25.10.2012Использование нечеткой логики при управлении техническими объектами, основанными на имитации действия человека-оператора при помощи ЭВМ, в соединении с пропорционально-интегрально-дифференциальным регулированием и алгоритмах управления процессом флотации.
доклад [74,7 K], добавлен 21.12.2009Анализ современного состояния систем автоматизации управления данными; учет инфраструктуры информационной системы и требования к ресурсам организации. Разработка системы управления данными на базе SharePoint-сайта, программная реализация и внедрение.
диссертация [4,1 M], добавлен 10.11.2011Основные понятия экономической информатики. Информационная система, ее роль и место в системе управления. Формирование решений с помощью нейросетей. Создание информационных систем с учетом стандартов их жизненного цикла. Электронный документооборот.
шпаргалка [206,4 K], добавлен 10.11.2010Рассмотрение основных принципов и методов проектирования систем реального времени. Описание конструктивных и функциональных особенностей объекта управления, построение диаграммы задач. Выбор аппаратной архитектуры, модели процессов-потоков, интерфейса.
курсовая работа [1,2 M], добавлен 19.01.2015Общая характеристика гидроэлектростанций Республики Беларусь. Разработка автоматизированной системы управления каскадом малых и микро гидроэлектростанций. Программирование логического контроллера датчиков температуры и оборотов турбин электростанции.
дипломная работа [4,1 M], добавлен 14.07.2014Реализация концепции геопространственных информационных технологий, в рамках которой программист создает приложения, используя стандартные языки программирования. Применение ГИС для эффективного контроля за территориально-распределенными объектами.
реферат [2,4 M], добавлен 12.01.2015Контроллер управления двигателями. Назначение, краткая характеристика, перспективы внедрения робота-дозиметриста. Обзор основных способов беспроводной передачи данных на большие расстояния. Проектирование принципиальной схемы бортового контроллера.
дипломная работа [2,4 M], добавлен 05.01.2013Применение, функции и элементы контроллеров. Функциональная структура системы управления движением поездов. Этапы проектирования контроллера для модели железной дороги на основе микропроцессора. Реализация машинной модели, блок-схема и листинг программы.
курсовая работа [744,6 K], добавлен 08.11.2009Система управления базами данных задач и составляющих их процессов предприятия. Требования к информационной системе. Состав запросов к базе данных. Связи и отношения между информационными объектами. Алгоритмы работы и архитектура информационной системы.
курсовая работа [727,5 K], добавлен 02.02.2014Идентификация моделей каналов преобразования координатных воздействий объекта управления. Реализация моделей на ЦВМ и их адекватность. Формулирование задач управления, требований к их решению и выбор основных принципов построения автоматических систем.
курсовая работа [1,4 M], добавлен 10.04.2013Программа поиска в базе данных в среде Borland Delphi 7.0 Enterprise. Условия и блок-схемы задач. Ввод массива. Текст программ в Delphi, в Паскаль. Текст программы поиска в базе данных. Кодирование материала. Изготовление реляционной базы данных.
практическая работа [27,6 K], добавлен 11.10.2008