Разработка алгоритмов параметрического синтеза нейро-нечетких регуляторов на базе аппарата теории интеллектуальных систем

Интеллектуальные системы управления на основе нечеткой логики. Алгоритмы параметрического синтеза нейро-нечетких регуляторов на базе аппарата теории интеллектуальных систем. Проектирование нечетких регуляторов на основе искусственных нейронных сетей.

Рубрика Производство и технологии
Вид дипломная работа
Язык русский
Дата добавления 26.05.2018
Размер файла 3,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Применение нечёткой логики для подстройки коэффициентов ПИД- регулятора

Настройка ПИД-регулятора по формулам обычно не является оптимальной и может быть улучшена с помощью дальнейшей подстройки. Подстройка может быть выполнена оператором на основании эвристических правил или автоматически, с помощью блока нечёткой логики (рис.1.25). Блок нечёткой логики (фаззи-блок) использует базу правил и методы нечёткого вывода. Фаззи-подстройка позволяет уменьшить перерегулирование, снизить время установления и повысить робастность ПИД-регулятора [11].

Рис.1.25 Структура ПИД-регулятора с блоком автонастройки на основе нечёткой логики

Процесс автонастройки регулятора с помощью блока нечёткой логики начинается с поиска начальных приближений коэффициентов регулятора K, Ti, Td. Обычно это делается методом Зиглера-Никольса, исходя из периода собственных колебаний в замкнутой системе и петлевого усиления. Далее формулируется критериальная функция, не обходимая для поиска оптимальных значений параметров настройки методами оптимизации.

В процессе настройки регулятора используется несколько шагов [20]. Сначала выбираются диапазоны входных и выходных сигналов тюнера (блока автонастройки), форма функций принадлежности искомых параметров, правила нечёткого вывода, механизм логического вывода, метод дефаззификации и диапазоны масштабных множителей, необходимых для пересчёта чётких переменных в нечёткие.

Поиск параметров регулятора выполняется методами оптимизации. Для этого выбирается целевая функция как интеграл от суммы квадратов ошибки регулирования и времени установления. В критерий минимизации иногда добавляют скорость нарастания выходной переменной объекта.

В качестве искомых параметров (параметров, которые надо найти) выбирают положение максимумов функций принадлежности и масштабные коэффициенты на входе и выходе фаззи-блока. К задаче оптимизации добавляют ограничения на диапазон изменения позиции функций принадлежности. Оптимизация критериальной функции может быть выполнена, например, с помощью генетических алгоритмов.

Следует отметить, что в случаях, когда информации достаточно для получения точной математической модели объекта, традиционный регулятор всегда будет лучше нечёткого потому, что при синтезе нечёткого регулятора исходные данные заданы приближённо.

Искусственные нейронные сети в ПИД-регуляторах

Нейронные сети, как и нечёткая логика, используются в ПИД-регуляторах двумя путями: для построения самого регулятора и для построения блока настройки его коэффициентов. Особенностью нейронной сети является способность к «обучению», что позволяет передать нейронной сети опыт эксперта. Регулятор с нейронной сетью похож на регулятор с табличным управлением, однако отличается специальными методами настройки («обучения»), разработанными для нейронных сетей, и методами интерполяции данных.

В отличие от нечёткого регулятора, где эксперт должен сформулировать правила настройки в лингвистических переменных, при использовании нейронной сети от эксперта не требуется формулировки правил - достаточно, чтобы он несколько раз сам настроил регулятор в процессе «обучения» нейронной сети.

Нейронные сети были предложены в 1943 году Мак-Каллоком и Питтсом как результат изучения нервной деятельности и биологических нейронов. Искусственный нейрон представляет собой функциональный блок с одним выходом y и n входами x1, x2,…xn, который реализует в общем случае нелинейное преобразование

,

где wi - весовые коэффициенты (параметры) при входных переменных xi; b - постоянное смещение; F(*) - функция активации нейрона. Функция активации может иметь, например, такой вид: F(z) = 1/(1 + exp(-az)) - сигмоидальная функция с некоторым параметром a. Нейронная сеть (рис.1.26) состоит из множества связанных между собой нейронов, количество связей может составлять тысячи. Благодаря нелинейности функций активации и большому количеству настраиваемых коэффициентов нейронная сеть может выполнять достаточно точно нелинейное отображение множества входных сигналов во множество выходных.

Рис. 1.26 Структура нейронной сети в блоке автонастройки

Типовая структура системы автоматического регулирования с ПИД-регулятором и нейронной сетью в качестве блока автонастройки показана на рис.1.27 [3,18]. Нейронная сеть NN в данной структуре играет роль функционального преобразователя, который для каждого набора сигналов r, e, u, y вырабатывает коэффициенты ПИД-регулятора K, Ti, Td.

Рис.1.27. Структура ПИД-регулятора с блоком автонастройки на основе нейронной сети NN

Самой сложной частью в проектировании регуляторов с нейронной сетью является процедура «обучения» сети. «Обучение» заключается в идентификации неизвестных параметров нейронов wi, b и a. Для «обучения» нейронной сети обычно используют методы градиентного поиска минимума критериальной функции е = (u*-u)2, зависящей от параметров нейронов. Процесс поиска является итерационным, на каждой итерации находят все коэффициенты сети, сначала для выходного слоя нейронов, затем предыдущего и так до первого слоя (метод обратного распространения ошибки) [3,18]. Используются также другие методы поиска минимума, в том числе генетические алгоритмы, метод моделирования отжига, метод наименьших квадратов.

Процесс «обучения» нейронной сети выглядит следующим образом (рис.1.28). Эксперту предоставляют возможность подстраивать параметры регулятора K, Ti, Td в замкнутой системе автоматического регулирования при различных входных воздействиях r(t). Предполагается, что эксперт умеет это делать с достаточным для практики качеством. Временные диаграммы (осциллограммы) переменных r*, e*, u*, y*, полученные в подстраиваемой экспертом системе (рис.1.28а), записываются в архив и затем подаются на нейронную сеть, подключённую к ПИД-регулятору (рис.1.28 б). Нейронная сеть настраивается таким образом, чтобы минимизировать погрешность е = (u*- u)2 между сигналом u*, полученным с участием эксперта, и сигналом u, полученным в процессе «обучения» нейронной сети. После выполнения процедуры «обучения» параметры нейронной сети заносятся в блок автонастройки. В соответствии с теорией нейронных сетей «обученная» нейронная сеть должна вести себя так же, как и эксперт, причём даже при тех входных воздействиях, которые не были включены в набор сигналов, использованных при «обучении».

Рис.1.28 Схема «обучения» нейронной сети в блоке автонастройки:

а - система управления, подстраиваемая экспертом; б - нейронная сеть, «обучаемая» с помощью сигналов, которые получены в представленной на рис.1.28 а системе

Длительность процесса «обучения» является основной преградой на пути широкого использования методов нейронных сетей в ПИД-регуляторах [12]. Другими недостатками нейронных сетей являются невозможность предсказания погрешности регулирования для воздействий, которые не входили в набор обучающих сигналов, а также отсутствие критериев выбора количества нейронов в сети, длительности «обучения», диапазона и количества обучающих воздействий. Ни в одной из публикаций не исследовалась робастность или запас устойчивости регулятора.

Генетические алгоритмы

Генетические алгоритмы являются мощным методом оптимизации, позволяющим найти глобальный оптимум быстрее, чем другие методы случайного поиска. Существенным их достоинством является отсутствие проблем со сходимостью и устойчивостью. Эти методы используются для идентификации моделей объектов управления, для поиска оптимальных параметров регулятора, для поиска оптимальных положений функций принадлежности в фаззи-регуляторах и для «обучения» нейронных сетей. Чаще всего генетические алгоритмы используются совместно с нейронными сетями и регуляторами с нечёткой логикой.

Недостатком генетических алгоритмов является большое время поиска экстремума, что не позволяет их использовать в быстродействующих системах реального времени.

Генетические алгоритмы основаны на принципах естественного отбора, сформулированных Дарвиным в 1859 году. Идею генетических алгоритмов применительно к решению математических задач сформулировал Дж. Холланд в 1962 году. В генетических алгоритмах используются понятия генов, хромосом, скрещивания, мутация, селекции, репродукции. Основной идеей генетических алгоритмов является прямое подобие принципу естественного отбора, когда выживают наиболее приспособленные особи.

Для применения генетических алгоритмов необходимо преобразовать переменные, фигурирующие в условии задачи, в генетические переменные. Такое преобразование задаётся схемой кодирования. Переменные могут быть представлены в двоичной форме, в форме действительных десятичных чисел или в другой форме, в зависимости от смысла решаемой задачи.

Классический генетический алгоритм состоит из следующих шагов [3,18].

1. Выбор исходной популяции хромосом размера N.

2. Оценка приспособленности хромосом в популяции.

3. Проверка условия остановки алгоритма.

4. Селекция хромосом.

5. Применение генетических операторов.

6. Формирование новой популяции.

7. Переход к пункту 2.

Для работы алгоритма нужно задать нижнюю и верхнюю границы изменения искомых параметров, вероятность скрещивания, вероятность мутации, размер популяции и максимальное количество поколений.

Исходная популяция хромосом генерируется случайным образом. Приспособленность хромосом оценивается с помощью целевой функции в кодированной форме. Далее хромосомы с лучшей приспособленностью собираются в группу, в пределах которой выполняются генетические операции скрещивания или мутации. Скрещивание позволяет получить от двух родителей перспективного потомка. Оператор мутации вносит изменения в хромосомы. В случае двоичного кодирования мутация состоит в изменении случайного бита в двоичном слове.

Пример кодирования трёх коэффициентов ПИД-регулятора для применения в генетических алгоритмах приведён на рис.1.28 [20,21]. Здесь хромосома состоит из трёх параметров общей длиной 48 бит. Операция скрещивания состоит в обмене генетическим материалом между хромосомами (родителями) для того, чтобы получить новую хромосому (потомка). Существует много различных форм операторов скрещивания. Один из них состоит в том, что в двух родительских хромосомах случайным образом выбирается некоторая позиция (рис.1.30), затем происходит обмен генетической информацией, расположенной справа от выбранной позиции [21]. После выполнения генетического алгоритма производят декодирование генетического представления результата в инженерные величины.

Рис.1.29 Пример кодирования коэффициентов регулятора для использования в генетическом алгоритме

Рис.1.30 Пример операции скрещивания

Оценка приспособленности хромосом в популяции для оценки коэффициентов ПИД-регулятора может быть выбрана, к примеру, как

,

где e(t) - текущее значение ошибки регулирования, t - время [20, 213]. Селекция хромосом осуществляется методом рулетки. На колесе рулетки имеются секторы, причём ширина сектора пропорциональна функции приспособленности. Поэтому чем больше значение этой функции, тем более вероятен отбор соответствующей ей хромосомы.

В работе [22] генетические алгоритмы используются как для идентификации объекта управления, так и для настройки параметров ПИД-регулятора. В обоих случаях схема применения алгоритма одинакова: составляется критериальная функция, зависящая в первом случае от параметров объекта управления, во втором - от параметров ПИД-регулятора K, Td, Ti. Далее с помощью генетического алгоритма отыскивается глобальный минимум функции, координатами которого являются искомые параметры объекта или ПИД-регулятора.

В работе [23] поиск оптимальных параметров ПИД-регулятора выполнялся генетическим алгоритмом со следующими параметрами: размер популяции - 20, максимальное количество поколений - 100, вероятность скрещивания - 0,9, вероятность мутации - 0,1, диапазон изменения параметров 0…40.

Таким образом, если объект управления нелинеен, сложен и не может быть идентифицирован, но имеются эвристические правила или опыт ручного управления таким объектом, то решить задачу управления можно с помощью фаззи- или нейросетевого регулятора. Для поиска оптимальных значений параметров ПИД-регуляторов и идентификации объектов управления с успехом используются генетические алгоритмы.

1.3 Процедура синтеза нечетких регуляторов

Обобщенная процедура синтеза нечетких алгоритмов управления может быть сформулирована следующим образом:

1. Определяется множество целей, которые ставятся перед системой. (Какие конечные результаты преследует создание системы?)

2. Уточняются множества входных и выходных переменных регулятора. (Какие координаты объекта должны наблюдаться и какие управляющие воздействия должны изменяться, для того чтобы достичь поставленных целей?)

3. Перечисляются возможные ситуации в работе системы. (Как должны выбираться лингвистические переменные и какие значения (термы) они могут принимать?)

4. Формируется база правил. (Какой набор правил отражает желаемые изменения состояния системы?)

5. Производится выбор методов фаззификации.

6. Конкретизируются механизм вывода и методы дефаззификации. (По каким зависимостям входы нечеткого регулятора должны преобразовываться в его управляющие воздействия ?).

Рассмотрим особенности применения данной процедуры на следующем примере, представляющем прежде всего методический интерес. Пусть структурная схема ИСУ соответствует рис.1.1, т. е. нечеткий регулятор используется для непосредственного (прямого) управления объектом. Тогда:

1. Цель синтеза - создание “хорошего” регулятора, обеспечивающего малое перерегулирование, высокое быстродействие и слабую колебательность (т. е. быстрое затухание) переходных процессов.

2. Входные величины регулятора - сигнал ошибки e=r-y и сигнал ее производной ce=de(t)/dt, выход - управляющее воздействие u.

3. Для того чтобы выработать стратегию управления, обратимся к рис.1.31, на котором показан график переходной функции системы y(t), т. е. ее реакции на единичное ступенчатое воздействие r(t).

Рис.1.31 График переходной функции системы

Разобъем график y(t) на следующие характерные участки: I - “Начало переходного процесса”: ошибка еК велика, скачок скорости ее изменения сеK; резко увеличить управляющее воздействие дuk-uk-1; II - “Продолжать движение”: ошибка еК велика, но убывает; поддерживать управление uk на прежнем уровне или слегка уменьшить; III , V, VII - “Достигли уровня уставки”: ошибка еK около нуля, скорость ее изменения достаточно мала; сохранить управление uk; IV ,VI - “Достигли локального максимума (минимума)”: ошибка еK невелика, скорость ее изменения сеK около нуля; незначительно уменьшить (или увеличить) uk; VIII - “Достигли установившегося состояния”: ошибка еK и скорость ее изменения сеK около нуля; сохранить управление uk.

Здесь еK, сеK и uk - значения сигнала ошибки, скорости ее изменения и управляющего воздействия в к-й момент времени tk (к=0,1,2,...); дuk=uk - uk-1.

4. Введем следующие обозначения: LP - “большое положительное” (large positive); SP - “малое положительное” (small positive); Z - “около нуля” (zero); SN - “малое отрицательное”(small negative); LN - “большое отрицательное”(large negative);

Тогда правила формирования сигнала управления можно записать в следующем виде (см. соответствующие пояснения на рис.1.31):

ПРАВИЛО I: “ЕСЛИ (еk= LP и сеk= LP), ТО дuk= LP”;

ПРАВИЛО II: “ЕСЛИ (еk= LP и сеk= LN), ТО дuk= Z”;

ИЛИ “ЕСЛИ (ек= SP и сеk= LN), ТО дuk= SN”;

ПРАВИЛО III: “ЕСЛИ (еk= Z и сеk= SN), ТО дuk= Z”;

ПРАВИЛО IV: “ЕСЛИ (еk= SN и сеk= Z), ТО дuk= SN”;

ПРАВИЛО V: “ЕСЛИ (еk= Z и сеk= SP), ТО дuk= Z”;

ПРАВИЛО VI: “ЕСЛИ (еk= SP и сеk= Z), ТО дuk= SP”;

ПРАВИЛО VIII: “ЕСЛИ (еk= Z и сеk= Z), ТО дuk = Z”.

(Правило VII отсутствует в данном перечне, т.к. номер правила здесь совпадает с номером участка кривой переходного процесса на рис.1.31, а лингвистические переменные е, се и дu на участке VII принимают те же значения, что и на участке III).

Как видно, приведенный алгоритм управления представляет собой нечеткий, “расписанный по шагам” вариант реализации ПИД - алгоритма.

Для рассматриваемого случая, когда нечеткий регулятор имеет 2 входа и 1 выход, удобно представить данный алгоритм управления с помощью так называемой таблицы решений (decision table) (табл.1.1).

Таблица 1.1

Данная таблица заполняется следующим образом. На пересечении i-й строки и j-го столбца записывается требуемое значение выходной переменной дuk, соответствующее i-му значению (терму) еk и j-му значению сеk.

Анализ полученной таблицы решений показывает, что предложенный выше набор правил I ч VIII не является функционально полным (таблица содержит большое число пустых клеток). Для заполнения недостающих клеток необходимо проанализировать большое число ситуаций управления. Например, возможен “инвертированный” вариант реализации Правила II:

“ЕСЛИ (еk= LN и сеk= LP), ТО дuk= Z” ИЛИ

“ЕСЛИ (еk= SN и сеk= LP), ТО дuk= SP”,

что позволяет внести в таблицу решений 2 дополнительных элемента (обведены в табл.1.1 пунктирными окружностями).

Очевидно, что увеличение размерности таблицы решений приводит не только к определенным трудностям с точки зрения пополнения (доопределения) системы правил принятия решений, но и связано с возрастанием вычислительных затрат при работе регулятора. Поэтому на практике рекомендуется принимать число значений (уровней квантования) каждой лингвистической переменной равным 3 ч7.

5. Как уже отмечалось, выбор функций принадлежности во многом остается предметом интуиции и опыта разработчика. Вместе с тем определенные рекомендации относительно решения данной задачи можно найти в [3,4,14].

Существуют стандартные формы задания функций принадлежности (рис.1.32): треугольная (а), трапецеидальная (б), S - типа, или функция “фильтра”(в), Z - типа (г), колоколообразная (д). Для того чтобы выбрать, например, функцию принадлежности, приведенную на рис.1.32, а, достаточно задать 2 ее параметра - центральную точку х* (“прототип” соответствующего нечеткого множества) и ширину 2Д перехода от принадлежности этому множеству к непринадлежности ему (т.е., по существу, меру “нечеткости” значения х=х*). И хотя зачастую это бывает непросто сделать (существует даже специальное понятие “сверхнечеткие множества” - “ultrafuzzy sets”, когда положение самой функции принадлежности является нечетким и ее границы ±Д определяются с помощью дополнительно вводимых лингвистических переменных [2,4]), опытный эксперт так или иначе всегда может выбрать искомые параметры в соответствии со своими представлениями о решаемой задаче.

Рис.1.32 Формы функций принадлежности

Для рассматриваемого здесь примера синтеза нечеткого регулятора можно принять следующую форму функций принадлежности (рис.1.33).

По оси абсцисс в данном случае откладываются нормализованные значения переменных , полученные путем деления е, се и дu на соответствующие максимальные значения

Рис.1.33 Функции принадлежности лингвистических переменных

60. В качестве механизма вывода обычно используется метод Максимума - Минимума или метод Максимума - Произведения. В общем случае первый из этих методов осуществляет переход от условных лингвистических правил вида «ЕСЛИ , ТО (ЕСЛИ , ТО )» к функции принадлежности переменной z i-му подмножеству Сi:

Если используется набор из n нечетких правил, то результирующая функция принадлежности выхода µ(z) находится путем объединения n нечетких подмножеств Сi:

По форме полученной функции принадлежности выхода при этом можно оценить качество сформулированных правил управления. Так, функция принадлежности вида 1 (рис.1.34) указывает на наличие одного доминирующего правила управления. Функция принадлежности 2 указывает, что имеются, по крайней мере, два противоречивых правила. Функция принадлежности 3 указывает, что не имеется подходящих правил для вычисления управления дu (т.е. недостает каких-то правил).

Рис.1.34 Оценка качества правил управления

Для дефаззификации чаще всего используется метод центра тяжести. Однако, вычисляя положение центра тяжести (дu)0 для полученного графика функции принадлежности µ(дu), следует учитывать факт пересечения носителей нечетких подмножеств дu. Поэтому каждый раз в процессе дефаззификации приходится пересчитывать значение управляющего воздействия (дu)0, что приводит к увеличению времени на вычисления.

Процедура дефаззификации существенно упрощается, если значения выходной лингвистической переменной дu заданы с помощью нескольких одноточечных нечетких подмножеств (singletons), например, как это сделано на рис.1.35, а.

Допустим, что полученная на основе механизма вывода функция принадлежности µ(дu) принимает вид (рис.1.35, б), где высоты отдельных подмножеств (линий) определяются уровнями активизации соответствующих правил управления (уровнями выполнения условий “ЕСЛИ” этих правил). Тогда вычисление координаты центра тяжести (дu)0 производится по формуле)

,

где µBi(дu) - функции принадлежности одному из одноточечных нечетких подмножеств Bi (т.е. LN, SN, Z, SP, LP); дui - числа-носители этих подмножеств. Для рассматриваемого на рис.1.35, б случая имеем

.

Рис.1.35 Процедура дефаззификации для одноточечных нечетких подмножеств

Эксперименты показывают, что полученные нечеткие системы, даже при сделанных выше упрощениях, являются робастными (т.е. мало чувствительными к различного рода возмущениям) и что эти упрощения не оказывают существенного влияния на качество результатов.

ГЛАВА II. АЛГОРИТМЫ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА НЕЙРО-НЕЧЕТКИХ РЕГУЛЯТОРОВ НА БАЗЕ АППАРАТА ТЕОРИИ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ

2.1 Проектирование нечетких регуляторов на основе искусственных нейронных сетей

Как уже отмечалось, главное преимущество нечетких регуляторов - возможность управления сложными объектами с плохо изученной динамикой на основе методов, базирующихся на знаниях. Идея нечеткого управления при этом сводится к моделированию поведения человека - эксперта, способного управлять объектом, не зная его математической модели. Эксперт формулирует свои действия по управлению в виде некоторых лингвистических правил, представляемых затем с помощью аппарата нечеткой логики. Однако сам переход от лингвистических правил к их количественному представлению является недостаточно формализованным и зависит, в частности, от произвольного выбора формы функций принадлежности. Поскольку качество нечеткого регулятора существенно зависит от изменения формы функций принадлежности, то необходима оптимизация (подстройка) параметров этих функций.

Новые возможности для решения этой проблемы открываются в связи с применением искусственных нейронных сетей (artificial neural networks). Объединение нечетких и нейронных сетей позволяет создать качественно новый класс регуляторов, называемых нейро-нечеткими (neuro-fuzzy) или нечетко-нейронными (fuzzy-neuro) и играющих все более заметную роль в интеллектуальном управлении [5]. Эти регуляторы сочетают указанные выше достоинства нечетких алгоритмов с положительными качествами нейронных сетей (универсальность, высокое быстродействие, способность к обучению, устойчивость к отказам). Некоторые из дополнительных функций, реализуемых в ИСУ с помощью нейронных сетей, уже рассматривались в 4.1.3.

Поскольку вопросы проектирования нейронных сетей (НС) представляют собой самостоятельный интерес, ограничимся лишь самыми первыми (элементарными) сведениями, дающими представление о данном классе моделей (более подробную информацию по НС можно найти, например, в [27-30]. Первоначально НС предполагалось использовать для моделирования деятельности человеческого мозга. Сегодня они получили широкое применение в технике - для решения задач распознавания образов, прогнозирования, оптимизации, обработки сигналов при наличии больших шумов, управления в реальном времени.

Существует несколько типов НС, которые могут использоваться в системах управления. На рис. 4.16 приведена распространенная структурная схема НС, предложенная еще в 1958 г. нейробиологом из Корнеллского университета (США) Ф. Розенблаттом и получившая название многослойного персептрона (multilayer perceptron). (Кстати, и здесь не обошлось без пессимистов: известный математик и кибернетик Марвин Мински из Массачусетского технологического института в 1969 г. написал книгу, где раскритиковал персептроны как вещи, “вплотную примыкающие к бесполезным”).

Рис.4.16 Структурная схема НС

На структурной схеме выделены три слоя, два из которых включают в себя большое число нейронов (neurons), представляющих собой однотипные, простейшие, взаимодействующие друг с другом узлы обработки информации. Второй слой НС, называемый скрытым (или промежуточным) слоем, связан с входными сигналами x1, x2,..., xn - элементами входного слоя - посредством связей (синапсов) с определенными весовыми коэффициентами wsj(1), (s=1,2,..., l; j=1,2,..., n).

Модель нейрона скрытого слоя имеет следующий вид (рис. 4.17, а).

Рис.4.17 Модель нейрона и виз функции f(AS)

Сигнал us здесь вычисляется с помощью формулы

,

где xj (j=1, 2,..., n) - входы НС; x0=1 - константа (постоянный вход); wsj(1)- настраиваемые коэффициенты (веса); As - взвешенная сумма входных величин НС; f(As) - нелинейная функция, выбираемая в значительной степени произвольно. На рис. 4.17, б приведена так называемая функция активации нейрона - «сигмоидная» функция f(As), обладающая следующими свойствами: f(As) - неотрицательная, монотонно возрастающая функция, принимающая асимптотически значения 1 при As>? и 0 при As>-?; f(0)=0,5. Пример аналитического выражения для функции f(As):

Аналогичной структурой обладают нейроны, расположенные в выходном слое НС. Поведение этих нейронов описывается уравнением

,

где u0=1 - константа; wis(2) - весовые коэффициенты (веса соответствующих связей - синапсов); l и m - соответственно число нейронов в скрытом и выходном слое. Общее число искусственных нейронов в современных технических НС достигает 104 (человеческий мозг содержит около 1011 нейронов и более чем 1015 связей между ними).

Основное свойство НС - возможность изменять свои характеристики в желаемом направлении (за счет изменения весовых коэффициентов wsj(1)wis(2)) в процессе обучения. Сам процесс обучения протекает следующим образом. На входы НС подаются обучающие данные x1, x2,..., xn, для которых известны желаемые (эталонные) реакции НС - y1*, y2*,..., ym*. Далее определяются фактические выходные реакции сети y1, y2,..., ym на эти данные и вектор ошибки e=(e1, e2,..., em)T, компоненты которого представляют собой разности между фактическими и желаемыми значениями выходов НС: ei=yi*-yi, (i=1, 2, ..., m).

Составляется функция равная сумме квадратов указанных ошибок, и процесс повторяется. В результате для каждого рассматриваемого (k-го) набора из (m+n) обучающих данных (x1k*, x2k*,..., xnk*; y1k*, y2k*,..., ymk*) получаем k-е значение суммарной квадратичной ошибки

.

Цель настройки весовых коэффициентов wsj(1), wis(2)) - уменьшение суммарной ошибки Е, для чего обычно используется градиентный метод оптимизации. Согласно этому методу, значения конкретного весового коэффициента W на (k+1)-м и k-м цикле оптимизации связаны между собой следующим соотношением:

,

где параметр б влияет на скорость сходимости процесса (обычно рекомендуется 0,1<б<1,0); ДEk= Ek - Ek-1; ДWk= Wk - Wk-1. Используя алгоритм (4.5) для адаптации коэффициентов wsj(1), wis(2)) на достаточно большом числе обучающих данных, можно добиться малых значений суммарной квадратичной ошибки Е, т.е. хорошего совпадения фактических и эталонных реакций НС.

Существуют различные варианты алгоритмов адаптации весовых коэффициентов НС, из которых наиболее распространенным является метод обратного распространения (Back Propagation) [5, 27-30]. Для реализации изложенных алгоритмов можно использовать, например, параллельные вычисления на транспьютерах, что позволяет выявить достоинства НС в полном объеме. Основные проблемы построения НС, решаемые зачастую эмпирически, - выбор числа слоев и количества нейронов в каждом слое, выбор наиболее эффективного набора обучающих данных, последовательности их предъявления НС и алгоритма адаптации (обучения).

Параллельная структура НС может быть использована в нечетких системах управления (которые по своей природе также могут быть рассмотрены как параллельные) при представлении нечетких подмножеств, заданных их функциями принадлежности, в качестве входных нейронов. На рис. 4.18 показана схема нечеткого регулятора с обучением, полученного на основе метода нечетких ассоциативных отображений (Fuzzy Assosiated Maps - FAM) и работающего аналогично обучаемой НС [16].

Рис.4.18 Построение нечеткого регулятора по методу FAM.

Символом “#” здесь обозначены “четкие” значения переменных, символ “>”обозначает соответствующие им нечеткие подмножества (термы). Для выполнения правил вывода используется метод Минимума-Произведения (MIN-PROD). Предполагается, что на этапе обучения происходит настройка весовых коэффициентов связей, соединяющих выходы блока фаззифиации со входами механизма вывода, а также выходы механизма вывода со входами блока дефаззификации. Для этого используются обучающие данные и алгоритмы обучения, аналогичные обучению НС. После завершения процесса обучения (это может занимать достаточно большое число циклов) регулятор готов к работе.

В [5] описано применение методов нейро-нечеткого управления для проектирования интеллектуальной системы управления полетом и силовой установкой гиперзвукового самолета нового поколения типа Х-29. Решение этой задачи классическими методами практически невозможно, поскольку разработка точных математических моделей потребует годы теоретических исследований, анализа результатов продувок, стендовых и летных испытаний и т.д. Дополнительные сложности связаны с увеличением числа степеней свободы (управление вектором тяги и др.), появлением нерасчетных режимов полета (например, скоростей с числом Маха>10), ограничениями на управление аэродинамическими поверхностями на неустойчивых режимах и т.п. Использование НС позволяет в данном случае производить идентификацию характеристик системы в реальном времени (с учетом нелинейной динамики самолета) даже при таких изменениях динамики, которые возникают при отказах или повреждениях самолета. Нечеткие регуляторы обеспечивают адаптивное, нелинейное управление самолетом и его силовой установкой в широком диапазоне изменения условий полета, в том числе обеспечение безопасности полета при возникновении критических (аварийных) ситуаций.

В заключение процитируем еще раз слова основоположника и пропагандиста теории нечетких множеств проф. Л.А.Заде [9]: “В последующие годы нечеткие алгоритмы и стратегии управления будут завоевывать, хотя, возможно, и против желания, все большее признание. Они должны быть приняты и должны приобрести некоторую респектабельность, так как обычные “четкие” алгоритмы не могут в общем случае справиться со сложностью и плохой определенностью больших систем. Для того чтобы создать благоприятную среду для развития нечетких алгоритмов, теория управления должна меньше значения придавать математической строгости и точности и больше заботиться о развитии качественных и приближенных решений насущных проблем реального мира. Такая теория может оказаться гораздо богаче и увлекательнее, чем теория управления в настоящее время”.

2.2 Синтез адаптивной САУ с эталонной моделью на основе нечеткой логики

Известно, что качество процессов управления при использовании ПИД-регуляторов (см. выражение (3.1)) существенно зависит от выбора его коэффициентов усиления KП, KИ и KД для пропорциональной, интегральной и дифференциальной составляющей соответственно. Большинство инженеров на практике настраивают эти коэффициенты вручную, методом проб и ошибок. Эта процедура является достаточно сложной и требует опыта проектирования систем управления. C другой стороны, наличие такого опыта позволяет построить процедуру автоматической настройки коэффициентов усиления ПИД-регулятора на основе алгоритмов нечеткой логики. Ниже рассматривается один из возможных способов решения данной задачи [30].

Допустим, что структурная схема адаптивной системы управления с эталонной моделью имеет следующий вид (рис. 3.9).

Уравнение основного ПИД-регулятора здесь несколько отличается от (3.1) и определяется соотношением

Рис. 3.9 Структурная схема нечеткой адаптивной САУ с ПИД - регулятором

(в [25] такой регулятор называется И-ПД-). Наличие интегральной составляющей обеспечивает нулевую статическую ошибку САУ; выбором коэффициентов KИ, KП и KД обеспечиваются желаемые показатели качества переходных процессов. Будем учитывать 3 таких показателя - время достижения 10 % от установившегося значения (t1); время нарастания, т.е. достижения 90 % от установившегося значения (tН); перерегулирование (у). Два из этих показателей (t1 и tН) отмечены на рис. 3.10, где показан график переходной функции у*(t) - реакции эталонной модели на ступенчатое изменение уставки r(t). Третий показатель (у) для переходного процесса, представленного на рис. 3.10, равен нулю, поскольку в качестве у*(t) выбран монотонный переходной процесс.

Рис. 3.10 Переходная функция эталонной модели

Будем полагать, что цель, поставленная перед нечетким регулятором, - обеспечить желаемые показатели качества системы t1*, tН*, у* за счет подстройки параметров основного регулятора KИ, KП, KД. Для этого необходимо использовать правила, основанные на опыте и интуиции эксперта. При этом учитывается следующий опыт:

1) если коэффициент усиления KИ увеличивается, то время нарастания уменьшается, а перерегулирование возрастает;

2) если коэффициент усиления KП увеличивается, то время нарастания сильно уменьшается, а перерегулирование возрастает;

3) если коэффициент усиления KД увеличивается, то время нарастания сохраняется, а перерегулирование слегка возрастает;

4) чтобы уменьшить время достижения 10 % от установившегося значения, необходимо уменьшить коэффициент усиления KИ и одновременно увеличить коэффициент усиления KП.

Будем рассматривать в качестве входов НР отклонения Дt1= t1*- t1, ДtН=tН*- tН, Ду=у*-у, а под выходами НР будем понимать настраиваемые значения коэффициентов усиления KИ, KП, KД основного регулятора. Базу правил НР, построенную на основе мнений эспертов, представим в виде таблицы 3.2

Таблица 3.2 База правил

Дt1 = NB

Дt1 = ZO

Дt1 = PB

Ду

ДtН

NB

ZO

PB

Ду

ДtН

NB

ZO

PB

Ду

ДtН

NB

ZO

PB

NB

0,5

1,25

1

0,8

0,8

1

0,65

0,95

1

NB

0,7

1,3

1

0,6

0,6

1

-0,4

1,4

0,6

NB

0,75

1,25

1

0,75

0,75

1

0,75

0,9

1

ZO

0,8

0,6

0,8

0,8

1

-0,4

1

0,9

1

ZO

1

1,4

1,4

1

1

1

1,2

0,7

1

ZO

0,9

1,2

1

0,9

1,1

0,5

1,6

0,8

1

PB

1,8

1,2

1

1,25

0,9

1

1,25

0,75

1

PB

1,25

1,25

1

1,8

0,7

1,8

1,25

0,75

1

PB

2

1,9

-1,9

2,5

0,9

1

0,5

0,75

1

Здесь используются обозначения термов, принятые в [25]: NB - “отрицательное большое” (negative big), ZO - “около нуля, оптимальное” (zero, optimal), PB - “большое отрицательное” (positive big). Соответствующие этим термам функции принадлежности входных переменных НР (после нормирования диапазонов изменения указанных величин Дt1, ДtН, Ду) показаны на рис. 3.11.

Поясним механизм составления таблицы 3.2. В каждой из клеток этой таблицы, составленной для различных значений переменной Дt1, записаны значения поправочных коэффициентов SИ, SП, SД, определяющих требуемый закон изменения параметров ПИД-регулятора в зависимости от значений входных лингвистических переменных НР:

ДKИ = (1-SИ) · KИ; ДKП = (1-SП) · KП; ДKД = (1-SД) · KД.

Рис.3.11 Функции принадлежности

Так, например:

1. ЕСЛИ (Дt1=NB И ДtН1=NB И Ду=NB), ТО (SИ=0,5 И SП=1,25 И SД=1),

т.е. в случае затянутого, слабо демпфированного переходного процесса у(t) необходимо на 50 % увеличить коэффициент усиления КИ, на 25 % снизить коэффициент усиления КП, сохраняя неизменным значение КД.

20. ЕСЛИ (Дt1=РB И ДtН=РB И Ду=ZO), ТО (SИ=2,5 И SП=0,9 И SД=1),

т.е. при наличии слишком форсированного переходного процесса у(t) необходимо резко уменьшить значение КП, изменив даже его знак; несколько увеличить значение КП, сохранив на том же уровне значение КД, и т. д.

Таким образом, измеренные значения отклонений Дt1, ДtН, Ду (входы нечеткого регулятора) после их фаззификации с помощью приведенных на рис.3.11 функций принадлежности подвергаются обработке с использованием записанных в табл. 3.2 правил вывода. Если на данном этапе применить метод Произведения, а для дефаззификации воспользоваться методом центра тяжести, то получаем следующие результирующие значения поправочных коэффициентов SИ, SП, SД:

;

;

Тройная сумма в каждом из данных выражений учитывает тот факт, что любое из измеренных значений Дt1, ДtН, Ду принадлежит двум соседним нечетким подмножествам. Число отличных от нуля слагаемых в тройной сумме, записанной в знаменателе, равно числу активизируемых правил вывода, а величина этой суммы равна сумме уровней активности данных правил (сравните с приведенными ранее предложениями).

После вычисления “четких” значений коэффициентов (SИ)0, (SП)0, (SД)0 необходимо подставить их в формулы (3.6), определяющие приращения искомых параметров (KИ, KП, KД) ПИД-регулятора.

Пусть объект управления описывается дискретной передаточной функцией

,

где а1=-1,529; а2=0,5323; b1=0,07628; b2=0,06168; период дискретизации Т0=10 мс. На рис. 3.12 приведены результаты моделирования системы, осуществляющей управление перемещением данного объекта.

Пунктирными линиями здесь показаны выходы управляемого объекта до выполнения процессов самонастройки указанных выше коэффициентов усиления. Сплошные линии обозначают выходы эталонной модели и совпадающие с ними выходы объекта после выполнения 5 итераций процесса самонастройки. Приведенные на рис. 3.12 результаты моделирования соответствуют случаям самонастройки для предварительно выбранной медленной (а) и быстрой (б) переходной функции САУ. Таким образом, использование нечеткого алгоритма адаптации обеспечивает хорошее совпадение переходных процессов на выходе САУ и ее эталонной модели, сохраняя такие традиционные преимущества ПИД-регуляторов, как их низкая чувствительность к параметрическим и сигнальным возмущениям.

Рис.3.12 Результаты моделирования адаптивной САУ

2.3 Программная и аппаратная реализация нечетких регуляторов

На практике для реализации алгоритмов нечеткой логики используются следующие возможные способы:

а) реализация нечетких алгоритмов с помощью соответствующего программного обеспечения (ПО);

б) разработка специальных “нечетких” компьютеров, предназначенных для обработки данных, информации и знаний с помощью команд естественного языка и правил вывода, похожих на те, которые использует человек;

в) аналоговая или аналого-цифровая реализация на базе больших (БИС) и сверхбольших (СБИС) интегральных схем.

На рис. 4.14 показано примерное соотношение перечисленных способов построения нечетких регуляторов в 1992 г. (фактически) и 1997 г. (прогноз) [16].

Как видно из этого рис., имеет место тенденция к сокращению удельного веса нечетких регуляторов, реализуемых программными средствами на основе обычных ЭВМ, и, наоборот, возрастает применение специально разработанного для этих целей оборудования, реализуемого на базе последних достижений микроэлектроники и вычислительной техники.

Рис.4.14 Тенденции развития нечетких регуляторов: 1 - реализация с помощью ПО; 2 - «нечеткие» компьютеры; 3 - реализация с помощью БИС

Основная проблема в программной реализации алгоритмов нечеткой логики (Fuzzy - Software) - необходимость обработки большого объема информации в реальном времени. Так, при использовании функций принадлежности, запоминаемых с помощью 64-х 4-битовых значений, обработка 49 правил с двумя входами и одной выходной величиной (функции принадлежности которой заданы в виде набора изолированных значений - singletons) на 32-разрядной ЭВМ IBM-80386-20 МГц занимает около 170 мкс, что соответствует примерно 300.000 правил/с. Время, требуемое для обработки 25 правил с семью входами и тремя выходами, составляет уже около 1 мс, что соответствует скорости обработки информации 60.000 правил/с. Для решения этой же задачи компьютеру IBM-80486-DX/2-50 МГц потребуется около 120 мкс, что составляет примерно 400.000 правил/с.

Значительное повышение быстродействия нечетких регуляторов достигается путем аппаратной реализации их алгоритмов. Различают 3 поколения специального аппаратного обеспечения нечеткой логики. Первое поколение “нечетких” БИС (Fuzzy Chips), основанное на аналоговой микроэлектронике, поступило на рынок в 1987 г. На рис. 4.15 приведен пример схемной реализации простого нечеткого регулятора [17].

Рис.4.15 Схемная реализация нечеткого регулятора

Здесь каждая из входных величин х1 и х2 фаззифицируется с помощью трех функций принадлежности. Условия лингвистических правил, выраженные с помощью союза “И”, реализуются с помощью операций пересечения (min). Предусмотрена специальная матрица, устанавливающая конкретный вид данных правил. Нечеткие значения выходной величины здесь рассматриваются как одноточечные подмножества (singletons), функции принадлежности которых определяются с помощью 5 операций объединения (max) и подаются затем на схему дефаззификации.

Второе поколение нечетких регуляторов - это СБИС, сочетающие аналоговый и цифровой принцип действия и программируемые пользователем как чистые цифровые схемы с мажорированием. Примерами этих СБИС являются выпускаемые с 1990 г. интегральные схемы OMRON FP-3000, TOGAI-Infra Logic F 110, легко подключаемые к датчикам и исполнительным механизмам. В то же время, они являются недостаточно гибкими, поскольку они имеют или жестко заданный характер связей (OMRON), или малый набор стандартных команд (TOGAI).

Третье поколение нечетких регуляторов (начиная с 1992 г.) представляет собой “нечеткие” компьютеры (Fuzzy-Computers), или “нечеткие” процессоры (Fuzzy-Processors), обеспечивающие не только удобное взаимодействие оператора и ЭВМ (а значит, и ускорение сроков проектирования, оптимизации и доводки системы управления), но и повышение скорости обработки информации за счет организации параллельных вычислений, использования векторных процессоров, транспьютеров и т.п. Примером такого процессора является СБИС высокой степени интеграции (70.000 транзисторов), разработанная в 1992 г. американскими специалистами Ватанабе, Симоном, Детлофом и Юнтом по заказу Национальной Аэрокосмической Ассоциации (NASA). Эта СБИС может обслуживать нечеткую систему управления с четырьмя входами и двумя выходными величинами, заданными с помощью 64 функций принадлежности по 4 бита, записанных в памяти. Обеспечивается возможность реализации 102 правил вывода с использованием метода Максимума-Минимума и дефаззификации на основе вычисления центра тяжести. За счет параллельной обработки информации достигается скорость обработки, равная 580.000 вычислений каждого из 102 правил в секунду, т.е. 58*106 правил/с.

Фирмами “Сименс” и “Информ” совместно разработан “нечеткий” процессор FUZZY-166, построенный на основе 16-разрядного микропроцессора и предназначенный для работы с 10 аналоговыми входами, а также 60 цифровыми входами и выходами. При разработке процессора использовались язык Ассемблер (Риск) с сокращенным набором команд и стандартный компилятор для языка СИ, а также система программирования нечетких данных “Fuzzy-Werkbank” фирмы “Информ”.

Имеются сообщения о “нечетком” микроконтроллере Neural Logix ADS 230, выполненном на основе искусственной нейронной сети и предназначенном для работы с IBM-совместимыми компьютерами [16]. В данной разработке используется микропроцессор NLX230, который выполняет 30*106 правил/с.

2.4 Управление процессом шлифовки внутренних поверхностей

К процессу шлифовки внутренних поверхностей в деталях часто предъявляются очень высокие требования. Для управления этим технологическим процессом используется система автоматического регулирования (САР), структурная схема которой показана на рис. 4.5. Здесь используются следующие обозначения: МК - цифровой микроконтроллер для управления приводом станка на базе микропроцессора МС 68000 фирмы “Моторола” (США); Fn - нормальная сила шлифовки; Ft - тангенциальная сила шлифовки; Рel - электрический сигнал, подаваемый на шпиндель для шлифовки внутренних поверхностей; Vtr - радиальная скорость подачи. На управляющую ЭВМ возлагаются функции цифрового регулирования (вычисления управляющего воздействия Vtr), а также адаптации процесса управления к действию параметрических возмущений.

Рис.4.5. Структурная схема САР

Традиционно задача адаптации решается путем идентификации параметров управляемого объекта с последующей настройкой параметров регулятора (рис. 4.6).

Здесь аi, bj - коэффициенты числителя и знаменателя дискретной передаточной функции объекта Wo(z); pi, qj - коэффициенты числителя и знаменателя дискретной передаточной функции регулятора C(z); у - регулируемая величина (в зависимости от принятой программы регулирования, это Fn или Ft); r - заданное значение регулируемой величины (уставка); u - управляющее воздействие (скорость подачи инструмента Vtr).

Рис.4.6 Схема адаптивной системы регулирования

Вместе с тем разработка алгоритма идентификации сопряжена в данном случае со значительными трудностями - процессы измерения сильно зашумлены, характеристики “вход - выход” объекта могут быть представлены с помощью математических зависимостей лишь очень приближенно, повышение порядка этих уравнений не дает желаемого эффекта и приводит к резкому увеличению сложности регулятора.

Принципиально иной подход к решению задачи управления процессом шлифовки обеспечивается на основе использования алгоритмов нечеткой логики. Сохраняя тот же состав оборудования, что и на рис. 4.5, существенно видоизменим набор алгоритмов управления, включив в них, помимо нечетких алгоритмов, также уровень обучения (развития) системы (рис. 4.7).

Рис.4.7 Структурная схема САР с нечетким регулятором

Здесь: e=rk-yk - значение сигнала ошибки в k-й момент времени; се=екк-1 - приращение сигнала ошибки за время Д=tk-tk-1; u=uk - величина управляющего воздействия; cu=uk-uk-1 - приращение сигнала u за время Д; E, CE, U и CU - лингвистические переменные, соответствующие значениям сигналов e, ce, u и cu; Ge, Gce, Gu, Gcu - значения коэффициентов усиления, на которые умножаются значения e, ce, u, cu соответственно; Fe, Fce - операции фаззификации четких значений е, се; Fe-1, Fce-1 - операции дефаззификации лингвистических переменных U и CU.

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.