Использование методов теории оптимального управления при решении обратных задач оценки результатов испытаний технических систем

Идентичность методов решения задач идентификации, возникающих при оценке результатов испытаний сложных динамических систем и задач теории оптимального управления. Математические модели объекта измерений. Идентификация состояния динамической системы.

Рубрика Математика
Вид статья
Язык русский
Дата добавления 27.05.2018
Размер файла 69,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Использование методов теории оптимального управления при решении обратных задач оценки результатов испытаний технических систем

С.И. Досько,

В.В. Киренков,

Е.В. Юганов

Аннотация

Отмечена идентичность методов решения задач идентификации, возникающих при оценке результатов испытаний сложных динамических систем, и классических задач теории оптимального управления. Показано, что использование методов решения последних может оказаться весьма эффективным при решении некоторых типовых обратных задач при проведении как активного, так и пассивного эксперимента.

Ключевые слова: динамическая система, обратная задача, объект регулирования, регулятор, идентифицируемость, управляемость, оптимальный закон управления.

История развития прикладных наук знает немало примеров, когда методы и подходы, разработанные для одной из них, оказываются весьма эффективными для других, на первый взгляд практически не связанных. Это в полной мере может быть отнесено к испытаниям различных технических систем, в частности изделий авиационной и ракетно-космической техники. Имеется в виду обработка потоков телеметрической информации, регистрируемых при проведении наземных и летных испытаний, с привлечением современных информационных технологий. В настоящей статье с этой точки зрения рассмотрены некоторые типовые задачи идентификации состояния бортовых систем. Показано, как методические трудности решения таких обратных задач могут быть преодолены посредством использования методов, разработанных в другом известном направлении прикладной математики - теории оптимального управления.

Основанием для предлагаемого подхода, по мнению авторов, является то, что обратные задачи и задачи оптимального управления преследуют с математической точки зрения идентичную конечную цель - нахождение экстремума (min или max) функционала от каких- то характеристик решаемой задачи. На эту аналогию обращал внимание еще академик А.Н. Тихонов - автор классических методов решения обратных некорректно поставленных задач [5], рассматривая с единых позиций задачи интерпретации (идентификации) и задачи синтеза и управления.

Математические модели объекта контроля и измерений. Одним из наиболее признанных путей решения задачи идентификации является составление ее математической модели и подтверждение по результатам испытаний соответствия (адекватности) параметров этой модели расчетным значениям. Математические модели объектов или процессов, подлежащих идентификации, обычно представляются в следующей форме:

, (1)

где - X(t) - n-мерный вектор состояния; U(t) - m-мерный вектор управления; F(t) - р-мерный вектор возмущений.

Весьма желательной, если возможно, является линеаризация этой модели посредством ее представления в отклонениях от опорного программного движения. Тогда соотношение (1) может быть записано в следующем стандартном, в частности для теории оптимальных процессов, виде:

(2)

где А - квадратная матрица состояния системы (n n); B (n m), D (n p) - матрицы управляющих и возмущающих воздействий соответственно.

Целесообразность перехода от формы (1) к форме (2) обусловлена тем, что к настоящему времени для линейных динамических систем разработаны методы решения задач оптимального управления, охватывающие различные критерии качества. Этого, к сожалению, нельзя сказать о нелинейных системах. Уравнение измерений также представляется в традиционной для теории оптимального управления форме:

(3)

где Y(l 1), С (l n) -вектор и матрица измерений соответственно; V (l 1) - случайный процесс, характеризующий ошибки измерений.

Будем считать, что ошибки измерений представимы в форме стационарных случайных функций, удовлетворяющих следующим условиям:

Mv(t)=const; Dv(t)=Kv(t,t)=Kv(0)=const;

Kv(t1,t2)=Kv(t2-t1)=Kv(ф);Kv(ф)= Kv(-ф).

Случайные функции, удовлетворяющие этим условиям, называются стационарными в широком смысле. Как показано в ряде работ, затухающая составляющая их нормированных корреляционных функций хорошо описывается одним из следующих выражений:

Или

Методология решения задачи идентификации во многом зависит от принятой модели идентифицируемого объекта (процесса). Возможны два варианта:

1. Идентифицируемый объект - это вектор неизвестных параметров Да (Да 1, Да 2, Даm), составляющие которого ?ai являются константами.

2. Составляющие ?ai могут быть произвольными функциями времени.

Примером объекта первого типа могут быть совокупности каких-то параметров регулятора, входящих, например, в закон управления. Объектами второго типа могут быть все случаи динамического характера изменения идентифицируемых параметров, например внешних воздействий на объект регулирования. идентификация управление оптимальный

Идентификация состояния динамической системы. Любая динамическая система всегда подразделяется на две основные части: регулятор (собственно система управления) и объект регулирования. При наличии общих подходов, например приведенных выше методов представления математических моделей этих составных частей и их измерений, методологии решения задачи идентификации для регулятора и объекта могут существенно отличаться друг от друга.

Оценка параметров регулятора в условиях штатной эксплуатации системы (пассивного эксперимента) весьма затруднена. Поэтому ее целесообразнее всего проводить в условиях активного эксперимента, т.е. испытаний, когда система может быть возбуждена какими-то тестирующими воздействиями. Проводить же оценку характеристик объекта регулирования, наоборот, представляется возможным только в условиях нормальной штатной эксплуатации. Основной задачей, которая решается в процессе активного эксперимента, является определение фактических значений некоторого комплекса наиболее важных параметров регулятора системы ai, в частности параметров закона управления. Поэтому с точки зрения принятых выше моделей эта задача принадлежит к первому типу. Задача же определения внешних реально ожидаемых воздействий F при активном эксперименте не ставится. В такой постановке помимо задачи собственно идентификации встает всегда и другая задача: как выбрать эти тестирующие воздействия, которые с учетом естественных ограничений могли бы обеспечить наилучшие (в каком-то смысле) условия наблюдаемости и идентифицируемости системы? Обе эти задачи могут решаться с привлечением методов теории оптимальных процессов и теории чувствительности [3;5].

Пусть имеется динамическая система, уравнение которой в матрично-векторной форме по аналогии с (1) может быть представлено в следующем виде:

, (4)

где а[m1] - упомянутый выше вектор оцениваемых параметров.

В заданном интервале времени 0 - T система подвергается испытаниям, в процессе которых на ее вход подается внешнее воздействие F(t). В ходе испытаний регистрируется часть фазовых координат в соответствии с уравнением измерений (3):

.

Требуется провести оценку неизвестных элементов вектора а, сформировав предварительно на этом интервале оптимальные значения вектора входных воздействий F(t). Первый этап решения задачи - ее линеаризация относительно опорного решения, имеющего место при номинальных значениях элементов а 0 вектора а, а именно:

,

где Да[m1] - вектор отклонений оцениваемых параметров; W(t)(nm) - так называемая матрица коэффициентов чувствительности, определяемая по правилам дифференцирования матриц и векторов следующим образом:

Элементы матрицы чувствительности W(t) могут быть получены путем дифференцирования по а соотношения (4):

(5)

Таким образом, соотношение (4) при а = а 0 и соотношение (5) при W(0)=0 определяют изменение по времени функций чувствительности при заданном внешнем воздействии F(t). Полученные соотношения позволяют перевести исходную задачу в разряд линейных задач, для которых разработаны и исследованы методы идентификации, дающие несмещенные и эффективные оценки. В предположении гауссовского характера ошибок измерений V(t) решение для вектора Да ищется исходя из условия минимума квадратичного функционала, имеющего вид

(6)

где Т - символ транспонирования.

Минимизация функционала (6) по Да приводит к следующему матрично-векторному уравнению для определения составляющих этого вектора:

(7)

где

-

вектор отклонений фактических результатов измерений от модельных значений, соответствующих Да =0.

Уравнение (7) представляет собой алгебраическое уравнение m-го порядка относительно составляющих вектора Да (Да 1, Да 2, Даm), решение которого в общем виде записывается следующим образом:

, (8)

где

-

так называемая матрица идентификации (иногда ее называют информационной матрицей Фишера).

Элементы этой матрицы определяются характером изменения по времени и величиной функций чувствительности W(t), определяемых входными воздействиями F(t). В условиях активного эксперимента имеется возможность так их формировать, чтобы обеспечить в каком-то смысле оптимальные условия для определения элементов вектора Да. В качестве этих оптимальных условий целесообразно выбрать такие, которые обеспечивают минимально возможные ошибки определения элементов этого вектора. Как следует из соотношения (8), данные погрешности могут характеризоваться диагональными элементами матрицы B-1. Критерий, к которому нужно стремиться, состоит в том, чтобы сумма всех диагональных членов этой матрицы была минимальной в рамках дозволенных пределов изменения входных воздействий F(t). Известно, что сумма диагональных элементов квадратной матрицы, или ее след Sp, равна сумме собственных чисел этой матрицы. Если обозначить собственные числа матрицы В через л1, л2, лm, то след матрицы B-1 и условия оптимальности запишутся следующим образом:

Оперировать со следом матрицы B-1 очень непросто, ввиду чего при решении аналогичных задач условие минимизации следа обратной матрицы B-1 заменяют более простым - условием максимизации следа матрицы В, т.е.

. (9)

Условие (9) трактуется при решении задач идентификации как условие максимума следа информационной матрицы Фишера. Рассмотренный подход позволяет свести исходную задачу идентификации к задаче выбора оптимального управления процессами, описываемыми уравнениями (3, 7, 11), с критерием качества (9). Здесь целесообразно обратиться к методам теории оптимального управления - использовать классический принцип максимума Л.С. Понтрягина [3]. Из этого принципа следует, что оптимальное входное воздействие F(t) в данном случае имеет кусочно-постоянный (релейный) вид, т.е. может быть представлено следующим образом:

(10)

где С - модуль предельно допустимого входного воздействия; - знак функции вспомогательных переменных Ш метода Л.С. Понтрягина, методология определения которых рассмотрена в [3] и здесь не приводится.

Задача состоит в том, чтобы найти моменты времени, соответствующие изменению знака функции . Как правило, даже для сравнительно простых систем это возможно только применением итеративных численных методов. Практические примеры решения такой задачи с оценкой эффективности входного воздействия вида (10) по сравнению с другими традиционными приведены в [6]. Основное отличие условий проведения пассивного и активного экспериментов состоит в том, что если при активном эксперименте испытатель имеет возможность назначать входные воздействия в соответствии с выбранным критерием оптимальности - максимумом следа информационной матрицы Фишера, то при пассивном эксперименте в условиях нормальной эксплуатации системы такая возможность отсутствует. Кроме того, если в первом случае эти входные воздействия могут считаться известными, то во втором имеет место обратная ситуация, ибо, как правило, отсутствует возможность их измерять.

Ввиду этого использовать рассмотренную методологию решения задачи идентификации при активном эксперименте для условий нормальной эксплуатации (пассивного эксперимента) не представляется возможным. Ставить же задачу одновременной оценки параметров регулятора системы ai и внешних воздействий F(t) нереально, хотя формально такая задача может быть поставлена и решена (с использованием в качестве регуляризирующих условий априорной информации).

Итак, главной задачей при идентификации состояния динамической системы в условиях пассивного эксперимента (нормальной эксплуатации) будем считать определение возмущений - внешних воздействий на систему. В качестве универсального метода решения и здесь могут быть использованы методы теории оптимальных процессов, в частности методы построения оптимальных систем с квадратичным критерием качества.

Среди разработанных методов теории оптимальных процессов с квадратичным критерием качества есть метод решения так называемой задачи слежения, которая ставится следующим образом [1; 2]. Математическая модель системы и измерений в линейной постановке задается в виде

(11)

Соотношения (11) отличаются от приведенных соотношений (2) и (3) отсутствием возмущающих воздействий F в первом уравнении и ошибок измерений V во втором. Задачей слежения является определение и реализация закона изменения по времени вектора управления U(t), который обеспечит отслеживание системой желаемого выходного сигнала Z(t). Такая задача имеет аналитическое решение при использовании следующего квадратичного критерия качества относительно невязки (вектора рассогласования) и вектора управления U(t):

(12)

где - положительно определенные матрицы размерности n n и m m соответственно.

Показано [1; 2], что оптимальное управление при таком критерии качества формируется в виде суммы двух составляющих, первая из которых линейно зависит только от текущего состояния системы (вектора X), а вторая - только от значения желаемого выхода системы Z(t) как в текущий момент времени, так и в будущем, т.е.

.

Оптимальный закон управления, таким образом, является как бы синтезом законов управления двух систем: следящей системы с отрицательной обратной связью (первый член) и программного управления, зависящего только от Z(t) (второй член). Вопросы формирования матрицы H(t) и вектора G(t) для задачи слежения рассмотрены в [1; 2].

Остановимся теперь на том, как методология решения такой задачи может быть использована для решения задачи идентификации входных воздействий F(t). Прежде всего, отметим, что для большинства динамических систем с обратными связями деление параметров на фазовые координаты и управляющие воздействия является условным хотя бы потому, что последние всегда имеют ограниченную скорость изменения. В качестве примера можно привести формирование управляющих моментов при линейных законах управления классическими рулевыми агрегатами летательных аппаратов. Перенося с учетом этого управляющие воздействия U(t) в соотношениях (1) и (2) в состав фазовых координат и формируя расширенный вектор состояния X(n+m,1), придем к соотношению вида (11), а именно

(13)

в котором под F нужно понимать не вектор возмущений, а вектор управления, подлежащий определению. Вектор измерений Y(t), в который входят и управляющие воздействия U(t), может теперь пониматься как желаемый выход системы Z(t). Задача идентификации входного воздействия сводится, таким образом, к рассмотренной выше и методически решенной в теории оптимального управления задаче слежения [1;2]. Достоинством такого подхода является и то, что в качестве критерия качества для этой задачи может быть выбран квадратичный критерий вида (12) с весовой матрицей Q, составляющие которой обратно пропорциональны дисперсиям ошибок измерений, математическая модель которых описана выше. Еще одним достоинством такого подхода является то, что при его применении не требуется предварительный этап алгебраизации рассматриваемой динамической задачи, что большинство авторов (например, [8]) считают чуть ли не обязательным при решении такого рода обратных задач.

Одним из наиболее принципиальных и до конца не решенных методических вопросов в трактовке рассматриваемого метода является вопрос выбора весовых матриц . Если вопрос выбора матрицы Q хотя бы методически ясен (это матрица, обратная корреляционной матрице ошибок измерений), то вопрос выбора матрицы R в критерии оптимальности (12) куда менее определен. Покажем, как эти трудности могут быть преодолены, если поставленную задачу рассматривать с позиции обратных некорректно поставленных задач, решая ее путем построения классического (по А.Н. Тихонову) регуляризирующего оператора. Такой оператор реализуется путем минимизации так называемого сглаживающего функционала I, записанного через нормы невязок

и вектора управления (в данном случае - возмущений) U(t):

(14)

где a 0 - параметр регуляризации.

Такой метод рекомендуется для решения обратных существенно некорректных задач, когда искомые функции не могут быть отнесены к компактным множествам. Нетрудно видеть, что сглаживающий функционал (14) идентичен ранее введенному квадратичному критерию (12) при следующих значениях весовых множителей : = E - единичная матрица; = a - матрица регуляризации.

Если критерии (12) и (14) относить только к вектору рассогласований e(t), полагая , то в такой постановке задача по определению входного воздействия оказывается некорректно поставленной. Введение в критерий (14) дополнительного ограничения на управление (возмущение) F(t) (a ? 0) обеспечивает перевод задачи в разряд корректно поставленных [5]. Это означает, что решение обратной задачи ищется теперь не на множестве F(t), а на его сужении - обладающем свойством компактности подмножестве F(t)д:

F(t)д=Qд?F(t),

где Qд - класс элементов F(t), для которых норма невязки - меньше погрешности измерений.

Описанные трудности и методы их преодоления связаны с невозможностью представления в общем случае искомой функции F(t) как элемента некоторого компактного множества. В некоторых случаях, тем не менее, априори бывает известно, что она может быть представлена в виде конечномерного замкнутого компакта с известными весовыми функциями. В матрично-векторном виде это представление выглядит так:

(15)

где ц(t) - матрица размерности pk заданных неслучайных функций; щ - вектор размерности k1 случайных величин, подлежащих оценке.

Представление F в такой компактной форме переводит задачу в разряд корректно поставленных [7; 8] и позволяет существенно упростить ее решение. Используя понятие фундаментальной матрицы решений Ф(t,t0) для системы (13), выражение для расширенного вектора состояния X можно записать в следующем виде:

(16)

Функции , входящие в выражение (16) под знаком интеграла, известны, ввиду чего значения этого интеграла в любой момент времени ti в интервале 0 - Т (t - t0) могут быть определены (для некоторых случаев даже аналитически). Имея это в виду, а также то, что Ф(t0,t0) = E, где Е - единичная матрица, соотношение (15) можно представить в виде следующего линейного матрично-векторного соотношения:

,

где

-

матрица размерности n k.

После этого задача решается методом, рассмотренным выше, для случая активного эксперимента. Минимизируется по щ квадратичный функционал

что дает для оценки вектора щ соотношение, аналогичное соотношению (8).

Приведенный случай оценки возмущающих воздействий, когда задача идентификации может быть успешно решена, является частным случаем решения задачи слежения. Для придания алгоритму решения этой задачи универсального статуса необходимо решить вопрос о методике выбора весовых матриц a, R в функционалах (12) и (14), не ограничиваясь только одномерным случаем.

Список литературы

1. Брайсон, А. Прикладная теория оптимальных процессов / А. Брайсон, Ю-Ши Хо. -М.: Мир, 1972.

2. Ройтенберг, Я.И. Автоматическое управление / Я.И. Ройтенберг. - М.: Наука, 1978.

3. Понтрягин, Л.С. Математическая теория оптимальных процессов / Л.С. Понтрягин [и др.]. - М.: Физматгиз, 1961.

4. Розенвассер, Е.Н. Чувствительность систем управления / Е.Н. Розенвассер, Р.М. Юсупов. - М.: Наука, 1981.

5. Тихонов, А.Н. Методы решения некорректных задач / А.Н. Тихонов, В.Я. Арсенин. - М.: Наука, 1974.

6. Меньшиков, В.А. Определение и идентификация импеданса электрохимических систем / В.А. Меньшиков, В.В. Киренков [и др.]. - М.: Изд-во НИИ КС им. А.А. Максимова, 2008.

Размещено на Allbest.ru

...

Подобные документы

  • Анализ межотраслевых связей, коэффициентов прямых и полных затрат труда. Определение оптимального плана выпуска продукции и решения с использованием двойственных оценок. Элементы теории игр, моделирование производственных процессов. Функция Кобба-Дугласа.

    контрольная работа [113,9 K], добавлен 19.01.2015

  • Возникновение и развитие теории динамических систем. Развитие методов реконструкции математических моделей динамических систем. Математическое моделирование - один из основных методов научного исследования.

    реферат [35,0 K], добавлен 15.05.2007

  • Рассмотрение общих сведений обратных задач математической физики. Ознакомление с методами решения граничных обратных задач уравнений параболического типа. Описание численного решения данных задач для линейно упруго-пластического режима фильтрации.

    диссертация [2,8 M], добавлен 19.06.2015

  • Математические модели технических объектов и методы для их реализации. Анализ электрических процессов в цепи второго порядка с использованием систем компьютерной математики MathCAD и Scilab. Математические модели и моделирование технического объекта.

    курсовая работа [565,7 K], добавлен 08.03.2016

  • Изучение нестандартных методов решения задач по математике, имеющих широкое распространение. Анализ метода функциональной, тригонометрической подстановки, методов, основанных на применении численных неравенств. Решение симметрических систем уравнений.

    курсовая работа [638,6 K], добавлен 14.02.2010

  • Проектирование методов математического моделирования и оптимизации проектных решений. Использование кусочной интерполяции при решении задач строительства автомобильных дорог. Методы линейного программирования. Решение специальных транспортных задач.

    методичка [690,6 K], добавлен 26.01.2015

  • Основные определения теории уравнений в частных производных. Использование вероятностных, численных и эмпирических методов в решении уравнений. Решение прямых и обратных задач методом Монте-Карло на примере задачи Дирихле для уравнений Лапласа и Пуассона.

    курсовая работа [294,7 K], добавлен 17.06.2014

  • Сравнительный анализ численных методов решения систем линейных алгебраических уравнений. Вычисление определителей и обратных матриц. Реализация методов в виде машинных программ на языке высокого уровня и решение задач на ЭВМ. Модификации метода Гаусса.

    реферат [85,2 K], добавлен 04.03.2011

  • Постановка начально-краевых задач фильтрации суспензии с нового кинетического уравнения при учете динамических факторов различных режимов течения. Построение алгоритмов решения задач, составление программ расчетов, получение численных результатов на ЭВМ.

    диссертация [1,1 M], добавлен 19.06.2015

  • История возникновения уравнений, понятие их решения и виды упрощения. Анализ способов решения ряда занимательных задач с помощью уравнений. Обращение Аль-Хорезми с уравнениями как с рычажными весами. Параметры и переменные, область определения и корень.

    реферат [38,0 K], добавлен 01.03.2012

  • Метод замены переменной при решении задач. Тригонометрическая подстановка. Решение уравнений. Решение систем. Доказательство неравенств. Преподавание темы "Применение тригонометрической подстановки для решения алгебраических задач".

    дипломная работа [461,7 K], добавлен 08.08.2007

  • Некоторые математические вопросы теории обслуживания сложных систем. Организация обслуживания при ограниченной информации о надёжности системы. Алгоритмы безотказной работы системы и нахождение времени плановой предупредительной профилактики систем.

    реферат [1,4 M], добавлен 19.06.2008

  • Сущность вероятностной задачи-схемы независимых испытаний швейцарского профессора математики Я. Бернулли. Пример решения задачи по формуле Бернулли. Применение методов теории вероятностей в различных отраслях естествознания, техники и прикладных науках.

    презентация [301,3 K], добавлен 10.03.2011

  • Граф как множество вершин (узлов), соединённых рёбрами, способы и сфера их применения. Специфика теории графов как раздела дискретной математики. Основные способы преобразования графов, их особенности и использование для решения математических задач.

    курсовая работа [1,8 M], добавлен 18.01.2013

  • Методы решения задач с экономическим содержанием повышенного уровня сложности. Выявление структуры экономических задач на проценты. Вывод формул для решения задач на равные размеры выплат. Решение задач на сокращение остатка на одну долю от целого.

    курсовая работа [488,3 K], добавлен 22.05.2022

  • Математическое программирование - область математики, в которой изучаются методы решения задач условной оптимизации. Основные понятия и определения в задачах оптимизации. Динамическое программирование – математический метод поиска оптимального управления.

    презентация [112,6 K], добавлен 23.06.2013

  • Ознакомление с содержанием и этапами реализации программы ТРИЗ как способа развития диалектического мышления и творческого воображения. Сравнительный анализ технологий теории решения изобретательных задач в исполнении Г.С. Альтшуллера и Р. Бартини.

    контрольная работа [49,8 K], добавлен 10.07.2010

  • Рассмотрение основных методов решения школьных задач на движение двух тел в разных и одинаковых направлениях: анализ и синтез, сведение к ранее решенным, математическое моделирование (знаковые, графические модели), индукция, исчерпывающая проба.

    презентация [11,8 K], добавлен 08.05.2010

  • Оптимизация как раздел математики, ее определение, сущность, цели, формулировка и особенности постановки задач. Общая характеристика различных методов математической оптимизации функции. Листинг программ основных методов решения задач оптимизации функции.

    курсовая работа [414,1 K], добавлен 20.01.2010

  • Систематизация различных методов решения планиметрических задач. Обоснование рациональности решения планиметрической задачи методами дополнительных построений, подобия треугольников, векторного аппарата, соотношения углов и тригонометрической замены.

    реферат [727,1 K], добавлен 19.02.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.