Математическая модель компромиссного управления динамическими системами
Введение понятия компромиссного набора стратегий для дифференциальной игры нескольких лиц. Обоснование способа его построения в классе позиционных стратегий. Рассмотрение модельного примера. Выбор адекватного по содержанию задачи понятия решения.
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 26.04.2019 |
Размер файла | 285,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Математическая модель компромиссного управления динамическими системами
С.В. Лутманов
Аннотация
Вводится понятие компромиссного набора стратегий для дифференциальной игры нескольких лиц. Обосновывается способ его построения в классе позиционных стратегий. Рассмотрен модельный пример.
Ключевые слова: дифференциальная игра; стабильный мост; цена игры; экстремальное прицеливание.
Введение© Лутманов С.В., 2012
Одна из основных проблем в исследовании неантагонистической игры состоит в выборе адекватного содержанию задачи понятия решения. Наиболее распространен подход, основанный на принципе равновесия по Нэшу. Равновесный набор обладает свойством устойчивости по отношению к игроку-уклонисту: единоличное уклонение игрока от равновесного набора стратегий приводит к ухудшению (увеличению) его платы. Недостаток равновесных по Нэшу ситуаций состоит в том, что величины платы игроков для таких ситуаций могут оказаться существенно хуже (больше) потенциально возможных. Естественно, такие ситуации уже не будут обладать свойством устойчивости по отношению к игроку-уклонисту.
В работе вводится понятие компромиссного набора стратегий, сохраняющего свойство устойчивости по отношению к игроку-уклонисту (в ослабленном варианте). При этом на примере конкретной дифференциальной игры показано, что для компромиссного набора стратегий выполняются неравенства компромиссный дифференциальный модельный
.
В отличие от равновесных по Нэшу наборов стратегий единоличное уклонение какого-либо игрока от стратегии, предписываемой ему компромиссным набором, может привести к увеличению его выигрыша. Фактором, обеспечивающим устойчивость компромиссного набора стратегий, является потребность игроков не допустить значительный выигрыш какого-либо одного игрока.
1. Игра в нормальной форме
Под игрой (необязательно дифференциальной), записанной в нормальной форме, будем понимать тройку
,
где - множество номеров игроков, - множество всех стратегий, а - функция платы i-го, , игрока. Игра состоит в том, что каждый игрок выбирает независимо от других какую-либо стратегию из своего множества стратегий. В результате складывается ситуация , на которой вычисляется плата , каждого из игроков. Игрок заинтересован в минимизации своей платы. В этом пункте для простоты будем предполагать, что все встречающиеся по ходу изложения и функций платы существуют.
Определение 1.1. Набор стратегий называется равновесным по Нэшу, если
. (1.1)
Из определения 1.1 следует, что для равновесных наборов характерно следующее:
Сообщество игроков не позволяет любому своему члену получить плату меньше (лучше), чем некоторая величина
.
Имеет место совпадение этих величин с соответствующими значениями плат, которые получают игроки при применении равновесного набора стратегий
.
Отказ от выполнения условия 2 приводит к следующему определению.
Пусть
.
Определение 1.2. Будем говорить, что ситуация является компромис-
сной по отношению к векторам , если для всех справедливы неравенства
. (1.2)
Принцип компромисса обобщает равновесие по Нэшу в том смысле, что при определение 1.2 переходит в определение 1.1.
2. Дифференциальная игра нескольких лиц
Динамика системы описывается обыкновенным векторным дифференциальным уравнением
, (2.1)
где - текущее время, - фазовый вектор объекта, - вектор управляющих параметров i-го игрока, - вектор-функция, описывающая как внутреннее устройство объекта, так и воздействие различных внешних факторов.
Будем предполагать, что множества компактны. Функция непрерывна по совокупности переменных .
Относительно правых частей дифференциальных уравнений (2.1) принимаются стандартные в теории дифференциальных игр предположения [1].
1. Локальные условия Липшица
,
.
2. Условия продолжимости решения
.
3. Существование седловой точки в "маленькой -игре" для всех :
Плата i-го игрока определяется формулой
(2.2)
где - некоторая заданная непрерывная функция, - реализация фазового вектора объекта, а - момент окончания игры.
Свои управляющие параметры игрок формирует, основываясь на информации о текущем времени и реализовавшемся фазовом векторе объекта, при этом он не осведомлен о выборе управляющих параметров остальных игроков в этот момент времени. Понятия позиционной стратегии игрока и движения объекта, отвечающего набору позиционных стратегий, определяются аналогично [1].
Определение 2.1. Позиционной стратегией игрока называется произвольная функция .
Пусть - произвольная позиционная стратегия и - конечное разбиение отрезка времени точками .
Определение 2.2. Ломаной Эйлера , выходящей из позиции и порожденной позиционной стратегией , назовем всякую абсолютно непрерывную функцию , удовлетворяющую дифференциальному уравнению
,
Здесь реализация вектора управляющих параметров для всех представляет собой произвольную интегрируемую по Лебегу функцию со значениями в множестве .
Определение 2.3. Движением, выходящим из позиции и порожденным позиционной стратегией -го, , игрока, назовем всякую функцию , для которой найдется последовательность ломаных Эйлера , равномерно сходящаяся к ней на при условии .
Совокупность всех движений, выходящих из позиции и порожденных позиционной стратегией , -го, , игрока, будем обозначать символом
и называть пучком конструктивных движений.
Пусть и каждый игрок с номером выбрал некоторую позиционную стратегию.
Определение 2.4. Множество
назовем пучком конструктивных движений, выходящих из начальной позиции и порожденных набором позиционных стратегий множества игроков .
Известно [1], что
для всех . При этом
,
если .
Построение компромиссных
наборов стратегий
Пусть
.
Определение 3.1. Будем говорить, что набор позиционных стратегий всех игроков компромиссен относительно векторов , для начальной позиции , , если
(3.1)
И
. (3.2)
Рассмотрим множества
.
Будем предполагать, что
.
Пусть максимальный стабильный мост первого игрока [1] в игре, в которой множество игроков решает задачу наведения на множество против игрока с номером в момент времени . Для всех полагаем
Лемма 1. Множества попарно не пересекаются.
Доказательство. Допустим противное. Тогда найдутся номера , такие, что . Пусть и, следовательно, . По теореме об альтернативе [1] для начальной позиции разрешимы задачи уклонения в момент игроков и от множеств и соответственно. Пусть стратегии игроков и , решающие указанные задачи. Тогда для всех должно выполняться . Последнее невозможно, так как , а . Лемма доказана.
Предположим, что
и существует множество , для которого
1) - замкнутое множество;
2) ;
3) ;
4) для любой позиции и момента времени существует набор программных управлений
всех игроков, такой, что для решения дифференциального уравнения
выполняется включение .
Заметим, что из условий 2) и 3) следует, что .
Набор компромиссных стратегий определим соотношениями
. (3.3)
Здесь набор векторов удовлетворяет условию
, (3.4)
, (3.5)
а набор векторов
Условию
,
(3.6)
. (3.7)
Теорема 1. Набор стратегий всех игроков , определенный соотношениями (3.3), является компромиссным относительно векторов для любой начальной позиции .
Доказательство. Прежде всего, заметим, что в силу определения множества и леммы 1 выполнены условия
, .
Следовательно, набор стратегий определен корректно.
Для всех начальных позиций установим справедливость неравенств (3.1). Действительно, множество будем трактовать как стабильный мост, обрывающийся в момент времени на множестве , в некоторой вспомогательной игре. В этой игре объединение всех игроков решает задачу наведения на множество в момент времени . Компромиссный набор стратегий в малой окрестности множества представляет собой стратегию экстремального прицеливания объединения всех игроков на множество .
Тогда для любого движения выполнено включение . В частности, , что и означает выполнение неравенства (3.1).
Неравенство (3.2) докажем от противного. Пусть оно нарушается для некоторой начальной позиции и номера . Тогда найдется движение
,
для которого . Это невозможно, так как для всех номеров в позициях набор стратегий
является стратегией экстремального прицеливания на множество объединения игроков на стабильный мост , для которого выполнено равенство . Теорема доказана.
4. Модельная игра
Постановка игры. На двумерной плоскости находится точка, управляемая k-игроками (). Каждый игрок имеет возможность независимо от других назначать точке вектор скорости, произвольный по направлению и ограниченный по длине числом . Игра начинается в момент времени из некоторого начального положения управляемой точки и заканчивается в момент времени .
На плоскости заданы фиксированные точки , имеющие соответственно радиус-векторы , относительно начала координат. Платой -го, , игрока служит расстояние от финального положения управляемой точки в момент времени до целевого множества этого игрока.
Неформальная цель каждого из игроков состоит в минимизации своей платы.
Рассмотрим случай (см. рис. 1), когда
,
.
, .
Дифференциальные уравнения движения управляемой точки имеют вид
.(4.1)
В качестве компромиссных оценок возьмем вектора
, .
Полагаем
, ,
, ,
где.
Непосредственно проверяется, что
,
.
Полагаем
,
,
,
.
Очевидно, что
.Вычислим производную функций в силу системы дифференциальных уравнений (4.1). Имеем
Легко видеть, что
,
,
.
Тогда множества являются соответствующими максимальными стабильными мостами.
Полагаем
,
,
,
.
В силу леммы 1 имеет место . Условие
проверяется путем доказательства неравенств
Справедливость указанных неравенств устанавливается в результате численных расчетов, проведенных с применением пакета "Mathematica". Выполнение условия 4) для множества обеспечивают постоянные стратегии игроков, удовлетворяющие условию
.
Таким образом, множества обладают всеми свойствами, перечисленными в разделе 3. Тогда набор стратегий всех игроков, определенный формулой (3.3), в силу теоремы 1 является компромиссным относительно векторов
, для любой начальной позиции, принадлежащей множеству .
Набор стратегий всех игроков, назначающий векторы управляющих параметров из условия (3.4), (3.5) для начальных позиций, принадлежащих множеству , обеспечивает каждому из игроков выполнение оценки сверху для его платы. Однако этот набор стратегий может оказаться неустойчивым по отношению к игроку-уклонисту. Это означает, что игрок-уклонист может выбрать такое позиционное управление, которое позволит ему получить значение платы лучше (меньше) соответствующей нижней компромиссной оценки.
Действительно, пусть игроки назначают свои управляющие воздействия из условия (3.4), (3.5). Выберем начальную позицию . Рассмотрим последовательно следующие ситуации:
А) среди игроков нет уклонистов;
Б) первый игрок уклоняется от этого правила, прицеливаясь на свое целевое множество;
В) второй игрок уклоняется от этого правила, прицеливаясь на свое целевое множество;
Г) третий игрок уклоняется от этого правила, прицеливаясь на свое целевое множество.
Таблица 1
Компромиссная оценка снизу |
Величина платы в ситуации А) |
Компромиссная оценка сверху |
Величина платы при уклонении |
||
Первый игрок |
0.13 |
0.566152 |
0.57 |
0.456535 |
|
Второй игрок |
0.9 |
1.12948 |
1.131 |
0.672874 |
|
Третий игрок |
1.4 |
1.69855 |
1.71 |
0.875904 |
Из табл. 1 видно, что значения плат игроков в ситуации А) укладываются в верхние и нижние компромиссные оценки. Однако уклонисты (кроме первого) могут получить лучшее значение платы, чем соответствующие нижние компромиссные оценки.
Такой результат невозможен в случае компромиссного набора стратегий. Пусть, например, игроки-уклонисты в качестве стратегии уклонения выбирают прицеливание на свое терминальное множество. В табл. 2 приведены значения плат игроков для таких ситуаций.
Таблица 2
Компромиссная оценка снизу |
Величина платы для компромис- сной ситуации |
Компромиссная оценка сверху |
Величина платы при уклонении |
||
Первый игрок |
0.13 |
0.566152 |
0.57 |
0.456535 |
|
Второй игрок |
0.9 |
1.12948 |
1.131 |
0.908814 |
|
Третий игрок |
1.4 |
1.69855 |
1.71 |
1.40733 |
|
Для сравнения построим ситуацию равновесия по Нэшу в данной игре. Необходимые и достаточные условия равновесия по Нэшу в классе постоянных управлений для начального положения имеют вид [2]
(4.2)
Решение системы (4.2) получено численно:
.
Выпишем финальное положение управляемой точки в случае равновесных по Нэшу управлений:
Расстояния от управляемой точки в конечном положении до целевых множеств игроков следующие:
.
Таким образом, справедливы неравенства
.
На рис. 1 дана геометрическая иллюстрация приведенных ниже численных результатов.
Заключение
В работе введено понятие компромиссного управления в играх нескольких лиц, в некотором смысле обобщающее равновесие по Нэшу. Сформулирована и доказана теорема существования компромиссных ситуаций в позиционных дифференциальных играх. Конструктивный характер условий теоремы позволил построить компромиссный набор стратегий в модельной дифференциальной игре и провести сравнительный анализ этого набора с набором, равновесным по Нэшу.
Список литературы
1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1973. 455 с.
2. Лутманов С.В. Необходимые и достаточные условия равновесия по Нэшу в игре в перемещениях // Проблемы механики и управления: межвуз. cб. науч. тр. Пермь, 2002. C. 4-10.
Размещено на Allbest.ru
...Подобные документы
Теория игр - математическая теория конфликтных ситуаций. Разработка математической модели игры двух лиц с нулевой суммой, ее реализация в виде программных кодов. Метод решения задачи. Входные и выходные данные. Программа, руководство пользователя.
курсовая работа [318,4 K], добавлен 17.08.2013Предмет, методы и понятия математической статистики, ее взаимосвязь с теорией вероятности. Основные понятия выборочного метода. Характеристика эмпирической функции распределения. Понятие гистограммы, принцип ее построения. Выборочное распределение.
учебное пособие [279,6 K], добавлен 24.04.2009Ознакомление с основами метода Гаусса при решении систем линейных уравнений. Определение понятия ранга матрицы. Исследование систем линейных уравнений; особенности однородных систем. Рассмотрение примера решения данной задачи в матрической форме.
презентация [294,9 K], добавлен 14.11.2014Исследование понятия "форма" в биологии и векторной геометрии. Математическая модель формообразования и пути познания энергетических процессов в геометрии. Деление отрезка в золотом сечении. Уравнение экспансии как векторная основа формообразования.
реферат [400,8 K], добавлен 20.08.2009Проектирование математической модели. Описание игры в крестики-нолики. Модель логической игры на основе булевой алгебры. Цифровые электронные устройства и разработка их математической модели. Игровой пульт, игровой контроллер, строка игрового поля.
курсовая работа [128,6 K], добавлен 28.06.2011Общие аксиомы конструктивной геометрии. Аксиомы математических инструментов. Постановка задачи на построение, методика решения задач. Особенности методик построения: одним циркулем, одной линейкой, двусторонней линейкой, построения с помощью прямого угла.
курс лекций [4,0 M], добавлен 18.12.2009Задачи Коши и методы их решения. Общие понятия, сходимость явных способов типа Рунге-Кутты, практическая оценка погрешности приближенного решения. Автоматический выбор шага интегрирования, анализ брюсселятора и метод Зонневельда для его расчета.
курсовая работа [1,7 M], добавлен 03.11.2011Синтез оптимального управления при осуществлении разворота. Разработка математической модели беспилотных летательных аппаратов. Кинематические уравнения движения центра масс. Разработка алгоритма оптимального управления, результаты моделирования.
курсовая работа [775,3 K], добавлен 16.07.2015Введение рассматриваемых систем координат и их положение. Расположение магниторезистивных датчиков на осях. Расчёт проекции горизонтальной составляющей вектора напряженности магнитного поля. Обоснование необходимости использования акселерометра.
контрольная работа [68,2 K], добавлен 23.09.2011Постановка задачи коммивояжера и основные алгоритмы решения. Маршруты и пути. Понятия транспортной сети. Понятие увеличивающая дуга, цепь, разрез. Алгоритм Флойда-Уоршелл. Решение задачи аналитическим методом. Создание приложения для решения задачи.
курсовая работа [541,3 K], добавлен 08.10.2015Рассмотрение эффективности применения методов штрафов, безусловной оптимизации, сопряженных направлений и наискорейшего градиентного спуска для решения задачи поиска экстремума (максимума) функции нескольких переменных при наличии ограничения равенства.
контрольная работа [1,4 M], добавлен 16.08.2010Методы решения задачи коммивояжера. Математическая модель задачи коммивояжера. Алгоритм Литтла для нахождения минимального гамильтонова контура для графа с n вершинами. Решение задачи коммивояжера с помощью алгоритма Крускала и "деревянного" алгоритма.
курсовая работа [118,7 K], добавлен 30.04.2011Использование системы MathCAD как средства описания алгоритмов решения основных математических задач. Рассмотрение законов Кеплера и понятия о всемирном тяготении. Аналитические и численные решения задачи трех тел (материальных точек), вывод уравнений.
курсовая работа [287,2 K], добавлен 04.06.2013Элементы алгебры и введение в математический анализ. Дифференциальное исчисление функций одной или нескольких переменных и элементы дифференциальной геометрии. Интегральное исчисление. Числовые и функциональные ряды. Кратные и криволинейные интегралы.
дипломная работа [188,5 K], добавлен 09.03.2009Деятельность при решении задач складывается из умственных действий и осуществляется эффективно, если первоначально она происходит на основе внешних действий с предметами. Главная проблема - дети не могут перейти от текста задачи к математической модели.
дипломная работа [79,2 K], добавлен 24.06.2008Основные методы формализованного описания и анализа случайных явлений, обработки и анализа результатов физических и численных экспериментов теории вероятности. Основные понятия и аксиомы теории вероятности. Базовые понятия математической статистики.
курс лекций [1,1 M], добавлен 08.04.2011Способы построения искусственного базиса задачи. Выражение искусственной целевой функции. Математическая модель задачи в стандартной форме. Получение симплекс-таблиц. Минимизации (сведения к нулю) целевой функции. Формы преобразования в задаче равенства.
задача [86,0 K], добавлен 21.08.2010Решение двойственной задачи с помощью первой основной теоремы теории двойственности, графическим и симплексным методом. Математическая модель транспортной задачи, расчет опорного плана перевозок методами северо-западного угла и минимального элемента.
контрольная работа [333,3 K], добавлен 27.11.2011Раскрытие понятия об уравнение Дирака и вывод его решения в виде плоских волн. Обозначение матриц и рассмотрение их основных свойств. Определение понятия спинора и релятивистских обозначений пространственно-временных координат и метрических тензоров.
курсовая работа [282,8 K], добавлен 14.06.2011История развития теории игр как математического метода изучения оптимальных стратегий в играх. Представление игр: экстенсивная и нормальная форма. Классификация и типы математических игр, их характеристика. Общее понятие и основные цели метаигры.
реферат [49,5 K], добавлен 29.12.2010