Гладкие потенциалы в построении компромиссных наборов стратегий в дифференциальных играх нескольких лиц
Обосновывается алгоритм построения компромиссного набора стратегий для дифференциальной игры нескольких лиц. Рассматривается набор гладких потенциалов, представляющих собой непрерывно дифференцируемые функции текущего времени и фазовых координат.
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 26.04.2019 |
Размер файла | 197,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
УДК 519.6
Гладкие потенциалы в построении компромиссных наборов стратегий в дифференциальных играх нескольких лиц
С.В. Лутманов
Пермский государственный национальный исследовательский университет
Россия, 614990, Пермь, ул. Букирева, 15
mpu@psu.ru; (342)239-63-09
Вводится понятие компромиссного набора стратегий для дифференциальной игры нескольких лиц. Обосновывается алгоритм его построения на базе набора гладких потенциалов, представляющих собой непрерывно дифференцируемые функции текущего времени и фазовых координат, производные которых в силу дифференциальных уравнений движения сохраняют постоянный знак. Приводится иллюстрирующий пример.
Ключевые слова: компромиссный набор стратегий; равновесие по Нэшу; дифференциальная игра; стабильный мост; экстремальное прицеливание.
дифференциальный игра потенциал координата
Smooth potentials in building compromise sets of strategies in differential games of several persons
S. V. Lutmanof
Perm State University, Russia, 614990, Perm, Bukireva st., 15
mpu@psu.ru; (342) 2 396-309
Introduces the notion of compromise package strategies in differential games of several persons. Substantiates the algorithm for its construction on the basis of the set of smooth potentials, representing a continuously differentiable functions in the current time and the phase-out coordinates, derivatives of the differential equations of motion keeps them permanent mark. Is the illustration.
Key words: a compromise set of strategies; Nash equilibrium; differential games; stable bridge; extremal aiming.
Наиболее распространенные подходы к выбору решения неантагонистической игры основаны на понятии равновесия, или -равновесия. Это решение обладает свойством устойчивости по отношению к игроку-уклонисту: единоличное отклонение от него каким-либо игроком приводит к ухудшению результата уклониста в игре. Анализ особенностей концепции равновесия в теории игр можно найти, например, в книге [1].
Исследованиям в области дифференциальных игр нескольких лиц посвящены работы отечественных авторов Гусева М.И., Жуковского В.И., Клейменова А.Ф., Кононенко А.Ф., Малафеева О.А., Петросяна Л.А., Петрова Н.Н., Смольякова Э.Р., Чистякова С.В. и др. В работах [2-3] приводятся некоторые результаты, полученные в этой области и подробная библиография. Обзор результатов зарубежных авторов представлен в статье [4].
Важным аспектом построения математической модели конфликтно управляемого динамического объекта является формализация понятия стратегии игрока и движения объекта, отвечающего выбранному набору стратегий игроков. В настоящей работе принят подход, развиваемый в монографиях Красовского Н.Н. и Субботина А.И. [5-6] для антагонистических дифференциальных игр и обобщенный на случай игр нескольких лиц Клейменовым А.Ф. в работе [7].
В статье рассматривается неантагонистическая игра нескольких лиц, в которой интерес каждого игрока, помимо минимизации своей платы, состоит еще и в том, чтобы любой из его оппонентов не мог получить результат лучший (меньший) некоторой заданной величины. При этом собственный результат игрока должен быть не хуже (не больше) другой заданной величины. В работе принимается, что рациональное поведение участников описанного конфликта состоит в выборе компромиссного набора стратегий, обеспечивающего каждому игроку значение платы не хуже (не больше) верхней оценки платы. При этом никакое единоличное уклонение игрока от стратегии, предписываемой компромиссным набором, не позволяет ему получить значение платы лучше (меньше) нижней оценки платы.
Игра в нормальной форме
Под игрой (необязательно дифференциальной), записанной в нормальной форме, будем понимать тройку
,
где - множество номеров игроков, - множество всех стратегий, а - функция платы -го, , игрока. Игра состоит в том, что каждый игрок выбирает независимо от других какую-либо стратегию из своего множества стратегий. В результате складывается ситуация , на которой вычисляется плата каждого из игроков. Игрок заинтересован в минимизации своей платы. Дополнительно предположим, что для значений плат каждого игрока заданы некоторые оценочные границы . В дальнейшем вектора
будем называть соответственно нижними и верхними компромиссными оценками плат игроков.
Классическое решение игры в форме равновесия (в том числе и равновесия при малом ) в общем случае не обязано удовлетворять включениям . В связи с этим предлагается следующее определение рационального поведения участников рассматриваемой конфликтной ситуации.
Определение 1.1. Ситуация называется компромиссной по отношению к оценкам , если для всех справедливы неравенства
.
Компромисс игроков заключается в том, что -й игрок предпочитает несущественному улучшению результата в игре (лучше ему все равно не получить) не допустить значительного выигрыша любого из оппонентов, т. е. не допустить неравенство сохраняя при этом значение своей платы в пределах приемлемого для себя неравенства
Заметим, что если некоторая ситуация является компромиссной относительно оценок , то она будет равновесной при и просто равновесной, если Необходимыми условиями существования компромиссных ситуаций служат неравенства
,
.
Дифференциальная игра нескольких лиц
Динамика системы описывается обыкновенным векторным дифференциальным уравнением
, (2.1)
где - текущее время, - фазовый вектор объекта, - вектор управляющих параметров -го игрока, - вектор-функция, описывающая как внутреннее устройство объекта, так и воздействие различных внешних факторов.
Будем предполагать, что множества компактны. Функция непрерывна по совокупности переменных .
Относительно правых частей дифференциальных уравнений (2.1) принимаются стандартные в теории дифференциальных игр предположения [5].
Локальные условия Липшица
,
.
Условия продолжимости решения
,
.
Существование седловой точки в "маленькой -игре" для всех :
=
,
Плата -го игрока определяется формулой
(2.2)
где - некоторая заданная непрерывная функция, - реализация фазового вектора объекта, а - момент окончания игры.
Свои управляющие параметры игроки назначают, основываясь на информации о текущем времени и реализовавшемся фазовом векторе объекта. При этом допускается, что в случае неоднозначной трактовки каких-либо элементов управляющей конструкции игроки осуществляют выбор этих элементов единым для всех образом. В частности, принимается, что физическая реализация управляющих воздействий игроков происходит в согласованные (в одни и те же для всех игроков) моменты времени.
Определение 2.1. Позиционной стратегией игрока называется произвольная функция , где .
Пусть и - набор произвольных позиционных стратегий множества игроков и - конечное разбиение отрезка времени точками .
Определение 2.2. Ломаной Эйлера , выходящей из позиции и порожденной набором позиционных стратегий , назовем всякую абсолютно непрерывную функцию , удовлетворяющую дифференциальному уравнению
,
,
где является произвольной интегрируемой по Лебегу функцией со значениями во множестве .
Определение 2.3. Движением, выходящим из позиции и порожденным набором позиционных стратегий множества игроков , будем называть всякую функцию , для которой найдется последовательность ломаных Эйлера , равномерно сходящаяся к ней на промежутке времени , при условии, что .
Совокупность всех движений, выходящих из позиции и порожденных набором позиционных стратегий , будем обозначать символом и называть пучком конструктивных движений, выходящих из позиции и порожденных набором позиционных стратегий множества игроков .
В частности, если , то ломаные Эйлера и пучок движений будем обозначать символами и соответственно. Известно [5], что для всех .
Гладкие потенциалы
По аналогии с книгой [5] введем понятие гладких потенциалов в дифференциальных играх нескольких лиц.
Определение 3.1. Пусть нижние и верхние компромиссные оценки. Будем говорить, что набор непрерывных функций
образует систему гладких потенциалов для этих оценок, если
существует число такое, что для всех функция непрерывно дифференцируема в области
,
а функция непрерывно дифференцируема в области
в каждой позиции существует набор управляющих параметров такой, что
+
и
.
Определим набор стратегий всех игроков условием
. (3.1)
Теорема 3.1. Набор стратегий является компромиссным относительно оценок для любой начальной позиции
.
Доказательство. Допустим противное. Тогда существует начальная позиция , для которой либо найдется номер и движение ,что будет выполнено неравенство
;
либо найдется номер и движение
,
что будет выполнено неравенство
.
Пусть имеет место первый случай и , где
.
Тогда существует число , так что для достаточно больших номеров будет выполняться неравенство . В силу условия найдутся номера и число (одно и то же для достаточно больших ), для которых
, ,
.
С одной стороны, выполнено неравенство
>. (3.2)
С другой стороны,
(3.3)
В силу условия 2.3 слагаемое стремится к нулю равномерно по всем ломаным Эйлера при .
Таким образом, левая часть неравенства (3.3) стремится к нулю с ростом , что противоречит (3.2).
Пусть теперь имеет место второй случай и , где
.
Тогда существует число , что для достаточно больших номеров будет выполняться неравенство . В силу найдутся номера и число (одно и то же для достаточно больших ), для которых
, ,
.
С одной стороны,
. (3.4)
С другой стороны,
(3.5)
В силу условия 2.3 слагаемое стремится к нулю равномерно по всем ломаным Эйлера при . Таким образом, левая часть неравенства (3.5) стремится к нулю с ростом , что противоречит (3.4). Теорема доказана.
Модельный пример
Для иллюстрации полученного результата приведем пример, рассмотренный в работе [8], и построим для него набор гладких потенциалов.
Пример 4.1. Рассматривается игра трех лиц на плоскости. Дифференциальные уравнения движения управляемой точки имеют вид
.
Целевыми множествами игроков служат точки
,
.
Взаимное расположение указанных множеств показано на рис. 1.
Компромиссными оценками служат векторы
.
Функции определим формулами
,
где координаты точки (см. рис. 1). Непосредственно проверяется, что для достаточно малых множества и множество попарно не пересекаются (рис. 2). Тогда набор управляющих параметров может быть корректно определен условиями
,
,
,
.
Покажем, что функции являются гладкими потенциалами.
Для этого достаточно установить, что наборы управляющих параметров обеспечивают выполнение условия 3.3. Действительно, пусть . Тогда
Пусть теперь . Тогда
Таким образом, условия 3.3 выполнены, набор функций является набором гладких потенциалов, и по теореме 3.1 набор стратегий всех игроков (3.1) является компромиссным относительно оценок
.
Заключение
В статье вводится понятие компромиссного набора стратегий, отражающее стремление игрока, помимо минимизации своей платы, не допустить, чтобы любой из его оппонентов получил результат лучший (меньший) некоторой заданной величины. При этом собственный результат игрока должен быть не хуже (не больше) другой заданной величины. Доказана теорема о том, что наличие гладких потенциалов позволяет эффективно строить компромиссный набор стратегий всех игроков.
Приведен пример дифференциальной игры трех лиц, в которой набор гладких потенциалов существует и компромиссный набор стратегий построен.
Список литературы
1. Харшаньи Д., Зельтен Р. Общая теория выбора равновесия в играх. СПб.: Экономическая школа, 2001. 405 с.
2. Тынянский Н.Т., Жуковский В.И. Дифференциальные игры с ненулевой суммой (бескоалиционный вариант) // Итоги науки и техники. Сер.: Мат. анализ. 1977. № 15. С.199-266.
3. Жуковский В.И., Ухоботов В.И. Дифференциальные игры со многими участниками. Указатель литературы за 1989-1994 гг. Челябинск: Чел. ГУ, 1995. 123 с.
4. Buckdahn R., Cardaliaguet P. Quincampoix M.: Some recent aspects of differential game theory. Dynamic Games and Applications 1. 2011. P. 74-114.
5. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1973. 455 с.
6. Красовский Н.Н. Управление динамической системой. М.: Наука, 1985. 520 с.
7. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука. Уральское отделение, 1993. 180 c.
8. Лутманов С.В., Чернышев К.А. Реализация принципа компромисса в линейных дифференциальных играх // Вестник Пермского университета. Сер.: Математика. Механика. Информатика. 2012. Вып. 3 (11). С. 42-49.
Размещено на Allbest.ru
...Подобные документы
Понятие функции нескольких переменных. Аргументы, частное значение и область применения функции. Рассмотрение функции двух и трех переменных. Предел функции нескольких переменных, теорема. Главная сущность непрерывности функции нескольких переменных.
реферат [86,3 K], добавлен 30.10.2010Понятия зависимой, независимой переменных, области определения функции. Примеры нахождения области функции. Примеры функций нескольких переменных: линейная, квадратическая, функция Кобба-Дугласа. Построение графика и линии уровня функции двух переменных.
презентация [104,8 K], добавлен 17.09.2013Существование и способ построения фундаментального набора решений для систем, состоящих из одного или нескольких неравенств. Метод последовательного уменьшения числа неизвестных. Системы однородных и неоднородных произвольных линейных неравенств.
курсовая работа [69,8 K], добавлен 09.12.2011Предмет и методы изучения дифференциальной векторно-матричной алгебры, ее структура. Векторное решение однородных и неоднородных дифференциальных уравнений. Численное решение векторно-матричных уравнений. Формулы построения вычислительных процедур.
реферат [129,3 K], добавлен 15.08.2009Алгоритм вычисления интегральной суммы для функции нескольких переменных f(x, y) по плоской кривой АВ. Ознакомление с понятием криволинейного интеграла первого рода. Представление формулы расчета криволинейного интеграла по пространственной кривой.
презентация [306,9 K], добавлен 17.09.2013Общая схема методов спуска. Метод покоординатного спуска. Минимизация целевой функции по выбранным переменным. Алгоритм метода Гаусса-Зейделя. Понятие градиента функции. Суть метода наискорейшего спуска. Программа решения задачи дискретной оптимизации.
курсовая работа [90,8 K], добавлен 30.04.2011Дифференциальные уравнения как модели эволюционных процессов. Автономные системы дифференциальных уравнений и их фазовые пространства. Асимптотическая устойчивость линейных однородных автономных систем. Изображения фазовых кривых при помощи ПО Maple.
дипломная работа [477,4 K], добавлен 17.06.2015История развития теории игр как математического метода изучения оптимальных стратегий в играх. Представление игр: экстенсивная и нормальная форма. Классификация и типы математических игр, их характеристика. Общее понятие и основные цели метаигры.
реферат [49,5 K], добавлен 29.12.2010Элементы алгебры и введение в математический анализ. Дифференциальное исчисление функций одной или нескольких переменных и элементы дифференциальной геометрии. Интегральное исчисление. Числовые и функциональные ряды. Кратные и криволинейные интегралы.
дипломная работа [188,5 K], добавлен 09.03.2009Численные методы представляют собой набор алгоритмов, позволяющих получать приближенное (численное) решение математических задач. Два вида погрешностей, возникающих при решении задач. Нахождение нулей функции. Метод половинного деления. Метод хорд.
курс лекций [81,2 K], добавлен 06.03.2009Алгоритм вычисления интегральной суммы для функции нескольких переменных по кривой АВ. Определение понятия криволинейного интеграла второго рода. Представление суммы интегралов двух функций вдоль кривой АВ как криволинейного интеграла общего вида.
презентация [69,4 K], добавлен 17.09.2013Расчет частных производных первого порядка. Поиск и построение области определения функции. Расчет полного дифференциала. Исследование функции на экстремум. Поиск наибольшего и наименьшего значения функции в замкнутой области. Производные второго порядка.
контрольная работа [204,5 K], добавлен 06.05.2012Понятие функции двух и более переменных, ее предел и непрерывность. Частные производные первого и высших порядков. Определение полного дифференциала. Необходимые и достаточные условия существования экстремума и его нахождение на условном множестве.
реферат [145,4 K], добавлен 03.08.2010Нахождение экстремума функции нескольких переменных не на всей области определения, а на множестве, удовлетворяющему некоторому условию. Практический пример нахождения точки максимума и минимума функции. Главные особенности метода множителей Лагранжа.
презентация [112,6 K], добавлен 17.09.2013Понятие и математическое описание элементов дифференциального уравнения как уравнения, связывающего искомую функцию одной или нескольких переменных. Состав неполного и линейного дифференциального уравнения первого порядка, их применение в экономике.
реферат [286,2 K], добавлен 06.08.2013Обобщенные решения линейных дифференциальных уравнений. Основные примеры построения фундаментальных решений линейных дифференциальных операторов с постоянными коэффициентами, метод преобразования Фурье. Преимущества использования методов спуска.
курсовая работа [1,1 M], добавлен 10.04.2014Определение наименьшего и наибольшего значения функции в ограниченной области и ее градиента; общего интеграла и общего и частного решения дифференциального уравнения. Исследование ряда на абсолютную сходимость с применением признаков Коши и Даламбера.
контрольная работа [107,2 K], добавлен 25.11.2013Понятие, предел и непрерывность функции двух переменных. Частные производные первого порядка, нахождение полного дифференциала. Частные производные высших порядков и экстремум функции нескольких переменных. Необходимые условия существования экстремума.
контрольная работа [148,6 K], добавлен 02.02.2014Построение графиков функций F(x), симметричное их отбражение относительно оси координат ОХ, ОУ, при значениях -F, -x. Особенности построения графиков функций и симметричное отображение относительно осей координат: f(x)+A; f(x+а); kf(x); |f(x)|; |f(|x|)|.
контрольная работа [82,1 K], добавлен 18.03.2010Виды дифференциальных уравнений: обыкновенные, с частными производными, стохастические. Классификация линейных уравнений второго порядка. Нахождение функции Грина, ее применение для решения неоднородных дифференциальных уравнений с граничными условиями.
курсовая работа [4,8 M], добавлен 29.04.2013