Реализация принципа компромисса в линейных дифференциальных играх нескольких лиц

Понятие компромиссного набора стратегий для дифференциальной игры нескольких лиц, способ его построения в классе позиционных стратегий. Разработка эффективного алгоритма реализации этого способа для линейной неантагонистической игры нескольких лиц.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 26.04.2019
Размер файла 390,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Пермский государственный национальный исследовательский университет

Реализация принципа компромисса в линейных дифференциальных играх нескольких лиц

С.В. Лутманов, К.А. Чернышев

Аннотация

Вводится понятие компромиссного набора стратегий для дифференциальной игры нескольких лиц. Обосновывается способ его построения в классе позиционных стратегий. Разработан эффективный алгоритм реализации этого способа для линейных дифференциальных игр. Рассмотрены модельные примеры.

Ключевые слова: компромиссный набор стратегий; равновесие по Нэшу; дифференциальная игра; стабильный мост; экстремальное прицеливание.

The concept of a compromise set of strategy for differential game of several persons is entered. The way of its construction locates in a class of item strategy. The effective algorithm of realization of this way is developed for linear differential games. Modeling examples are considered.

Key words: a compromise set of strategy; balance according to Nash; differential game; the stable bridge; an extreme aiming.

Содержание

Введение

1. Постановка линейной дифференциальной игры нескольких лиц

2. Принцип компромисса в неантагонистической игре нескольких лиц

3. Построение компромиссного набора стратегий

4. Стабильные мосты

5. Модельные примеры

Заключение

Список литературы

Введение

В работе [2] формулируются условия существования компромиссного набора стратегий в дифференциальных играх нескольких лиц в классе позиционных стратегий. Для линейных дифференциальных игр этим условиям можно придать конструктивный характер. На их базе авторами был разработан эффективный алгоритм построения компромиссных наборов стратегий. В статье указанный алгоритм был применен для исследования двух конкретных линейных дифференциальных игр трех лиц. В обеих играх рассматривается движение точки по гладкой горизонтальной плоскости. В первой игре управляющими параметрами игроков служат проекции вектора скорости, а во второй игре - вектора ускорения точки. На управляющие параметры игроков накладываются геометрические ограничения, состоящие в том, что рассматриваемые векторы произвольны по направлению, но ограничены по величине.

1. Постановка линейной дифференциальной игры нескольких лиц

В игре участвуют игроков. Они управляют точкой в пространстве на промежутке времени . Движение точки описывается обыкновенным векторным линейным дифференциальным уравнением

. (1.1)

Здесь - фазовый вектор - текущее время, - вектор управляющих параметров го игрока, - матрицы размера , , соответственно непрерывно зависящие от времени . Управление точкой -й игрок осуществляет путем выбора в каждый момент времени вектора управляющих параметров из заданного множества

.

В пространстве для всех задано выпуклое компактное множество , называемое целевым множеством i-го игрока. Платой игрока служит расстояние от проекции фазового вектора в конечный момент времени на первые координат до своего целевого множества. Таким образом,

. (1.2)

Неформальная цель игрока состоит в минимизации своей платы.

Управляющие параметры каждый игрок выбирает, основываясь на информации о текущем времени и реализовавшемся фазовом векторе. При этом он не осведомлен о выборе управляющих параметров остальными игроками в данный момент времени. Понятия позиционной стратегии игрока и движения точки, отвечающего набору позиционных стратегий, определяются аналогично [1].

Определение 1.1. Позиционной стратегией игрока называется произвольная функция

.

Пусть - некоторая позиционная стратегия и - конечное разбиение отрезка времени точками .

Определение 1.2. Ломаной Эйлера , выходящей из позиции и порожденной позиционной стратегией , назовем всякую абсолютно непрерывную функцию , удовлетворяющую дифференциальному уравнению

,

.

Здесь реализация вектора управляющих параметров для всех представляет собой произвольную интегрируемую по Лебегу функцию со значениями в множестве .

Определение 1.3. Движением, выходящим из позиции и порожденным позиционной стратегией -го, , игрока, назовем всякую функцию , для которой найдется последовательность ломаных Эйлера , равномерно сходящаяся к ней на при условии

.

Совокупность всех движений, выходящих из позиции и порожденных позиционной стратегией , -го, , игрока будем обозначать символом и называть пучком конструктивных движений. Пусть и каждый игрок с номером выбрал некоторую позиционную стратегию.

Определение 1.4. Множество

назовем пучком конструктивных движений, выходящих из начальной позиции и порожденных набором позиционных стратегий множества игроков .

Известно [1], что

для всех . При этом

,

если .

2. Принцип компромисса в неантагонистической игре нескольких лиц

Сформулируем принцип компромисса для игры нескольких лиц в нормальной форме

.

Здесь множество всех игроков, множество стратегий i-го игрока, а функция

,

является платой i-го игрока.

Пусть

В дальнейшем компоненты векторов и будем называть нижними и верхними компромиссными оценками соответствующего игрока.

Определение 2.1. Ситуация

называется компромиссной относительно оценок , если для всех выполняются неравенства

(2.1)

Из определения 2.1 следует, что для компромиссного набора стратегий значение платы го игрока лежит в промежутке , и никакое единоличное уклонение игрока от стратегии, предписываемой компромиссным набором, не позволяет ему получить значение платы лучше (меньше) нижней компромиссной оценки.

Компромисс игроков состоит в том, что й игрок предпочитает несущественному улучшению результата в игре не допустить значительного выигрыша любого из оппонентов , сохраняя при этом значение своей платы в пределах приемлемого неравенства .

Заметим, что при определение компромиссного набора стратегий переходит в определение равновесия по Нэшу.

В связи с тем, что пучки движений, порожденные позиционных стратегиями игроков, содержат более одного движения, определение компромиссного набора стратегий применительно к позиционной дифференциальной игре требует уточнения.

Определение 2.2. Будем говорить, что набор позиционных стратегий всех игроков компромиссен относительно векторов для начальной позиции , , если для всех выполнены неравенства

(2.2)

и

.(2.3)

3. Построение компромиссного набора стратегий

Обозначим

.

Полагаем , где максимальный стабильный мост первого игрока [1] в игре, в которой множество игроков решает задачу наведения на множество против игрока с номером в момент времени . Можно показать [2], что множества попарно не пересекаются, если попарно не пересекаются множества . При этом

.

Пусть множество таково, что

и

для всех . В предположении, что множества попарно не пересекаются, построим множество , обладающее свойствами:

1) - замкнутое множество;

2) ;

3) ;

4) для любой позиции и момента времени существует набор программных управлений

всех игроков, такой, что для решения дифференциального уравнения

выполняется включение .

Набор компромиссных стратегий определим соотношениями

,

если

если , любой вектор из множества в остальных позициях .

Здесь набор векторов удовлетворяет условиям

,

, , (3.1)

а набор векторов

условиям

,

. (3.2)

На рис. 1 приведена схема реализации управлений игроков в момент времени . Из нее видно, что построенный набор стратегий не является противоречивым. В работе [2] была доказана теорема, устанавливающая что этот набор стратегий является компромиссным для любой начальной позиции из множества .

Теорема 1. Набор стратегий всех игроков , определенный соотношениями (3.1)-(3.2), является компромиссным относительно оценок для любой начальной позиции .

4. Стабильные мосты

Множества и компромиссный набор стратегий могут быть построены на основе метода экстремального прицеливания в линейных дифференциальных играх [1].

Полагаем

,

(4.1)

где

, (4.2)

(4.3)

Заметим, что максимум в уравнении (4.2) достигается на единственном векторе , если . Предположим, что в равенстве (4.3) максимум также достигается на единственном векторе , если . Тогда функции дифференцируемы в областях, где они положительны, и при дифференцировании зависимость векторов от позиции игнорируется. Вычислим их полные производные по времени в силу системы. Имеем

(4.4)

Из выражения (4.4) видно, что

. (4.5)

Условие (4.5) обеспечивает стабильность моста .

Аналогично

(4.6)

Из (4.6) видно, что

. (4.7)

Условие (4.7) обеспечивает стабильность мостов .

Заметим, что управляющие параметры в равенстве (3.1), (3.2) в данном случае можно определить из условий

,

,

.

5. Модельные примеры

Пример 1. Рассматривается игра трех лиц на плоскости . Дифференциальные уравнения движения управляемой точки имеют вид

.

Целевыми множествами игроков являются точки

,

,

а компромиссными оценками - векторы

.

Множества записываются в виде

Взаимное расположение указанных множеств приведено на рис. 2.

Множества строятся по формулам (4.1)-(4.3):

,

.

Взаимное расположение этих множеств показано на рис. 3.

Обозначим

.

Компромиссный набор стратегий определяется по формулам

если ,

если , любой вектор из множества в остальных позициях;

если ;

если , любой вектор из множества в остальных позициях;

если ,

если , любой вектор из множества в остальных позициях;

Для начальной позиции рассмотрим последовательно следующие ситуации:

А) среди игроков нет уклонистов;

Б) первый игрок уклоняется от компромиссного набора, прицеливаясь на свое целевое множество;

В) второй игрок уклоняется от компромиссного набора, прицеливаясь на свое целевое множество;

Г) третий игрок уклоняется от компромиссного набора, прицеливаясь на свое целевое множество.

Управление уклонистом выбираем в виде

если , и любой вектор из множества в остальных позициях. Результаты расчетов приведены в табл. 1.

Таблица 1

Игрок

Нижняя компромиссная оценка

Величина платы для компромиссной ситуации

Величина платы при уклонении

Верхняя компромиссная оценка

Первый

0.3

0.402921

0.301655

0.42

Второй

0.9

1.23664

0.906414

1.3

Третий

1.4

1.71456

1.40452

1.75

Данные табл. 1 подтверждают факт принадлежности значения платы го игрока промежутку , для компромиссного набора стратегий. При этом уклонение игрока от этого набора не привело к достижению игроком-уклонистом величины платы меньшей, чем его нижняя компромиссная оценка.

Пример 2. Рассматривается игра, описанная в примере 1. Отличие состоит в том, что дифференциальные уравнения движения управляемой точки имеют вид

Вводя обозначения , приходим к эквивалентной записи этой системы

Множества здесь имеют вид

,

.

Обозначим

.

Компромиссный набор стратегий определяется по формулам

если ,

если ,

любой вектор из множества в остальных позициях;

если ,

если ,

любой вектор из множества в остальных позициях;

если ,

если ,

любой вектор из множества в остальных позициях;

Для начальной позиции

рассмотрим те же ситуации А)-Г), что и в примере 1. Управления уклонистов выбираем в виде

если , любой вектор из множества в остальных позициях. Результаты расчетов приведены в табл. 2.

Таблица 2

Игрок

Нижняя компромиссная оценка

Величина платы для компромиссной ситуации

Величина платы при уклонении

Верхняя компромиссная оценка

Первый

0.3

0.395655

0.310041

0.42

Второй

0.9

1.25179

1.11112

1.3

Третий

1.4

1.72333

1.70119

1.75

Данные табл. 2 снова подтверждают факт принадлежности значения платы i-го игрока промежутку , для компромиссного набора стратегий. При этом уклонение игрока от этого набора не приводит к достижению игроком-уклонистом величины платы меньшей, чем его нижняя компромиссная оценка.

Заключение

линейный дифференциальный игра алгоритм

В статье разработан эффективный алгоритм построения компромиссного набора стратегий для линейных дифференциальных игр. На его базе исследованы две конкретные дифференциальные игры. Численные эксперименты подтвердили свойство компромиссного набора, выражающегося в том, что уклонение любого из игроков от компромиссного набора стратегий не позволяет ему получить значение платы меньше, чем его нижняя компромиссная оценка.

Список литературы

1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1973. 455 с.

2. Лутманов С.В. Математическая модель компромиссного управления динамическими системами. // Вестн. Перм. ун-та. Сер. Математика. Механика. Информатика. 2012. Вып. 1(9). С.38-45.

Размещено на Allbest.ru

...

Подобные документы

  • Разработка на основе игры "Точки" подхода к программированию "искусственного интеллекта" в позиционных играх и возможность применения данного подхода для решения задач в области экономики, управления и других областях науки. Модель игровой ситуации.

    дипломная работа [1,5 M], добавлен 21.07.2013

  • Проблема сокращения перебора при анализе сложных позиционных игр, древовидная структура выбора стратегий, в которых дерево игры в силу своего гигантского размера не может быть построено на практике полностью. Короткие нарды как конкретный пример игры.

    дипломная работа [1,6 M], добавлен 27.10.2013

  • Реализация программы для решения матричных игр. Задание матрицы игры вручную и случайным образом, нахождение оптимальных стратегий игроков итерационным и методом чистых стратегий. Проектирование и листинг программного кода, сохранение матрицы игры.

    контрольная работа [716,7 K], добавлен 11.06.2011

  • Методы вычисления точных вероятностей в покере. Проектирование алгоритма нахождения вероятности выигрыша для нескольких игроков. Теоретический расчет вероятности выигрыша в игре. Программная оптимизация и упрощение алгоритмов вычисления вероятностей.

    курсовая работа [96,1 K], добавлен 17.06.2013

  • Основные подходы при создании Windows приложений. Изучение навыков работы с 2D графикой в Windows приложениях. Методы генерации псевдослучайных чисел. Разработка игры "Сапер" с расположением мин на основе нескольких методов генерации случайных чисел.

    курсовая работа [63,2 K], добавлен 18.02.2009

  • Характеристика задачи АВ01, ее выходная и входная информация, выбор и обоснование состава технических средств и средств программной реализации. Разработка алгоритма и программы решения задачи АВ01, руководства пользователя и контрольный пример решения.

    курсовая работа [2,1 M], добавлен 21.12.2011

  • Приемы программирования в Delphi. Алгоритм поиска альфа-бета отсечения, преимущества. Описание программного средства. Разработка программы, реализующая алгоритм игры "реверси". Руководство пользователя. Листинг программы. Навыки реализации алгоритмов.

    курсовая работа [357,1 K], добавлен 28.02.2011

  • Разработка и реализация компьютерной игры "Змейка" с помощью языка программирования Pascal и модуля CRT. Составление общего алгоритма программы, выделение ее функциональных частей. Разработка тестовых примеров. Использование типизированных файлов.

    курсовая работа [2,1 M], добавлен 23.02.2011

  • Выбор программных средств для реализации игры "Угадай число". Разработка функционально-структурной схемы для написания текста программы. Изучение сути вариации алгоритма полного перебора с определённой эвристикой. Варианты компьютерной реализации игры.

    контрольная работа [337,3 K], добавлен 19.06.2012

  • Общие сведения и существующие среды реализации компьютерной игры "Лабиринт". Разработка алгоритмов в виде блок-схемы, принципы программной реализации игры. Особенности тестирования разработанного программного продукта. Аспекты эксплуатации продукта.

    курсовая работа [1,4 M], добавлен 18.01.2017

  • Объединение как совокупность нескольких ансамблей дискретных, случайных событий. Безусловная энтропия - среднее количество информации, приходящееся на один символ. Описание информационных свойств непрерывного источника. Понятие дифференциальной энтропии.

    контрольная работа [106,8 K], добавлен 28.07.2009

  • Разработка быстрого и эффективного алгоритма для решения задачи оценки параметров обыкновенных дифференциальных уравнений с запаздывающими аргументами, не разрешаемых аналитически. Реализация алгоритма в виде библиотеки на языке программирования MATLAB.

    дипломная работа [1,6 M], добавлен 19.06.2012

  • Разработка и создание игры "Змейка". Использование динамически-активных принципов языка Java. Графические объекты программы. Описание игры, правила, теоретические сведения. Классы приложения. Типы данных. Реализация. Метод. Объект. Блок-схема игры.

    курсовая работа [12,4 K], добавлен 18.06.2008

  • Понятие и эволюция игр, анализ их различных жанров и существующих аналогов. Выбор программных средств для реализации игры, написание сюжета и выбор среды разработки игры. Алгоритмы для придания гибкости обучающей игре. Описание программных модулей.

    дипломная работа [2,7 M], добавлен 27.10.2017

  • Алгоритмическое представление и описание правил игры "Эволюция". Построение диаграммы прецедентов. Разработка графического интерфейса пользователя. Реализация интерфейса в среде Unity. Структура файла сохранения игры. Проектирование поведения компьютера.

    дипломная работа [3,3 M], добавлен 18.02.2017

  • Принципы работы и основы программирования машины Тьюринга, а также перечень правил написания алгоритмов на ее эмуляторе. Особенности решения задачи по сложению нескольких чисел в двоичной системе путем реализации ее алгоритма на эмуляторе машины Тьюринга.

    контрольная работа [82,4 K], добавлен 05.12.2010

  • Исследование спецификации логической игры "Сапёр". Системное и функциональное проектирование приложения. Разработка программных модулей. Обзор классов, необходимых для создания интерфейса данного приложения. Инструменты для реализации логической игры.

    курсовая работа [1,2 M], добавлен 13.01.2016

  • Разработка компьютерной игры "Эволюция" с помощью игрового движка Unit. Сравнение критериев игры-аналога и разрабатываемой игры. Разработка графического интерфейса пользователя. Настройки камеры в редакторе Unity. Структура файла сохранения игры.

    дипломная работа [3,6 M], добавлен 11.02.2017

  • История возникновения и происхождения игры в шашки, ее популярность. Классификация шашечных игр по размерам доски и особенностям правил, виды и варианты шашек. Правила воспроизведения сражений в "Русские шашки". Составление алгоритма и кода программы.

    курсовая работа [250,3 K], добавлен 28.01.2012

  • Характеристика разновидностей программной реализации чатов. Разработка программы клиент-серверного чата с возможность общения в локальной сети нескольких человек одновременно. Протокол взаимодействия клиента и сервера. Порядок работы с программой.

    курсовая работа [530,7 K], добавлен 25.04.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.