Об одном альтернативном утверждении относительно исхода дифференциальной игры "наведения-уклонения" нескольких лиц в классе "чистых" и "смешанных" стратегий

Позиционная дифференциальная игра "наведения–уклонения" нескольких лиц. Динамика конфликтно-управляемого объекта. Формализация игры в классе "чистых" стратегий. Теорема об альтернативе. Основные условия существования седловой точки в "маленькой игре".

Рубрика Математика
Вид статья
Язык русский
Дата добавления 26.04.2019
Размер файла 261,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Об одном альтернативном утверждении относительно исхода дифференциальной игры "наведения-уклонения" нескольких лиц в классе "чистых" и "смешанных" стратегий

С. В. Лутманов

Пермский государственный университет, Россия, 614990, Пермь, ул. Букерева, 15

mpu@psu.ru; (342)239-63-09

Рассматривается позиционная дифференциальная игра "наведения-уклонения" нескольких лиц. Игра формализована в классе "чистых" и "смешанных" стратегий. В предположении, что целевые множества игроков попарно не пересекаются, доказывается альтернативное утверждение относительно исходов игры. Смысл утверждения состоит в следующем. Для каждой начальной позиции либо существует единственный игрок, разрешающий задачу наведения на свое целевое множество, либо найдется такой способ управления всех игроков, что ни один из игроков-"уклонистов" не может привести фазовый вектор игры на свое целевое множество при условии, что остальные игроки придерживаются указанного способа управления.

Ключевые слова: "чистые" стратегии; "смешанные" стратегии; стабильный мост; теорема об альтернативе.

On one alternative statement relative to an outcome of the differential "training-evading" game of several persons in the class of "pure" and "mixed" strategies

S. V. Lutmanov

Perm State University, Russia, 614990, Perm, Bukirev st., 15

mpu@psu.ru; (342)239-63-09

The positional differential "training-evading" game of several persons is discussed. The game is formalized in the class of "pure" and "mixed" strategies. On the assumption that players' target sets do not intersect in pairs, the alternative statement relative to outcomes of the game is proved.

Key words: “pure” strategies; “mixed” strategies; stable bridge; theorem on an alternative.

1. Постановка дифференциальной игры "наведения-уклонения" нескольких лиц в классе "чистых" и "смешанных" стратегий

Динамика конфликтно-управляемого объекта описывается обыкновенным векторным дифференциальным уравнением

, (1.1)

где - текущее время, - фазовый вектор объекта, - вектор управляющих параметров i-го игрока, - вектор-функция, описывающая как внутреннее устройство объекта, так и воздействие различных внешних факторов. Будем предполагать, что множества компактны, а функция непрерывна по совокупности переменных .

Относительно правых частей дифференциальных уравнений (1.1) принимаются стандартные в теории дифференциальных игр предположения:

1) локальные условия Липшица

,;

;

2) условия продолжимости решения

.

В пространстве i-му игроку ставится в соответствие компактное множество , которое будем называть целевым множеством этого игрока. Неформальная цель игрока состоит в приведении фазового вектора игры в конечный момент времени на свое целевое множество. В случае если в конечный момент времени фазовый вектор игры не принадлежит ни одному из целевых множеств, то считается, что в игре достигнут компромисс. Описанную дифференциальную игру назовем игрой "наведения-уклонения" нескольких лиц.

Принимается, что в любой момент времени игроки имеют точную информацию о реализовавшейся позиции игры. В случае уклонения какого-либо игрока от предписываемого набора стратегий ни игрок-"уклонист", ни оставшиеся игроки не получают дополнительной информации о действиях друг друга. В зависимости от выполнения или невыполнения условия существования седловой точки в "маленькой игре" (см. определение 1) дифференциальная игра формализуется либо в классе "чистых", либо в классе "смешанных" позиционных стратегий.

2. Формализация игры в классе "чистых" стратегий

Формализуем дифференциальную игру нескольких лиц в классе "чистых" позиционных стратегий.

Определение 1. Будем говорить, что в дифференциальной игре нескольких лиц выполнено условие существования седловой точки в "маленькой игре", если для всех номеров и векторов выполняется равенство

,

. (2.1)

Условие (2.1), в частности, имеет место для функций вида

..

Определение 2. "Чистой" позиционной стратегией i-го игрока называется произвольная функция

, .

игра наведение стратегия седловой

Соответствие между позиционной стратегией и реализующей ее функцией будем обозначать символом .

Пусть - набор произвольных "чистых" позиционных стратегий и - конечное разбиение отрезка времени точками

.

Определение 3. Ломаной Эйлера , выходящей из позиции и порожденной набором позиционных стратегий , назовем всякую абсолютно непрерывную функцию , удовлетворяющую дифференциальному уравнению

Определение 4. Движением, выходящим из позиции и порожденным набором "чистых" позиционных стратегией , , назовем всякую функцию , для которой найдется последовательность ломаных Эйлера , равномерно сходящаяся к ней на отрезке при условии .

Совокупность всех движений, выходящих из позиции и порожденных набором "чистых" позиционных стратегией , , будем обозначать символом и называть пучком конструктивных движений. Можно показать [1], что для любой позиции и любого набора "чистых" позиционных стратегий пучок движений

содержит хотя бы одно движение.

Уклонение i-го () игрока от стратегии, предписываемой ему набором стратегий , будем моделировать тем, что в определении ломаной Эйлера реализация вектора управляющих воздействий i-го игрока определяется не в виде кусочно-постоянной функции

(2.2)

а в виде произвольного программного управления . Пучок конструктивных движений, получающийся в результате перебора всех возможных уклонений i-го игрока, обозначим символом

.

Игрок под номером , принимая решение уклониться от стратегии, предписываемой ему каким-либо набором стратегий, должен учитывать возможность любых действий со стороны остальных игроков. Эту возможность будем моделировать тем, что в определении ломаной Эйлера реализация вектора управляющих воздействий j-го игрока, определяется не в виде кусочно-постоянной функции (2.2), а в виде произвольного программного управления . Пучок конструктивных движений, получающийся в результате перебора всех возможных действий со стороны игроков , обозначим символом .

В общем случае все множество номеров делится на множество и множество . Игроки, номера которых принадлежат множеству , формируют свои управляющие воздействия по формуле (1). Остальные игроки формируют их в виде произвольного программного управления

.

Пучок конструктивных движений в этом случае обозначим символом . Очевидно, что

..

3. Формализация игры в классе "смешанных" стратегий

В случае невыполнения условия (2.1) дифференциальная игра формализуется в классе "смешанных" позиционных стратегий.

Определение 5. "Смешанной" позиционной стратегией i-го игрока называется произвольная функция

,

которая каждой позиции ставит в соответствие меру , где совокупность всех вероятностных мер, нормированных на множестве .

Пусть , - набор произвольных "смешанных" позиционных стратегий и - конечное разбиение отрезка времени точками .

Определение 6. Ломаной Эйлера , выходящей из позиции и порожденной набором "смешанных" позиционных стратегией , назовем всякую абсолютно непрерывную функцию , удовлетворяющую дифференциальному уравнению

,

.

Определение 7. Движением, выходящим из позиции и порожденным набором "смешанных" позиционных стратегией , , назовем всякую функцию , для которой найдется последовательность ломаных Эйлера

, равномерно сходящаяся к ней на отрезке при условии .

Совокупность всех движений, выходящих из позиции и порожденных набором "смешанных" позиционных стратегией , будем обозначать символом . Известно [1], что для любой позиции и любого набора "смешанных" позиционных стратегий пучок движений содержит хотя бы одно движение.

Уклонение i-го () игрока от стратегии, предписываемой ему набором стратегий , будем моделировать тем, что в определении ломаной Эйлера реализация вероятностной меры, нормированной на множестве -области изменения управляющих параметров i-го игрока, определяется не в виде кусочно-постоянной меры

, (3.1)

а в виде произвольной слабо измеримой меры . При этом слабая измеримость меры понимается в том смысле, что для любой непрерывной функции функция , определенная формулой

,

измерима по Лебегу на промежутке . Пучок конструктивных движений, получающийся в результате перебора всех возможных слабо измеримых вероятностных мер, нормированных на множестве , обозначим символом

.

Игрок под номером , принимая решение уклониться от стратегии, предписываемой ему каким-либо набором стратегий, должен учитывать возможность любых действий со стороны остальных игроков. Эту возможность будем моделировать тем, что в определении ломаной Эйлера реализация вектора управляющих воздействий j-го игрока, определяется не в виде кусочно-постоянной меры (2), а в виде произвольной слабо измеримой меры . Пучок конструктивных движений, получающийся в результате перебора всех возможных действий со стороны игроков , обозначим символом .

В общем случае все множество номеров поделим на множество и . При построении ломаной Эйлера принимаем, что игроки с номерами из множества формируют свои управляющие воздействия по формуле (2), а остальные игроки - в виде произвольной слабо измеримой меры . Пучок конструктивных движений в этом случае обозначим символом . Очевидно, что

.

4. Стабильные мосты

В дальнейшем на базе сформулированной игры "наведения-уклонения" нескольких лиц будет рассматриваться вспомогательная антагонистическая дифференциальная игра "наведения-уклонения" двух лиц [1]. В этой игре первый игрок отождествляется с подмножеством игроков , а второй игрок - с подмножеством игроков . Первый игрок решает задачу наведения на множество , а второй-задачу уклонения от этого множества.

В зависимости от классов стратегий, в которых игра формализована, будем применять следующие обозначения:

оба игрока применяют "чистые" стратегии;

оба игрока применяют "смешанные" стратегии.

Определение 8. Множество

будем называть i-стабильным (-стабиль-ным) мостом, обрывающимся на множестве , в дифференциальной игре "наведения-уклонения" нескольких лиц, если оно является стабильным мостом первого игрока [1], в антагонистической игре

,

и при этом

.

Из определения стабильности следует, что если два множества являются стабильными мостами в любом из указанных выше смыслов, то и их объединение также будет стабильным мостом. Тогда существует максимальный стабильный мост, содержащий любой другой стабильный мост. В работе [1] показано, что максимальный стабильный мост замкнут.

Лемма 1. Пусть W - максимальный -стабильный (при выполнении (1.2) i-стабильный) мост, обрывающийся на множестве . Тогда для любого найдется такое, что будет выполнено

.

Здесь максимальный -стабильный (i-стабильный) мост, обрывающийся на множестве . Множество представляет собой замкнутую -окрестность множества .

Доказательство. Допустим, что утверждение леммы неверно. Тогда найдутся число и последовательность монотонно убывающих чисел , таких, что

,

где . Каждое из множеств замкнуто и ограничено, так как оно образовано пересечением двух замкнутых множеств, одно из которых ограничено. Из монотонного убывания последовательности положительных чисел следует, что для любых номеров выполнено вложение . Отсюда в силу [2] выводим, что

.

Пусть . Тогда . Из того факта, что множество является максимальным стабильным мостом, обрывающимся на множестве , следует, что для начальной позиции неразрешима задача наведения в антагонистической дифференциальной игре .

По теореме об альтернативе [1] в этой позиции разрешима задача об уклонении от некоторой открытой -окрестности множества в антагонистической дифференциальной игре (в случае выполнения условия (2.1) в игре ). Следовательно, позиция не может принадлежать ни одному из мостов , для которых . Последнее утверждение невозможно, так как из включения должно следовать включение при всех . Полученное противоречие доказывает лемму.

Определение 9. Множество будем называть -стабильным (-стабиль-ным) мостом в дифференциальной игре "наведения-уклонения" нескольких лиц, если оно является стабильным мостом второго игрока [1], в антагонистической игре

, ().

Определение 10. Систему множеств будем называть -стабильной (-стабильной), если для всех множество является -стабильным (-стабильным) мостом в дифференциальной игре "наведения-уклонения" нескольких лиц.

5. Экстремальное прицеливание

Пусть замкнутое множество.

Определение 11. Стратегия () -го игрока называется экстремальной к множеству , если она является экстремальной стратегий первого игрока к множеству в игре ().

Лемма 2. Пусть замкнутый -стабильный (-стабильный) мост в дифференциальной игре "наведения-уклонения" нескольких лиц, стратегия является экстремальной к множеству и . Тогда для всякого движения

(при выполнении условия (1.2) ) будет выполнено включение для всех , если , .

Справедливость данной леммы следует непосредственно из леммы 15.1 (леммы 65.1) [1].

Пусть система попарно непересекающихся открытых множеств. Полагаем

. (5.1)

В случае, когда точек , доставляющих в (5.1), более одной, берется любая из них.

Определение 12. Набор "чистых" стратегий будем называть экстремальным к системе множеств , если при всех и позициях , для которых

,

имеет место равенство

=

.

Для остальных позиций управляющие воздействия игроков принимаются произвольными векторами из допустимых множеств.

Определение 13. Набор "смешанных" стратегий будем называть экстремальным к системе множеств , если при всех и позициях , для которых , имеет место равенство

Для остальных позиций управляющие воздействия игроков отождествляются с произвольными вероятностными мерами на допустимых множествах.

Лемма 3. Пусть система попарно непересекающихся открытых -стабильных (-стабильных) множеств. Набор стратегий () всех игроков является экстремальным к системе множеств

и

.

Тогда для любого номера и движения (при выполнении условия (1.2) )

будет выполнено включение

для всех , если при всех .

Справедливость данной леммы следует непосредственно из леммы 15.2 (леммы 65.2) в книге [1].

6. Теорема об альтернативе

В этом пункте предполагается, что целевые множества игроков попарно не пересекаются. Дадим определения возможных исходов дифференциальной игры "наведения-уклонения" нескольких лиц.

Определение 14. Будем говорить, что в начальной позиции стратегия -го игрока, , решает задачу наведения на целевое множество этого игрока, если для всех (для всех ) выполнено включение .

Определение 15. Будем говорить, что в начальной позиции набор стратегий всех игроков является компромиссным, если существует , что для всех и

.

выполняется условие

.

Лемма 4. Пусть выполнено условие

Тогда где максимальный -стабильный мост (при выполнении условия (2.1) максимальный -стабильный мост), обрывающийся на множестве .

Доказательство. От противного приходим к паре индексов , для которых . Пусть . Тогда в силу леммы 2 стратегия , экстремальная к множеству , и стратегия , экстремальная к множеству , игроков и соответственно обеспечат включения

(при выполнении условия (2.1)

),

(при выполнении условия (2.1)

).

С другой стороны, справедливо вложение

().

Для любого

, ()

должно выполняться

.

Последнее невозможно, что и доказывает справедливость леммы.

Из доказанной леммы следует, что для начальной позиции справедливо одно и только одно из следующих двух утверждений:

1) существует номер , что ;

2) ,

где максимальный -стабильный (-стабильный) мост, обрывающийся на множестве .

В первом случае очевидно разрешима задача наведения -го игрока в соответствующем классе стратегий. Пусть имеет место второй случай. Тогда по лемме 1 найдется число , что , где - максимальный -стабильный (-стабиль-ный) мост, обрывающийся на множестве . Для всех номеров множество является открытым. Оно представляет собой совокупность тех и только тех начальных позиций, для которых не разрешима задача уклонения второго игрока в антагонистической дифференциальной игре

(при выполнении условия (2.1) игре ). Тогда множество является максимальным стабильным мостом первого игрока в игре

(в игре ) и, следовательно, -стабильным (-стабильным) мостом. Отсюда следует, что система открытых множеств является -стабильной (-стабильной.). Тогда по лемме 3 для всякой начальной позиции

набор стратегий всех игроков, экстремальный к системе множеств , будет компромиссным.

Таким образом, доказано следующее альтернативное утверждение относительно исходов дифференциальной игры "наведения-уклонения" нескольких лиц.

Размещено на http://www.allbest.ru/

Теорема 1. Пусть в дифференциальной игре "наведения-уклонения" нескольких лиц целевые множества игроков попарно не пересекаются. Тогда для любой начальной позиции либо существует игрок, решающий задачу наведения на свое целевое множество в классе "смешанных" стратегий, либо существует компромиссный набор "смешанных" стратегий всех игроков. При выполнении (2.1) - условия существования седловой точки в "маленькой игре" аналогичная альтернатива имеет место и в классе "чистых стратегий".

Требование попарной непересекаемости целевых множеств в условиях теоремы существенно. Это видно из следующего примера.

Пример 1. Рассмотрим дифференциальную игру трех лиц:

Целевые множества и максимальные -стабильные мосты , показаны на рисунке. Пусть множество всех позиций таких, что любое движение в игре, выходящее из как из начальной, попадает на множество . На рисунке это множество ограничено штриховой линией. Полагаем , где

.

Непосредственно проверяется, что . Для любой начальной позиции утверждение теоремы неверно.

Список литература

1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.456 с.

2. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1976. 544 с.

Размещено на Allbest.ru

...

Подобные документы

  • Определение матричных игр в чистых стратегиях. Смешанные стратегии и их свойства. Решения игр матричным методом. Метод последовательного приближения цены игры. Отыскание седлового элемента. Антагонистические игры как первый класс математических моделей.

    контрольная работа [855,7 K], добавлен 01.06.2014

  • Принцип минимакса как основа целесообразного поведения игроков в антагонистической игре. Порядок разыгрывания в некооперативной игре в нормальной форме. Принцип оптимальности стратегий для нее. Представление игры в развернутой и в нормальной форме.

    реферат [241,5 K], добавлен 20.10.2012

  • Принятие решений как особый вид человеческой деятельности. Рациональное представление матрицы игры. Примеры матричных игр в чистой и смешанной стратегиях. Исследование операций: взаимосвязь задач линейного программирования с теоретико-игровой моделью.

    курсовая работа [326,4 K], добавлен 05.05.2010

  • Изучение общих сведений о матричных и антагонистических играх. Понятие позиционной игры, дерева, информационного множества. Рассмотрение принципа максимина и принципа равновесия. Оптимальность по Парето. Позиционная неантагонистическая игра, ее свойства.

    курсовая работа [1,4 M], добавлен 17.10.2014

  • Понятие функции нескольких переменных. Аргументы, частное значение и область применения функции. Рассмотрение функции двух и трех переменных. Предел функции нескольких переменных, теорема. Главная сущность непрерывности функции нескольких переменных.

    реферат [86,3 K], добавлен 30.10.2010

  • Игры, повторяемые многократно, их отличительные свойства и этапы. Смешанные стратегии, условия и возможности их использования на практике. Аналитический метод решения игры типа 2 x 2. Основные теоремы для прямоугольных игр. Алгебраические решения.

    презентация [893,5 K], добавлен 23.10.2013

  • Определение точки экстремума для функции двух переменных. Аналог теоремы Ферма. Критические, стационарные точки. Теорема "Достаточное условие экстремума", доказательство. Схема исследования функции нескольких переменных на экстремум, практический пример.

    презентация [126,2 K], добавлен 17.09.2013

  • Основные статистические показатели, их расчет на практике при исследовании и анализе влияния величины капитала на величину чистых активов, выявление закономерностей для совокупности. Влияние величины капитала на величину чистых активов и их взаимосвязь.

    курсовая работа [301,3 K], добавлен 22.08.2011

  • Основные определения теории биматричных игр. Пример биматричной игры "Студент-Преподаватель". Смешанные стратегии в биматричных играх. Поиск "равновесной ситуации". 2x2 биматричные игры и формулы для случая, когда у каждого игрока имеется две стратегии.

    реферат [84,2 K], добавлен 13.02.2011

  • Проектирование математической модели. Описание игры в крестики-нолики. Модель логической игры на основе булевой алгебры. Цифровые электронные устройства и разработка их математической модели. Игровой пульт, игровой контроллер, строка игрового поля.

    курсовая работа [128,6 K], добавлен 28.06.2011

  • Понятие функции двух и более переменных, ее предел и непрерывность. Частные производные первого и высших порядков. Определение полного дифференциала. Необходимые и достаточные условия существования экстремума и его нахождение на условном множестве.

    реферат [145,4 K], добавлен 03.08.2010

  • Составление платежной матрицы, поиск нижней и верхней чисты цены игры, максиминной и минимаксной стратегии игроков. Упрощение платежной матрицы. Решение матричной игры с помощью сведения к задаче линейного программирования и надстройки "Поиск решения".

    контрольная работа [1010,3 K], добавлен 10.11.2014

  • Исследование движения точки по отношению к двум системам координат. Абсолютная и относительная величины вектора. Теорема о сложении скоростей. Теорема о сложении ускорений (теорема Кориолиса). Применения правила Н.Е. Жуковского при нахождении ускорения.

    презентация [1,0 M], добавлен 24.10.2013

  • Теоретические аспекты обучения решению уравнений в 8 классе. Основные направления изучения линий уравнений в школьном курсе алгебры. Методика изучения квадратных уравнений. Методико-педагогические основы обучения решению квадратных уравнений.

    курсовая работа [134,3 K], добавлен 01.07.2008

  • Понятия зависимой, независимой переменных, области определения функции. Примеры нахождения области функции. Примеры функций нескольких переменных: линейная, квадратическая, функция Кобба-Дугласа. Построение графика и линии уровня функции двух переменных.

    презентация [104,8 K], добавлен 17.09.2013

  • Понятие, предел и непрерывность функции двух переменных. Частные производные первого порядка, нахождение полного дифференциала. Частные производные высших порядков и экстремум функции нескольких переменных. Необходимые условия существования экстремума.

    контрольная работа [148,6 K], добавлен 02.02.2014

  • Элементы алгебры и введение в математический анализ. Дифференциальное исчисление функций одной или нескольких переменных и элементы дифференциальной геометрии. Интегральное исчисление. Числовые и функциональные ряды. Кратные и криволинейные интегралы.

    дипломная работа [188,5 K], добавлен 09.03.2009

  • Понятие и основные свойства вложимой системы, необходимые условия вложимости и методы решения системы. Нахождение первого интеграла дифференциальной системы и условия его существования. Применение теоремы об эквивалентности дифференциальных систем.

    курсовая работа [97,7 K], добавлен 21.08.2009

  • Теория игр - математическая теория конфликтных ситуаций. Разработка математической модели игры двух лиц с нулевой суммой, ее реализация в виде программных кодов. Метод решения задачи. Входные и выходные данные. Программа, руководство пользователя.

    курсовая работа [318,4 K], добавлен 17.08.2013

  • Определение и примеры симметрических многочленов от трех и нескольких переменных. Решение систем уравнений с тремя неизвестными. Освобождение от иррациональности в знаменателе. Разложение на множители. Основная теорема об антисимметрических многочленах.

    курсовая работа [303,5 K], добавлен 12.04.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.