Решение игр в смешанных стратегиях
Алгоритм получения оптимального решения игры, не имеющей седловой точки, при помощи метода чередования чистых стратегий. Геометрическая интерпретация игры 2х2. Порядок и особенности определения оптимальных стратегий игроков геометрическим методом.
Рубрика | Математика |
Вид | реферат |
Язык | русский |
Дата добавления | 12.07.2015 |
Размер файла | 638,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Решение игр в смешанных стратегиях
Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.
Смешанной стратегией игрока А называется применение чистых стратегий с вероятностями , причем сумма вероятностей равна 1: = 1. Смешанные стратегии игрока А записываются в виде матрицы:
или в виде строки Аналогично смешанные стратегии игрока В обозначаются:
Или
,
где сумма вероятностей появления стратегий равна 1:
.
Чистые стратегии можно считать частным случаем смешанных и задавать строкой, в которой 1 соответствует чистой стратегии. На основании принципа минимакса определяется оптимальное решение (или решение) игры: это пара оптимальных стратегий в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v. Цена игры удовлетворяет неравенству:
,
где и - нижняя и верхняя цены игры.
Справедлива следующая основная теорема теории игр -- теорема Неймана. Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.
Пусть
и
пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.
Справедлива теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий.
Эта теорема имеет большое практическое значение -- она дает конкретные модели нахождения оптимальных стратегий при отсутствии седловой точки.
Рассмотрим игру размера 2х2, которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение -- это пара чистых стратегий, соответствующих этой точке.
Игра, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий
и .
Для того чтобы их найти, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии , то его средний выигрыш будет равен цене игры v, какой бы активной стратегией ни пользовался игрок В. Для игры 2х2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрока А (проигрыш игрока В) -- случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний выигрыш игрока А (оптимальная стратегия) будет равен v и для 1-й, и для 2-й стратегии противника.
Пусть игра задана платежной матрицей:
.
Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию
,
а игрок B - чистую стратегию(это соответствует 1-му столбцу платежной матрицы Р), равен цене игры v: .
Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегию , т.е.
.
Учитывая, что , получаем систему уравнений для определения оптимальной стратегии и цены игры v:
(1)
Решая эту систему, получим оптимальную стратегию
(2)
, (3)
и цену игры
. (4)
Применяя теорему об активных стратегиях при отыскании-- оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (или ) средний проигрыш игрока В равен цене игры v, т.е.
(5)
Тогда оптимальная стратегия определяется формулами:
(6)
(7)
Применим полученные результаты для отыскания оптимальных стратегий для игры «Поиск», рассмотренной в предыдущей лекции. Найти оптимальные стратегии игры «Поиск».
Решение. Игра "Поиск" задана платежной матрицей без седловой точки:
Поэтому ищем решение в смешанных стратегиях; для игрока А средний выигрыш равен цене игры v (при и ), для игрока В средний проигрыш равен цене игры v (при и ). Системы уравнений в данном случае имеют вид:
Решая эти системы, получаем
Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью 1/2, при этом средний выигрыш равен 0.
Геометрическая интерпретация игры 2х2
Решение игры 2х2 допускает наглядную геометрическую интерпретацию. Пусть игра задана платежной матрицей
По оси абсцисс отложим единичный отрезок ; точка (x=0) изображает стратегию , а все промежуточные точки этого отрезка -- смешанные стратегии первого игрока, причем расстояние от до правого конца отрезка -- это вероятность стратегии , расстояние до левого конца -- вероятность стратегии. На перпендикулярных осях 1--1 и II--II откладываем выигрыши при стратегиях и соответственно. Если 2-й игрок примет стратегию , то она дает выигрыши и на осях 1--1 и II--II, соответствующие стратегиям и . Обозначим эти точки на осях 1--1 и II--II буквой . Средний выигрыш , соответствующий смешанной стратегии , определяется по формуле математического ожидания
и равен ординате точки , которая лежит на отрезке и имеет абсциссу (рис.1).
Аналогично строим отрезок , соответствующий применению вторым игроком стратегии (рис.2). При этом средний выигрыш - ордината точки .
В соответствии с принципом минимакса оптимальная стратегия такова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в максимум. Ординаты точек, лежащих на ломаной (рис.3), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке-- против стратегии на участке -- против стратегии ). Оптимальную стратегию определяет точка N, в которой минимальный выигрыш достигает максимума; ее ордината равна цене игры v. На рис3 обозначены также верхняя и нижняя цены игры и.
Пример 2
Применим геометрический метод для решения следующей задачи. Решить графически игру, заданную платежной матрицей:
решение игра смешанный стратегия
Решение. Откладываем по оси абсцисс (рис.4) единичный отрезок . На вертикальной оси 1--1 откладываем отрезки: = 1,5, соответствующий стратегии и = 3, соответствующий стратегии . На вертикальной оси II--II отрезок = 2 соответствует стратегии , отрезок = 1 соответствует стратегии ( рис.4). Нижняя цена игры . Верхняя цена игры , седловая точка отсутствует. Из рис.4 видно, что абсцисса точки N определяет оптимальную стратегию , а ордината -- цену игры v. Точка N является точкой пересечения прямых и . Уравнение прямой , проходящей через точки (0; 1,5) и (1; 2):
или
Уравнение прямой , проходящей через точки (0; 3) и (1;1):
или
Точка пересечения прямых является решением системы:
или х = 0,6; у == 1,8, т.е. N (0,6; 1,8).
Рис. 5
Таким образом, ;оптимальная стратегия=(0,6;0,4), цена игры v=1,8
Геометрически можно также определить оптимальную стратегию игрока В, если поменять местами игроков А и В и вместо максимума нижней границы в соответствии с принципом минимакса (рис.5) рассмотреть минимум верхней границы.
Абсцисса точки М определяет в оптимальной стратегии игрока В, ордината этой точки -цена игры. Прямая проходящая через точки (0; 1,5) и (1; 3), удовлетворяет уравнению
Прямая , проходящая через точки (0; 2) и (1; 1), удовлетворяет уравнению у = -х +2.
Координаты их точки пересечения М - это решение системы уравнений:
Откуда
х = 0,2; у = 1,8, т.е. =0,8,
Оптимальное решение игры найдено.
Из решения задачи следует, что геометрически можно определять оптимальную стратегию как игрока А, так и игрока B, в обоих случаях используется принцип минимакса, но во втором случае строится не нижняя, а верхняя граница выигрыша и на ней определяется не максимум, а минимум. Если платежная матрица содержит отрицательные числа, то для графического решения задачи лучше перейти к новой матрице с неотрицательными элементами; для этого к элементам исходной матрицы достаточно добавить соответствующее положительное число. Решение игры при этом не изменится, а цена игры увеличится на это число. В задаче платежная матрица не имела седловой точки ().
При наличии седловой точки графическое решение дают варианты, изображенные на рис.6 и рис.7. На рис.6 наибольшей ординатой на ломаной обладает точка , поэтому оптимальной является чистая стратегия для игрока А ( - для игрока В), т.е. оптимальное решение: = (0; 1), = (0; 1). Игра имеет седловую точку = v.
Чистая стратегия (рис.7) не выгодна для игрока В, поскольку при любой стратегии игрока А она дает последнему больший выигрыш, чем чистая стратегия . На основании принципа минимакса выделим прямую и на ней точку с наибольшей ординатой на оси I-I. Чистая стратегия является оптимальной для игрока А, а чистая стратегия - для игрока В. Оптимальное решение: цена игры , т.е. имеется седловая точка.
Графический метод можно применить также при решении игры 2 и m
Размещено на Allbest.ru
...Подобные документы
Определение матричных игр в чистых стратегиях. Смешанные стратегии и их свойства. Решения игр матричным методом. Метод последовательного приближения цены игры. Отыскание седлового элемента. Антагонистические игры как первый класс математических моделей.
контрольная работа [855,7 K], добавлен 01.06.2014Принятие решений как особый вид человеческой деятельности. Рациональное представление матрицы игры. Примеры матричных игр в чистой и смешанной стратегиях. Исследование операций: взаимосвязь задач линейного программирования с теоретико-игровой моделью.
курсовая работа [326,4 K], добавлен 05.05.2010Принцип минимакса как основа целесообразного поведения игроков в антагонистической игре. Порядок разыгрывания в некооперативной игре в нормальной форме. Принцип оптимальности стратегий для нее. Представление игры в развернутой и в нормальной форме.
реферат [241,5 K], добавлен 20.10.2012Составление платежной матрицы, поиск нижней и верхней чисты цены игры, максиминной и минимаксной стратегии игроков. Упрощение платежной матрицы. Решение матричной игры с помощью сведения к задаче линейного программирования и надстройки "Поиск решения".
контрольная работа [1010,3 K], добавлен 10.11.2014Сущность и характеристика метода покоординатного спуска (метод Гаусса-Зейделя). Геометрическая интерпретация метода покоординатного спуска для целевой функции z=(x,y). Блок-схема и алгоритм для написания программы для оптимизации методом Хука-Дживса.
контрольная работа [878,3 K], добавлен 26.12.2012Основные определения теории биматричных игр. Пример биматричной игры "Студент-Преподаватель". Смешанные стратегии в биматричных играх. Поиск "равновесной ситуации". 2x2 биматричные игры и формулы для случая, когда у каждого игрока имеется две стратегии.
реферат [84,2 K], добавлен 13.02.2011Исследование сущности и сфер применения метода итераций. Нелинейные уравнения. Разработка вычислительный алгоритм метода итераций. Геометрический смысл. Составление программы решения систем нелинейных уравнений методом итераций в среде Turbo Pascal.
реферат [183,7 K], добавлен 11.04.2014Основные сведения о симплекс-методе, оценка его роли и значения в линейном программировании. Геометрическая интерпретация и алгебраический смысл. Отыскание максимума и минимума линейной функции, особые случаи. Решение задачи матричным симплекс-методом.
дипломная работа [351,2 K], добавлен 01.06.2015Последовательность решения линейной краевой задачи. Особенности метода прогонки. Алгоритм метода конечных разностей: построение сетки в заданной области, замена дифференциального оператора. Решение СЛАУ методом Гаусса, конечно-разностные уравнения.
контрольная работа [366,5 K], добавлен 28.07.2013Теория игр - математическая теория конфликтных ситуаций. Разработка математической модели игры двух лиц с нулевой суммой, ее реализация в виде программных кодов. Метод решения задачи. Входные и выходные данные. Программа, руководство пользователя.
курсовая работа [318,4 K], добавлен 17.08.2013Формирование нижних и верхних оценок целевой функции. Алгоритм метода ветвей и границ, решение задач с его помощью. Решение задачи коммивояжера методом ветвей и границ. Математическая модель исследуемой задачи, принципы ее формирования и порядок решения.
курсовая работа [153,2 K], добавлен 25.11.2011Суть задачи коммивояжера, ее применение. Общая характеристика методов ее решения: метод полного перебора, "жадные" методы, генетические алгоритмы и их обобщения. Особенности метода ветвей и границ и определение наиболее оптимального решения задачи.
курсовая работа [393,2 K], добавлен 18.06.2011Основные определения. Алгоритм решения. Неравенства с параметрами. Основные определения. Алгоритм решения. Это всего лишь один из алгоритмов решения неравенств с параметрами, с использованием системы координат хОа.
курсовая работа [124,0 K], добавлен 11.12.2002Понятие Диофантовых уравнений, их сущность и особенности, методика и этапы решения. Великая теорема Ферма и порядок ее доказательства. Алгоритм решения иррациональных уравнений. Метод поиска Пифагоровых троек. особенности решения уравнения Каталана.
учебное пособие [330,2 K], добавлен 23.04.2009Игры, повторяемые многократно, их отличительные свойства и этапы. Смешанные стратегии, условия и возможности их использования на практике. Аналитический метод решения игры типа 2 x 2. Основные теоремы для прямоугольных игр. Алгебраические решения.
презентация [893,5 K], добавлен 23.10.2013Линейное программирование как наиболее разработанный и широко применяемый раздел математического программирования. Понятие и содержание симплекс-метода, особенности и сферы его применения, порядок и анализ решения линейных уравнений данным методом.
курсовая работа [197,1 K], добавлен 09.04.2013Нахождение проекции точки на прямую, проходящую через заданные точки. Изучение формул Крамера для решения систем линейных уравнений. Определение точки пересечения перпендикуляра и исходной прямой. Исследование и решение матричной системы методом Гаусса.
контрольная работа [98,6 K], добавлен 19.04.2015История развития теории игр как математического метода изучения оптимальных стратегий в играх. Представление игр: экстенсивная и нормальная форма. Классификация и типы математических игр, их характеристика. Общее понятие и основные цели метаигры.
реферат [49,5 K], добавлен 29.12.2010Решение уравнения гармонического осциллятора при помощи разложения в ряд Тейлора. Применение метода индуцированной алгебры. Решение уравнения гармонического осциллятора при помощи метода индуцированной алгебры. Сравнение работоспособности методов решений.
курсовая работа [92,0 K], добавлен 24.05.2012Стандартные методы решений уравнений и неравенств. Алгоритм решения уравнения с параметром. Область определения уравнения. Решение неравенств с параметрами. Влияние параметра на результат. Допустимые значения переменной. Точки пересечения графиков.
контрольная работа [209,4 K], добавлен 15.12.2011