Методы решения игр
Решение игры с природой по критериям Гурвица, Лапласа, Сэвиджа и Вальда. Использование метода Брауна и симплекс-метода для определения оптимальной стратегии игрока и максимального значения выигрыша. Расчет цены игры, ее проверка на наличие седловой точки.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 03.05.2013 |
Размер файла | 2,3 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
ФГБОУ ВПО «УРАЛЬСКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ»
Контрольная работа
по дисциплине «Теория игр»
Выполнил:
Зверев Сергей Владимирович
Группа: ФК-11 Пр
Проверила: Петрова С.Н.
2013
Задача 1
а) Решить игру с природой по критерию Гурвица, б=0,4;
б) Решить игру с природой по критерию Лапласа;
в) Решить игру с природой по критерию Сэвиджа;
г) Решить игру с природой по критерию Вальда.
Решение:
а) Решить игру с природой по критерию Гурвица, б=0,4
1. Для матрицы выигрышей:
К(А1)=0,4•9+0,6•(-3)=1,8
К(А2)=0,4•9+0,6•(2)=4,8
К(А3)=0,4•8+0,6•(1)=3,8
К(А4)=0,4•3+0,6•(1)=1,8
Лучшая стратегия А2
2. Для матрицы потерь:
К(А1)=0,4(-3)+9=4,2
К(А2)=0,4•2+0,6•9=6,2
К(А3)=0,4•1+0,6•8=5,2
К(А4)=0,4•1+0,6•3=2,2
Лучшая стратегия А4.
б) Решить игру с природой по критерию Лапласа.
1) Если А - матрица выигрышей
2) Если А- матрица потерь
10
16
15
6
1) Если А - матрица выигрышей, то оптимальной является стратегия А2
2) Если А- матрица потерь, то оптимальной является стратегия А4
в) Решить игру с природой по критерию Сэвиджа.
Стратегия R - матрица риска. Элементы находятся по формуле
А-матрица выигрышей
А - матрица потерь
1 -3 2
9 8 9
1. Если А-матрица выигрышей
5
7
8
8
Оптимальной является 1 стратегия
2. Если А-матрица потерь
8
7
5
6
Оптимальной является 3 стратегия
г) Решить игру с природой по критерию Вальда (максиминный, минимаксный)
1)Если А - матрица выигрышей, то выбирается
-3
2
1
1
Оптимальной является стратегии А2.
1)Если А - матрица потерь, то выбирается
9
9
8
3
Оптимальной является стратегия А4
Задача 2
Решить игру методом Брауна, выполнить 20 итераций.
Решение.
Найдем наилучшую стратегию первого игрока: минимальное число в каждой строке обозначаем б1 = -1, б2 = 0, б3 = 3. Выбираем максимальное из этих значении б = б3 = 3 - нижняя цена игры.
Аналогично для второго игрока. Найдем максимальное значения выигрыша по столбцам в1 = 6, в2 = 8, в3 = 9 и минимальное из этих чисел в = = в1 = 6 верхняя цена игры. Игра не имеет седловой точки.
б = max (-1,0,3) = 3, в = min(6,8,9) = 6; б?в, 3?v?6.
v = 9/2 = 4.5; p* = (0,1/4, 3/4), q* = (1/2, 0,1/2).
Метод фиктивного розыгрыша Брауна-Робинсона.
Игроки многократно разыгрывают игру и пытаются выявить те стратегии, которые дают им больший накопительный выигрыш. Одно разыгрывание игры - партия. Число партий может быть сколько угодно большим. Данный процесс также называется итерационным, поскольку в каждой партии (итерации) игроки используют один и тот же алгоритм выбора наилучшей стратегии.
Оптимальные смешанные стратегии игроков определяются частотами выбора чистых стратегий, а в качестве цены игры применяют значение v, полученное на последнем шаге.
Для определенности считают, что первый ход делает игрок, А и выбирает свою осторожную стратегию.
Если несколько стратегий игрока дают один и тот же результат, то с т.з. его накопленного выигрыша (проигрыша) выбирается стратегия с меньшим номером.
Оптимальные стратегии игроков определяются частотами выбора их чистых стратегий. Приближенное значение цены игры - результатом vN на последней итерации.
Метод заключается в поочередном выборе каждой стороной наилучшей чистой стратегии против наблюдаемого эмпирического распределения чистых стратегий противника.
На первом шаге противники выбирают произвольные чистые стратегии i1и j1соответственно. Пусть противниками на первых N шагах последовательно выбирались стратегии (i1,i2,i3, i4,….iN) и (j1, j2, j3,…jN) и xiN, yiN - количеством шагов, на которых первым и вторым игроками выбирались стратегии i1и j1 соответственно. Очевидно,
Задача 3
Решить игру симплекс-методом
2 2 3 1
-1 8 6 3
5 7 4 6
3 2 4 0
Решение
Найдем наилучшую стратегию первого игрока: минимальное число в каждой строке обозначим б1. Получаем: б1 =1, б2 =-1, б3 = 4, б4 =0. Выбираем максимальное из этих значений б = б3 = 4 - нижняя цена игры.
Аналогично для второго игрока. Найдем максимальное значение выигрыша по столбцам: в1 =5, в2 =8, в3 =6, в4 =6 и минимальное из этих чисел в = в1 =5 - верхняя цена игры.
б = max(1, -1, 4, 0) = 4, в = min(5, 8, 6, 6) = 5 б?в, 4?v?5
Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий.
Для определения оптимальной стратегии игрока В имеем следующую задачу линейного программирование:
Добавлено 4 дополнительные переменные: s5 ? 0, s6 ? 0, s7?0, s8? 0.
Шаг 0, выбран ключевой элемент (3,1) |
||||||||||
Базис |
БП |
s1 |
s2 |
s3 |
s4 |
s5 |
s6 |
s7 |
s8 |
|
s5 |
1 |
2 |
2 |
3 |
1 |
1 |
0 |
0 |
0 |
|
s6 |
1 |
-1 |
8 |
6 |
3 |
0 |
1 |
0 |
0 |
|
s7 |
1 |
5 |
7 |
4 |
6 |
0 |
0 |
1 |
0 |
|
s8 |
1 |
3 |
2 |
4 |
0 |
0 |
0 |
0 |
1 |
|
ИС |
0 |
1 |
-1 |
-1 |
-1 |
0 |
0 |
0 |
0 |
Шаг 1, выбран ключевой элемент (2,3) |
||||||||||
Базис |
БП |
s1 |
s2 |
s3 |
s4 |
s5 |
s6 |
s7 |
s8 |
|
s5 |
3/5 |
0 |
-4/5 |
7/5 |
-7/5 |
1 |
0 |
-2/5 |
0 |
|
s6 |
6/5 |
0 |
47/5 |
34/5 |
21/5 |
0 |
1 |
1/5 |
0 |
|
s7 |
1/5 |
1 |
7/5 |
4/5 |
6/5 |
0 |
0 |
1/5 |
0 |
|
s8 |
2/5 |
0 |
-11/5 |
8/5 |
-18/5 |
0 |
0 |
-3/5 |
1 |
|
ИС |
1/5 |
0 |
2/5 |
-1/5 |
1/5 |
0 |
0 |
1/5 |
0 |
Шаг 2 |
||||||||||
Базис |
БП |
s1 |
s2 |
s3 |
s4 |
s5 |
s6 |
s7 |
s8 |
|
s5 |
6/17 |
0 |
-93/34 |
0 |
-77/34 |
1 |
-7/34 |
-15/34 |
0 |
|
s6 |
3/17 |
0 |
47/34 |
1 |
21/34 |
0 |
5/34 |
1/34 |
0 |
|
s7 |
1/17 |
1 |
5/17 |
0 |
12/17 |
0 |
-2/17 |
3/17 |
0 |
|
s8 |
2/17 |
0 |
-75/17 |
0 |
-78/17 |
0 |
-4/17 |
-11/17 |
1 |
|
ИС |
4/17 |
0 |
23/34 |
0 |
11/34 |
0 |
1/34 |
7/34 |
0 |
Получен оптимальный план Sопт = (1/17, 0,3/17, 0), Zmax = 4/17.
Для определения оптимальной стратегии игрока А имеет двойственную задачу линейного программирования:
Найдем решение задачи L(T), не прибегая к симплекс-методу, используя соотношения двойственности.
Решение полученной задачи можно найти с помощью второй теоремы двойственности: дефицитный (избыточный) ресурс, полностью (не полностью) используемый по оптимальному плану производства, имеет положительную (нулевую) оценку, и технология, применяемая с ненулевой (нулевой) интенсивностью, имеет нулевую (положительную) оценку. Т.е. для оптимальных решений
Задача 4
игра природа стратегия цена
Решить игру Р графически
Р = 1 -2 > Q = 3 0
4 6 6 8
7 9 9 11
Решение:
В исходной матрице Р присутствуют отрицательные элементы.
Для упрощения расчетов добавим к элементам матрицы число 2, получаем матрицу Q. Такая замена не изменит решения игры, по теореме фон Неймана изменится только ее цена.
Решим задачу геометрическим методом, который включает в себя следующие этапы:
1. В декартовой системе координат по оси абсцисс откладывается отрезок, длинна которого равна 1. Левый конец отрезка (точка х=0) соответствует стратегии В1, правый - стратегии В2(х=1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (р1, р2), где р1+р2 =1
2. На левой оси I-I (оси ординат) откладываются выигрыши стратегий В1. На линии II-II, параллельной оси ординат, из точки 1 откладываются выигрыши стратегий В2.
Решение игры (3х2) проводим с позиции игрока А, придерживающегося минимаксной стратегии. Стратегия А3 доминирует над стратегиями А1 и А2 (все элементы строки 3 больше или равны значениям 1-ой или 2-й строк), следовательно, исключаем стратегии А1 и А2 (1-ю и 2-ю строки матрицы). Чистые стратегии А1 и А2 (см.рис.) не выгодны для игрока А, поскольку при любой стратегии игрока В они дают последнему больший выигрыш, чем чистая стратегия А3. На основании принципа минимакса выделим прямую А3А3 и на ней точку А3 с наименьшей ординатой на оси I-I, то есть при р1*=1, р2 * =0 имеем оптимальное решение.
Решение игры проводим с позиции игрока В, придерживающегося максимальной стратегии. Средний выигрыш v3, соответствующий смешанной стратегии SB, определяется по формуле математического ожидания v3 = 9р1 + 11р2 и равен ординате точки М3, которая лежит на отрезке А3А3 и имеет абсциссу SB, (см.рис.). На основании принципа максимина выделим прямую А3А3 и на ней точку А3 с наименьшей ординатой на оси I-I, то есть при р1*=1, р2 * =0 имеем оптимальное решение S*B = (1;0).
Чистая стратегия В1 является оптимальной для игрока В, а чистая стратегия А3 - для игрока А. Цена игры для матрицы Q равна v* = 9*1+11*0 = б = в = 9, то есть имеется седловая точка. Поскольку ранее к элементам матрицы было прибавлено число 2, то вычтем это число из цены игры. Цена игры для матрицы Р равна v=v* - 2 = 9 - 2 = 7.
Задача 5
Найти верхнюю и нижнюю цену игр. Проверить игру на наличие седловой точки.
Размещено на Allbest.ru
...Подобные документы
Основные определения теории биматричных игр. Пример биматричной игры "Студент-Преподаватель". Смешанные стратегии в биматричных играх. Поиск "равновесной ситуации". 2x2 биматричные игры и формулы для случая, когда у каждого игрока имеется две стратегии.
реферат [84,2 K], добавлен 13.02.2011Форма для ввода целевой функции и ограничений. Характеристика симплекс-метода. Процесс решения задачи линейного программирования. Математическое описание алгоритма симплекс-метода. Решение задачи ручным способом. Описание схемы алгоритма программы.
контрольная работа [66,3 K], добавлен 06.04.2012Составление платежной матрицы, поиск нижней и верхней чисты цены игры, максиминной и минимаксной стратегии игроков. Упрощение платежной матрицы. Решение матричной игры с помощью сведения к задаче линейного программирования и надстройки "Поиск решения".
контрольная работа [1010,3 K], добавлен 10.11.2014Решение задачи об оптимальном направлении капиталовложений в строительную отрасль и оптимизации поставки грузов. Применение симплекс-метода для оптимальной организации ремонтно-строительных работ. Изучение методов динамического программирования.
контрольная работа [2,2 M], добавлен 08.01.2011Материал инструмента и заготовки, вертикально-сверлильный станок. Ограничения по стойкости, мощности привода станка, кинематике и стойкости. Расчет целевой функции производительности, оптимальной точки режима резания. Оптимальное решение симплекс-методом.
задача [64,3 K], добавлен 12.10.2009Изучение численно-аналитического метода решения краевых задач математической физики на примере неоднородной задачи Дирихле для уравнения Лапласа. Численная реализация вычислительного метода и вычислительного эксперимента, особенности их оформления.
практическая работа [332,7 K], добавлен 28.01.2014Линейное программирование как наиболее разработанный и широко применяемый раздел математического программирования. Понятие и содержание симплекс-метода, особенности и сферы его применения, порядок и анализ решения линейных уравнений данным методом.
курсовая работа [197,1 K], добавлен 09.04.2013Определение матричных игр в чистых стратегиях. Смешанные стратегии и их свойства. Решения игр матричным методом. Метод последовательного приближения цены игры. Отыскание седлового элемента. Антагонистические игры как первый класс математических моделей.
контрольная работа [855,7 K], добавлен 01.06.2014Сущность метода системосовокупностей как одного из распространенных и универсальных методов решения неравенств любого типа. Обобщение метода интервалов на тригонометрической окружности. Эффективность и наглядность графического метода решения задач.
методичка [303,7 K], добавлен 14.03.2011Решения интегральных уравнений на полубесконечном промежутке с ядром, зависящим от разности аргументов с помощью метода Винера-Хопфа. Решение задач в случае бесконечного и полубесконечного промежутка. Применение метода Винера-Хопфа к уравнению Лапласа.
реферат [1,3 M], добавлен 18.05.2010Игры, повторяемые многократно, их отличительные свойства и этапы. Смешанные стратегии, условия и возможности их использования на практике. Аналитический метод решения игры типа 2 x 2. Основные теоремы для прямоугольных игр. Алгебраические решения.
презентация [893,5 K], добавлен 23.10.2013Поиск корней нелинейных САУ с помощью метода продолжения решения по параметру. Математическое описание метода. Программное обеспечение для построения графиков сходимости метода. Требования к программному обеспечению и описание логической структуры.
курсовая работа [365,5 K], добавлен 27.04.2011Основные сведения о симплекс-методе, оценка его роли и значения в линейном программировании. Геометрическая интерпретация и алгебраический смысл. Отыскание максимума и минимума линейной функции, особые случаи. Решение задачи матричным симплекс-методом.
дипломная работа [351,2 K], добавлен 01.06.2015Однородные системы линейных неравенств и выпуклые конусы. Применение симплекс-метода для отыскания опорного решения системы линейных неравенств, ее геометрический смысл. Основная задача линейного программирования. Теорема Минковского, ее доказательство.
курсовая работа [807,2 K], добавлен 03.04.2015Выбор эффективного метода определения собственных значений и собственных векторов для конкретной инженерной задачи. Степенной метод вычисления максимального по модулю собственного значения матрицы A и его модификациями. Умножение матрицы на вектор.
методичка [122,0 K], добавлен 01.07.2009Численное решение дифференциальных уравнений с помощью многошагового метода прогноза и коррекции Милна. Суммарная ошибка метода Милна. Применение метода Рунге-Кутта для нахождения первых значений начального отрезка. Абсолютная погрешность значения.
контрольная работа [694,0 K], добавлен 27.02.2013Стандартные методы решений уравнений и неравенств. Алгоритм решения уравнения с параметром. Область определения уравнения. Решение неравенств с параметрами. Влияние параметра на результат. Допустимые значения переменной. Точки пересечения графиков.
контрольная работа [209,4 K], добавлен 15.12.2011Метод Эйлера: сущность и основное содержание, принципы и направления практического применения, определение погрешности. Примеры решения задачи в Excel. Метод разложения решения в степенной ряд. Понятие и погрешность, решение с помощью метода Пикара.
контрольная работа [129,0 K], добавлен 13.03.2012Решение уравнения гармонического осциллятора при помощи разложения в ряд Тейлора. Применение метода индуцированной алгебры. Решение уравнения гармонического осциллятора при помощи метода индуцированной алгебры. Сравнение работоспособности методов решений.
курсовая работа [92,0 K], добавлен 24.05.2012Приближенные решения кубических уравнений. Работы Диофанта, Ферма и Ньютона. Интерационный метод нахождения корня уравнения. Геометрическое и алгебраическое описания метода хорд. Погрешность приближенного решения. Линейная скорость сходимости метода.
презентация [255,1 K], добавлен 17.01.2011