Методы решения игр

Решение игры с природой по критериям Гурвица, Лапласа, Сэвиджа и Вальда. Использование метода Брауна и симплекс-метода для определения оптимальной стратегии игрока и максимального значения выигрыша. Расчет цены игры, ее проверка на наличие седловой точки.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 03.05.2013
Размер файла 2,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

ФГБОУ ВПО «УРАЛЬСКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ»

Контрольная работа

по дисциплине «Теория игр»

Выполнил:

Зверев Сергей Владимирович

Группа: ФК-11 Пр

Проверила: Петрова С.Н.

2013

Задача 1

а) Решить игру с природой по критерию Гурвица, б=0,4;

б) Решить игру с природой по критерию Лапласа;

в) Решить игру с природой по критерию Сэвиджа;

г) Решить игру с природой по критерию Вальда.

Решение:

а) Решить игру с природой по критерию Гурвица, б=0,4

1. Для матрицы выигрышей:

К(А1)=0,4•9+0,6•(-3)=1,8

К(А2)=0,4•9+0,6•(2)=4,8

К(А3)=0,4•8+0,6•(1)=3,8

К(А4)=0,4•3+0,6•(1)=1,8

Лучшая стратегия А2

2. Для матрицы потерь:

К(А1)=0,4(-3)+9=4,2

К(А2)=0,4•2+0,6•9=6,2

К(А3)=0,4•1+0,6•8=5,2

К(А4)=0,4•1+0,6•3=2,2

Лучшая стратегия А4.

б) Решить игру с природой по критерию Лапласа.

1) Если А - матрица выигрышей

2) Если А- матрица потерь

10

16

15

6

1) Если А - матрица выигрышей, то оптимальной является стратегия А2

2) Если А- матрица потерь, то оптимальной является стратегия А4

в) Решить игру с природой по критерию Сэвиджа.

Стратегия R - матрица риска. Элементы находятся по формуле

А-матрица выигрышей

А - матрица потерь

1 -3 2

9 8 9

1. Если А-матрица выигрышей

5

7

8

8

Оптимальной является 1 стратегия

2. Если А-матрица потерь

8

7

5

6

Оптимальной является 3 стратегия

г) Решить игру с природой по критерию Вальда (максиминный, минимаксный)

1)Если А - матрица выигрышей, то выбирается

-3

2

1

1

Оптимальной является стратегии А2.

1)Если А - матрица потерь, то выбирается

9

9

8

3

Оптимальной является стратегия А4

Задача 2

Решить игру методом Брауна, выполнить 20 итераций.

Решение.

Найдем наилучшую стратегию первого игрока: минимальное число в каждой строке обозначаем б1 = -1, б2 = 0, б3 = 3. Выбираем максимальное из этих значении б = б3 = 3 - нижняя цена игры.

Аналогично для второго игрока. Найдем максимальное значения выигрыша по столбцам в1 = 6, в2 = 8, в3 = 9 и минимальное из этих чисел в = = в1 = 6 верхняя цена игры. Игра не имеет седловой точки.

б = max (-1,0,3) = 3, в = min(6,8,9) = 6; б?в, 3?v?6.

v = 9/2 = 4.5; p* = (0,1/4, 3/4), q* = (1/2, 0,1/2).

Метод фиктивного розыгрыша Брауна-Робинсона.

Игроки многократно разыгрывают игру и пытаются выявить те стратегии, которые дают им больший накопительный выигрыш. Одно разыгрывание игры - партия. Число партий может быть сколько угодно большим. Данный процесс также называется итерационным, поскольку в каждой партии (итерации) игроки используют один и тот же алгоритм выбора наилучшей стратегии.

Оптимальные смешанные стратегии игроков определяются частотами выбора чистых стратегий, а в качестве цены игры применяют значение v, полученное на последнем шаге.

Для определенности считают, что первый ход делает игрок, А и выбирает свою осторожную стратегию.

Если несколько стратегий игрока дают один и тот же результат, то с т.з. его накопленного выигрыша (проигрыша) выбирается стратегия с меньшим номером.

Оптимальные стратегии игроков определяются частотами выбора их чистых стратегий. Приближенное значение цены игры - результатом vN на последней итерации.

Метод заключается в поочередном выборе каждой стороной наилучшей чистой стратегии против наблюдаемого эмпирического распределения чистых стратегий противника.

На первом шаге противники выбирают произвольные чистые стратегии i1и j1соответственно. Пусть противниками на первых N шагах последовательно выбирались стратегии (i1,i2,i3, i4,….iN) и (j1, j2, j3,…jN) и xiN, yiN - количеством шагов, на которых первым и вторым игроками выбирались стратегии i1и j1 соответственно. Очевидно,

Задача 3

Решить игру симплекс-методом

2 2 3 1

-1 8 6 3

5 7 4 6

3 2 4 0

Решение

Найдем наилучшую стратегию первого игрока: минимальное число в каждой строке обозначим б1. Получаем: б1 =1, б2 =-1, б3 = 4, б4 =0. Выбираем максимальное из этих значений б = б3 = 4 - нижняя цена игры.

Аналогично для второго игрока. Найдем максимальное значение выигрыша по столбцам: в1 =5, в2 =8, в3 =6, в4 =6 и минимальное из этих чисел в = в1 =5 - верхняя цена игры.

б = max(1, -1, 4, 0) = 4, в = min(5, 8, 6, 6) = 5 б?в, 4?v?5

Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий.

Для определения оптимальной стратегии игрока В имеем следующую задачу линейного программирование:

Добавлено 4 дополнительные переменные: s5 ? 0, s6 ? 0, s7?0, s8? 0.

Шаг 0, выбран ключевой элемент (3,1)

Базис

БП

s1

s2

s3

s4

s5

s6

s7

s8

s5

1

2

2

3

1

1

0

0

0

s6

1

-1

8

6

3

0

1

0

0

s7

1

5

7

4

6

0

0

1

0

s8

1

3

2

4

0

0

0

0

1

ИС

0

1

-1

-1

-1

0

0

0

0

Шаг 1, выбран ключевой элемент (2,3)

Базис

БП

s1

s2

s3

s4

s5

s6

s7

s8

s5

3/5

0

-4/5

7/5

-7/5

1

0

-2/5

0

s6

6/5

0

47/5

34/5

21/5

0

1

1/5

0

s7

1/5

1

7/5

4/5

6/5

0

0

1/5

0

s8

2/5

0

-11/5

8/5

-18/5

0

0

-3/5

1

ИС

1/5

0

2/5

-1/5

1/5

0

0

1/5

0

Шаг 2

Базис

БП

s1

s2

s3

s4

s5

s6

s7

s8

s5

6/17

0

-93/34

0

-77/34

1

-7/34

-15/34

0

s6

3/17

0

47/34

1

21/34

0

5/34

1/34

0

s7

1/17

1

5/17

0

12/17

0

-2/17

3/17

0

s8

2/17

0

-75/17

0

-78/17

0

-4/17

-11/17

1

ИС

4/17

0

23/34

0

11/34

0

1/34

7/34

0

Получен оптимальный план Sопт = (1/17, 0,3/17, 0), Zmax = 4/17.

Для определения оптимальной стратегии игрока А имеет двойственную задачу линейного программирования:

Найдем решение задачи L(T), не прибегая к симплекс-методу, используя соотношения двойственности.

Решение полученной задачи можно найти с помощью второй теоремы двойственности: дефицитный (избыточный) ресурс, полностью (не полностью) используемый по оптимальному плану производства, имеет положительную (нулевую) оценку, и технология, применяемая с ненулевой (нулевой) интенсивностью, имеет нулевую (положительную) оценку. Т.е. для оптимальных решений

Задача 4

игра природа стратегия цена

Решить игру Р графически

Р = 1 -2 > Q = 3 0

4 6 6 8

7 9 9 11

Решение:

В исходной матрице Р присутствуют отрицательные элементы.

Для упрощения расчетов добавим к элементам матрицы число 2, получаем матрицу Q. Такая замена не изменит решения игры, по теореме фон Неймана изменится только ее цена.

Решим задачу геометрическим методом, который включает в себя следующие этапы:

1. В декартовой системе координат по оси абсцисс откладывается отрезок, длинна которого равна 1. Левый конец отрезка (точка х=0) соответствует стратегии В1, правый - стратегии В2(х=1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (р1, р2), где р12 =1

2. На левой оси I-I (оси ординат) откладываются выигрыши стратегий В1. На линии II-II, параллельной оси ординат, из точки 1 откладываются выигрыши стратегий В2.

Решение игры (3х2) проводим с позиции игрока А, придерживающегося минимаксной стратегии. Стратегия А3 доминирует над стратегиями А1 и А2 (все элементы строки 3 больше или равны значениям 1-ой или 2-й строк), следовательно, исключаем стратегии А1 и А2 (1-ю и 2-ю строки матрицы). Чистые стратегии А1 и А2 (см.рис.) не выгодны для игрока А, поскольку при любой стратегии игрока В они дают последнему больший выигрыш, чем чистая стратегия А3. На основании принципа минимакса выделим прямую А3А3 и на ней точку А3 с наименьшей ординатой на оси I-I, то есть при р1*=1, р2 * =0 имеем оптимальное решение.

Решение игры проводим с позиции игрока В, придерживающегося максимальной стратегии. Средний выигрыш v3, соответствующий смешанной стратегии SB, определяется по формуле математического ожидания v3 = 9р1 + 11р2 и равен ординате точки М3, которая лежит на отрезке А3А3 и имеет абсциссу SB, (см.рис.). На основании принципа максимина выделим прямую А3А3 и на ней точку А3 с наименьшей ординатой на оси I-I, то есть при р1*=1, р2 * =0 имеем оптимальное решение S*B = (1;0).

Чистая стратегия В1 является оптимальной для игрока В, а чистая стратегия А3 - для игрока А. Цена игры для матрицы Q равна v* = 9*1+11*0 = б = в = 9, то есть имеется седловая точка. Поскольку ранее к элементам матрицы было прибавлено число 2, то вычтем это число из цены игры. Цена игры для матрицы Р равна v=v* - 2 = 9 - 2 = 7.

Задача 5

Найти верхнюю и нижнюю цену игр. Проверить игру на наличие седловой точки.

Размещено на Allbest.ru

...

Подобные документы

  • Основные определения теории биматричных игр. Пример биматричной игры "Студент-Преподаватель". Смешанные стратегии в биматричных играх. Поиск "равновесной ситуации". 2x2 биматричные игры и формулы для случая, когда у каждого игрока имеется две стратегии.

    реферат [84,2 K], добавлен 13.02.2011

  • Форма для ввода целевой функции и ограничений. Характеристика симплекс-метода. Процесс решения задачи линейного программирования. Математическое описание алгоритма симплекс-метода. Решение задачи ручным способом. Описание схемы алгоритма программы.

    контрольная работа [66,3 K], добавлен 06.04.2012

  • Составление платежной матрицы, поиск нижней и верхней чисты цены игры, максиминной и минимаксной стратегии игроков. Упрощение платежной матрицы. Решение матричной игры с помощью сведения к задаче линейного программирования и надстройки "Поиск решения".

    контрольная работа [1010,3 K], добавлен 10.11.2014

  • Решение задачи об оптимальном направлении капиталовложений в строительную отрасль и оптимизации поставки грузов. Применение симплекс-метода для оптимальной организации ремонтно-строительных работ. Изучение методов динамического программирования.

    контрольная работа [2,2 M], добавлен 08.01.2011

  • Материал инструмента и заготовки, вертикально-сверлильный станок. Ограничения по стойкости, мощности привода станка, кинематике и стойкости. Расчет целевой функции производительности, оптимальной точки режима резания. Оптимальное решение симплекс-методом.

    задача [64,3 K], добавлен 12.10.2009

  • Изучение численно-аналитического метода решения краевых задач математической физики на примере неоднородной задачи Дирихле для уравнения Лапласа. Численная реализация вычислительного метода и вычислительного эксперимента, особенности их оформления.

    практическая работа [332,7 K], добавлен 28.01.2014

  • Линейное программирование как наиболее разработанный и широко применяемый раздел математического программирования. Понятие и содержание симплекс-метода, особенности и сферы его применения, порядок и анализ решения линейных уравнений данным методом.

    курсовая работа [197,1 K], добавлен 09.04.2013

  • Определение матричных игр в чистых стратегиях. Смешанные стратегии и их свойства. Решения игр матричным методом. Метод последовательного приближения цены игры. Отыскание седлового элемента. Антагонистические игры как первый класс математических моделей.

    контрольная работа [855,7 K], добавлен 01.06.2014

  • Сущность метода системосовокупностей как одного из распространенных и универсальных методов решения неравенств любого типа. Обобщение метода интервалов на тригонометрической окружности. Эффективность и наглядность графического метода решения задач.

    методичка [303,7 K], добавлен 14.03.2011

  • Решения интегральных уравнений на полубесконечном промежутке с ядром, зависящим от разности аргументов с помощью метода Винера-Хопфа. Решение задач в случае бесконечного и полубесконечного промежутка. Применение метода Винера-Хопфа к уравнению Лапласа.

    реферат [1,3 M], добавлен 18.05.2010

  • Игры, повторяемые многократно, их отличительные свойства и этапы. Смешанные стратегии, условия и возможности их использования на практике. Аналитический метод решения игры типа 2 x 2. Основные теоремы для прямоугольных игр. Алгебраические решения.

    презентация [893,5 K], добавлен 23.10.2013

  • Поиск корней нелинейных САУ с помощью метода продолжения решения по параметру. Математическое описание метода. Программное обеспечение для построения графиков сходимости метода. Требования к программному обеспечению и описание логической структуры.

    курсовая работа [365,5 K], добавлен 27.04.2011

  • Основные сведения о симплекс-методе, оценка его роли и значения в линейном программировании. Геометрическая интерпретация и алгебраический смысл. Отыскание максимума и минимума линейной функции, особые случаи. Решение задачи матричным симплекс-методом.

    дипломная работа [351,2 K], добавлен 01.06.2015

  • Однородные системы линейных неравенств и выпуклые конусы. Применение симплекс-метода для отыскания опорного решения системы линейных неравенств, ее геометрический смысл. Основная задача линейного программирования. Теорема Минковского, ее доказательство.

    курсовая работа [807,2 K], добавлен 03.04.2015

  • Выбор эффективного метода определения собственных значений и собственных векторов для конкретной инженерной задачи. Степенной метод вычисления максимального по модулю собственного значения матрицы A и его модификациями. Умножение матрицы на вектор.

    методичка [122,0 K], добавлен 01.07.2009

  • Численное решение дифференциальных уравнений с помощью многошагового метода прогноза и коррекции Милна. Суммарная ошибка метода Милна. Применение метода Рунге-Кутта для нахождения первых значений начального отрезка. Абсолютная погрешность значения.

    контрольная работа [694,0 K], добавлен 27.02.2013

  • Стандартные методы решений уравнений и неравенств. Алгоритм решения уравнения с параметром. Область определения уравнения. Решение неравенств с параметрами. Влияние параметра на результат. Допустимые значения переменной. Точки пересечения графиков.

    контрольная работа [209,4 K], добавлен 15.12.2011

  • Метод Эйлера: сущность и основное содержание, принципы и направления практического применения, определение погрешности. Примеры решения задачи в Excel. Метод разложения решения в степенной ряд. Понятие и погрешность, решение с помощью метода Пикара.

    контрольная работа [129,0 K], добавлен 13.03.2012

  • Решение уравнения гармонического осциллятора при помощи разложения в ряд Тейлора. Применение метода индуцированной алгебры. Решение уравнения гармонического осциллятора при помощи метода индуцированной алгебры. Сравнение работоспособности методов решений.

    курсовая работа [92,0 K], добавлен 24.05.2012

  • Приближенные решения кубических уравнений. Работы Диофанта, Ферма и Ньютона. Интерационный метод нахождения корня уравнения. Геометрическое и алгебраическое описания метода хорд. Погрешность приближенного решения. Линейная скорость сходимости метода.

    презентация [255,1 K], добавлен 17.01.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.