Разработка вариантов решения задач теории игр

Решение игры с природой по заданному критерию Гурвица, критерию Лапласа и критерию Севиджа. Проверка платежной матрицы на доминирующие строки и доминирующие столбцы. Проверка правильности решения игры с помощью критерия оптимальности стратегии.

Рубрика Программирование, компьютеры и кибернетика
Вид контрольная работа
Язык русский
Дата добавления 05.03.2017
Размер файла 73,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФГБОУ ВПО «Уральский государственный экономический университет»

Центр дистанционного образования

Контрольная работа

по дисциплине «Теория игр»

вариант 5

Преподаватель: Петрова С.Н.

Студент: Малютина Ю.Р.

Специальность: Экономика

Группа: ЭПБп-14Р

Екатеринбург 2017

1) Решить игру:

а) Решить игру с природой по критерию Гурвица, б=0,4.

Исходные данные

1

-3

4

2

9

8

0

-7

6

1

4

2

Критерий Гурвица является критерием пессимизма - оптимизма. За оптимальную принимается та стратегия, для которой выполняется соотношение:

max(si)

где si = y min(aij) + (1-y)max(aij)

При y = 1 получим критерий Вальде, при y = 0 получим - оптимистический критерий (максимакс).

Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1.

Рассчитываем si.

s1 = 0.4*(-3)+(1-0.4)*4 = 1.2

s2 = 0.4*2+(1-0.4)*9 = 6.2

s3 = 0.4*(-7)+(1-0.4)*6 = 0.8

s4 = 0.4*1+(1-0.4)*4 = 2.8

Ai

П1

П2

П3

min(aij)

max(aij)

y min(aij) + (1-y)max(aij)

A1

1

-3

4

-3

4

1.2

A2

2

9

8

2

9

6.2

A3

0

-7

6

-7

6

0.8

A4

1

4

2

1

4

2.8

Выбираем из (1.2; 6.2; 0.8; 2.8) максимальный элемент max=6.2

Вывод: выбираем стратегию N=2.

Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A2.

б) Решить игру с природой по критерию Лапласа.

Критерий Лапласа.

Если вероятности состояний природы правдоподобны, для их оценки используют принцип недостаточного основания Лапласа, согласно которого все состояния природы полагаются равновероятными, т.е.:

q1 = q2 =... = qn = 1/n.

qi = 1/3

Ai

П1

П2

П3

?(aij)

A1

0.333

-1

1.333

0.667

A2

0.667

3

2.667

6.333

A3

0

-2.333

2

-0.333

A4

0.333

1.333

0.667

2.333

pj

0.333

0.333

0.333

Выбираем из (0.67; 6.33; -0.33; 2.33) максимальный элемент max=6.33

Вывод: выбираем стратегию N=2.

в) Решить игру с природой по критерию Севиджа.

Критерий Севиджа.

Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:

a = min(max rij)

Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.

Находим матрицу рисков.

Риск - мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце bj = max(aij) характеризует благоприятность состояния природы.

1. Рассчитываем 1-й столбец матрицы рисков.

r11 = 2 - 1 = 1; r21 = 2 - 2 = 0; r31 = 2 - 0 = 2; r41 = 2 - 1 = 1;

2. Рассчитываем 2-й столбец матрицы рисков.

r12 = 9 - (-3) = 12; r22 = 9 - 9 = 0; r32 = 9 - (-7) = 16; r42 = 9 - 4 = 5;

3. Рассчитываем 3-й столбец матрицы рисков.

r13 = 8 - 4 = 4; r23 = 8 - 8 = 0; r33 = 8 - 6 = 2; r43 = 8 - 2 = 6;

Ai

П1

П2

П3

A1

1

12

4

A2

0

0

0

A3

2

16

2

A4

1

5

6

Результаты вычислений оформим в виде таблицы.

Ai

П1

П2

П3

max(aij)

A1

1

12

4

12

A2

0

0

0

0

A3

2

16

2

16

A4

1

5

6

6

Выбираем из (12; 0; 16; 6) минимальный элемент min=0

Вывод: выбираем стратегию N=2.

г) Решить игру с природой по критерию Вальда.

Критерий Вальда.

По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.

a = max(min aij)

Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.

Ai

П1

П2

П3

min(aij)

A1

1

-3

4

-3

A2

2

9

8

2

A3

0

-7

6

-7

A4

1

4

2

1

Выбираем из (-3; 2; -7; 1) максимальный элемент max=2

Вывод: выбираем стратегию N=2.

2) Решить игру методом Брауна, выполнить 20 итераций

1

4

8

9

6

5

7

8

3

Рассмотрим игру двух лиц, интересы которых противоположны. Такие игры называют антагонистическими играми двух лиц. В этом случае выигрыш одного игрока равен проигрышу второго, и можно описать только одного из игроков.

Предполагается, что каждый игрок может выбрать только одно из конечного множества своих действий. Выбор действия называют выбором стратегии игрока.

Если каждый из игроков выбрал свою стратегию, то эту пару стратегий называют ситуацией игры. Следует заметить, каждый игрок знает, какую стратегию выбрал его противник, т.е. имеет полную информацию о результате выбора противника.

Чистой стратегией игрока I является выбор одной из n строк матрицы выигрышей А, а чистой стратегией игрока II является выбор одного из столбцов этой же матрицы.

1. Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.

Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Игроки

B1

B2

B3

a = min(Ai)

A1

1

4

8

1

A2

9

6

5

5

A3

7

8

3

3

b = max(Bi)

9

8

8

Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 5, которая указывает на максимальную чистую стратегию A2.

Верхняя цена игры b = min(bj) = 8.

Что свидетельствует об отсутствии седловой точки, так как a ? b, тогда цена игры находится в пределах 5 ? y ? 8. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).

2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.

Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью.

Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ? akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) - доминирующая, k-я - доминируемая.

Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij ? ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю - доминируемой.

В платежной матрице отсутствуют доминирующие строки.

В платежной матрице отсутствуют доминирующие столбцы.

Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.

Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.

Пусть игра задана матрицей A размерности m x n. Каждое разыгрывание игры в чистых стратегиях будет далее называться партией. Метод Брауна-Робинсон -- это итеративная процедура построения последовательности пар смешанных стратегий игроков, сходящейся к решению матричной игры.

В 1-ой партии оба игрока выбирают произвольную чистую стратегию. Пусть сыграно k партий, причем выбор стратегии в каждой партии запоминается. В (k + 1)-ой партии каждый игрок выбирает ту чистую стратегию, которая максимизирует его ожидаемый выигрыш, если противник играет в соответствии с эмпирическим вероятностным распределением, сформировавшимся за k партий. Оценивается интервал для цены игры и, если он достаточно мал, процесс останавливается. Полученные при этом вероятностные распределения определяют смешанные стратегии игроков.

Пусть на первом этапе выбрана стратегия №1

Итерация №1. Минимальный элемент для нее равен 1 и находится под номером j=1. Следовательно, игрок II выбирает стратегию №1

Максимальный элемент равен 9 и находится под номером j=2. Следовательно, игрок I выбирает стратегию №2

Итерация №2. Минимальный элемент для нее равен 10 и находится под номером j=1. Следовательно, игрок II выбирает стратегию №1

Максимальный элемент равен 18 и находится под номером j=2. Следовательно, игрок I выбирает стратегию №2

Остальное решение сведем в таблицу.

k

i

B1

B2

B3

j

A1

A2

A3

Vmin

Vmax

Vср

1

1

1

4

8

1

1

9

7

1

9

5

2

2

10

10

13

1

2

18

14

5

9

7

3

2

19

16

18

2

6

24

22

16/3

8

20/3

4

2

28

22

23

2

10

30

30

11/2

15/2

13/2

5

2

37

28

28

2

14

36

38

28/5

38/5

33/5

6

3

44

36

31

3

22

41

41

31/6

41/6

6

7

2

53

42

36

3

30

46

44

36/7

46/7

41/7

8

2

62

48

41

3

38

51

47

41/8

51/8

23/4

9

2

71

54

46

3

46

56

50

46/9

56/9

17/3

10

2

80

60

51

3

54

61

53

51/10

61/10

28/5

11

2

89

66

56

3

62

66

56

56/11

6

61/11

12

2

98

72

61

3

70

71

59

61/12

71/12

11/2

13

2

107

78

66

3

78

76

62

66/13

6

72/13

14

1

108

82

74

3

86

81

65

37/7

43/7

40/7

15

1

109

86

82

3

94

86

68

82/15

94/15

88/15

16

1

110

90

90

2

98

92

76

45/8

49/8

47/8

17

1

111

94

98

2

102

98

84

94/17

6

98/17

18

1

112

98

106

2

106

104

92

49/9

53/9

17/3

19

1

113

102

114

2

110

110

100

102/19

110/19

106/19

20

1

114

106

122

2

114

116

108

53/10

29/5

111/20

здесь:

k - номер партии.

i - номер стратегии, выбираемой игроком A.

j - номер стратегии, выбираемой игроком В.

Bi - накопленный игроком А выигрыш за k партий, при условии, что в данной партии B выбирает стратегию Bi.

Аj - накопленный игроком В проигрыш за k партий, при условии, что в данной партии A выбирает стратегию Аj.

Vmin - нижняя оценка игры = min (накопленный выигрыш)/k.

Vmax - верхняя оценка игры = max (накопленный проигрыш)/k.

Доказано, что:

W=(Vmin+Vmax)/2, при k > ? и

pi = Ni/k

qj = Nj/k

Ni - сколько раз выбирается Аi стратегия.

Nj - сколько раз выбирается Bj стратегия.

NA1 = 8

P(A1) = 8/20 = 2/5

NA2 = 11

P(A2) = 11/20 = 11/20

NA3 = 1

P(A3) = 1/20 = 1/20

NB1 = 2

P(B4) = 2/20 = 1/10

NB2 = 8

P(B4) = 8/20 = 2/5

NB3 = 10

P(B4) = 10/20 = 1/2

Цена игры, W = 111/20

Стратегия игрока I: p = (2/5, 11/20, 1/20)

Стратегия игрока II: q = (1/10, 2/5, 1/2)

3) Решить игру симплекс-методом.

1

2

3

0

-8

4

6

1

3

7

4

6

3

6

1

0

Каждый игрок знает, какую стратегию выбрал его противник, т.е. имеет полную информацию о результате выбора противника.

Чистой стратегией игрока I является выбор одной из n строк матрицы выигрышей А, а чистой стратегией игрока II является выбор одного из столбцов этой же матрицы.

1. Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.

Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Игроки

B1

B2

B3

B4

a = min(Ai)

A1

1

2

3

0

0

A2

-8

4

6

1

-8

A3

3

7

4

6

3

A4

3

6

1

0

0

b = max(Bi)

3

7

6

6

Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 3, которая указывает на максимальную чистую стратегию A3.

Верхняя цена игры b = min(bj) = 3.

Седловая точка (3, 1) указывает решение на пару альтернатив (A3,B1). Цена игры равна 3.

2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.

Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью.

Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ? akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) - доминирующая, k-я - доминируемая.

Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij ? ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю - доминируемой.

Стратегия A3 доминирует над стратегией A1 (все элементы строки 3 больше или равны значениям 1-ой строки), следовательно, исключаем 1-ую строку матрицы. Вероятность p1 = 0.

Стратегия A3 доминирует над стратегией A4 (все элементы строки 3 больше или равны значениям 4-ой строки), следовательно, исключаем 4-ую строку матрицы. Вероятность p4 = 0.

-8

4

6

1

3

7

4

6

С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B2 (все элементы столбца 1 меньше элементов столбца 2), следовательно, исключаем 2-й столбец матрицы. Вероятность q2 = 0.

С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B3 (все элементы столбца 1 меньше элементов столбца 3), следовательно, исключаем 3-й столбец матрицы. Вероятность q3 = 0.

-8

1

3

6

Мы свели игру 4 x 4 к игре 2 x 2.

В матрице присутствуют отрицательные элементы. Для упрощения расчетов добавим к элементам матрицы (8). Такая замена не изменит решения игры, изменится только ее цена (по теореме фон Неймана).

0

9

11

14

3. Находим решение игры в смешанных стратегиях.

Математические модели пары двойственных задач линейного программирования можно записать так:

найти минимум функции F(x) при ограничениях (для игрока II):

11x2 ? 1

9x1+14x2 ? 1

F(x) = x1+x2 > min

найти максимум функции Z(y) при ограничениях (для игрока I):

9y2 ? 1

11y1+14y2 ? 1

Z(y) = y1+y2 > max

Решим прямую задачу линейного программирования симплексным методом, с использованием симплексной таблицы.

Определим максимальное значение целевой функции Z(Y) = y1+y2 при следующих условиях-ограничений.

9y2?1

11y1+14y2?1

Для построения первого опорного плана систему неравенств приведем к системе уравнений путем введения дополнительных переменных (переход к канонической форме).

0y1 + 9y2 + 1y3 + 0y4 = 1

11y1 + 14y2 + 0y3 + 1y4 = 1

Решим систему уравнений относительно базисных переменных: y3, y4

Полагая, что свободные переменные равны 0, получим первый опорный план:

Y0 = (0,0,1,1)

Базис

B

y2

y3

y4

y3

1

0

9

1

0

y4

1

11

14

0

1

Z(Y0)

0

-1

-1

0

0

Переходим к основному алгоритму симплекс-метода.

Итерация №0.

Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты.

В качестве ведущего выберем столбец, соответствующий переменной y2, так как это наибольший коэффициент по модулю.

Вычислим значения Di по строкам как частное от деления: bi / ai2

и из них выберем наименьшее:

min (1: 9, 1: 14 ) = 1/14

Следовательно, 2-ая строка является ведущей.

Разрешающий элемент равен (14) и находится на пересечении ведущего столбца и ведущей строки.

Базис

B

y1

y2

y3

y4

min

y3

1

0

9

1

0

1/9

y4

1

11

14

0

1

1/14

Z(Y1)

0

-1

-1

0

0

Формируем следующую часть симплексной таблицы. Вместо переменной y4 в план 1 войдет переменная y2.

Получаем новую симплекс-таблицу:

Базис

B

y1

y2

y3

y4

y3

5/14

-99/14

0

1

-9/14

y2

1/14

11/14

1

0

1/14

Z(Y1)

1/14

-3/14

0

0

1/14

Итерация №1.

Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты.

В качестве ведущего выберем столбец, соответствующий переменной y1, так как это наибольший коэффициент по модулю.

Вычислим значения Di по строкам как частное от деления: bi / ai1

и из них выберем наименьшее:

min (-, 1/14: 11/14 ) = 1/11

Следовательно, 2-ая строка является ведущей.

Разрешающий элемент равен (11/14) и находится на пересечении ведущего столбца и ведущей строки.

Базис

B

y1

y2

y3

y4

min

y3

5/14

-99/14

0

1

-9/14

-

y2

1/14

11/14

1

0

1/14

1/11

Z(Y2)

1/14

-3/14

0

0

1/14

Формируем следующую часть симплексной таблицы. Вместо переменной y2 в план 2 войдет переменная y1.

Получаем новую симплекс-таблицу:

Базис

B

y1

y2

y3

y4

y3

1

0

9

1

0

y1

1/11

1

14/11

0

1/11

Z(Y2)

1/11

0

3/11

0

1/11

Конец итераций: индексная строка не содержит отрицательных элементов - найден оптимальный план

Среди значений индексной строки нет отрицательных. Поэтому эта таблица определяет оптимальный план задачи.

Окончательный вариант симплекс-таблицы:

Базис

B

y1

y2

y3

y4

y3

1

0

9

1

0

y1

1/11

1

14/11

0

1/11

Z(Y3)

1/11

0

3/11

0

1/11

Оптимальный план можно записать так:

y1 = 1/11, y2 = 0

Z(Y) = 1*1/11 + 1*0 = 1/11

Используя последнюю итерацию прямой задачи найдем, оптимальный план двойственной задачи.

x1=0, x2=1/11

Это же решение можно получить, применив теоремы двойственности.

Из теоремы двойственности следует, что X = C*A-1.

Составим матрицу A из компонентов векторов, входящих в оптимальный базис.

A = (A3, A1) =

1

0

0

11

Определив обратную матрицу D = А-1 через алгебраические дополнения, получим:

D = A-1 =

1

0

0

1/11

Как видно из последнего плана симплексной таблицы, обратная матрица A-1 расположена в столбцах дополнительных переменных.

Тогда X = C*A-1 =

(0, 1) x

1

0

0

1/11

= (0;1/11)

Оптимальный план двойственной задачи равен:

x1 = 0, x2 = 1/11

F(X) = 1*0+1*1/11 = 1/11

Цена игры будет равна g = 1/F(x), а вероятности применения стратегий игроков:

qi = g*yi; pi = g*xi.

Цена игры: g = 1: 1/11 = 11

p1 = 11 * 0 = 0

p2 = 11 * 1/11 = 1

Оптимальная смешанная стратегия игрока I:

P = (0; 1)

q1 = 11 * 1/11 = 1

q2 = 11 * 0 = 0

Оптимальная смешанная стратегия игрока II:

Q = (1; 0)

Поскольку ранее к элементам матрицы было прибавлено число (8), то вычтем это число из цены игры.

11 - 8 = 3

Цена игры: v=3

критерий оптимальность игра матрица

4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.

?aijqj ? v

?aijpi ? v

M(P1;Q) = (-8*1) + (1*0) = -8 ? v

M(P2;Q) = (3*1) + (6*0) = 3 = v

M(P;Q1) = (-8*0) + (3*1) = 3 = v

M(P;Q2) = (1*0) + (6*1) = 6 ? v

Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно.

Поскольку из исходной матрицы были удалены строки и столбцы, то найденные векторы вероятности можно записать в виде:

P(0,0,1,0)

Q(1,0,0,0)

4) Решить игру графически.

4

2

3

9

4

8

Рассмотрим игру двух лиц, интересы которых противоположны. Такие игры называют антагонистическими играми двух лиц. В этом случае выигрыш одного игрока равен проигрышу второго, и можно описать только одного из игроков.

Предполагается, что каждый игрок может выбрать только одно из конечного множества своих действий. Выбор действия называют выбором стратегии игрока.

Если каждый из игроков выбрал свою стратегию, то эту пару стратегий называют ситуацией игры. Следует заметить, каждый игрок знает, какую стратегию выбрал его противник, т.е. имеет полную информацию о результате выбора противника.

Чистой стратегией игрока I является выбор одной из n строк матрицы выигрышей А, а чистой стратегией игрока II является выбор одного из столбцов этой же матрицы.

1. Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.

Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Игроки

B1

B2

a = min(Ai)

A1

4

2

2

A2

3

9

3

A3

4

8

4

b = max(Bi)

4

9

Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 4, которая указывает на максимальную чистую стратегию A3.

Верхняя цена игры b = min(bj) = 4.

Седловая точка (3, 1) указывает решение на пару альтернатив (A3,B1). Цена игры равна 4.

2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.

Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью.

Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ? akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) - доминирующая, k-я - доминируемая.

Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij ? ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю - доминируемой.

Стратегия A3 доминирует над стратегией A1 (все элементы строки 3 больше или равны значениям 1-ой строки), следовательно, исключаем 1-ую строку матрицы. Вероятность p1 = 0.

3

9

4

8

В платежной матрице отсутствуют доминирующие столбцы.

Мы свели игру 3 x 2 к игре 2 x 2.

Решим задачу геометрическим методом, который включает в себя следующие этапы:

1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии A1, правый - стратегии A2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2).

2. На левой оси ординат откладываются выигрыши стратегии A1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии A2.

Решение игры (2 x 2) проводим с позиции игрока A, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет.

Максиминной оптимальной стратегии игрока A соответствует точка N, для которой можно записать следующую систему уравнений:

p1 = 0

p2 = 1

Цена игры, y = 4

Теперь можно найти минимаксную стратегию игрока B, записав соответствующую систему уравнений

q1 = 1.

q2 = 0.

Ответ:

Цена игры: y = 4, векторы стратегии игроков:

Q(1, 0), P(0, 1)

4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.

?aijqj ? v

?aijpi ? v

M(P1;Q) = (3*1) + (9*0) = 3 ? v

M(P2;Q) = (4*1) + (8*0) = 4 = v

M(P;Q1) = (3*0) + (4*1) = 4 = v

M(P;Q2) = (9*0) + (8*1) = 8 ? v

Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно.

Поскольку из исходной матрицы были удалены строки, то найденные векторы вероятности можно записать в виде:

P(0,0,1)

Q(1,0)

5) Найти верхнюю и нижнюю цену игры, проверить игру на наличие седловой точки.

5

-3

4

2

5

9

9

0

6

1

3

2

Рассмотрим игру двух лиц, интересы которых противоположны. Такие игры называют антагонистическими играми двух лиц. В этом случае выигрыш одного игрока равен проигрышу второго, и можно описать только одного из игроков.

Предполагается, что каждый игрок может выбрать только одно из конечного множества своих действий. Выбор действия называют выбором стратегии игрока.

Если каждый из игроков выбрал свою стратегию, то эту пару стратегий называют ситуацией игры. Следует заметить, каждый игрок знает, какую стратегию выбрал его противник, т.е. имеет полную информацию о результате выбора противника.

Чистой стратегией игрока I является выбор одной из n строк матрицы выигрышей А, а чистой стратегией игрока II является выбор одного из столбцов этой же матрицы.

1. Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.

Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Игроки

B1

B2

B3

a = min(Ai)

A1

5

-3

4

-3

A2

2

5

9

2

A3

9

0

6

0

A4

1

3

2

1

b = max(Bi)

9

5

9

Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 2, которая указывает на максимальную чистую стратегию A2.

Верхняя цена игры b = min(bj) = 5.

Что свидетельствует об отсутствии седловой точки, так как a ? b, тогда цена игры находится в пределах 2 ? y ? 5. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).

2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.

Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью.

Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ? akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) - доминирующая, k-я - доминируемая.

Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij ? ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю - доминируемой.

Стратегия A3 доминирует над стратегией A1 (все элементы строки 3 больше или равны значениям 1-ой строки), следовательно, исключаем 1-ую строку матрицы. Вероятность p1 = 0.

Стратегия A2 доминирует над стратегией A4 (все элементы строки 2 больше или равны значениям 4-ой строки), следовательно, исключаем 4-ую строку матрицы. Вероятность p4 = 0.

2

5

9

9

0

6

С позиции проигрышей игрока В стратегия B2 доминирует над стратегией B3 (все элементы столбца 2 меньше элементов столбца 3), следовательно, исключаем 3-й столбец матрицы. Вероятность q3 = 0.

2

5

9

0

Мы свели игру 4 x 3 к игре 2 x 2.

Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.

Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.

3. Находим решение игры в смешанных стратегиях.

Запишем систему уравнений.

Для игрока I

2p1+9p2 = y

5p1 = y

p1+p2 = 1

Для игрока II

2q1+5q2 = y

9q1 = y

q1+q2 = 1

Решая эти системы методом Гаусса (решение см. ниже), находим:

y = 33/4

p1 = 3/4 (вероятность применения 1-ой стратегии).

p2 = 1/4 (вероятность применения 2-ой стратегии).

Оптимальная смешанная стратегия игрока I: P = (3/4; 1/4)

q1 = 5/12 (вероятность применения 1-ой стратегии).

q2 = 7/12 (вероятность применения 2-ой стратегии).

Оптимальная смешанная стратегия игрока II: Q = (5/12; 7/12)

Цена игры:

y = 33/4

Размещено на Allbest.ru

...

Подобные документы

  • Поиск по заданному критерию, содержание данного процесса и особенности его использования для решения головоломки "игра в восемь". Методы экономии пространства для поиска по заданному критерию, потребность алгоритма А в ресурсах времени и пространства.

    презентация [121,6 K], добавлен 17.10.2013

  • Критерий Гурвица, обеспечивающий промежуточное решение между крайним оптимизмом и крайним пессимизмом, его необходимые признаки. Критерий Ходжа-Лемана относительно выигрыша. Построение оптимального решения для матрицы решений по критерию Гурвица.

    презентация [1,1 M], добавлен 25.12.2015

  • Представление задач в виде графов AND/OR, примеры. Задача с ханойской башней. Формулировка процесса игры в виде графа. Основные процедуры поиска по заданному критерию. Эвристические оценки и алгоритм поиска. Пример отношений с определением задачи.

    лекция [154,6 K], добавлен 17.10.2013

  • Разработка базы данных спортивной обуви NIKE. Работа основных модулей и блоков. Процесс упорядочения элементов по определенному критерию. Формы сортировки базы данных. Добавление данных в базу. Поиск значений по заданному пользователем критерию.

    курсовая работа [2,9 M], добавлен 16.08.2012

  • Графическое решение задач. Составление математической модели. Определение максимального значения целевой функции. Решение симплексным методом с искусственным базисом канонической задачи линейного программирования. Проверка оптимальности решения.

    контрольная работа [191,1 K], добавлен 05.04.2016

  • Сущность и методика исследования вероятностной структуры сигналов, законы распределения случайных величин. Проверка гипотезы по критерию Колмогорова-Смирнова и Пирсона. Разработка программы вычисления признаков и формирования обучающего множества данных.

    курсовая работа [509,6 K], добавлен 03.12.2009

  • Матричные игры и линейное программирование. Итеративный метод решения матричных игр. Игры на выживание, игры-погони. Критерии принятия решений. Персонал, набранный с помощью резерва в результате решения статистической игры по различным критериям.

    курсовая работа [629,3 K], добавлен 08.10.2014

  • Сущность задач оптимизации и методы их решения с ориентацией на современные средства компьютерной техники. Область допустимых решений. Структура оптимизационной модели. Проверка правильности нахождения точек координат методом половинного деления.

    курсовая работа [2,4 M], добавлен 25.04.2015

  • Реализация программы для решения матричных игр. Задание матрицы игры вручную и случайным образом, нахождение оптимальных стратегий игроков итерационным и методом чистых стратегий. Проектирование и листинг программного кода, сохранение матрицы игры.

    контрольная работа [716,7 K], добавлен 11.06.2011

  • Принятие решений в условиях неопределенности. Классические и производные критерии принятия решений. Критерии Байеса-Лапласа, Сэвиджа, Гурвица, Ходжа-Лемана и Гермейра. Графоаналитический метод решения матричных игр. Основные элементы матрицы решений.

    контрольная работа [1,4 M], добавлен 26.04.2012

  • Ортонормированная матрица – матрица, столбцы и строки которой образуют системы ортонормированных векторов. Решения задачи для матрицы, которая является и не является ортонормированной. Разработка структур данных и алгоритмов. Код программы на языке С++.

    курсовая работа [429,1 K], добавлен 09.03.2012

  • Построение логической модели определенного вида по выборке данных указанного объема, которая содержит информацию о трех входах системы и одном выходе, и представлена в виде матрицы размерностью 30х4. Поверка адекватности этой модели по заданному критерию.

    дипломная работа [20,0 K], добавлен 13.08.2010

  • Анализ метода линейного программирования для решения оптимизационных управленческих задач. Графический метод решения задачи линейного программирования. Проверка оптимального решения в среде MS Excel с использованием программной надстройки "Поиск решения".

    курсовая работа [2,2 M], добавлен 29.05.2015

  • Краткий обзор решения транспортных задач. Экономическая интерпретация поставленной задачи. Разработка и описание алгоритма решения задачи. Построение математической модели. Решение задачи вручную и с помощью ЭВМ. Анализ модели на чувствительность.

    курсовая работа [844,3 K], добавлен 16.06.2011

  • Цели и стратегии теории игр, понятие минимаксного выигрыша и седловой точки. Графический метод решения игровых задач с нулевой суммой. Сведение задач теории игр к задачам линейного программирования. Критерии оценки результатов игровой модели с природой.

    курсовая работа [127,1 K], добавлен 15.06.2010

  • Проектирование схемы решения дифференциального уравнения, обеспечивающей управление процессом решения и задания начальных условий с помощью ЦВМ. Этапы программирования задач на аналоговых вычислительных машинах. Проверка результатов моделирования.

    курсовая работа [71,6 K], добавлен 24.09.2010

  • Основы построения кластерной архитектуры, их классификация и преимущества. Решение оптимизационных задач по расчету производительности, надежности и по мультипликативному критерию при заданных параметрах. Основы работы в математическом редакторе MathCad.

    курсовая работа [89,8 K], добавлен 22.01.2011

  • Разработка компьютерной игры "Эволюция" с помощью игрового движка Unit. Сравнение критериев игры-аналога и разрабатываемой игры. Разработка графического интерфейса пользователя. Настройки камеры в редакторе Unity. Структура файла сохранения игры.

    дипломная работа [3,6 M], добавлен 11.02.2017

  • Возможности современных компьютерных технологий решения задач в средах MS Excel, MS Word. Область программирования в офисных пакетах. Применение ЭВМ в решении математических задач. Разработка программного обеспечения. Разработка приложений с помощью VBA.

    дипломная работа [742,2 K], добавлен 29.01.2009

  • Метод Гаусса-Зейделя как модификация метода Якоби, его сущность и применение. Разработка программы решения системы линейных алгебраических уравнений на языке VB, проверка правильности работы программы в MS Excel и математических пакетах MathCad и MatLab.

    курсовая работа [325,5 K], добавлен 27.10.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.