Выбор стратегии в теории игр
Решение игры в чистых стратегиях. Построение платежных матриц. Понятие и поиск седловой точки. Определение гарантированного и вероятностного выигрыша. Применение метода Гаусса при решении системы неравенств. Минимизация математического ожидания игрока.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 17.12.2016 |
Размер файла | 168,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования
«ФинансоВЫЙ УНИВЕРСИТЕТ при Правительстве Российской Федерации» (Финуниверситет)
Калужский филиал Финуниверситета
Факультет «Управления и бизнес-технологий»
Кафедра «Бухгалтерский учет, анализ и аудит»
контрольная работа
ПО ДИСЦИПЛИНЕ: «Теория игр»
Выбор стратегии в теории игр
Выполнил студент: 3 курса,
заочной формы обучения
Свечников Ю.О.
Преподаватель:
Зайчикова И. В.
Калуга 2015
Задание 1
Условие: Для следующих платежных матриц найти нижнюю и верхнюю цены игры, минимаксные стратегии и наличие седловой точки. В последнем случае определить оптимальное решение игры.
Решение: Проверяем, имеет ли платежная матрица седловую точку.
Если да, то выписываем решение игры в чистых стратегиях.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.
Игроки |
B1 |
B2 |
B3 |
B4 |
a = min(Ai) |
|
A1 |
8 |
9 |
9 |
4 |
4 |
|
A2 |
7 |
6 |
5 |
9 |
5 |
|
A3 |
8 |
5 |
3 |
6 |
3 |
|
A4 |
8 |
3 |
7 |
7 |
3 |
|
b = max(Bi) |
8 |
9 |
9 |
9 |
Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 5, которая указывает на максимальную чистую стратегию A2.
Верхняя цена игры b = min(bj) = 8.
Что свидетельствует об отсутствии седловой точки, так как a ? b, тогда цена игры находится в пределах 5 ? y ? 8. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
Находим решение игры в смешанных стратегиях.
Запишем систему уравнений.
Для игрока I
8p1+7p2+8p3+8p4 = y
9p1+6p2+5p3+3p4 = y
9p1+5p2+3p3+7p4 = y
4p1+9p2+6p3+7p4 = y
p1+p2+p3+p4 = 1
Для игрока II
8q1+9q2+9q3+4q4 = y
7q1+6q2+5q3+9q4 = y
8q1+5q2+3q3+6q4 = y
8q1+3q2+7q3+7q4 = y
q1+q2+q3+q4 = 1
Решая эти системы методом Гаусса (решение см. ниже), находим:
y = 73/10
p1 = 4453/10220 (вероятность применения 1-ой стратегии).
P2 = 511/730 (вероятность применения 2-ой стратегии).
P3 = -2117/10220 (вероятность применения 3-ой стратегии).
P4 = 1/14 (вероятность применения 4-ой стратегии).
Вероятность получилась отрицательная. Следовательно, данный метод не применим при решении игры для исходных данных. Необходимо решать симплекс-методом.
Q1 = 511/730 (вероятность применения 1-ой стратегии).
Q2 = 1/10 (вероятность применения 2-ой стратегии).
Q3 = 0 (вероятность применения 3-ой стратегии).
Q4 = 1/5 (вероятность применения 4-ой стратегии).
Оптимальная смешанная стратегия игрока II: Q = (511/730; 1/10; 0; 1/5)
Задание 2
Условие: Провести возможные упрощения платежной матрицы и решить игру аналитическим методом.
Решение: 1. Проверяем, имеет ли платежная матрица седловую точку.
Если да, то выписываем решение игры в чистых стратегиях.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.
Игроки |
B1 |
B2 |
B3 |
B4 |
B5 |
a = min(Ai) |
|
A1 |
8 |
14 |
3 |
7 |
0 |
0 |
|
A2 |
7 |
16 |
8 |
9 |
2 |
2 |
|
A3 |
8 |
12 |
4 |
6 |
6 |
4 |
|
A4 |
6 |
13 |
2 |
5 |
6 |
2 |
|
A5 |
9 |
17 |
6 |
10 |
9 |
6 |
|
b = max(Bi) |
9 |
17 |
8 |
10 |
9 |
Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 6, которая указывает на максимальную чистую стратегию A5.
Верхняя цена игры b = min(bj) = 8.
Что свидетельствует об отсутствии седловой точки, так как a ? b, тогда цена игры находится в пределах 6 ? y ? 8. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.
Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью.
Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ? akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) - доминирующая, k-я - доминируемая.
Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij ? ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю - доминируемой.
Стратегия A5 доминирует над стратегией A1 (все элементы строки 5 больше или равны значениям 1-ой строки), следовательно исключаем 1-ую строку матрицы. Вероятность p1 = 0.
Стратегия A5 доминирует над стратегией A3 (все элементы строки 5 больше или равны значениям 3-ой строки), следовательно исключаем 3-ую строку матрицы. Вероятность p3 = 0.
Стратегия A5 доминирует над стратегией A4 (все элементы строки 5 больше или равны значениям 4-ой строки), следовательно исключаем 4-ую строку матрицы. Вероятность p4 = 0.
7 |
16 |
8 |
9 |
2 |
|
9 |
17 |
6 |
10 |
9 |
С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B2 (все элементы столбца 1 меньше элементов столбца 2), следовательно исключаем 2-й столбец матрицы. Вероятность q2 = 0.
С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B4 (все элементы столбца 1 меньше элементов столбца 4), следовательно исключаем 4-й столбец матрицы. Вероятность q4 = 0.
С позиции проигрышей игрока В стратегия B5 доминирует над стратегией B1 (все элементы столбца 5 меньше элементов столбца 1), следовательно исключаем 1-й столбец матрицы. Вероятность q1 = 0.
8 |
2 |
|
6 |
9 |
Мы свели игру 5 x 5 к игре 2 x 2. Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.
Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.
3. Находим решение игры в смешанных стратегиях.
Запишем систему уравнений.
Для игрока I
8p1+6p2 = y
2p1+9p2 = y
p1+p2 = 1
Для игрока II
8q1+2q2 = y
6q1+9q2 = y
q1+q2 = 1
Решая эти системы методом Гаусса (решение см. ниже), находим:
y = 62/3
p1 = 1/3 (вероятность применения 1-ой стратегии).
P2 = 2/3 (вероятность применения 2-ой стратегии).
Оптимальная смешанная стратегия игрока I: P = (1/3; 2/3)
q1 = 7/9 (вероятность применения 1-ой стратегии).
Q2 = 2/9 (вероятность применения 2-ой стратегии).
Оптимальная смешанная стратегия игрока II: Q = (7/9; 2/9)
Цена игры:
y = 62/3
Задание 3
Условие: Решить игру графо-аналитическим методом игру, заданную платежной матрицей:
Решение: Проверяем, имеет ли платежная матрица седловую точку.
Если да, то выписываем решение игры в чистых стратегиях.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.
Игроки |
B1 |
B2 |
a = min(Ai) |
|
A1 |
7 |
-1 |
-1 |
|
A2 |
5 |
4 |
4 |
|
A3 |
1 |
5 |
1 |
|
A4 |
3 |
-2 |
-2 |
|
A5 |
2 |
1 |
1 |
|
b = max(Bi) |
7 |
5 |
Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 4, которая указывает на максимальную чистую стратегию A2.
Верхняя цена игры b = min(bj) = 5.
Что свидетельствует об отсутствии седловой точки, так как a ? b, тогда цена игры находится в пределах 4 ? y ? 5. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.
Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.
В матрице присутствуют отрицательные элементы. Для упрощения расчетов добавим к элементам матрицы (2). Такая замена не изменит решения игры, изменится только ее цена (по теореме фон Неймана).
9 |
1 |
|
7 |
6 |
|
3 |
7 |
|
5 |
0 |
|
4 |
3 |
Находим решение игры в смешанных стратегиях.
Решим задачу геометрическим методом, который включает в себя следующие этапы:
1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии B1, правый - стратегии B2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2).
2. На левой оси ординат откладываются выигрыши стратегии B1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии B2.
Решение игры (m x 2) проводим с позиции игрока B, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет.
Максиминной оптимальной стратегии игрока B соответствует точка N, лежащая на пересечении прямых A2A2 и A3A3, для которых можно записать следующую систему уравнений:
y = 7 + (6 - 7)q2
y = 3 + (7 - 3)q2
Откуда
q1 = 1/5
q2 = 4/5
Цена игры, y = 31/5
Теперь можно найти минимаксную стратегию игрока A, записав соответствующую систему уравнений, исключив стратегию A1,A4,A5, которая дает явно больший проигрыш игроку A, и, следовательно, p1 = 0,p4 = 0,p5 = 0.
7p2+3p3 = y
6p2+7p3 = y
p2+p3 = 1
или
7p2+3p3 = 31/5
6p2+7p3 = 31/5
p2+p3 = 1
Решая эту систему, находим:
p2 = 4/5.
P3 = 1/5.
Поскольку ранее к элементам матрицы было прибавлено число (2), то вычтем это число из цены игры.
Цена игры: y = 31/5 - 2 = 21/5
Ответ:
Цена игры: y = 21/5, векторы стратегии игроков:
P(0, 4/5, 1/5, 0, 0), Q(1/5, 4/5)
Проверим правильность решения игры с помощью критерия оптимальности стратегии.
?aijqj ? v
?aijpi ? v
M(P1;Q) = (7*1/5) + (-1*4/5) = 0.6 ? v
M(P2;Q) = (5*1/5) + (4*4/5) = 4.2 = v
M(P3;Q) = (1*1/5) + (5*4/5) = 4.2 = v
M(P4;Q) = (3*1/5) + (-2*4/5) = -1 ? v
M(P5;Q) = (2*1/5) + (1*4/5) = 1.2 ? v
M(P;Q1) = (7*0) + (5*4/5) + (1*1/5) + (3*0) + (2*0) = 4.2 = v
M(P;Q2) = (-1*0) + (4*4/5) + (5*1/5) + (-2*0) + (1*0) = 4.2 = v
Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно.
Задание 4
Условие: Предприятие выпускает скоропортящуюся продукцию А и В. Данные о ее себестоимости, отпускных ценах и объемах реализации приведены в таблице.
1) Составить математическую модель для определения ежедневного объема производства продукции, обеспечивающего предприятию наибольшую прибыль.
2) Определить ежедневный объем производства продукции, обеспечивающий предприятию наибольшую прибыль
Вид продукции |
Себестоимость единицы продукции |
Отпускная цена, ден. ед. |
Объем реализации, ед. |
|||
В день изготовления |
Позже |
В теплую погоду |
В холодную погоду |
|||
А В |
8 4 |
15 8 |
9 5 |
200 410 |
520 150 |
математический игра стратегия выигрыш гаусс
Решение: Игрок А - предприятие, цель которого максимизировать прибыль.
Стратегия А1 - ориентация на теплую погоду.
Стратегия А2 - ориентация на холодную погоду.
1. Составим математическую модель:
а1.1 = 200Ч(15-8)+410Ч(8-4) = 3040
а1.2 = 200Ч(15-8)+150Ч(8-4)+260Ч(5-4) = 2260
а2.1 = 200Ч(15-8)+320Ч(9-8)+150Ч(8-4) = 2320
а2.2 = 520Ч(15-8)+150Ч(8-4) = 4240
Получится математическая модель:
б = 2320 ? в = 3040 , следовательно решение игры в чистых стратегиях отсутствует.
2. Находим решение игры в смешанных стратегиях.
Пусть SА ( р1;р2)
3040 р1 + 2320 р2 = 2260 р1 + 4240 р2
р1 =
+ р2 = 1
р2 = 0,289
р1 = 1-0,289 = 0,711
V = 3040Ч0,711 + 2320Ч0,289 = 2831,92
Предприятие получит гарантированную прибыль 2831,92, если с вероятностью 0,711 (71,1%) будет ориентироваться на теплую погоду, и с вероятностью 0,289 (28,9%) на холодную.
3. Определим ежедневный объём продукции:
VА = 200Чр1 + 520Чр2 = 292
VВ = 410Чр1 + 150Чр2 = 335
Вывод: таким образом предприятию необходимо ежедневно выпускать 292 ед. продукции А, и 335 продукции В. Тем самым предприятие обеспечит себе гарантированную прибыль не менее чем 2831,92.
Задание 5
Условие: Решить игру, заданную платежной матрицей
1. Проверяем, имеет ли платежная матрица седловую точку.
Если да, то выписываем решение игры в чистых стратегиях.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.
Игроки |
B1 |
B2 |
B3 |
a = min(Ai) |
|
A1 |
0 |
1 |
-2 |
-2 |
|
A2 |
-1 |
0 |
3 |
-1 |
|
A3 |
2 |
-3 |
0 |
-3 |
|
b = max(Bi) |
2 |
1 |
3 |
Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = -1, которая указывает на максимальную чистую стратегию A2.
Верхняя цена игры b = min(bj) = 1.
Что свидетельствует об отсутствии седловой точки, так как a ? b, тогда цена игры находится в пределах -1 ? y ? 1. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.
Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью.
Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ? akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) - доминирующая, k-я - доминируемая.
Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij ? ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю - доминируемой.
В платежной матрице отсутствуют доминирующие строки.
В платежной матрице отсутствуют доминирующие столбцы.
Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.
Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.
В матрице присутствуют отрицательные элементы. Для упрощения расчетов добавим к элементам матрицы (3).
Такая замена не изменит решения игры, изменится только ее цена (по теореме фон Неймана).
3 |
4 |
1 |
|
2 |
3 |
6 |
|
5 |
0 |
3 |
3. Находим решение игры в смешанных стратегиях.
Математические модели пары двойственных задач линейного программирования можно записать так:
найти минимум функции F(x) при ограничениях:
3x1+2x2+5x3 ? 1
4x1+3x2 ? 1
x1+6x2+3x3 ? 1
F(x) = x1+x2+x3 > min
найти максимум функции Ф(y) при ограничениях:
3y1+4y2+y3 ? 1
2y1+3y2+6y3 ? 1
5y1+3y3 ? 1
Ф(y) = y1+y2+y3 > max
Решаем эти системы симплексным методом.
Решим прямую задачу линейного программирования симплексным методом, с использованием симплексной таблицы.
Определим максимальное значение целевой функции F(X) = x1 + x2 + x3 при следующих условиях-ограничений.
3x1 + 4x2 + x3?1
2x1 + 3x2 + 6x3?1
5x1 + 3x3?1
Для построения первого опорного плана систему неравенств приведем к системе уравнений путем введения дополнительных переменных (переход к канонической форме).
В 1-м неравенстве смысла (?) вводим базисную переменную x4. В 2-м неравенстве смысла (?) вводим базисную переменную x5. В 3-м неравенстве смысла (?) вводим базисную переменную x6.
3x1 + 4x2 + 1x3 + 1x4 + 0x5 + 0x6 = 1
2x1 + 3x2 + 6x3 + 0x4 + 1x5 + 0x6 = 1
5x1 + 0x2 + 3x3 + 0x4 + 0x5 + 1x6 = 1
Матрица коэффициентов A = a(ij) этой системы уравнений имеет вид:
Базисные переменные это переменные, которые входят только в одно уравнение системы ограничений и притом с единичным коэффициентом.
Экономический смысл дополнительных переменных: дополнительные переменные задачи ЛП обозначают излишки сырья, времени, других ресурсов, остающихся в производстве данного оптимального плана.
Решим систему уравнений относительно базисных переменных: x4, x5, x6 Полагая, что свободные переменные равны 0, получим первый опорный план:
X1 = (0,0,0,1,1,1)
Базисное решение называется допустимым, если оно неотрицательно.
Базис |
B |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
|
x4 |
1 |
3 |
4 |
1 |
1 |
0 |
0 |
|
x5 |
1 |
2 |
3 |
6 |
0 |
1 |
0 |
|
x6 |
1 |
5 |
0 |
3 |
0 |
0 |
1 |
|
F(X0) |
0 |
-1 |
-1 |
-1 |
0 |
0 |
0 |
Переходим к основному алгоритму симплекс-метода.
Итерация №0.
1. Проверка критерия оптимальности. Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты.
2. Определение новой базисной переменной. В качестве ведущего выберем столбец, соответствующий переменной x3, так как это наибольший коэффициент по модулю.
3. Определение новой свободной переменной. Вычислим значения Di по строкам как частное от деления: bi / ai3 и из них выберем наименьшее:
min (1 : 1 , 1 : 6 , 1 : 3 ) = 1/6
Следовательно, 2-ая строка является ведущей.
Разрешающий элемент равен (6) и находится на пересечении ведущего столбца и ведущей строки.
Базис |
B |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
min |
|
x4 |
1 |
3 |
4 |
1 |
1 |
0 |
0 |
1 |
|
x5 |
1 |
2 |
3 |
6 |
0 |
1 |
0 |
1/6 |
|
x6 |
1 |
5 |
0 |
3 |
0 |
0 |
1 |
1/3 |
|
F(X1) |
0 |
-1 |
-1 |
-1 |
0 |
0 |
0 |
0 |
4. Пересчет симплекс-таблицы. Формируем следующую часть симплексной таблицы. Вместо переменной x5 в план 1 войдет переменная x3.
Строка, соответствующая переменной x3 в плане 1, получена в результате деления всех элементов строки x5 плана 0 на разрешающий элемент РЭ=6. На месте разрешающего элемента в плане 1 получаем 1.
В остальных клетках столбца x3 плана 1 записываем нули.
Таким образом, в новом плане 1 заполнены строка x3 и столбец x3.
Все остальные элементы нового плана 1, включая элементы индексной строки, определяются по правилу прямоугольника. Для этого выбираем из старого плана четыре числа, которые расположены в вершинах прямоугольника и всегда включают разрешающий элемент РЭ.
НЭ = СЭ - (А*В)/РЭ
СТЭ - элемент старого плана, РЭ - разрешающий элемент (6), А и В - элементы старого плана, образующие прямоугольник с элементами СТЭ и РЭ. Представим расчет каждого элемента в виде таблицы:
B |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
|
1-(1 * 1):6 |
3-(2 * 1):6 |
4-(3 * 1):6 |
1-(6 * 1):6 |
1-(0 * 1):6 |
0-(1 * 1):6 |
0-(0 * 1):6 |
|
1 : 6 |
2 : 6 |
3 : 6 |
6 : 6 |
0 : 6 |
1 : 6 |
0 : 6 |
|
1-(1 * 3):6 |
5-(2 * 3):6 |
0-(3 * 3):6 |
3-(6 * 3):6 |
0-(0 * 3):6 |
0-(1 * 3):6 |
1-(0 * 3):6 |
|
0-(1 * -1):6 |
-1-(2 * -1):6 |
-1-(3 * -1):6 |
-1-(6 * -1):6 |
0-(0 * -1):6 |
0-(1 * -1):6 |
0-(0 * -1):6 |
Получаем новую симплекс-таблицу:
Базис |
B |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
|
x4 |
5/6 |
8/3 |
7/2 |
0 |
1 |
-1/6 |
0 |
|
x3 |
1/6 |
1/3 |
1/2 |
1 |
0 |
1/6 |
0 |
|
x6 |
1/2 |
4 |
-3/2 |
0 |
0 |
-1/2 |
1 |
|
F(X1) |
1/6 |
-2/3 |
-1/2 |
0 |
0 |
1/6 |
0 |
Итерация №1.
1. Проверка критерия оптимальности. Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты.
2. Определение новой базисной переменной. В качестве ведущего выберем столбец, соответствующий переменной x1, так как это наибольший коэффициент по модулю.
3. Определение новой свободной переменной. Вычислим значения Di по строкам как частное от деления: bi / ai1 и из них выберем наименьшее:
min (5/6 : 22/3 , 1/6 : 1/3 , 1/2 : 4 ) = 1/8
Следовательно, 3-ая строка является ведущей.
Разрешающий элемент равен (4) и находится на пересечении ведущего столбца и ведущей строки.
Базис |
B |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
min |
|
x4 |
5/6 |
22/3 |
31/2 |
0 |
1 |
-1/6 |
0 |
5/16 |
|
x3 |
1/6 |
1/3 |
1/2 |
1 |
0 |
1/6 |
0 |
1/2 |
|
x6 |
1/2 |
4 |
-11/2 |
0 |
0 |
-1/2 |
1 |
1/8 |
|
F(X2) |
1/6 |
-2/3 |
-1/2 |
0 |
0 |
1/6 |
0 |
0 |
4. Пересчет симплекс-таблицы. Формируем следующую часть симплексной таблицы. Вместо переменной x6 в план 2 войдет переменная x1.
Строка, соответствующая переменной x1 в плане 2, получена в результате деления всех элементов строки x6 плана 1 на разрешающий элемент РЭ=4
На месте разрешающего элемента в плане 2 получаем 1.
В остальных клетках столбца x1 плана 2 записываем нули.
Таким образом, в новом плане 2 заполнены строка x1 и столбец x1.
Все остальные элементы нового плана 2, включая элементы индексной строки, определяются по правилу прямоугольника.
Представим расчет каждого элемента в виде таблицы:
Получаем новую симплекс-таблицу:
Базис |
B |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
|
x4 |
1/2 |
0 |
9/2 |
0 |
1 |
1/6 |
-2/3 |
|
x3 |
1/8 |
0 |
5/8 |
1 |
0 |
5/24 |
-1/12 |
|
x1 |
1/8 |
1 |
-3/8 |
0 |
0 |
-1/8 |
1/4 |
|
F(X2) |
1/4 |
0 |
-3/4 |
0 |
0 |
1/12 |
1/6 |
Итерация №2.
1. Проверка критерия оптимальности. Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты.
2. Определение новой базисной переменной. В качестве ведущего выберем столбец, соответствующий переменной x2, так как это наибольший коэффициент по модулю.
3. Определение новой свободной переменной. Вычислим значения Di по строкам как частное от деления: bi / ai2 и из них выберем наименьшее:
min (1/2 : 41/2 , 1/8 : 5/8 , - ) = 1/9
Следовательно, 1-ая строка является ведущей.
Разрешающий элемент равен (41/2) и находится на пересечении ведущего столбца и ведущей строки.
Базис |
B |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
min |
|
x4 |
1/2 |
0 |
41/2 |
0 |
1 |
1/6 |
-2/3 |
1/9 |
|
x3 |
1/8 |
0 |
5/8 |
1 |
0 |
5/24 |
-1/12 |
1/5 |
|
x1 |
1/8 |
1 |
-3/8 |
0 |
0 |
-1/8 |
1/4 |
- |
|
F(X3) |
1/4 |
0 |
-3/4 |
0 |
0 |
1/12 |
1/6 |
0 |
4. Пересчет симплекс-таблицы. Формируем следующую часть симплексной таблицы. Вместо переменной x4 в план 3 войдет переменная x2.
Строка, соответствующая переменной x2 в плане 3, получена в результате деления всех элементов строки x4 плана 2 на разрешающий элемент РЭ=41/2. На месте разрешающего элемента в плане 3 получаем 1.
В остальных клетках столбца x2 плана 3 записываем нули. Таким образом, в новом плане 3 заполнены строка x2 и столбец x2. Все остальные элементы нового плана 3, включая элементы индексной строки, определяются по правилу прямоугольника. Представим расчет каждого элемента в виде таблицы:
Получаем новую симплекс-таблицу:
Базис |
B |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
|
x2 |
1/9 |
0 |
1 |
0 |
2/9 |
1/27 |
-4/27 |
|
x3 |
1/18 |
0 |
0 |
1 |
-5/36 |
5/27 |
1/108 |
|
x1 |
1/6 |
1 |
0 |
0 |
1/12 |
-1/9 |
7/36 |
|
F(X3) |
1/3 |
0 |
0 |
0 |
1/6 |
1/9 |
1/18 |
1. Проверка критерия оптимальности. Среди значений индексной строки нет отрицательных. Поэтому эта таблица определяет оптимальный план задачи. Окончательный вариант симплекс-таблицы:
Базис |
B |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
|
x2 |
1/9 |
0 |
1 |
0 |
2/9 |
1/27 |
-4/27 |
|
x3 |
1/18 |
0 |
0 |
1 |
-5/36 |
5/27 |
1/108 |
|
x1 |
1/6 |
1 |
0 |
0 |
1/12 |
-1/9 |
7/36 |
|
F(X4) |
1/3 |
0 |
0 |
0 |
1/6 |
1/9 |
1/18 |
Оптимальный план можно записать так:
x2 = 1/9
x3 = 1/18
x1 = 1/6
F(X) = 1*1/9 + 1*1/18 + 1*1/6 = 1/3
Используя последнюю итерацию прямой задачи найдем, оптимальный план двойственной задачи.
Из теоремы двойственности следует, что Y = C*A-1.
Составим матрицу A из компонентов векторов, входящих в оптимальный базис. Определив обратную матрицу D = А-1 через алгебраические дополнения, получим:
Как видно из последнего плана симплексной таблицы, обратная матрица A-1 расположена в столбцах дополнительных переменных.
Тогда
Y = C*A-1 =
Оптимальный план двойственной задачи равен:
y1 = 1/6
y2 = 1/9
y3 = 1/18
Z(Y) = 1*1/6+1*1/9+1*1/18 = 1/3
Критерий оптимальности полученного решения. Если существуют такие допустимые решения X и Y прямой и двойственной задач, для которых выполняется равенство целевых функций F(x) = Z(y), то эти решения X и Y являются оптимальными решениями прямой и двойственной задач соответственно.
Цена игры будет равна g = 1/F(x), а вероятности применения стратегий игроков:
qi = g*yi; pi = g*xi.
Цена игры:
g = 1 : 1/3 = 3
p1 = 3 * 1/6 = 1/2
p2 = 3 * 1/9 = 1/3
p3 = 3 * 1/18 = 1/6
Оптимальная смешанная стратегия игрока I:
P = (1/2; 1/3; 1/6)
q1 = 3 * 1/6 = 1/2
q2 = 3 * 1/9 = 1/3
q3 = 3 * 1/18 = 1/6
Оптимальная смешанная стратегия игрока II:
Q = (1/2; 1/3; 1/6)
Поскольку ранее к элементам матрицы было прибавлено число (3), то вычтем это число из цены игры.
3 - 3 = 0
Цена игры: v=0
4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.
?aijqj ? v
?aijpi ? v
M(P1;Q) = (0*1/2) + (1*1/3) + (-2*1/6) = 0 = v
M(P2;Q) = (-1*1/2) + (0*1/3) + (3*1/6) = -0 = v
M(P3;Q) = (2*1/2) + (-3*1/3) + (0*1/6) = 0 = v
M(P;Q1) = (0*1/2) + (-1*1/3) + (2*1/6) = -0 = v
M(P;Q2) = (1*1/2) + (0*1/3) + (-3*1/6) = 0 = v
M(P;Q3) = (-2*1/2) + (3*1/3) + (0*1/6) = -0 = v
Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно.
Задание 6
Условие: Решить игру с природой, заданную платежной матрицей
ь по критерию Гурвица, б=0,3;
ь по критерию Лапласа;
ь по критерию Сэвиджа;
ь по критерию Вальда
Критерий Лапласа. Если вероятности состояний природы правдоподобны, для их оценки используют принцип недостаточного основания Лапласа, согласно которого все состояния природы полагаются равновероятными, т.е.:
q1 = q2 = ... = qn = 1/n.
qi = 1/4
Ai |
П1 |
П2 |
П3 |
П4 |
?(aij) |
|
A1 |
1.5 |
1.25 |
0.25 |
-0.75 |
2.25 |
|
A2 |
1 |
-0.5 |
2.5 |
0.25 |
3.25 |
|
A3 |
-0.75 |
2.25 |
-0.5 |
1.75 |
2.75 |
|
A4 |
0.25 |
1.5 |
0.5 |
2.5 |
4.75 |
|
pj |
0.25 |
0.25 |
0.25 |
0.25 |
Выбираем из (2.25; 3.25; 2.75; 4.75) максимальный элемент max=4.75
Вывод: выбираем стратегию N=4.
Критерий Вальда. По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min aij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Ai |
П1 |
П2 |
П3 |
П4 |
min(aij) |
|
A1 |
6 |
5 |
1 |
-3 |
-3 |
|
A2 |
4 |
-2 |
10 |
1 |
-2 |
|
A3 |
-3 |
9 |
-2 |
7 |
-3 |
|
A4 |
1 |
6 |
2 |
10 |
1 |
Выбираем из (-3; -2; -3; 1) максимальный элемент max=1
Вывод: выбираем стратегию N=4.
Критерий Севиджа. Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max rij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
Риск - мера несоответствия между разными возможными результатами принятия определенных стратегий.
Максимальный выигрыш в j-м столбце bj = max(aij) характеризует благоприятность состояния природы.
1. Рассчитываем 1-й столбец матрицы рисков.
r11 = 6 - 6 = 0; r21 = 6 - 4 = 2; r31 = 6 - (-3) = 9; r41 = 6 - 1 = 5;
2. Рассчитываем 2-й столбец матрицы рисков.
r12 = 9 - 5 = 4; r22 = 9 - (-2) = 11; r32 = 9 - 9 = 0; r42 = 9 - 6 = 3;
3. Рассчитываем 3-й столбец матрицы рисков.
r13 = 10 - 1 = 9; r23 = 10 - 10 = 0; r33 = 10 - (-2) = 12; r43 = 10 - 2 = 8;
4. Рассчитываем 4-й столбец матрицы рисков.
r14 = 10 - (-3) = 13; r24 = 10 - 1 = 9; r34 = 10 - 7 = 3; r44 = 10 - 10 = 0;
Ai |
П1 |
П2 |
П3 |
П4 |
|
A1 |
0 |
4 |
9 |
13 |
|
A2 |
2 |
11 |
0 |
9 |
|
A3 |
9 |
0 |
12 |
3 |
|
A4 |
5 |
3 |
8 |
0 |
Результаты вычислений оформим в виде таблицы.
Ai |
П1 |
П2 |
П3 |
П4 |
max(aij) |
|
A1 |
0 |
4 |
9 |
13 |
13 |
|
A2 |
2 |
11 |
0 |
9 |
11 |
|
A3 |
9 |
0 |
12 |
3 |
12 |
|
A4 |
5 |
3 |
8 |
0 |
8 |
Выбираем из (13; 11; 12; 8) минимальный элемент min=8
Вывод: выбираем стратегию N=4.
Критерий Гурвица. Критерий Гурвица является критерием пессимизма - оптимизма.
За оптимальную принимается та стратегия, для которой выполняется соотношение:
max(si)
где si = y min(aij) + (1-y)max(aij)
При y = 1 получим критерий Вальде, при y = 0 получим - оптимистический критерий (максимакс).
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1.
Рассчитываем si.
s1 = 0.3*(-3)+(1-0.3)*6 = 3.3
s2 = 0.3*(-2)+(1-0.3)*10 = 6.4
s3 = 0.3*(-3)+(1-0.3)*9 = 5.4
s4 = 0.3*1+(1-0.3)*10 = 7.3
Ai |
П1 |
П2 |
П3 |
П4 |
min(aij) |
max(aij) |
y min(aij) + (1-y)max(aij) |
|
A1 |
6 |
5 |
1 |
-3 |
-3 |
6 |
3.3 |
|
A2 |
4 |
-2 |
10 |
1 |
-2 |
10 |
6.4 |
|
A3 |
-3 |
9 |
-2 |
7 |
-3 |
9 |
5.4 |
|
A4 |
1 |
6 |
2 |
10 |
1 |
10 |
7.3 |
Выбираем из (3.3; 6.4; 5.4; 7.3) максимальный элемент max=7.3
Вывод: выбираем стратегию N=4.
<...Подобные документы
Основные определения теории биматричных игр. Пример биматричной игры "Студент-Преподаватель". Смешанные стратегии в биматричных играх. Поиск "равновесной ситуации". 2x2 биматричные игры и формулы для случая, когда у каждого игрока имеется две стратегии.
реферат [84,2 K], добавлен 13.02.2011Определение матричных игр в чистых стратегиях. Смешанные стратегии и их свойства. Решения игр матричным методом. Метод последовательного приближения цены игры. Отыскание седлового элемента. Антагонистические игры как первый класс математических моделей.
контрольная работа [855,7 K], добавлен 01.06.2014Однородные системы линейных неравенств и выпуклые конусы. Применение симплекс-метода для отыскания опорного решения системы линейных неравенств, ее геометрический смысл. Основная задача линейного программирования. Теорема Минковского, ее доказательство.
курсовая работа [807,2 K], добавлен 03.04.2015Проверка выполнимости теоремы Бернулли на примере надёжности электрической схемы. Примеры решения задач с игральными костями, выигрыша в лотерею, вероятности брака и др. Биноминальный закон распределения: решение математического ожидания и дисперсии.
контрольная работа [74,4 K], добавлен 31.05.2010Принятие решений как особый вид человеческой деятельности. Рациональное представление матрицы игры. Примеры матричных игр в чистой и смешанной стратегиях. Исследование операций: взаимосвязь задач линейного программирования с теоретико-игровой моделью.
курсовая работа [326,4 K], добавлен 05.05.2010Расчет денежных расходов предприятия на выпуск изделий, при выражении их стоимости при помощи матриц. Проверка совместимости системы уравнений и их решение по формулам Крамера и с помощью обратной матрицы. Решение алгебраических уравнений методом Гаусса.
контрольная работа [576,6 K], добавлен 28.09.2014Сущность метода системосовокупностей как одного из распространенных и универсальных методов решения неравенств любого типа. Обобщение метода интервалов на тригонометрической окружности. Эффективность и наглядность графического метода решения задач.
методичка [303,7 K], добавлен 14.03.2011Решение системы уравнений по методу Крамера, Гаусса и с помощью обратной матрицы. Общее число возможных элементарных исходов для заданных испытаний. Расчет математического ожидания, дисперсии и среднего квадратического отклонения, график функции.
контрольная работа [210,4 K], добавлен 23.04.2013Расчет произведения заданных матриц. Решение системы линейных алгебраических уравнений по формулам Крамера, матричным методом и методом Гаусса. Координаты вектора в базисе. Определение ранга заданной матрицы. Система с базисом методом Жордана-Гаусса.
контрольная работа [88,2 K], добавлен 19.01.2014Понятие матрицы. Метод Гаусса. Виды матриц. Метод Крамера решения линейных систем. Действия над матрицами: сложение, умножение. Решение систем линейных уравнений методом Гаусса. Элементарные пребразования систем. Математические перобразования.
лекция [45,4 K], добавлен 02.06.2008Задачи на элементы теории вероятности и математической статистики. Решение систем линейных уравнений методом Крамера; методом Гаусса. Закон распределения дискретной случайной величены. Построение выпуклого многоугольника, заданного системой неравенств.
контрольная работа [96,1 K], добавлен 12.09.2008Стандартные методы решений уравнений и неравенств. Алгоритм решения уравнения с параметром. Область определения уравнения. Решение неравенств с параметрами. Влияние параметра на результат. Допустимые значения переменной. Точки пересечения графиков.
контрольная работа [209,4 K], добавлен 15.12.2011Выполнение действий над матрицами. Определение обратной матрицы. Решение матричных уравнений и системы уравнений матричным способом, используя алгебраические дополнения. Исследование и решение системы линейных уравнений методом Крамера и Гаусса.
контрольная работа [63,2 K], добавлен 24.10.2010Нахождение проекции точки на прямую, проходящую через заданные точки. Изучение формул Крамера для решения систем линейных уравнений. Определение точки пересечения перпендикуляра и исходной прямой. Исследование и решение матричной системы методом Гаусса.
контрольная работа [98,6 K], добавлен 19.04.2015Применение метода инверсии при решении задач на построение в геометрии. Решение задачи Аполлония, лемма об антипараллельных прямых. Инвариантные окружности и сохранение углов при инверсии. Недостатки применения инверсии и работа инверсора Гарта.
дипломная работа [790,0 K], добавлен 30.09.2009Сведения из истории математики о решении уравнений. Применение на практике методов решения уравнений и неравенств, основанных на использовании свойств функции. Исследование уравнения на промежутках действительной оси. Угадывание корня уравнения.
курсовая работа [1,4 M], добавлен 07.09.2010Нахождение пределов, не используя правило Лопиталя. Исследование функции на непрерывность, построение ее графика. Определение типа точки разрыва. Поиск производной функции. Поиск наибольшего и наименьшего значения функции на указанном ее отрезке.
контрольная работа [1,1 M], добавлен 26.03.2014Определение вероятности наступления определенного события по законам теории вероятности. Вычисление математического ожидания, дисперсии и среднего квадратичного отклонения. Нахождение выборочного уравнения регрессии по данным корреляционной таблицы.
контрольная работа [212,0 K], добавлен 01.05.2010Общая схема методов спуска. Метод покоординатного спуска. Минимизация целевой функции по выбранным переменным. Алгоритм метода Гаусса-Зейделя. Понятие градиента функции. Суть метода наискорейшего спуска. Программа решения задачи дискретной оптимизации.
курсовая работа [90,8 K], добавлен 30.04.2011Закон распределения суточного дохода трамвайного парка, оценка доверительного интервала для математического ожидания и дисперсии суточного дохода. Особенности определения математического ожидания рассматривающейся случайной величины при решении задач.
курсовая работа [69,5 K], добавлен 02.05.2011