Математические методы в программировании
Характеристика антагонистических, коалиционных, матричных видов игр. Ознакомление с содержанием и методами решения игровых задач с противодействием, природой и нулевой суммой. Способы сведения задач теории игр к задачам линейного программирования.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 03.12.2013 |
Размер файла | 55,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Министерство строительного комплекса и жилищно-коммунального хозяйства Московской области
ГБОУ СПО МО Воскресенский индустриальный техникум
Специальность "230105 Программное обеспечение вычислительной
техники и автоматизированных систем"
КУРСОВАЯ РАБОТА ПО МАТЕМАТИЧЕСКИМ МЕТОДАМ
ПОЯСНИТЕЛЬНАЯ ЗАПИСКА
Принял(а) Вострякова А.В. Выполнил(а)
Студента группы ДП-3
Каштанов Евгений Вячеславович
Содержание
игра противодействие линейный программирование
Введение
1. Основные понятия теории игр
2. Игры с противодействием и нулевой суммой
3. Графический метод решения игровых задач с нулевой суммой
3.1 Решение задач графическим методом
4. Сведение задач теории игр к задачам линейного программирования
4.1 Решение задач
5. Игры с природой (без противодействия)
5.1 Решение задач
Заключение
Список литературы
Введение
Основные понятия теории игр
Моя цель - это теории игр - выработка рекомендаций для различного поведения игроков в конфликтной ситуации, т.е. выбор оптимальной стратегии для каждого из них. Различают два больших класса игровых моделей: модели без противодействия (или их еще называют "играми с природой") и модели с противодействием (действия конкурентов на рынке).
Игры с противодействием часто называют конфликтными ситуациями, которые широко распространены в обществе. Например, конкурентная борьба в экономике, в спортивных соревнованиях, состязание сторон в ходе судебного заседания и т.д. Игровая модель, в отличии от конфликтной ситуации, строится по определенным законам, а игроки придерживаются определенных правил.
Развитие игры во времени представляется как ряд последовательных "ходов". Ходы могут быть сознательные и случайные. Случайный ход - результат, получаемый не решением игрока, а каким либо механизмом случайного выбора (покупательский спрос, задержка с поставкой материалов и т.п.). Сознательный ход - выбор игроком одного из возможных вариантов действия (стратегий) и принятие решения о его осуществлении.
В процессе целенаправленной человеческой деятельности возникают ситуации, в которых интересы отдельных лиц (участников, групп, сторон) или прямо противоположные, или, не будучи бескомпромиссными, все же не совпадают. Простейшими и наиболее наглядными примерами таких ситуаций являются спортивные игры, арбитражные споры, военные учения (маневры), борьба между блоками избирателей за своих кандидатов, в международных отношениях - отстаивание интересов своего государства и т. п. Здесь каждый из участников сознательно стремится добиться наилучшего результата за счет другого участника. Подобного рода ситуации встречаются и в различных сферах производственной деятельности. Игра (в математике) - это идеализированная математическая модель коллективного поведения: несколько игроков влияют на результат игры, причем их интересы различны. На сегодняшний день в силу молодости теории игр, не существует четкой классификации игр, однако можно отметить основные направления, по которым будет осуществляться классификация игр: количество игроков, количество стратегий, характер взаимоотношений, характер выигрышей, вид функции выигрышей т.д.. По количеству игроков игры делятся на конечные и бесконечные. По характеру игры делят на: игры с нулевой суммой и игры с ненулевой суммой. Игрой с нулевой суммой есть такая, когда сумма выигрышей всех игроков в любой партии равна нулю. Игра двух игроков с нулевой суммой называется антагонистической, так как цели игроков противоположны: выигрыш одного происходит за счет проигрыша другого. По видам функций выигрышей игры делятся на: матричные, биматричных, непрерывные, сепарабельные и другие. Одним из самых простых, и наиболее изученных классов игр, являются матричные игры. Матричная игра - это конечная игра двух игроков с нулевой суммой, в которой выигрыши первого игрока задаются в виде матрицы. Исследование матричных игр интересное том, что к ним могут быть приближенно сведены много игр более общего вида. Актуальность: Актуальность выбранной темы обусловлена ??широтой сфер ее применения. Теория игр играет центральную роль в теории отраслевой организации, теории контрактов, теории корпоративных финансов и многих других областях. Область применения матричных игр включает не только экономические дисциплины, но и биологию, политологию, военное дело и др.. Объект исследования: Матричные игры. Предмет исследования: Методы решения матричных игр. Нахождение решения матричной игры методами линейного программирования. Цель: Исследовать методы нахождения решения матричных игр. Создать программное приложение, который находит оптимальные стратегии игроков и цену игры, заданной платежной матрицей.
Теория игр занимается изучением конфликтных ситуаций, где сталкиваются интересы индивидов, партий, государств и т.п. Как утверждал Г.Лейбниц, "...и игры заслуживают изучения; и если какой-нибудь проницательный математик посвятит себя их изучению, то получит много важных результатов, ибо нигде человек не показывает столько изобретательности, как в игре ". Нет математической теории, которая могла бы дать алгоритм любой реальной игры, но существуют ситуации, подобные игровые и допускающие математический анализ.
1. Основные понятия теории игр
Остановимся на классификации игр.
Интересы участников игры (игроков) могут оказаться несовпадающими и даже противоположными.
В последнем случае игра называется антагонистической. В игре могут участвовать два или более игроков. Случай игры с одним участником (пасьянс, управление физическим объектом и т.д.) в сущности, является игрой двух лиц, где вторым участником выступает природа (судьба, рок, провидение). Игроки могут в игре выступать каждый за себя или объединяться в группы.
В последнем случае игра называется коалиционной.
Игры, в которых игроки осведомлены о состоянии своем и партнеров, а также о прошлом поведении участников игры, относятся к категории игр полной информацией (типичные примеры - шахматы, "крестики-нолики" и т.п.). Большинство же игр протекает в условиях неполной информации, где сведения о состоянии партнеров исчерпываются лишь вероятностными характеристиками (домино, карточные игры, игры против "природы").
Антагонистическую игру, где выигрыш одного коллектива равен проигрышу другого, называют игрой с нулевой суммой.
Система правил, однозначно определяющая выбор хода игрока в зависимости от сложившейся ситуации, называется стратегией. Каждая фиксированная стратегия игрока, где любой ситуации сопоставлен конкретный выбор, называется чистой. В реальности чаще используются смешанные стратегии, где чистые стратегии смешиваются с некоторыми частотами.
Простейшими являются игры 2 лиц с нулевой суммой.
Пусть в такой игре игрок 1 имеет m выборов и игрок 2 - n выборов. Если игрок 1 делает свой i-й выбор, а игрок 2 - свой j-й выбор, то выигрыш игрока 1 (проигрыш игрока 2) равен Rij.
Такая игра называется матричной и матрица R = [ Rij / i=1..m , j=1..n ] называется матрицей выигрышей (платежной матрицей).
При ведении игры игрок должен ориентироваться на оптимальную политику партнера и наказывать его за отступления от таковой.
Проведем рассуждения за игрока 1.
Если Я воспользуюсь i-м выбором, мой противник для минимизации моего выигрыша сделает тот из своих выборов, который даст min Rij. Соответственно, Я должен использовать тот выбор, который гарантирует мне выигрыш, не меньший
Противник, рассуждая аналогично, приходит к выводу о гарантированном проигрыше, не превышающем
Если в матрице выигрышей существует элемент
Rkl = V1 = V2,
то говорят о наличии оптимальной политики "в пространстве чистых стратегий" и оптимальными выборами для игроков соответственно являются выборы k и l. Пару (k, l) называют седловой точкой.
Пример 1. Пусть игра определяется матрицей
Седловые точки - (4, 1) и (4, 2). Цена игры = 6; оптимальный выбор для игрока 1 - четвертый, для игрока 2 равнозначны первый и второй (под ценой игры понимают гарантированный выигрыш-проигрыш при оптимальной политике обоих игроков).
Пример 2. Пусть игра определяется матрицей
Здесь равенство V1 = V2 не выполняется; оптимальной чистой стратегии для игроков нет.
При анализе игр часто прибегают к попыткам обнаружить доминирование между строками и столбцами.
Так в примере 1 элементы четвертой строки больше элементов других строк: использование выбора 4 выгоднее других выборов при любой политике противника. Противник видит, что в такой ситуации использовать выборы 3 и 4 неразумно.
Использование доминирования т.о. позволяет уменьшить размеры изучаемой матрицы исключением "невыгодных" строк и столбцов.
При отсутствии седловой точки среди чистых стратегий приходится искать такую среди смешанных.
Если игрок 1 прибегает к своему выбору i с вероятностью Pi, а игрок 2 - к своему j-му выбору с вероятностью Qj, то ожидаемый выигрыш игрока 1 (проигрыш игрока 2) равен
Основная теорема теории игр (теорема Джона фон Неймана) утверждает, что любая матричная игра с нулевой суммой всегда имеет седловую точку, т.е. существуют векторы P и Q такие, что
(V - цена игры).
2. Игры с противодействием и нулевой суммой
Предположим, что имеются две конкурирующие фирмы, выпускающие однотипные товары. Для обеспечения наибольшей прибыли обе фирмы разработали стратегии реализации товара. В общем случае это можно записать в виде матрице (табл. 1.1).
Пусть фирма А разработала четыре стратегии, а фирма В - пять стратегий.
То есть фирма А - А1; А2; А3; А4 Аi , где i = 1,4.
Фирма В соответственно - В1; В2; В3; В4; В5 Вj , где j = 1,5.
Каждая фирма от реализации своей стратегии предполагает получить какой-то доход (табл. 2.1).
Таблица 2.1
Стратегии |
В1 |
В2 |
В3 |
В4 |
В5 |
|
А1 |
5 |
8 |
7 |
5 |
4 |
|
А2 |
1 |
10 |
5 |
5 |
6 |
|
А3 |
2 |
4 |
3 |
6 |
2 |
|
А4 |
3 |
5 |
4 |
4 |
3 |
Если фирма А выберет первую стратегию, то минимальный доход составит 4. Минимальный доход от второй стратегии - 1; от третьей - 2; от четвертой - 3. У фирмы В имеется в наличии пять стратегий. Использование первой стратегии обернется убытком в 1 единицу; второй (убыток) - 4; третьей - 3, четвертой - 4 и пятой - 2.
На первый взгляд фирма А должна избрать вторую стратегию (А2), чтобы получить выигрыш 10, но в ответ вторая фирма изберет первую стратегию (В1) и выигрыш фирмы А составит только 1.
Поэтому цель первой фирмы можно сформулировать так: получить максимальный доход из возможных минимальных. Введем в табл. 2.1 дополнительную строку и дополнительный столбец, в которых укажем возможные минимальные прибыли и максимальные (табл. 2.2).
Таблица 2.2
Стратегии |
В1 |
В2 |
В3 |
В4 |
В5 |
Минимальная прибыль фирмы А |
|
А1 |
5 |
8 |
7 |
5 |
4 |
4 |
|
А2 |
1 |
10 |
5 |
5 |
6 |
1 |
|
А3 |
2 |
4 |
3 |
6 |
2 |
2 |
|
А4 |
3 |
5 |
4 |
4 |
3 |
3 |
|
Максимальный убыток фирмы В |
5 |
10 |
7 |
6 |
6 |
Исходя из данных (табл. 2.2) фирме А надо придерживаться стратегии А1 , а фирме В - стратегии В1 .
Таким образом, гарантированный минимальный доход фирмы А составит 4, а минимально возможный убыток, который понесет фирма В, составит 5 (минимально возможный проигрыш).
Минимальный гарантированный выигрыш называется нижней ценой игры. При плохой игре фирмы В выигрыш может быть и большим.
Минимально возможный проигрыш называется верхней ценой игры.
Для нашего примера нижняя цена игры составляет 4 (минимальный гарантированный выигрыш фирмы А), а верхняя цена игры - 5 (минимально возможный проигрыш фирмы В).
Приведенные выше рассуждения хороши, если конкурирующая фирма заранее не знает, как себя поведет противник.
Если конкурирующая фирма ознакомлена с планами конкурента, то она может выбрать другую стратегию (отличную от осторожной стратегии) и получить больший выигрыш (доход).
Таким образом, приведенные осторожные стратегии являются неустойчивыми по отношению к дополнительной информации.
На практике иногда случается, что нижняя цена игры равна верхней цене игры. В этом случае говорят об устойчивых стратегиях игроков (конкурирующих фирм) или о задачах с седловой точкой.
Задача с седловой точкой представлена в (табл. 2.3).
Таблица 2.3
Стратегии |
В1 |
В2 |
В3 |
В4 |
В5 |
Минимальная прибыль фирмы А |
|
А1 |
4 |
8 |
7 |
5 |
4 |
4 |
|
А2 |
1 |
10 |
5 |
5 |
6 |
1 |
|
А3 |
2 |
4 |
3 |
6 |
2 |
2 |
|
А4 |
3 |
5 |
4 |
4 |
3 |
3 |
|
Максимальный убыток фирмы В |
4 |
10 |
7 |
6 |
6 |
Стратегии обоих противников в задачах с седловой точкой называются оптимальными и не зависят от дополнительно полученной информации. В специальной литературе доказано, что если при исследовании игровой модели известна вся предыстория (все ранее сделанные ходы), то существуют оптимальные (чистые) стратегии поведения игроков (конкурентов).
Если игровая задача не имеет седловой точки, то на практике конкурирующие фирмы (игроки) используют смешанные стратегии, т.е. попеременно используют две или более стратегий. В этом случае использование фирмой А нескольких стратегий можно записать как сумму вероятностей использования каждой стратегии Sa= p1+ p2+ …+ pm .
Соответственно, использование нескольких стратегий фирмой В можно записать
Sb= q1+ q2+ …+ qn
Поэтому в общем случае исследование игровой модели сводится к определению вероятностей использования конкретных стратегий каждой фирмой (игроком).
3. Графический метод решения игровых задач с нулевой суммой
Суть графического метода состоит в том, что из матрицы удаляют дублирующие и поглощаемые строки и столбцы. Дублирующими называют полностью одинаковые строки или столбцы. Доминирующей строкой называется такая строка, которая содержит элементы, большие или равные соответствующим элементам другой строки, называемой поглощаемой. Доминирующим столбцом называется такой, который содержит элементы, меньше или равные соответствующим элементам другого столбца, который называется поглощаемым.
Воспользуемся табл. 2.1.
Строка (стратегия) А1 является доминирующей по отношению к строке (стратегии) А4 , так как содержит элементы, большие соответствующих элементов строки А4 . Соответственно строка А4 является поглощаемой и из дальнейшего рассмотрения удаляется (табл. 3.1).
Таблица 3.1
Первый шаг упрощения таблицы
Стратегии |
В1 |
В2 |
В3 |
В4 |
В5 |
|
А1 |
5 |
8 |
7 |
5 |
4 |
|
А2 |
1 |
10 |
5 |
5 |
6 |
|
А3 |
2 |
4 |
3 |
6 |
2 |
Первый столбец является доминирующим по отношению ко второму, третьему и четвертому столбцам (поглощаемым). Поступаем аналогично (табл. 3.2).
Таблица 3.2
Второй шаг упрощения таблицы
Стратегии |
В1 |
В5 |
|
А1 |
5 |
4 |
|
А2 |
1 |
6 |
|
А3 |
2 |
2 |
Еще раз рассматриваем строки. Первая строка поглощает третью строку. Поглощаемые строки (столбцы) содержат самые плохие стратегии. Окончательно получим (табл. 3.3).
Таблица 3.3
Третий шаг упрощения таблицы
Стратегии |
В1 |
В5 |
|
А1 |
5 |
4 |
|
А2 |
1 |
6 |
Вероятность использования первой фирмой первой стратегии обозначим через p1. Тогда вероятность использования второй стратегии первым игроком будет p2 = 1- p1
На оси х отложим две точки 0 и 1. Через эти точки проведем прямые линии, параллельные оси у. Затем в первое выражение подставим 0 вместо p1, а потом - единицу. И по двум точкам построим прямую линию.
Аналогично построим вторую прямую линию. Пересечение двух прямых линий и даст решение задачи
4p1 + 1= - 2p1 + 6
4p1 + 2p1 = - 1 + 6
6p1 = 5
p1 = 0,83
Итак, вероятность использования первой стратегии фирмой А составляет 0,83 (p1 = 0,83), а второй стратегии p2 = 1 - 0,83 - соответственно 0,17 (p2 = 0,17).
Аналогично определим оптимальную стратегию поведения фирмы В:
Пусть у1 - вероятность выбора второй игрой 5 стратегией, у2 - 6 стратегией.
(p4 + p5 = 1, p5 = 1- p4)
(a11 - a12) · у1 + a12 = (5 - 4) у1 + 4 = у1 + 4;
(a21 - a22) · у1 + a22 = (1 - 6) у1 + 6 = -5 у1 + 6.
у1 + 4 = -5 у1 + 6
6 у1 = 2
у1 = 0,33
Вероятность использования первой стратегии фирмой В составляет 0,33 (у1 = 0,33), а второй стратегии у2=1- 0,33 - соответственно 0,67 (у2 = 0,67).
3.1 Решение задач графическим методом
Пример 1: Рассмотрим игру заданной платежной матрицей.
Решение
Проверим есть ли Седловая точка :
? = max (2,2,3,2) = 3,? = min (7,6,6,4,5) = 4 ? ? ?
Седловой точки нет, игра в чистых стратегиях не решается. Найдем смешанную стратегию игроков.
Посмотрим, можно ли удалить не выгодную стратегию для игроков. Для первого игрока невыгодной считается та стратегия, которая, обеспечивает выигрыш меньший, чем какая либо другая. Для второго игрока считается та стратегия не выгодной, которая обеспечить проигрыш больший, чем другая стратегия.
Невыгодные стратегии для первого игрока: |
4, 2 |
|
Невыгодные стратегии для второго игрока: |
1, 2, 3 |
Пусть p1 - вероятность с которой первый игрок должен применять 1 стратегию, p3 - вероятность применения 3 стратегией, p3 = 1- p1 .
Ожидаемый выигрыш 1 игрока, если второй выбрал 4 стратегию:
p1 · 4 + (1 - p1) · 3 = p1 + 3; Ожидаемый выигрыш 1 игрока, если второй выбрал 5 стратегию:
p1 · 2 + (1 - p1) · 5 = -3 p1 + 5;
p1 + 3 = -3 p1 + 5
4 p1 = 2
p1 = 1/2 , p3 =1/2 .
Первому игроку для получения гарантированного выигрыша 3,5 (1/2+3) рекомендуется чередовать стратегии 1 и 3.
Рассмотрим второго игрока.
Пусть p4 - вероятность выбора вторым игроком 4 стратегией, p5 - 5 стратегией (p4 + p5 = 1, p5 = 1- p4). Ожидаемый проигрыш второго игрока, если первый выберет 1 стратегию. p4 · 4 + (1- p4) · 2 = 2 p4 + 2. Ожидаемые проигрыш второго игрока, если первый выберет 3 стратегию
p4 · 3 + (1- p4) · 5 = -2 p4 + 5
2 p4 + 2 = -2 p4 +5
4 p4 =3
p4 =3/4
p5 =1/4
? = 3/4 · 2 + 2 = 3,5
Ответ: Из 4 игр 3 надо сыграть 4 стратегией, 1 игру - 5 стратегией, и тогда проигрыш будет не больше 3,5, для первого игрока 1 надо сыграть 2 стратегией и 1 - второй стратегией.
Пример 2: Решить игру, заданную матрицей.
Решение:
Проверим если ли седловая точка:
? = max (2,4) = 4
? = min (6,5) = 5???
седловой точки нет, игра в чистой стратегии не решается. Найдем смешанную стратегию игроков. Т.к. игровая матрица задана первоначально в размерности 2?2, значит убирать столбцы или строки не нужно.
Ожидаемый выигрыш 1 игрока если второй выбрал 1 стратегию:
А1 · 2 + (1 - А1) · 6 = -4А1 + 6;
Ожидаемый выигрыш 1 игрока если второй выбрал 2 стратегию:
А1 · 5 + (1 - p1) · 4 = А1 + 4;
- 4 А1 + 6 = А1 + 4
- 4 А1 + А1 = 4 - 6
- 5 А1 = - 2
А1 = 2/5 , А2 = 3/5.
Первому игроку для получения гарантированного выигрыша 4,
(2/5+4) рекомендуется играть 1 стратегией.
Рассмотрим второго игрока.
Пусть В1 - вероятность выбора второй игрой 4 стратегией,
(В1 + В2 = 1, В2 = 1- В1)
Ожидаемый проигрыш второго игрока, если первый выберет 1 стратегию.
В1 · 2 + (1- В1) · 5 = - 3 В1 + 5
Ожидаемый проигрыш второго игрока, если первый выберет 2 стратегию.
В1 · 6 + (1- В1) · 4 = 2 В1 + 4
- 3 В1 + 5 = 2 В1 + 4
- 3 В1 - 2 В1 = 4 - 5
- 5 В1 = - 1
В1 = 1/5 , В2 = 4/5.
? = 1/5 · 2 + 4 = 4
Ответ : Из 2 игр 2 надо сыграть 1 стратегией, 1 игру - 2 стратегией, и тогда проигрыш будет не больше 4.
Пример 3: Решить игру, заданную матрицей
Проверим если ли седловая точка:
? = max (7,6) = 7
? = min (10,9,9) = 9 ? ? ?
седловой точки нет, игра в чистой стратегии не решается. Найдем смешанную стратегию игроков. Посмотрим, можно ли удалить не выгодную стратегию для игроков.
Для первого игрока невыгодной считается та стратегия, которая, обеспечивает выигрыш меньший, чем какая либо другая. Для второго игрока считается та стратегия не выгодной, которая обеспечить проигрыш больший, чем другая стратегия.
Ожидаемый выигрыш 1 игрока, если второй выбрал 1 стратегию:
p1 · 7 + (1 - p1) · 10 = -3p1 + 10;
Ожидаемый выигрыш 1 игрока, если второй выбрал 2 стратегию:
p1 · 9 + (1 - p1) · 6 = 3 p1 + 6;
-3p1 + 10 = 3 p1 + 6
-3p1 - 3p1 = -10 + 6
-6p1 = -4
p1 = 2/3 , p2 =1/3 .
Первому игроку для получения гарантированного выигрыша 7, (2/3+7) рекомендуется играть 1 стратегией.
Рассмотрим второго игрока.
Ожидаемые проигрыш второго игрока если первый выберет 1 стратегию.
p4 · 7 + (1- p4) · 9 = -2 p4 + 9
Ожидаемые проигрыш второго игрока если первый выберет 2 стратегию.
p4 · 10 + (1- p4) · 6 = 4 p4 + 6
-2p4 + 9 = 4 p4 + 6
-2p4 - 4p4 = 6 - 9
-6p4 = -3
р4 = 1/2 , p5 =1/2 .
Ответ : Из 2 игр (для первого) 2 надо сыграть 3 стратегией и 1 - 3 стратегией, (для второго) 1 надо сыграть 2 стратегией и 1 - 2 стратегией.
Пример 4: Решить игру, заданную матрицей
Проверим если ли седловая точка:
? = max (5,4,2,1) = 5
? = min (6,8) = 6 ? ? ?
седловой точки нет, игра в чистой стратегии не решается. Найдем смешанную стратегию игроков.
Посмотрим можно ли удалить не выгодную стратегию для игроков Для первого игрока невыгодной считается та стратегия, которая, обеспечивает выигрыш меньший, чем какая либо другая. Для второго игрока считается та стратегия не выгодной, которая обеспечить проигрыш больший, чем другая стратегия.
Невыгодная стратегия для первого игрока: |
2,3 |
Ожидаемый выигрыш 1 игрока, если второй выбрал 1 стратегию:
p1 · 6 + (1 - p1) · 1 = 5 p1 + 1;
Ожидаемый выигрыш 1 игрока, если второй выбрал 2 стратегию:
p1 · 5 + (1 - p1) · 8 = -3 p1 + 8;
5 p1 + 1 = -3 p1 + 8
5 p1 + 3p1 = 8 - 1
8 p1 = 7
p1 = 7/8 , p2 =1/8 .
Рассмотрим второго игрока. Ожидаемый проигрыш второго игрока, если первый выберет 1 стратегию.p4 · 6 + (1- p4) · 5 = p4 + 5. Ожидаемые проигрыш второго игрока, если первый выберет 2 стратегию.
p4 · 1 + (1- p4) · 8 = -7 p4 + 8
p4 + 5 = -7 p4 + 8
p4 + 7 p4 = 8 - 5
8 p4 = 3 р4 = 3/8 , p5 =5/8.
Ответ : Из 4 игр (для первого) 7 надо сыграть 8 стратегией и 1 - 8, (для второго) 3 надо сыграть 8 стратегией и 5 - 8.
4. Сведение задач теории игр к задачам линейного программирования
Предположим, что цена игры положительна ( > 0). Если это не так, то согласно свойству 6 всегда можно подобрать такое число с, прибавление которого ко всем элементам матрицы выигрышей даёт матрицу с положительными элементами, и следовательно, с положительным значением цены игры. При этом оптимальные смешанные стратегии обоих игроков не изменяются.
Свойство 1. Тройка (хо, о, ) является решением игры = (Х,,А) тогда и только тогда, когда (хо, о, к +а) является решением игры (Х,,кА+а), где а любое вещественное число, к 0.
Свойство 2. Для того, чтобы хо = () была оптимальной смешанной стратегией матричной игры с матрицей А и ценой игры , необходимо и достаточно выполнение следующих неравенств (j = )
Аналогично для игрока 2 : чтобы о = (, ...,, ...,) была оптимальной смешанной стратегией игрока 2 необходимо и достаточно выполнение следующих неравенств: (i = )
Из последнего свойства вытекает: чтобы установить, является ли предполагаемые (х, ) и решением матричной игры, достаточно проверить, удовлетворяют ли они неравенствам (*) и (**). С другой стороны, найдя неотрицательные решения неравенств (*) и (**) совместно со следующими уравнениями.
Получим решение матричной игры.
Итак, пусть дана матричная игра с матрицей А порядка m х n. Согласно свойству 7 оптимальные смешанные стратегии х = (х1, ..., хm), y = (y1, ..., yn) соответственно игроков 1 и 2 и цена игры должны удовлетворять соотношениям.
Разделим все уравнения и неравенства в (4.4) и (4.5) на (это можно сделать, т.к. по предположению > 0) и введём обозначения
Поскольку первый игрок стремится найти такие значения хi и, следовательно, pi , чтобы цена игры была максимальной, то решение первой задачи сводится к нахождению таких неотрицательных значений pi
Поскольку второй игрок стремится найти такие значения yj и, следовательно, qj, чтобы цена игры была наименьшей, то решение второй задачи сводится к нахождению таких неотрицательных значений qj
Решив эти задачи, получим значения pi , qj.
4.1 Решение задач
Пример 5: Найти решение игры, определяемой матрицей.
Решение.
Составим теперь пару взаимно-двойственных задач :
Решим вторую из них
Из оптимальной симплекс-таблицы следует, что
(q1, q2, q3) = (0;; 1),
а из соотношений двойственности следует, что
( p1, p2, p3) = (; 1; 0).
Следовательно, цена игры с платёжной матрицей А1 равна игры с платёжной матрицей А:
При этом оптимальные стратегии игроков имеют вид:
Х = (х1, х2, х3) = (р1; р2; р3) = =.
Y = (y1, y2, y3) = (q1; q2; q3) = = .
5. Игры с природой (без противодействия)
В играх с противодействием фирме А (одному игроку) противостоит другая фирма - В (игрок). Фирма В выбирает целенаправленную стратегию поведения с тем, чтобы уменьшить выигрыш фирмы А (следовательно, и свой проигрыш).
В играх с природой вторым игроком является природа, которая действует ("выбирает" стратегии) случайным образом. То есть она может или улучшать положение первого игрока, или ухудшать. Поэтому существует несколько критериев оценки результатов исследования игровой модели.
1. Критерий Вальде (пессимистический).
В соответствии с этим критерием следует применять самую осторожную стратегию, которая сведет к минимуму вероятность (риск) проигрыша и доставит минимальную прибыль. Эта стратегия обеспечивается критерием: max (min a ij ), где минимум выбирается по каждой строке.
То есть этот критерий совпадает с нижней ценой игры.
2. Критерий максимума (оптимистический).
Этот критерий полагает, что природа будет максимально благосклонна к игроку. Можно выбирать самые авантюристические стратегии и они будут реализоваться max (max a ij ), где максимум выбирается по каждой строке.
3. Критерий Гурвица.
Критерий Гурвица занимает промежуточное значение между критерием Вальде и критерием максимума. Сам игрок определяет вероятность своего "везения"
max (б min a ij + (1- б) max a ij )
Ответственное лицо, принимающее решение, определяет значение коэффициента б. Если потери могут быть весьма значительными, то значение коэффициента б приближается к единице, иначе к 0.
4. Критерий Сэвиджа.
Этот критерий анализирует возможные риски от применения каждой из стратегий и выбирает такую стратегию, которая обеспечивает приемлемые потери. Риски по каждой стратегии определяются по формуле:
r ij = max a ij - a ij
То есть из максимально возможного выигрыша при данном состоянии природы вычитается выигрыш, полученный от использования выбранной стратегии. Каждый элемент матрицы рисков обозначает потери, которые понесет фирма (точнее, недополученную прибыль), если для каждого текущего состояния природы будет выбрана неоптимальная стратегия. Оптимальная стратегия может быть определена по формуле:
min (max (max a ij - a ij)
где максимум выбирается в каждом конкретном столбце.
Для примера возьмем таблицу стратегий и составим для нее таблицу рисков
Если фирма (игрок) выберет стратегию А1, а природа реализует стратегию В1 , то фирма получит максимально возможную прибыль 5 (недополученная прибыль составит 0). Фирма угадала состояние природы. Но если природа реализует стратегию В4, то фирма вместо максимально возможной прибыли 12 получит прибыль 5, а недополученная прибыль составит 7.
Таблица 5.1
Таблица стратегий
Стратегии |
В1 |
В2 |
В3 |
В4 |
В5 |
|
А1 |
5 |
8 |
7 |
5 |
4 |
|
А2 |
1 |
10 |
5 |
5 |
6 |
|
А3 |
2 |
4 |
3 |
6 |
2 |
|
А4 |
3 |
5 |
4 |
12 |
3 |
|
max a ij |
5 |
10 |
7 |
12 |
6 |
Таблица 5.2
Таблица рисков
Стратегии |
В1 |
В2 |
В3 |
В4 |
В5 |
|
А1 |
0 |
2 |
0 |
7 |
2 |
|
А2 |
4 |
0 |
2 |
7 |
0 |
|
А3 |
3 |
6 |
4 |
6 |
4 |
|
А4 |
2 |
5 |
3 |
0 |
3 |
5.1 Решение задач
Пример 1: Швейная фабрика на летний сезон может реализовать два вида костюмов: 1200 костюмов по цене 520 руб. и 200 костюмов по цене 1000 руб., если погода будет жаркой. Если погода будет холодной, то фабрика может реализовать 650 костюмов первого вида и 700 костюмов второго вида.
Определить план выпуска костюмов каждого вида и прибыль, полученную от их реализации.
Решение:
Швейная фабрика располагает двумя стратегиями: А1 - погода будет жаркой и А2 - погода будет холодной.
Если фабрика воспользуется первой стратегией и погода действительно будет жаркой, то прибыль фабрики составит:
1200 · 520 + 200 · 1000 = 624 000 + 200 000 = 824 000 руб.
Если фабрика воспользуется первой стратегией, но погода будет холодной, то прибыль фабрики составит:
650 · 520 + 200 · 1000 - (1200 - 650) · 520 = 338 000 + 200 000 - 286 000 = 252 000 руб.
Если фабрика воспользуется второй стратегией и погода действительно будет холодной, то прибыль фабрики составит:
650 · 520 + 700 · 1000 = 338 000 + 700 000 = 1 038 000 руб.
Если фабрика воспользуется второй стратегией, но погода будет жаркой, то прибыль фабрики составит:
650 · 520 + 200 · 1000 - (700 - 200) · 1000 = 338 000 + 200 000 - 500 000 = 38 000 руб.
Составим матрицу прибыли (таб. 5.3).
Таблица 5.3
Матрица прибыли
Стратегии |
В1 |
В2 |
|
А1 |
824 000 |
252 000 |
|
А2 |
38 000 |
1 038 000 |
б = max (252 000; 38 000) = 252 000 руб.
в = min (824 000; 1 038 000) = 824 000 руб.
Таким образом, цена игры находится в диапазоне от 252 000 руб. до 824 000 руб.
Минимальный гарантированный доход швейной фабрики составит 252 000 руб., но возможен и доход в 824 000 руб.
Определим план выпуска изделий швейной фабрикой. Вероятность выбора стратегии А1 обозначим через х1, а вероятность выбора стратегий А2 - через х2. Учитывая, что х2 = 1 - х1,можем записать:
(a11 - a12)· х1 + a12 = (824 000 - 38 000)· х1 + 38 000 = 786 000 х1 + 38 000;
(a21 - a22)· х1 + a22 = (252 000 - 1 038 000) · х1 + 1 038 000 = -786 000 х1 + 1 038 000;
786 000 х1 + 786 000 х1 = 1 038 000 - 38 000
1 572 000 х1 = 1 000 000
х1 = 0,64; х2 = 1 - 0,64х2 = 0,36;
0,64 (1200; 200) + 0,36 (650; 700) = (1002; 380).
Цена игры составит: 786 000 х1 + 38 000 = 541 040 руб.
Таким образом, план выпуска изделий таков: 1002 костюма первого вида и 380 костюмов второго вида, и при любых погодных условиях швейная фабрика получит прибыль не менее 541 000 руб.
Определим критерии.
1. Критерий Вальде:
max (min a ij) = max (38 000; 252 000) = 252 000 руб.
Швейной фабрике целесообразно использовать стратегию А1 .
2. Критерий максимума:
max (max a ij ) = max (824 000; 1 038 000) = 1 038 000 руб.
Швейной фабрике целесообразно использовать стратегию А2 .
3. Критерий Гурвица:
пусть б = 0,4 , тогда для стратегии А1
б min a ij + (1 - б) max a ij = 0,4 · 252 000 + (1 - 0,4) · 824 000 = 595 200 руб.
для стратегии А2
б min a ij + (1 - б) max a ij = 0,4 · 38 000 + (1 - 0,4) · 1 038 000 = 638 000 руб.
Швейной фабрике целесообразно использовать стратегию А2 .
4. Критерий Сэвиджа:
Максимальный элемент в первом столбце - 824 000, во втором столбце - 1 038 000.
Швейной фабрике целесообразно использовать стратегию А1 или А2 .
Заключение
При написании курсовой работы по дисциплине "Математические методы" на тему "Теория игр" у меня возникли проблемы с теоретической частью курсовой работы. Мне приходилось брать одну литературу и искать нужную информацию, а потом, если в ней не полностью раскрыта тема, то брал следующую, а в ней более труднее приходилось разбираться, так как один автор пишет, как он понимает, а другой - свои взгляды на тему. Но я смог преодолеть эту непреодолимую пропасть.
Список литературы
1. " Математические методы в программировании " : / Агальцов В.П., Волдайская И.В. Учебник : - М . : ИД "ФОРУМ" : ИНФРА-М, 2006. - 224с. : ил. -(Профессиональное образование). - (Учимся программировать).
2. Лекции по дисциплине " Математические методы ".
3. "Математические методы: Учебник" / Партика Т.Л., Попов И.И. - М: ФОРУМ: ИНФРА, 2005.
4. "Математическое программирование" / Костевич Л., издательство "Новое знание", 2003.
Выдержки из исследования
В последние годы потребление пшеницы в мире росло. В 2011/12 урожайном году потребление пшеницы в мире выросло на 80% и составило 50 млн. тонн.
В 2012 году из-за неблагоприятных погодных условий урожай пшеницы снова, как в 2010 году, упал на треть и оказался самым низким за период 2006-2012 гг., составив *** тыс. тонн. Среди федеральных округов РФ наибольшую долю в объеме сбора пшеницы занимает *** федеральный округ. Среди регионов России наибольший урожай пшеницы озимой и яровой собирается ***.
По итогам 2012 года российский импорт зерна вырос более чем наполовину относительно показателя предыдущего года (плюс ***%) и составил *** тыс. тонн зерна в натуральном выражении.
Почти половину объема российского рынка зерна в натуральном выражении занимает пшеница, включая меслин. По итогам 2012 года данная зерновая культура составила ***% объема видимого потребления зерна в России (*** тыс. тонн).
Размещено на Allbest.ru
...Подобные документы
Цели и стратегии теории игр, понятие минимаксного выигрыша и седловой точки. Графический метод решения игровых задач с нулевой суммой. Сведение задач теории игр к задачам линейного программирования. Критерии оценки результатов игровой модели с природой.
курсовая работа [127,1 K], добавлен 15.06.2010Характеристика параметрических методов решения задач линейного программирования: методы внутренней и внешней точки, комбинированные методы. Алгоритм метода барьерных поверхностей и штрафных функций, применяемых для решения задач большой размерности.
контрольная работа [59,8 K], добавлен 30.10.2014Особенности задач линейного программирования. Симплексный метод решения задач линейного программирования. Обоснование выбора языка, инструментария программирования, перечень идентификаторов и блок-схема алгоритма. Логическая схема работы программы.
дипломная работа [2,4 M], добавлен 13.08.2011Постановка задач линейного программирования. Примеры экономических задач, сводящихся к задачам линейного программирования. Допустимые и оптимальные решения. Алгоритм Флойда — алгоритм для нахождения кратчайших путей между любыми двумя узлами сети.
контрольная работа [691,8 K], добавлен 08.09.2010Анализ метода линейного программирования для решения оптимизационных управленческих задач. Графический метод решения задачи линейного программирования. Проверка оптимального решения в среде MS Excel с использованием программной надстройки "Поиск решения".
курсовая работа [2,2 M], добавлен 29.05.2015Постановка задачи линейного программирования и формы ее записи. Понятие и методика нахождения оптимального решения. Порядок приведения задач к каноническому виду. Механизмы решения задач линейного программирования аналитическим и графическим способами.
методичка [366,8 K], добавлен 16.01.2010Практические навыки моделирования задач линейного программирования и их решения графическим и симплекс-методом с использованием прикладной программы SIMC. Моделирование транспортных задач и их решение методом потенциалов с помощью программы TRAN2.
контрольная работа [199,8 K], добавлен 15.06.2009Теоретическая основа линейного программирования. Задачи линейного программирования, методы решения. Анализ оптимального решения. Решение одноиндексной задачи линейного программирования. Постановка задачи и ввод данных. Построение модели и этапы решения.
курсовая работа [132,0 K], добавлен 09.12.2008Основные понятия математического линейного программирования. Постановка и методы решения заданий целочисленного и параметрического составления программ. Примеры вычисления задач с параметрами в целевой функции и в свободных членах системных ограничений.
дипломная работа [432,0 K], добавлен 25.10.2010Характеристика основных методов линейного программирования с n- переменными, в частности, графического и симплекс-метода. Способы решения задачи по определению оптимальной структуры товарооборота, обеспечивающей торговому предприятию максимум прибыли.
курсовая работа [678,7 K], добавлен 03.04.2011Особенности решения задач нелинейного программирования различными методами для проведения анализа поведения этих методов на выбранных математических моделях нелинейного программирования. Общая характеристика классических и числовых методов решения.
дипломная работа [2,4 M], добавлен 20.01.2013Сущность математических моделей, классификация и принципы их построения. Анализ операционного исследования. Этапы решения задачи принятия оптимальных решений с помощью ЭВМ. Примеры задач линейного программирования. Математические методы экспертных оценок.
курсовая работа [56,0 K], добавлен 20.11.2015Методы определения оптимального плана производства (приобретения) продукции с учетом ограниченного обеспечения ресурсами различного вида. Технология поиска оптимального решения задач линейного программирования (ЗЛП) с помощью итоговой симплекс-таблицы.
лабораторная работа [42,8 K], добавлен 11.03.2011Численные методы решения нелинейных уравнений, систем линейных и нелинейных алгебраических уравнений, дифференциальных уравнений, определенных интегралов. Методы аппроксимации дискретных функций и методы решения задач линейного программирования.
методичка [185,7 K], добавлен 18.12.2014Расчет производства необходимого количества продукции для получения максимальной прибыли предприятия. Математическая модель для решения задач линейного программирования. Построение ограничений и целевых функций. Исследование чувствительности модели.
задача [74,7 K], добавлен 21.08.2010Применение методов линейного программирования для решения оптимизационных задач. Основные понятия линейного программирования, свойства транспортной задачи и теоремы, применяемые для ее решения. Построение первичного опорного плана и системы потенциалов.
курсовая работа [280,8 K], добавлен 17.11.2011Анализ решения задачи линейного программирования. Симплексный метод с использованием симплекс-таблиц. Моделирование и решение задач ЛП на ЭВМ. Экономическая интерпретация оптимального решения задачи. Математическая формулировка транспортной задачи.
контрольная работа [196,1 K], добавлен 15.01.2009Широкое применение вычислительной техники как в общей математике, так и в одном из её разделов – математических методах. Ознакомление с решением задач линейного программирования симплекс-методом и графически. Составлена программа на языке Delphi.
курсовая работа [57,1 K], добавлен 04.05.2010Изучение и укрепление на практике всех моментов графического метода решения задач линейного программирования о производстве журналов "Автомеханик" и "Инструмент". Построение математической модели. Решение задачи с помощью электронной таблицы Excel.
курсовая работа [663,9 K], добавлен 10.06.2014Строение системы уравнений-ограничений и ее переменных, графический способ решения задач линейного программирования на плоскости. Выражение неизвестных через две независимые переменные, являющиеся координатными осями графика. Значение целевой функции.
лабораторная работа [61,4 K], добавлен 07.01.2011