Теория игр

Игра в нормальной форме. Ситуации сильного равновесия. Дуэли с одним выстрелом. Вектор Шепли произвольных игр и для игр власти. Арбитражная схема Нэша. Ситуация равновесия в позиционной игре с полной информацией, в непрерывных антагонистических играх.

Рубрика Математика
Вид контрольная работа
Язык русский
Дата добавления 19.02.2014
Размер файла 394,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ИНСТИТУТ МИРОВОЙ ЭКОНОМИКИ И ИНФОРМАТИЗАЦИИ

НЕГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

Контрольная работа

«Теория Игр»

Студентка

Шахлович Александра

Москва 2013

1. Игра в нормальной форме

Ответ: Пусть задана позиционная игра n лиц. Построим игру в нормальной форме Г следующим образом.

Множество игроков N в этой игре равно {1,2,…,,n}.

Пусть iN и } - семейство всех информационных множеств позиционной игры, содержащихся в множестве . Будем считать, что есть множество всех функций , отображающих W в ? и удовлетворяющих следующему условию: число не превосходит количества альтернатив в любой вершине из множества I.

Стратегия задает вероятностное распределение на множестве всех альтернатив в вершине v по следующему правилу:

В позициях случая также задается вероятностное распределение на множестве альтернатив условием

если jI.

Для каждой финальной вершины w определен единственный путь , соединяющий ее с начальной вершиной v0 и числа qt (t=0,…,k-1), равные pj(vt), где j номер альтернативы {vt,vt+1} в вершине vt.

Положим

.

Непосредственно проверяется, что величины P(w) задают вероятностное распределение на множестве финальных вершин. Таким образом, величины hi(w) можно считать случайными, причем распределения этих величин зависят от стратегий всех игроков. Обозначим gi(u1,u2,…,un) математическое ожидание величины hi при условии, что игроки выбрали стратегии u1,u2,…,un соответственно.

Определение. Построенная таким образом игра называется нормальной формой данной позиционной игры.

2. Ситуации сильного равновесия

Ответ:

Пример. «Пиратские корабли»

Два корабля уходят в один и тот же день на остров сокровищ. Каждый из n пиратов должен принять решение, на каком корабле ему плыть: на корабле А или на корабле В. Если ( t-- число пиратов, решивших плыть на корабле А, то путешествие на корабле А затянется на a(t) дней, а путешествие на корабле В, на котором (n-t) пиратов, продлится b(n-t) дней. Каждый игрок стремится минимизировать длительность его собственного путешествия. Данная ситуация описывается следующей игрой:

означает, что игрок i плывет на корабле А.

Предположим, что функции а и b строго монотонно возрастают на {0, ..., n} и выполнены условия

.

Некооперативным равновесием (NE-исходом) в данной игре является любой исход х*, для которого число , удовлетворяет следующим условиям:

нет желания переключаться со стратегии 1 на стратегию О и

)

нет желания переключаться со стратегии 0 на стратегию 1.

Предполагая для простоты, что

для всех t, получаем, что существует единственное целое число t*, удовлетворяющее двум приведенным выше неравенствам, а именно

Следовательно, исход х* есть равновесие по Нэшу тогда и только тогда, когда

.

Если игроки не могут обмениваться информацией перед выбором стратегии (они должны забронировать место на одном из двух кораблей заранее), то они не смогут координировать свои выборы так, чтобы достигнуть равновесия по Нэшу в чистых стратегиях. По-видимому, они будут использовать симметричное вполне смешанное равновесие, которое в действительности доминируемо по Парето любым NE-исходом в чистых стратегиях.

Любое соглашение, основанное на использовании конкретного NE-исхода, является устойчивым также по отношению к отклонениям коалицией, т. е. любой NE-исход является в данном случае сильным равновесием (см. определение ниже). Если a(t*) и b(n--t*) достаточно близки, то все игроки в соответствии с соглашением получают приблизительно равные выигрыши, т. е. выбор конкретного NE-исхода не является конфликтной ситуацией. Для реализации одного из этих исходов пираты должны последовательно и открыто выбирать корабль по следующему алгоритму:

Определение . Для данной игры в нормальной форме скажем, что х*--исход сильного равновесия, если не существует коалиции игроков, для которых было бы выгодно отклониться от данного исхода в случае, если дополнительная коалиция не реагирует на отклонение: не выполнено

игра шепли нэш равновесие

Обозначим SE (G) множество сильных равновесий в игре G. Оно может быть пустым.

Ответ:

Определение 1. Пусть -- игра в нормальной форме, в которой -- конечные множества при всех

Смешанной стратегией игрока i называется вероятностное распределение Следовательно, множество смешанных стратегий i-го игрока есть единичный симплекс в .

Смешанным расширением игры G называется игра в нормальной форме , где для всех

В смешанном расширении Gm игры G стратегия игрока i есть вероятностное распределение . Под этим подразумевается, что игрок i конструирует собственную лотерею, в которой стратегия выпадает в соответствии с . To, что лотерея его собственная, означает, что только игрок i знает стратегию, которая действительно выпала в лотерее (даже если остальные игроки, возможно, знают вероятностное распределение ). Более того, лотерея i-го игрока cтохастически не зависит от лотереи j-го игрока при всех j, (таким образом, игрок j не может получить никакой информации о лотерее i-ro игрока на основе наблюдения своей собственной лотереи).

Поскольку случайные переменные независимы в совокупности, то есть ожидаемый выигрыш игрока i. Принимая за функцию выигрыша игрока i в игре Gm, мы тем самым

считаем, что игрок i сравнивает различные лотереи на , попросту сопоставляя связанные с ними математические ожидания выигрыша и . Другими словами, и есть функция полезности по фон Нейману--Моргенштерну, которая распространяет предпочтения игрока i на все возможные лотереи на XN. Теперь существенно, что функция ui (х) принимает действительные значения, индуцированные функциями ui на ХN .

Чистая стратегия игрока i в исходной игре будет отождествляться со смешанной стратегией выбирающей xi с вероятностью 1:

В самом деле, из формулы (1) сразу следует, что

для всех

Поэтому будем рассматривать Хi как подмножество Mi а -- как расширение ui с ХN на МN.

Лемма . Гарантированный выигрыш игрока i в исходной игре не больше его гарантированного выигрыша в смешанном расширении игры:

для всех

.

3. Дуэли с одним выстрелом

Ответ:

Пример «шумная дуэль»: Каждый из двух игроков может произвести один выстрел. Игроки сходятся с постоянной скоростью. В момент t = 0 игроки достаточно далеко друг от друга, а в момент t=1 сходятся вплотную. Задана действительная функция а, на отрезке [0, 1], измеряющая меткость игрока i, i=1, 2. Значение аi(t) есть вероятность того, что игрок i поразит игрока j, если будет стрелять в момент t. Предположим, что аi не убывает, непрерывна и удовлетворяет краевым условиям .

Выигрыш (игрока 1) равен +1, если первый игрок поражает второго до того, как сам будет поражен; --1 в симметричном случае и 0, если ни один не поражен, либо оба поражены одновременно.

Множества стратегий суть X1 = X2 = [0, 1]. Стратегия xi игрока i означает:

«Я буду стрелять в момент t = xi если противник не выстрелит раньше. Если же он выстрелит, но промахнется, то я для надежности буду стрелять в момент t= 1». Следовательно, нормальная форма игры имеет вид (X1, X2, u1), где

Вычислим осторожные стратегии игрока 1. Для любого

Пусть l есть отрезок, принадлежащий [0, 1] (возможно, и точка), определяемый из условия

Функция возрастает до l, постоянна на l и убывает после l. Поэтому ) является множеством осторожных стратегий игрока 1. Гарантированный выигрыш игрока 1 есть общее значение функций на l. Аналогично можно показать, что и гарантированный проигрыш второго игрока равен . Следовательно, есть цена игры, а -- множество оптимальных стратегий для обоих игроков. Каждый стреляет оптимально, когда

4. Вектор Шепли произвольных игр

Ответ: Определение. Вектором Шепли называется отображение, которое каждой игре в форме характеристической функции ставит в соответствие дележ в соответствующей игре, если оно удовлетворяет следующим условиям:

1. для любого носителя K (аксиома эффективности);

2. для любого автоморфизма игры (аксиома симметрии);

3. для любых двух игр <N,v> и <N,v> (аксиома агрегации).

Лемма. Вместо аксиомы эффективности можно использовать следующее свойство

4. для любого болвана i (аксиома болвана).

Доказательство. Пусть выполнены аксиомы 1,2,3. Рассмотрим произвольного болвана i. Множество N\{i} является носителем, поэтому

.

Так как игрок i является болваном

v(N\{i})+v(i)=v(N).

А так как вектор (v) является дележом в игре <N,v> выполняется условие

.

Сравнивая три полученных равенства, получим , то есть выполняется аксиома 4.

Обратно, пусть выполняются аксиомы 2, 3 и 4. Рассмотрим произвольный носитель K. Так как все игроки, не входящие в K являются болванами, выполняется условие

.

По аксиоме болвана v(j)=j(j) для jN\K. А так как вектор (v) является дележом в игре <N,v> выполняется условие

.

Из этих трех условий получаем равенство

,

означающее, что выполнено утверждение аксиомы 1.

Лемма. Возможно задание вектора Шепли двумя свойствами:

1) для любой перестановки множества N (аксиома анонимности);

2) если для всех коалиций K не содержащих игрока i, то i(v)= i(w) (аксиома маргинальности).

5. Арбитражная схема Нэша

Ответ:

Арбитражные решения для случая двух игроков впервые определил Джон Нэш в 1950 г. Положения (принципы), принимаемые как исходные, называются аксиомами. Нэш предложил для обоснования арбитражного решения следующие аксиомы.

А1. Аксиома допустимости. Арбитражное решение должно содержаться в множестве , т.е. .

А2. Аксиома индивидуальной рациональности. Арбитражное решение должно давать каждому игроку выигрыш не меньший, чем его выигрыш в точке разлада (status quo), т.е.

, .

А3. Аксиома оптимальности по Парето. Арбитражное решение должно быть оптимальным по Парето, т.е. в не должно существовать такого , , которое не хуже для обоих игроков, чем арбитражное решение .

А4. Аксиома независимости от линейного преобразования. Этот принцип содержательно означает, что арбитражное решение не должно зависеть от выбора единицы измерения полезности и точки начала отсчета.

Определим этот принцип формально. Пусть множество получается из с помощью линейного преобразования, т.е.

,

где , , , - произвольные числа.

Тогда, если арбитражное решение для арбитражной задачи , то для арбитражной задачи , где

, ,

арбитражным решением должно быть

, .

А5. Аксиома симметрии. Если множество допустимых результатов симметрично, т.е. из того, что следует , то при в арбитражном решении арбитражной задачи должно выполняться . Другими словами, если множество симметрично и , то и в арбитражном решении должно быть .

А6. Аксиома независимости от посторонних альтернатив. Если арбитражное решение задачи и , где , то должно быть арбитражным решением задачи . Т.е. отбрасывание любых альтернативных исходов, если они не являются решением, не должно изменять арбитражного решения.

Справедливо следующее утверждение.

Теорема Нэша. Если множества выпуклы, замкнуты, ограничены и имеют внутренние точки, то существует единственное арбитражное отображение , удовлетворяющее аксиомам А1 - А6. При этом арбитражное решение определяется условием

.

Будем называть арбитражное решение, определяемое таким образом, арбитражным решением Нэша. Таким образом, задача отыскания арбитражного решения Нэша состоит в максимизации функции на множестве .

Итак, если принципы А1 - А6 принимаются как справедливые, то и арбитражное решение Нэша должно восприниматься как справедливое.

6. Существование ситуации равновесия в конечной позиционной игре с полной информацией

Ответ:

Теорема. В любой многошаговой (позиционной) игре с полной информацией на конечном древовидном графе существует ситуация абсолютного равновесия по Нэшу (NE)..

Доказательство. Докажем по индукции по длине игры l. Пусть l ??1 (рис. 1). Предположим - множеству очередностей i-го игрока. Игрок i выбирает альтернативу из условия максимизации своего выигрыша .

Игроки получают , соответственно. Если i -й игрок отклонится, он получит меньше, следовательно, он будет действовать согласно стратегии, образующей абсолютное NE.

Предположим теперь, что теорема справедлива для всех игр, таких что длина каждой из них не превосходит l?1.

Докажем, что ситуация равновесия существует для игры G длины l.

Так как подыгры (см. рис. 2), имеют длину не более l ?1, то по индукционному предположению теорема справедлива, следовательно, существует ситуация абсолютного NE

Пусть

.

И пусть в точке z* ходит игрок i : . Тогда игра G переходит в подыгру . Но в подыгре каждый i-ый игрок получает выигрыш , соответствующий ситуации NE . Поскольку - сужение стратегии на множество , то выигрыш i-го игрока в ситуации u* игры G равен выигрышу в ситуации

(1)

Аналогично доказывается, если . Пусть произвольная стратегия игрока в игре G. Обозначим .

Тогда

Утверждение теоремы следует теперь из (1), (2).

7. Теоремы о существовании ситуаций равновесия для непрерывных антагонистических игр

Ответ:

Существуют несколько теорем, которые обозначают необходимые условия существования равновесий в непрерывных играх. Определим такое свойство функций:

Определение: Пусть X - подмножество конечномерного Евклидова пространства.

Функция u: X > R является квазивогнутой если для всех , множество является выпуклым.

Легко показать, что каждая вогнутая функция является квазивогнутой, но не наоборот.

Также верно то, что каждая монотонная функция одной переменной является квазивогнутой.

Примеры квазивогнутой и не квазивогнутой функций приведены на рисунке.

На рисунке (a) функция удовлетворяет условиям: для данного (как и для любого другого) множество (показанное на рисунке) является выпуклым. На рисунке (b) условия квазивогнутости нарушаются: для данного множество является объединением двух отрезков - то есть не выпуклым.

На свойство квазивогнутости опирается следующая теорема, доказанная Гликсбергом (1952):

Теорема 1. Рассмотрим непрерывную игру G, в которой множества стратегий Si являются компактными. Предположим, что для каждого игрока i функция полезности является квази-вогнутой по si для всех s?i ? S?i. Тогда в игре существует равновесие Нэша в чистых стратегиях.

Доказательство этой теоремы похоже на доказательство теоремы Нэша: мы показываем, что точечно-множественное отображение, построенное из функций реакции игроков, удовлетворяет условиям теоремы Какутани и имеет непрерывную точку. Более того, теорема о существовании смешанного равновесия в конечных играх является частным случаем этой теоремы. Действительно, смешанное расширение любой конечной игры является непрерывной игрой, удовлетворяющей условиям Теоремы 1.

Теорема 2. Рассмотрим игру, в которой множества стратегий Si являются выпуклыми и компактными подмножествами конечномерных Евклидовых пространств . Предположим, что для каждого игрока i функция полезности является непрерывной по . Тогда в игре существует равновесие Нэша в смешанных стратегиях.

Доказательство этой теоремы технически более сложно, чем доказательства предыдущей теоремы, ибо множество смешанных стратегий в непрерывной игре является бесконечномерным. Здесь необходим более сильный результат, чем теорема Какутани; доказательство (или даже формулировка) которого выходят за рамки этой книги. Однако можно рассуждать (весьма приблизительно), что нарушение непрерывности функций полезности по чистым стратегиям ведет к нарушению непрерывности по смешанным стратегиям.

8. Вектор Шепли для игр власти

Ответ: Предположим, что некоторая интегрированная система, состоящая из n подразделений, совместно выполнила некоторый объем работ. Этот же объем могли бы выполнить либо одно «главное» (особенное) и любое (одно или несколько) из остальных подразделений, либо все остальные вместе без «главного». Требуется определить «справедливую» долю каждого из подразделений.

Построим формальную модель. Присвоим каждому подразделению интегрированной системы порядковый номер, обозначив «главное» номером «1». Если обозначить S - коалиция (группа) подразделений, а I - множество различных коалиций, то характеристическая функция данной игры примет следующий вид (1 - работа выполнена, 0 - нет):

Поскольку С-ядро рассмотренной выше игры является пустым множеством, поэтому представляют интерес другие принципы оптимальности.

Поскольку априори все «неглавные» участники равноправны, можно ожидать равенства их выигрышей для любого принципа оптимальности, что подтверждается полученными результатами. Выигрыш «главного» игрока всегда больше выигрыша других игроков (n > 3), но его относительная величина увеличивается с ростом количества участников. Например, вектор Шепли оценивает «монополию» «главного» игрока по «закону»

Вместе с тем качественное свойство, определяющее «главного» игрока, нуждается в уточнении. Если это свойство, например, отражает более высокую производительность, то согласно вектору Шеплиn«главный» игрок эквивалентен сразу трем игрокам. Его выигрыш должен составлять ровно половину от всего дохода, хотя остальные подразделения (без «главного») так же могли бы справиться с данной работой и получить больший выигрыш (каждому по 1/3 вместо 1/6). Поэтому дележ согласно N-ядру представляется более «справедливым», чем по вектору Шепли.

9. Связь вектора Шепли с С-ядром

Ответ:

Лемма. В 0-1-редуцированной игре трех лиц вектор Шепли принадлежит ядру тогда и только тогда, когда выполняются неравенства

4v({1,2})+ v({1,3}+ v({2,3})) 4, 4v({1,3})+ v({1,2}+ v({2,3})) 4,

4v({2,3})+ v({1,2}+ v({1,3})) 4.

Доказательство. Согласно полученной формуле в данном случае вектор Шепли имеет компоненты

Согласно теореме о характеризации ядра, этот вектор принадлежит C-ядру, тогда и только тогда, когда выполняются неравенства

Откуда и следует утверждение леммы.

Пример. Затраты на создание системы водоснабжения в трех районах описываются характеристической функцией

v({1})=-120,

v({2})=-140,

v({3})=-120,

v({1,2})=-170,

v({1,3})=-160,

v({2,3})=-190,

v({1,2,3})=-255.

Вектор Шепли в этой игре не принадлежит C-ядру, так как, например, . Однако C-ядро в этой игре не пусто. Ему принадлежит, например, точка .

Размещено на Allbest.ru

...

Подобные документы

  • Изучение общих сведений о матричных и антагонистических играх. Понятие позиционной игры, дерева, информационного множества. Рассмотрение принципа максимина и принципа равновесия. Оптимальность по Парето. Позиционная неантагонистическая игра, ее свойства.

    курсовая работа [1,4 M], добавлен 17.10.2014

  • Принцип минимакса как основа целесообразного поведения игроков в антагонистической игре. Порядок разыгрывания в некооперативной игре в нормальной форме. Принцип оптимальности стратегий для нее. Представление игры в развернутой и в нормальной форме.

    реферат [241,5 K], добавлен 20.10.2012

  • История развития теории игр как математического метода изучения оптимальных стратегий в играх. Представление игр: экстенсивная и нормальная форма. Классификация и типы математических игр, их характеристика. Общее понятие и основные цели метаигры.

    реферат [49,5 K], добавлен 29.12.2010

  • Системы дифференциальных уравнений первого порядка. Положение равновесия системы. Численный расчет линеаризованной системы уравнений. Определение асимптотической устойчивости состояния равновесия системы в соответствии с первым методом Ляпунова.

    курсовая работа [3,0 M], добавлен 15.05.2012

  • Приемы и методы качественной теории дифференциальных уравнений на плоскости. Визуализация и анализ инвариантных множеств динамических систем. Теорема о существовании четырех линий равновесия. Первый интеграл. Решение системы первого и второго порядка.

    курсовая работа [378,5 K], добавлен 02.04.2016

  • Основные определения теории биматричных игр. Пример биматричной игры "Студент-Преподаватель". Смешанные стратегии в биматричных играх. Поиск "равновесной ситуации". 2x2 биматричные игры и формулы для случая, когда у каждого игрока имеется две стратегии.

    реферат [84,2 K], добавлен 13.02.2011

  • Особенности нормальной формы линейного преобразования. Изучение собственных и присоединенных векторов линейного преобразования. Выделение подпространства, в котором преобразование А имеет только одно собственное значение. Анализ инвариантных множителей.

    курсовая работа [37,6 K], добавлен 21.02.2010

  • Характеристика основных понятий теории упругости, уравнений равновесия и формул Коши, анализ линейного закона Гука и определение условий пластичности. Решение задачи упругопластической деформации трубы под действием равномерного внутреннего давления.

    дипломная работа [511,3 K], добавлен 13.02.2010

  • Понятие теории игр как раздела математики, предмет которого - анализ принятия оптимальных решений в условиях конфликта. Общие понятия в теории игр. Коалиция интересов, кооперативная или коалиционная игра. Свойства стратегических эквивалентных игр.

    реферат [46,6 K], добавлен 06.05.2010

  • Схема полного исследования бесконечно больших и малых функций и построение их графика. Арифметические теоремы о пределе функции. Применение формулы Тейлора, Маклорена, Коши, Лопиталя-Бернулли. Теорема о производной вектор-функции постоянной длины.

    курс лекций [1,3 M], добавлен 14.12.2012

  • Возникновение теории вероятности как науки. Классическое определение вероятности. Частость наступления события. Операции над событиями. Сложение и умножение вероятности. Схема повторных независимых испытаний (система Бернулли). Формула полной вероятности.

    реферат [175,1 K], добавлен 22.12.2013

  • Поверхности и ориентация. Теория внутренней поверхности. Выбор ориентации поверхности при помощи выбора базиса касательных векторов. Выбор вектора единичной нормали. Внутренняя геометрия поверхности, определение развертки и теорема Александрова.

    реферат [144,0 K], добавлен 07.12.2012

  • Понятие и определение пирамиды. Отрезки, соединяющие вершину пирамиды с вершинами основания. Площадь боковой поверхности, основания и полной поверхности пирамиды. Свойства произвольных, усеченных и правильных пирамид. Определение высоты боковой грани.

    презентация [726,8 K], добавлен 05.04.2012

  • Понятие и способы образования плоских и кривых линий. Примеры пересечения алгебраической кривой линии. Поверхность в геометрии. Аргументы вектор-функции. Уравнения семейства линий. Способ построения касательной и нормали в произвольной точке лемнискаты.

    контрольная работа [329,5 K], добавлен 19.12.2014

  • Собственные значения и вектора матрицы. Применение итерационного метода вращений Якоби для решения симметричной полной проблемы собственных значений эрмитовых матриц. Алгоритмы решения задач и их реализация на современных языках программирования.

    курсовая работа [321,6 K], добавлен 15.11.2015

  • Статическая характеристика элемента. Выполнение аналитической линеаризации заданной функции в определенной точке. Обратное превращение Лапласа заданной передаточной функции ОАУ. Преобразование дифференциального уравнения к нормальной форме Коши.

    контрольная работа [564,9 K], добавлен 30.03.2015

  • Возникновение и развитие числовых сравнений и сравнений высших степеней с одним неизвестным. Методы решения сравнений высшей степени с одним неизвестным. Двучленные сравнения высшей степени. Использование критерия Эйлера. Квадратичный закон взаимности.

    курсовая работа [441,2 K], добавлен 11.09.2012

  • Практическиое решение задач по теории вероятности. Задача на условную вероятность. Задача на подсчет вероятностей. Задача на формулу полной вероятности. Задача на теорему о повторении опытов. Задача на умножение вероятностей. Задача на схему случаев.

    контрольная работа [29,7 K], добавлен 24.09.2008

  • Электрические цепи, описывающие их величины. Процесс распространения тепла. Построение ортогонального семейства кривых. Уравнение химической кинетики, скорость реакции. Закон реактивного движения. Форма равновесия жидкости во вращающемся сосуде.

    курсовая работа [951,1 K], добавлен 24.11.2014

  • Определение равнодействующей сходящихся сил геометрическим способом. Геометрическое условие равновесия сходящихся сил. Разложение силы по координатным осям, аналитический способ определения по проекциям. Равновесие тела под действием плоской системы сил.

    реферат [421,3 K], добавлен 20.01.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.