Нижняя и верхняя цены игры. Принцип минимакса

⇐ ПредыдущаяСтр 7 из 13Следующая ⇒

Дополним матрицу игры столбцом с минимальными значениями в строках и строкой с максимальными значениями в столбцах:

B A	B₁	B₂	…	B_n	min в строке
A₁	a₁₁	a₁₂	…	a_1n	a₁
A₂	a₂₁	a₂₂	…	a_2n	a₂
…	…	…	…	…
A_m	a_m1	a_m2	…	a_mn	a_m
max в столбце	b₁	b₂		b_n

Величина называется нижней ценой игрыили максимином).

Стратегия игрока A, соответствующая максимину a, называется максиминной стратегией игрока A.Если игрок A придерживается своей максиминной стратегии, то ему гарантирован выигрыш не меньше a, то есть a – это тот гарантированный минимальный выигрыш, который может обеспечить себе игрок A, придерживаясь наиболее осторожной стратегии.

Величина называется верхней ценой игрыили минимаксом.Стратегия игрока B, соответствующая минимаксу b, называется минимаксной стратегией игрока B.

Теорема 1Для игры двух лиц с нулевой суммой .

Если игрок B придерживается своей минимаксной стратегии, то ему гарантирован проигрыш не больше b. Положение, при котором игроки используют свои минимаксные стратегии неустойчиво и может быть нарушено поступившими сведениями о выбранной стратегии другого игрока. Если оба игрока разумны, то игрок A будет выбирать свою максиминную стратегию, а игрок B – минимаксную.

Пример 2.

Найдем нижнюю и верхнюю цены игры из примера 1.

B A	B₁	B₂	min в строке
A₁	-1	1	-1
A₂	1	-1	-1
max в столбце	1	1	a = -1 b = 1

Таким образом, если игрок Aбудет делать личные ходы, а его противник Bоб этом узнает, то игрок A получит минимальный выигрыш -1, то есть он будет в проигрыше, а игрок B получит минимальный проигрыш 1, то есть он будет выигрывать.Аналогичное утверждение справедливо и для игрока B.

Игра называется игрой с седловой точкой, если нижняя и верхняя цена игры совпадают.В этом случае, величина n = a = b называется чистой ценой игры.Седловой точке соответствует пара минимаксных стратегий, которые называются оптимальными, а их совокупность называется решением игры. В игре с седловой точкой любому игроку выгодно придерживаться оптимальных стратегий (любое отклонение от оптимальной стратегии ухудшает положение игрока). Чистая цена игры в игре с седловой точкой является значением выигрыша, которое в игре разумных противников игрок A не может увеличить, а игрок B уменьшить.При разумном поведении игроков исход игры с седловой точкой заранее предопределен. Играть в такие игры имеет смысл, если противник не знает оптимальной стратегии.

Пример 3

Двое играют в следующую игру: одновременно выбрасывают 1, 2 или 3 пальца. Выигрывает тот, у кого больше пальцев (выигрыш равен разности выброшенных пальцев). Если оба выбросили одинаковое количество пальцев, то никто не выиграл. Платежная матрица:

B A	B₁	B₂	B₃	min в строке
A₁	0	-1	-2	-2
A₂	1	0	-1	1
A₃	2	1	0	0
max в столбце	2	1	0	a = 0 b = 0

Так как нижняя a и верхняя b цены игры совпадают, то игра имеет седловую точку, поэтому игра решается в чистых стратегиях с чистой ценой игры n = 0.Оптимальные стратегии сторон: оба игрока выбрасывают по 3 пальца. При этом никто не выигрывает.

⇐ Предыдущая 2 3 4 5 678 9 10 11 Следующая ⇒

Последнее изменение этой страницы: 2018-06-01; просмотров: 415.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...