Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Платёжная матрица. Нижняя и верхняя цена игры




 

Рассмотрим парную конечную игру. Пусть игрок А располагает m личными стратегиями А1, А2, ..., Аm, а игрок В имеет n личных стратегий В1, В2, ..., Вn. В этом случае говорят, что игра имеет размерность m х n. В результате выбора игроками любой пары стратегий Аi и Bj ( ) однозначно определяется исход игры, т.е. выигрыш aij игрока А (положительный или отрицательный) и проигрыш (– aij) игрока В. Предположим, что значения aij известны для любой пары стратегий (Аi; Bj)

Матрица  элементами которой являются выигрыши, соответствующие стратегиям Аi и Bj, называется платёжной матрицей или матрицей игры. Общий вид этой матрицы представлен в таблице 7.1.

Таблица 7.1 – Платёжная матрица

   Вj Аi   В1 В2 ... Вn
A1 a11 a12 a1n
A2 a21 a22 a2n
Am am1 am2 amn

 

Строки этой таблицы соответствуют стратегиям игрока А, а столбцы – стратегиям игрока В.

Пусть игрок А выбирает некоторую стратегию Аi, тогда в наихудшем случае (например, если выбор станет известным игроку В) он получит наименьший выигрыш .                                                        (7.1)

Предвидя такую возможность, игрок А должен выбрать такую стратегию, чтобы максимизировать свой минимальный выигрыш.

                                                                 (7.2)

Величина α – гарантированный максимальный выигрыш игрока А, называется нижней ценой игры или максимином.

Стратегия, соответствующая максимуму, называется максиминной стратегией. Игрок В, выбирая стратегию, исходит из следующего: при выборе некоторой стратегии Вj, его проигрыш не превысит максимума из значений элементов j-го столбца матрицы.

                                    .                                   (7.3)

Рассматривая множество βj для различных значений j, игрок В выберет такое значение j, при котором его максимальный проигрыш минимизируется.

                                                      (7.4)

Величина β называется верхней ценой игры, или минимаксом. Это гарантированный минимальный проигрыш игрока В.

Стратегия, соответствующая минимаксу, называется минимаксной стратегией.

Если α = β = v,                                                                                 (7.5)

то выигрыш игрока А – вполне определённое число, игра называется вполне определённой, а выигрыш v (7.5) называется ценой игры и равен элементу матрицы, который одновременно является наибольшим в своём столбце и наименьшим в своей строке. Этот элемент называется седловой точкой (по аналогии с поверхностью седла, которая искривляется вверх в одном направлении и вниз в другом).

    Седловой точке соответствуют вполне определённые (чистые) стратегии игроков. Совокупность чистых стратегий А* игрока А и В* игрока В называют решением игры, которое обладает следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то для другого отклонение его от его оптимальной стратегии не может быть выгодно.

    Пример 7.1. Определить нижнюю и верхнюю цены для игр, заданных платёжными матрицами

   

    Решение. Все расчёты удобно проводить в таблице, в которой кроме матрицы Р введены столбец αi и строка βj (табл. 7.2) и (табл. 7.3).

 

Таблица 7.2 – Платёжная матрица Р1′ Таблица 7.3 – Платёжная матрица Р2

   Вj Аi   В1 В2 В3 В4 αi
A1 4 3 4 2 2
A2 3 4 6 5 3
A3 2 5 1 3 1
βj 4 5 6 5  
   Вj Аi   В1 В2 В3 В4 αi
A1 1 0 3 5 0
A2 3 2 4 3 2
A3 0 1 – 1 4 –1
βj 3 2 4 5  


    Решение. Минимальные значения aij в строках матрицы Р1 равны соответственно (2, 3, 1). Максимальное значение из них равно 3. Следовательно, α1 = 3 – нижняя цена игры. Для определения верхней цены данной матрицы найдём максимальное значение элементов в столбцах матрицы Р1. По столбцам имеем (4, 5, 6, 5). Следовательно, β1 = 4. Поскольку α1 ≠ β1, то матрица Р1 не имеет седловой точки.

    Аналогично, для матрицы P2 , . Таким образом, α1 = β2 = v = 2 – цена игры. Решение данной игры состоит в выборе игроком А стратегии А2, при этом его выигрыш не меньше 2; для игрока В оптимальной является стратегия В2, позволяющая ограничить его проигрыш этим же числом.

    а22 = 2 – седловая точка матрицы Р2. А2, В2 – чистые стратегии игроков А и В соответственно. Отклонение одним из игроков от оптимальной стратегии приводит к уменьшению выигрыша (для игрока А) и увеличению проигрыша (для игрока В).

 

        

    7.3 Решение игр в смешанных стратегиях

 

    Если игра не имеет седловой точки, то применение чистых стратегий не даёт оптимального решения игры. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.

    Смешанной стратегией SA игрока А называется применение чистых стратегий А1, А2, ..., Аi, ..., Аm с вероятностями р1, р2, ..., рi, ..., pm, причём . Смешанные стратегии игрока А записываются в виде матрицы

,

или в виде строки .

    Аналогично для игрока В

,

или , где .

    На основании принципа минимакса определяется оптимальное решение игры: эта пара оптимальных стратегий  в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v. Цена игры удовлетворяет неравенству

                                                      α ≤ v ≤ β                                           (7.6)

    Справедлива основная теорема теории игр – теорема Неймана: каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.

    Пусть  и  – пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной о нуля вероятностью, то она называется активной.

    Справедлива теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий.

    Эта теорема имеет большое практическое значение, она даёт конкретные модели нахождения оптимальных стратегий при отсутствии седловой точки. Чем больше размерность матрицы, не содержащей седловой точки, тем сложнее решение. Поэтому в теории матричных игр рассматриваются способы, с помощью которых решение одних игр сводится к решению других, более простых (в частности с помощью сокращения размерности матрицы). Сократить размерность матрицы можно, исключая дублирующие и заведомо невыгодные доминирующие стратегии. Например, в матрице P2 для игрока В заведомо невыгодной является четвёртая стратегия, так как все значения аi4 превышают соответствующие значения элементов первого и второго столбца. Четвёртый столбец матрицы можно исключить (игрок В не воспользуется этой стратегией).

    Можно сократить размер матрицы, разбив её на подматрицы, в которых суммы элементов по столбцам и строкам равны. Тогда вместо чистых стратегий в матрицу включаются смешанные. Элементы сокращённой матрицы получаются делением соответствующих сумм элементов на число чистых стратегий. Если смешанные стратегии входят в число оптимальных, то вероятности использования входящих в них чистых стратегий равны между собой.

    Пример 7.2. Сократить размерность матрицы

    Решение. В матрице P3 для подматриц выполняется условие равенства сумм элементов по строкам и столбцам. Объединяя стратегии А1 А2 А3; А4 А5; В1 В2; В3 В4, получим

    Полученная матрица содержит седловую точку

α = β = 1 = а11.

    Поэтому решение первоначальной игры, заданной матрицей P3, имеет вид , , т.к. стратегии А1, А2, А3 для игрока А и стратегии В1, В2 для игрока В чистые и равноправные. Стратегии А4, А5 и В3, В4 не применяются. Цена игры равна 1. Оптимальной для игрока А является комбинация стратегий А1, А2, А3, а для игрока В – комбинация стратегий В1 и В2. Вероятность применения стратегий А1, А2 и А3 равны между собой (Σ рi = 1). Аналогично для второго игрока, Σ qj = 1.

    Рассмотрим простейший случай конечной игры 2х2, в которой каждый игрок имеет две стратегии. Платёжная матрица игры  Если такая игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке. При отсутствии седловой точки игра в соответствии с основной теоремой теории игр имеет оптимальное решение, определяемое парой смешанных стратегий  и .

    Для того чтобы их найти, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии , то его средний выигрыш будет равен цене игры v при любой активной стратегии игрока В. Для игры 2х2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрока А (проигрыш игрока В) – случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний выигрыш игрока А (оптимальная смешанная стратегия) будет равен v и для первой и для второй стратегий.

    Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию , а игрок В – чистую стратегию В1 (это соответствует первому столбцу матрицы Р), равен цене игры v:

.

    Тот же средний выигрыш получит игрок А, если 2-й игрок применяет стратегию В2, т.е. . Учитывая, что , получаем систему уравнений для определения оптимальной стратегии  и ценой игры v:

                                                                                  (7.7)

    Решая эту систему, получим оптимальную стратегию

                               ,                              (7.8)

                                  

и цену игры                                  

                         .                                    (7.9)

    Составляя аналогичную систему уравнений, можно найти оптимальную стратегию для игрока В:

           .    (7.10)

    Пример 7.3.Найти решение игры, заданной матрицей .

    Решение.  Матрица не имеет седловой точки. По формулам (7.8 – 7.11) находим оптимальные стратегии и цену игры:

 

 










Последнее изменение этой страницы: 2018-06-01; просмотров: 327.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...