![]() Студопедия КАТЕГОРИИ: АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Платёжная матрица. Нижняя и верхняя цена игры
Рассмотрим парную конечную игру. Пусть игрок А располагает m личными стратегиями А1, А2, ..., Аm, а игрок В имеет n личных стратегий В1, В2, ..., Вn. В этом случае говорят, что игра имеет размерность m х n. В результате выбора игроками любой пары стратегий Аi и Bj ( Матрица Таблица 7.1 – Платёжная матрица
Строки этой таблицы соответствуют стратегиям игрока А, а столбцы – стратегиям игрока В. Пусть игрок А выбирает некоторую стратегию Аi, тогда в наихудшем случае (например, если выбор станет известным игроку В) он получит наименьший выигрыш Предвидя такую возможность, игрок А должен выбрать такую стратегию, чтобы максимизировать свой минимальный выигрыш. Величина α – гарантированный максимальный выигрыш игрока А, называется нижней ценой игры или максимином. Стратегия, соответствующая максимуму, называется максиминной стратегией. Игрок В, выбирая стратегию, исходит из следующего: при выборе некоторой стратегии Вj, его проигрыш не превысит максимума из значений элементов j-го столбца матрицы. Рассматривая множество βj для различных значений j, игрок В выберет такое значение j, при котором его максимальный проигрыш минимизируется. Величина β называется верхней ценой игры, или минимаксом. Это гарантированный минимальный проигрыш игрока В. Стратегия, соответствующая минимаксу, называется минимаксной стратегией. Если α = β = v, (7.5) то выигрыш игрока А – вполне определённое число, игра называется вполне определённой, а выигрыш v (7.5) называется ценой игры и равен элементу матрицы, который одновременно является наибольшим в своём столбце и наименьшим в своей строке. Этот элемент называется седловой точкой (по аналогии с поверхностью седла, которая искривляется вверх в одном направлении и вниз в другом). Седловой точке соответствуют вполне определённые (чистые) стратегии игроков. Совокупность чистых стратегий А* игрока А и В* игрока В называют решением игры, которое обладает следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то для другого отклонение его от его оптимальной стратегии не может быть выгодно. Пример 7.1. Определить нижнюю и верхнюю цены для игр, заданных платёжными матрицами
Решение. Все расчёты удобно проводить в таблице, в которой кроме матрицы Р введены столбец αi и строка βj (табл. 7.2) и (табл. 7.3).
Таблица 7.2 – Платёжная матрица Р1′ Таблица 7.3 – Платёжная матрица Р2′
Решение. Минимальные значения aij в строках матрицы Р1 равны соответственно (2, 3, 1). Максимальное значение из них равно 3. Следовательно, α1 = 3 – нижняя цена игры. Для определения верхней цены данной матрицы найдём максимальное значение элементов в столбцах матрицы Р1. По столбцам имеем (4, 5, 6, 5). Следовательно, β1 = 4. Поскольку α1 ≠ β1, то матрица Р1 не имеет седловой точки. Аналогично, для матрицы P2 а22 = 2 – седловая точка матрицы Р2. А2, В2 – чистые стратегии игроков А и В соответственно. Отклонение одним из игроков от оптимальной стратегии приводит к уменьшению выигрыша (для игрока А) и увеличению проигрыша (для игрока В).
7.3 Решение игр в смешанных стратегиях
Если игра не имеет седловой точки, то применение чистых стратегий не даёт оптимального решения игры. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии. Смешанной стратегией SA игрока А называется применение чистых стратегий А1, А2, ..., Аi, ..., Аm с вероятностями р1, р2, ..., рi, ..., pm, причём
или в виде строки Аналогично для игрока В
или На основании принципа минимакса определяется оптимальное решение игры: эта пара оптимальных стратегий α ≤ v ≤ β (7.6) Справедлива основная теорема теории игр – теорема Неймана: каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий. Пусть Справедлива теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий. Эта теорема имеет большое практическое значение, она даёт конкретные модели нахождения оптимальных стратегий при отсутствии седловой точки. Чем больше размерность матрицы, не содержащей седловой точки, тем сложнее решение. Поэтому в теории матричных игр рассматриваются способы, с помощью которых решение одних игр сводится к решению других, более простых (в частности с помощью сокращения размерности матрицы). Сократить размерность матрицы можно, исключая дублирующие и заведомо невыгодные доминирующие стратегии. Например, в матрице P2 для игрока В заведомо невыгодной является четвёртая стратегия, так как все значения аi4 превышают соответствующие значения элементов первого и второго столбца. Четвёртый столбец матрицы можно исключить (игрок В не воспользуется этой стратегией). Можно сократить размер матрицы, разбив её на подматрицы, в которых суммы элементов по столбцам и строкам равны. Тогда вместо чистых стратегий в матрицу включаются смешанные. Элементы сокращённой матрицы получаются делением соответствующих сумм элементов на число чистых стратегий. Если смешанные стратегии входят в число оптимальных, то вероятности использования входящих в них чистых стратегий равны между собой. Пример 7.2. Сократить размерность матрицы
Решение. В матрице P3 для подматриц выполняется условие равенства сумм элементов по строкам и столбцам. Объединяя стратегии А1 А2 А3; А4 А5; В1 В2; В3 В4, получим Полученная матрица содержит седловую точку α = β = 1 = а11. Поэтому решение первоначальной игры, заданной матрицей P3, имеет вид Рассмотрим простейший случай конечной игры 2х2, в которой каждый игрок имеет две стратегии. Платёжная матрица игры Для того чтобы их найти, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию
Тот же средний выигрыш получит игрок А, если 2-й игрок применяет стратегию В2, т.е. Решая эту систему, получим оптимальную стратегию и цену игры Составляя аналогичную систему уравнений, можно найти оптимальную стратегию для игрока В: Пример 7.3.Найти решение игры, заданной матрицей Решение.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее изменение этой страницы: 2018-06-01; просмотров: 437. stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда... |