Студопедия

КАТЕГОРИИ:

Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Решение матричных игр 2х2 в смешанных стратегиях

⇐ ПредыдущаяСтр 9 из 13Следующая ⇒

Игра 2х2 – наиболее простой случай конечных игр. Рассмотрим игру, не имеющую седловой точки, с платежной матрицей

	В₁	В₂
А₁	a₁₁	a₁₂
А₂	a₂₁	a₂₂

Пусть и –смешанные стратегии игроков. Найдем оптимальные смешанные стратегии игроков. Если игрок В придерживается стратегии В₁, то средний выигрыш А составит . Если игрок В придерживается стратегии В₂, то средний выигрыш А составит . По свойству оптимальных смешанных стратегий эти средние выигрыши должны совпадать и быть равными цене игры. Получаем систему:

Решаем систему

Аналогично, составляем систему для игрока В:

Решая систему, находим:

Цена игры

Решение игры 2х2 можно найти так же геометрически. Для этого на оси абсцисс отложим отрезок А₁А₂длиной 1. Левый конец отрезка (p=0) соответствует стратегии А₁, правый – стратегии А₂. Промежуточные точки отрезка соответствуют смешанным стратегиям первого игрока. Причем расстояние от промежуточной точки отрезка до правого края – это вероятность p₂ стратегии А₂, а расстояние до левого края – вероятность p₁ стратегии А₁. Через концы отрезка А₁А₂ проведем прямые, перпендикулярные оси абсцисс, на них будем откладывать выигрыши при стратегиях А₁ и А₂ соответственно. Если игрок В применяет стратегию В₁, то выигрыши первого игрока при стратегии А₁ составляет a₁₁, а при стратегии А₂ составляет a₂₁. Отложим эти выигрыши на перпендикулярах и соединим полученные точки прямой В₁В₁. Если игрок А применяет смешанную стратегию, то его выигрышу соответствует некоторая точка на отрезке В₁В₁. Аналогично строим отрезок В₂В₂, соответствующий применению вторым игроком стратегии В₂. В соответствии с принципом минимакса ломаная В₁NВ₂ – нижняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш максимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока А достаточно составить уравнения прямых и найти точку пересечения.

Аналогично можно рассмотреть задачу минимизации верхней границы выигрыша для игрока В.

Используя геометрическую интерпретацию можно найти решение игр, заданных матрицей 2хn. Каждой из nстратегий игрока В будет соответствовать прямая. Точка N, лежащая на нижней границе и дающая наибольшую величину выигрыша, определяет цену игры и ее решение. При этом определяются активные стратегии игрока В (соответствующие им прямые пересекаются в точке N). Для активных стратегий вероятности не равны 0, остальные стратегии игроком В не используются (их вероятности равны 0).

Аналогично можно решить игру с матрицей mxn. В этом случае строят верхнюю границу выигрыша и на ней определяют минимум.

Пример 4

Игра задана платежной матрицей.

1) Решить игру аналитически.

2) Провести моделирование результатов игры с помощью таблицы равномерно распределенных случайных чисел, разыграв 30 партий; определить относительные частоты использования чистых стратегий каждым игроком и средний выигрыш, сравнив результаты с полученными теоретически в п.1.

Решение:

1.Найдем нижнюю и верхнюю цену игры.

B A	B₁	B₂	min в строке
A₁	10	7	7
A₂	8	11	8
max в столбце	10	11	a = 8 b = 10

a¹b, следовательно, игра не имеет седловой точки, решение будет в смешанных стратегиях.

Найдем аналитически оптимальную стратегию игрока А и соответствующую цену игрыn.

Так как – оптимальная, то она должна гарантировать средний выигрыш игроку А, равный цене игры, при любом поведении игрока В:

для стратегии В₁: ;

для стратегии В₂: .

С учетом того, что сумма вероятностей смешанной стратегии равна 1, получаем систему уравнений:

Вычтем из первого уравнения второе: или .Значит:

Итак: , n = 9.

Аналогично получаем систему для нахождения смешанной стратегии игрока В.

Вычтем из первого уравнения второе: Откуда, подставим в первое уравнение (Вместо n подставим найденное значение для игрока А
n = 9):

Итак: .

Ответ: , .

2. Проведем моделирование результатов решения с помощью таблицы равномерно распределенных случайных чисел. Для 30 партий хватит 60 чисел, на основе которых будут выбираться стратегии игроками. Используемые случайные числа сгенерированы в MSExcel функцией =СЛЧИС(). В приложении достаточно много чисел, но использовать для моделирования можно любые 60, выбранные произвольно с любого места таблицы. Выберем 60 чисел:

0,02988	0,12558	0,25974	0,17641	0,00937	0,52264	0,08086	0,84858	0,99427	0,49452
0,61109	0,49042	0,61076	0,65834	0,25579	0,80641	0,07675	0,84419	0,18268	0,29702
0,76606	0,95854	0,20704	0,45154	0,27367	0,56261	0,30037	0,96485	0,47252	0,55084
0,73868	0,56421	0,07183	0,99420	0,11184	0,80524	0,42897	0,45031	0,05350	0,67078
0,94483	0,25710	0,39190	0,72491	0,88888	0,03791	0,50773	0,63034	0,94091	0,80165
0,41647	0,88664	0,83519	0,46930	0,39285	0,34159	0,77252	0,65987	0,48750	0,79735
0,51314	0,22625	0,06211	0,39299	0,84336	0,80859	0,52694	0,73306	0,36874	0,93390
0,71749	0,46727	0,18182	0,45791	0,08667	0,58570	0,75495	0,68645	0,90270	0,87484
0,99401	0,82235	0,89122	0,33631	0,42694	0,37053	0,70413	0,59805	0,40425	0,96181
0,41244	0,24426	0,37553	0,09464	0,56208	0,68889	0,59503	0,92378	0,03108	0,33182

Будем выбирать стратегии игроков, используя геометрическое определение вероятности. Так как все случайные числа из отрезка [0; 1], то чтобы стратегия А₁ появлялась примерно в половине случаев, будем ее выбирать если случайное число меньше 0,5; в остальных случаях выбирается стратегия А₂. Аналогично для игрока В. Стратегию В₁ будем выбирать, если соответствующее случайное число меньше 2/3»0,67, в противном случае выбираем стратегию В₂.

Заполним расчетную таблицу (Средний выигрыш игрока А считаем, как отношение накопленного выигрыша к количеству сыгранных партий):

Номер партии	Случайное число игрока А	Стратегия игрока А А₁: < 0,5	Случайное число игрока В	Стратегия игрока В В₁: <0,667	Выигрыш А	Накопленный выигрыш А	Средний выигрыш А (цена игры)
1.	0,029	А₁	0,125	В₁	10	10	10,000
2.	0,611	А₂	0,490	В₁	8	18	9,000
3.	0,766	А₂	0,958	В₂	11	29	9,667
4.	0,738	А₂	0,564	В₁	8	37	9,250
5.	0,944	А₂	0,257	В₁	8	45	9,000
6.	0,416	А₁	0,886	В₂	7	52	8,667
7.	0,513	А₁	0,226	В₁	10	62	8,857
8.	0,717	А₂	0,467	В₁	8	70	8,750
9.	0,994	А₂	0,822	В₂	11	81	9,000
10.	0,412	А₁	0,244	В₁	10	91	9,100
11.	0,259	А₁	0,176	В₁	10	101	9,182
12.	0,610	А₂	0,658	В₁	8	109	9,083
13.	0,207	А₁	0,451	В₁	10	119	9,154
14.	0,071	А₁	0,994	В₂	7	126	9,000
15.	0,391	А₁	0,724	В₂	7	133	8,867
16.	0,835	А₂	0,469	В₁	11	144	9,000
17.	0,062	А₁	0,392	В₁	10	154	9,059
18.	0,181	А₁	0,457	В₁	10	164	9,111
19.	0,891	А₂	0,336	В₁	8	172	9,053
20.	0,375	А₁	0,094	В₁	10	182	9,100
21.	0,009	А₁	0,522	В₁	10	192	9,143
22.	0,255	А₁	0,806	В₂	7	199	9,045
23.	0,273	А₁	0,562	В₁	10	209	9,087
24.	0,111	А₁	0,805	В₂	7	216	9,000
25.	0,888	А₂	0,037	В₁	8	224	8,960
26.	0,392	А₁	0,341	В₁	10	234	9,000
27.	0,843	А₂	0,808	В₂	11	245	9,074
28.	0,086	А₁	0,585	В₁	10	255	9,107
29.	0,426	А₁	0,370	В₁	10	265	9,138
30.	0,562	А₂	0,688	В₂	11	276	9,200

Таким образом, в результате моделирования в 30 партиях цена игры (средний выигрыш) равен 9,2. Этот результат согласуется с теоретической ценой игры 9.

Из 30 партий игрок А 18 раз применял стратегию А₁, 12 раз – стратегию А₂. Игрок В 21 раз применял стратегию В₁, 9 раз – стратегию В₂.Частоты использования игроками своих чистых стратегий соответственно равны: `p=(18/30;12/30)=(0,6;0,4),`q=(21/30;9/30)=(0,7;0,3). Сравнивая с теоретическими оптимальными стратегиями =(0,5; 0,5) и =(0,67; 0,33) можно сделать вывод, что результаты моделирования достаточно близко соответствуют теоретическим вероятностям даже для небольшого количества партий.

Пример 5

Решить графически игру, заданную платежной матрицей .

Решение

Матрица игры имеет размер 2х3, поэтому решение игры будем искать для игрока А. Отложим отрезок единичной длины А₁А₂, каждой точке которого поставим в соответствие некоторую смешанную стратегию первого игрока – (p₁, p₂). В частности, точке А₁соответствуетстратегия А₁, точке А₂ – стратегия А₂.

В точках А₁ и А₂восстановим перпендикуляр и на полученных прямых будем откладывать выигрыши игрока А при соответствующих стратегиях и строить прямые, соответствующие стратегиям игрока В.

В соответствии с принципом минимакса ломаная В₁NMВ₃ – нижняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш максимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока А достаточно составить уравнения прямых и найти точку пересечения прямых В₂В₂ и В₃В₃.

Уравнение прямой, проходящей через 2 точки (x₁,y₁) и (x₂,y₂) имеет вид .Прямая В₂В₂ проходит через точки (0,3) и (1,5), следовательно, ее уравнение или -2x+y=3.Прямая В₃В₃ проходит через точки (0,11) и (1,2), следовательно, ее уравнение или 9x+y=11. Для нахождения точки пересечения прямых В₂В₂ и В₃В₃ решим систему:

Вычтем из первого уравнения второе, получаем -11x=-8 Þx=8/11, y=3+2x=49/11. Точка N(8/11,49/11), следовательно, p₂=8/11, p₁=1-8/11=3/11, n=49/11.

Таким образом, , при цене игры .

Из рисунка видно, что стратегия В₁не входит в оптимальную смешанную стратегию,поэтому q₃=0,и мы можем найти оптимальную смешанную стратегию, удалив из платежной матрицыпервый столбец. Получаем матрицу , при этом столбцы ее соответствуют активным стратегиям В₂, В₃.

Так как – оптимальная, то она должна гарантировать средний выигрыш игроку В, равный цене игры, при любом поведении игрока А:

для стратегии А₁:

для стратегии А₂: .

С учетом того, что сумма вероятностей смешанной стратегии равна 1, цена игры получаем систему уравнений:

Вычтем из первого уравнения второе:

Решая систему, находим

Оптимальная смешанная стратегия для игрока В .

Ответ: ,

Пример 6

Решить графически игру, заданную платежной матрицей .

Решение

Матрица игры имеет размер 4х2, поэтому решение игры будем искать для игрока В. Аналогично примеру 5отложим отрезок единичной длины В₁В₂, каждой точке которого поставим в соответствие некоторую смешанную стратегию второго игрока – (q₁, q₂). В частности, точке В₁соответствует стратегия В₁, точке В₂ – стратегия В₂.

В точках В₁ и В₂восстановим перпендикуляр и на полученных прямых будем откладывать выигрыши игрока А при соответствующих стратегиях и строить прямые, соответствующие стратегиям игрока А.

В соответствии с принципом минимакса ломаная А₁NА₄ – верхняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрышминимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока В достаточно составить уравнения прямых и найти точку пересечения прямых А₁А₁ и А₄А₄.

Уравнение прямой, проходящей через 2 точки (x₁,y₁) и (x₂,y₂) имеет вид .Прямая А₁А₁ проходит через точки (0,6) и (1,5), следовательно, ее уравнение или x+y=6.Прямая А₄А₄ проходит через точки (0,1) и (1,8), следовательно, ее уравнение или -7x+y=1. Для нахождения точки пересечения прямых А₁А₁ и А₄А₄решим систему:

Вычтем из первого уравнения второе, получаем 8x=5Þx=5/8, y=6-x=43/8. Точка N(5/8,43/8), следовательно, q₂=5/8, q₁=1-5/8=3/8, n=43/8.

Таким образом, , при цене игры .

Из рисунка видно, что стратегииА₂ и А₃не входят в оптимальную смешанную стратегию,поэтому p₂=0 и p₃=0, имы можем найти оптимальную смешанную стратегию, удалив из платежной матрицывторую и третью строку. Получаем матрицу , при этом строки ее соответствуют активным стратегиям А₁, А₄.

для стратегии В₁:

для стратегии В₂: .

С учетом того, что сумма вероятностей смешанной стратегии равна 1, цена игры получаем систему уравнений:

Вычтем из первого уравнения второе:

Решая систему, находим

Оптимальная смешанная стратегия для игрока А .

Ответ: , ,

Таким образом, имеем следующийалгоритм графического решения простейших матричных игр 2хn ( или mx2):

1. Строимn (m) прямых, соответствующих стратегиям второго (первого) игрока.

2. Строим нижнюю (верхнюю) границу выигрыша.

3. Выбираем на границе выигрыша точку с максимальной (минимальной) ординатой.

4. Определяем по чертежу пару активных стратегий из числа построенных для второго (первого) игрока.

5. Находим координаты точки максимума (минимума) и решение игры.

⇐ Предыдущая 4 5 6 7 8910 11 12 13 Следующая ⇒

Последнее изменение этой страницы: 2018-06-01; просмотров: 672.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...