Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Решение матричных игр 2х2 в смешанных стратегиях




Игра 2х2 – наиболее простой случай конечных игр. Рассмотрим игру, не имеющую седловой точки,  с платежной матрицей

  В1 В2
А1 a11 a12
А2 a21 a22

Пусть и –смешанные стратегии игроков. Найдем оптимальные смешанные стратегии игроков. Если игрок В придерживается стратегии В1, то средний выигрыш А составит . Если игрок В придерживается стратегии В2, то средний выигрыш А составит . По свойству оптимальных смешанных стратегий эти средние выигрыши должны совпадать и быть равными цене игры. Получаем систему:

Решаем систему

Аналогично, составляем систему для игрока В:

Решая систему, находим:

Цена игры 

Решение игры 2х2 можно найти так же геометрически. Для этого на оси абсцисс отложим отрезок А1А2 длиной 1. Левый конец отрезка (p=0) соответствует стратегии А1, правый – стратегии А2. Промежуточные точки отрезка соответствуют смешанным стратегиям  первого игрока. Причем расстояние от промежуточной точки отрезка до правого края – это вероятность p2 стратегии А2, а расстояние до левого края – вероятность p1 стратегии А1. Через концы отрезка А1А2 проведем прямые, перпендикулярные оси абсцисс, на них будем откладывать выигрыши при стратегиях А1 и А2 соответственно. Если игрок В применяет стратегию В1, то выигрыши первого игрока при стратегии А1 составляет a11, а при стратегии А2 составляет a21. Отложим эти выигрыши на перпендикулярах и соединим полученные точки прямой В1В1. Если игрок А применяет смешанную стратегию, то его выигрышу соответствует некоторая точка на отрезке В1В1. Аналогично строим отрезок В2В2, соответствующий применению вторым игроком стратегии В2. В соответствии с принципом минимакса ломаная В12 – нижняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш максимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока А достаточно составить уравнения прямых и найти точку пересечения.

Аналогично можно рассмотреть задачу минимизации верхней границы выигрыша для игрока В.

Используя геометрическую интерпретацию можно найти решение игр, заданных матрицей 2хn. Каждой из nстратегий игрока В будет соответствовать прямая. Точка N, лежащая на нижней границе и дающая наибольшую величину выигрыша, определяет цену игры и ее решение. При этом определяются активные стратегии игрока В (соответствующие им прямые пересекаются в точке N). Для активных стратегий вероятности не равны 0, остальные стратегии игроком В не используются (их вероятности равны 0).

Аналогично можно решить игру с матрицей mxn. В этом случае строят верхнюю границу выигрыша и на ней определяют минимум.

Пример 4

Игра задана платежной матрицей .

1) Решить игру аналитически.

2) Провести моделирование результатов игры с помощью таблицы равномерно распределенных случайных чисел, разыграв 30 партий; определить относительные частоты использования чистых стратегий каждым игроком и средний выигрыш, сравнив результаты с полученными теоретически в п.1.

Решение:

1.Найдем нижнюю и верхнюю цену игры.

B A B1 B2 min в строке
A1 10 7 7
A2 8 11 8
max в столбце 10 11 a = 8 b = 10

a¹b, следовательно, игра не имеет седловой точки, решение будет в смешанных стратегиях.

Найдем аналитически оптимальную стратегию игрока А и соответствующую цену игрыn.

Так как – оптимальная, то она должна гарантировать средний выигрыш игроку А, равный цене игры, при любом поведении игрока В:

для стратегии В1: ;

для стратегии В2: .

С учетом того, что сумма вероятностей смешанной стратегии равна 1, получаем систему уравнений:

Вычтем из первого уравнения второе:  или .Значит:

Итак: , n = 9.

Аналогично получаем систему для нахождения смешанной стратегии игрока В.

Вычтем из первого уравнения второе: Откуда,  подставим в первое уравнение (Вместо n подставим найденное значение для игрока А
n = 9):

Итак: .

Ответ: , .

2. Проведем моделирование результатов решения с помощью таблицы равномерно распределенных случайных чисел. Для 30 партий хватит 60 чисел, на основе которых будут выбираться стратегии игроками. Используемые случайные числа сгенерированы в MSExcel функцией =СЛЧИС(). В приложении достаточно много чисел, но использовать для моделирования можно любые 60, выбранные произвольно с любого места таблицы. Выберем 60 чисел:

0,02988

0,12558

0,25974

0,17641

0,00937

0,52264

0,08086

0,84858

0,99427

0,49452

0,61109

0,49042

0,61076

0,65834

0,25579

0,80641

0,07675

0,84419

0,18268

0,29702

0,76606

0,95854

0,20704

0,45154

0,27367

0,56261

0,30037

0,96485

0,47252

0,55084

0,73868

0,56421

0,07183

0,99420

0,11184

0,80524

0,42897

0,45031

0,05350

0,67078

0,94483

0,25710

0,39190

0,72491

0,88888

0,03791

0,50773

0,63034

0,94091

0,80165

0,41647

0,88664

0,83519

0,46930

0,39285

0,34159

0,77252

0,65987

0,48750

0,79735

0,51314

0,22625

0,06211

0,39299

0,84336

0,80859

0,52694

0,73306

0,36874

0,93390

0,71749

0,46727

0,18182

0,45791

0,08667

0,58570

0,75495

0,68645

0,90270

0,87484

0,99401

0,82235

0,89122

0,33631

0,42694

0,37053

0,70413

0,59805

0,40425

0,96181

0,41244

0,24426

0,37553

0,09464

0,56208

0,68889

0,59503

0,92378

0,03108

0,33182

Будем выбирать стратегии игроков, используя геометрическое определение вероятности. Так как все случайные числа из отрезка [0; 1], то чтобы стратегия А1 появлялась примерно в половине случаев, будем ее выбирать если случайное число меньше 0,5; в остальных случаях выбирается стратегия А2. Аналогично для игрока В. Стратегию В1 будем выбирать, если соответствующее случайное число меньше 2/3»0,67, в противном случае выбираем стратегию В2.

Заполним расчетную таблицу (Средний выигрыш игрока А считаем, как отношение накопленного выигрыша к количеству сыгранных партий):

Номер партии Случайное число игрока А Стратегия игрока А А1: < 0,5 Случайное число игрока В Стратегия игрока В В1: <0,667 Выигрыш А Накоплен­ный выиг­рыш А Средний выигрыш А (цена игры)
1. 0,029 А1 0,125 В1 10 10 10,000
2. 0,611 А2 0,490 В1 8 18 9,000
3. 0,766 А2 0,958 В2 11 29 9,667
4. 0,738 А2 0,564 В1 8 37 9,250
5. 0,944 А2 0,257 В1 8 45 9,000
6. 0,416 А1 0,886 В2 7 52 8,667
7. 0,513 А1 0,226 В1 10 62 8,857
8. 0,717 А2 0,467 В1 8 70 8,750
9. 0,994 А2 0,822 В2 11 81 9,000
10. 0,412 А1 0,244 В1 10 91 9,100
11. 0,259 А1 0,176 В1 10 101 9,182
12. 0,610 А2 0,658 В1 8 109 9,083
13. 0,207 А1 0,451 В1 10 119 9,154
14. 0,071 А1 0,994 В2 7 126 9,000
15. 0,391 А1 0,724 В2 7 133 8,867
16. 0,835 А2 0,469 В1 11 144 9,000
17. 0,062 А1 0,392 В1 10 154 9,059
18. 0,181 А1 0,457 В1 10 164 9,111
19. 0,891 А2 0,336 В1 8 172 9,053
20. 0,375 А1 0,094 В1 10 182 9,100
21. 0,009 А1 0,522 В1 10 192 9,143
22. 0,255 А1 0,806 В2 7 199 9,045
23. 0,273 А1 0,562 В1 10 209 9,087
24. 0,111 А1 0,805 В2 7 216 9,000
25. 0,888 А2 0,037 В1 8 224 8,960
26. 0,392 А1 0,341 В1 10 234 9,000
27. 0,843 А2 0,808 В2 11 245 9,074
28. 0,086 А1 0,585 В1 10 255 9,107
29. 0,426 А1 0,370 В1 10 265 9,138
30. 0,562 А2 0,688 В2 11 276 9,200

Таким образом, в результате моделирования в 30 партиях цена игры (средний выигрыш) равен 9,2. Этот результат согласуется с теоретической ценой игры 9.

Из 30 партий игрок А 18 раз применял стратегию А1, 12 раз – стратегию А2. Игрок В 21 раз применял стратегию В1, 9 раз – стратегию В2.Частоты использования игроками своих чистых стратегий соответственно равны: `p=(18/30;12/30)=(0,6;0,4),`q=(21/30;9/30)=(0,7;0,3). Сравнивая с теоретическими оптимальными стратегиями =(0,5; 0,5) и =(0,67; 0,33) можно сделать вывод, что результаты моделирования достаточно близко соответствуют теоретическим вероятностям даже для небольшого количества партий.


Пример 5

Решить графически игру,  заданную платежной матрицей .

Решение

Матрица игры имеет размер 2х3, поэтому решение игры будем искать для игрока А. Отложим отрезок единичной длины А1А2каждой точке которого поставим в соответствие некоторую смешанную стратегию первого игрока – (p1, p2). В частности, точке А1соответствуетстратегия А1, точке А2 – стратегия А2.

В точках А1 и А2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыши игрока А при соответствующих стратегиях и строить прямые, соответствующие стратегиям игрока В.

В соответствии с принципом минимакса ломаная В1NMВ3 – нижняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш максимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока А достаточно составить уравнения прямых и найти точку пересечения прямых В2В2 и В3В3.

Уравнение прямой, проходящей через 2 точки (x1,y1)  и (x2,y2) имеет вид .Прямая В2В2 проходит через точки (0,3) и (1,5), следовательно, ее уравнение или -2x+y=3.Прямая В3В3 проходит через точки (0,11) и (1,2), следовательно, ее уравнение или 9x+y=11. Для нахождения точки пересечения прямых В2В2 и В3В3 решим систему:

Вычтем из первого уравнения второе, получаем -11x=-8 Þx=8/11, y=3+2x=49/11. Точка N(8/11,49/11), следовательно, p2=8/11, p1=1-8/11=3/11, n=49/11.

Таким образом, , при цене игры .

Из рисунка видно, что стратегия В1 не входит в оптимальную смешанную стратегию,поэтому q3=0,и мы можем найти оптимальную смешанную стратегию, удалив из платежной матрицыпервый столбец. Получаем матрицу , при этом столбцы ее соответствуют активным стратегиям В2, В3.

Так как – оптимальная, то она должна гарантировать средний выигрыш игроку В, равный цене игры, при любом поведении игрока А:

для стратегии А1:

для стратегии А2: .

С учетом того, что сумма вероятностей смешанной стратегии равна 1, цена игры получаем систему уравнений:

Вычтем из первого уравнения второе:

Решая систему, находим

Оптимальная смешанная стратегия для игрока В .

Ответ: ,

Пример 6

Решить графически игру,  заданную платежной матрицей .

Решение

Матрица игры имеет размер 4х2, поэтому решение игры будем искать для игрока В. Аналогично примеру 5отложим отрезок единичной длины В1В2каждой точке которого поставим в соответствие некоторую смешанную стратегию второго игрока – (q1, q2). В частности, точке В1соответствует стратегия В1, точке В2 – стратегия В2.

В точках В1 и В2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыши игрока А при соответствующих стратегиях и строить прямые, соответствующие стратегиям игрока А.

В соответствии с принципом минимакса ломаная А14 – верхняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрышминимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока В достаточно составить уравнения прямых и найти точку пересечения прямых А1А1 и А4А4.

Уравнение прямой, проходящей через 2 точки (x1,y1)  и (x2,y2) имеет вид .Прямая А1А1 проходит через точки (0,6) и (1,5), следовательно, ее уравнение или x+y=6.Прямая А4А4 проходит через точки (0,1) и (1,8), следовательно, ее уравнение или -7x+y=1. Для нахождения точки пересечения прямых А1А1 и А4А4решим систему:

Вычтем из первого уравнения второе, получаем 8x=5Þx=5/8, y=6-x=43/8. Точка N(5/8,43/8), следовательно, q2=5/8, q1=1-5/8=3/8, n=43/8.

Таким образом, , при цене игры .

Из рисунка видно, что стратегииА2 и А3не входят в оптимальную смешанную стратегию,поэтому p2=0 и p3=0, имы можем найти оптимальную смешанную стратегию, удалив из платежной матрицывторую и третью строку. Получаем матрицу , при этом строки ее соответствуют активным стратегиям А1, А4.

Так как – оптимальная, то она должна гарантировать средний выигрыш игроку А, равный цене игры, при любом поведении игрока В:

для стратегии В1:

для стратегии В2: .

С учетом того, что сумма вероятностей смешанной стратегии равна 1, цена игры получаем систему уравнений:

Вычтем из первого уравнения второе:

Решая систему, находим

Оптимальная смешанная стратегия для игрока А .

Ответ: , ,

Таким образом, имеем следующийалгоритм графического решения простейших матричных игр 2хn ( или mx2):

1. Строимn (m) прямых, соответствующих стратегиям второго (первого) игрока.

2. Строим нижнюю (верхнюю) границу выигрыша.

3. Выбираем на границе выигрыша точку с максимальной (минимальной) ординатой.

4. Определяем по чертежу пару активных стратегий из числа построенных для второго (первого) игрока.

5. Находим координаты точки максимума (минимума) и  решение игры.










Последнее изменение этой страницы: 2018-06-01; просмотров: 404.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...