Студопедия КАТЕГОРИИ: АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
ИТЕРАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ МАТРИЧНЫХ ИГР
1. МЕТОД БРАУНА-РОБИНСОНА (МЕТОД ФИКТИВНОГО РАЗЫГРЫВАНИЯ) Идея метода: многократноефиктивное разыгрывание игры, когда одна итерация называется партией. Рассматривается матричная игра ГА с матрицей А={αij}, где . В первой партии игроки произвольно выбирают свои чистые стратегии. В k-й партии каждый игрок выбирает ту чистую стратегию, которая максимизирует его ожидаемый выигрыш против наблюдаемого эмпирического вероятностного распределения противника за (k-1) партию. Пусть за k - партий игрок 1 i-ю стратегию использовал -раз, а игрок 2 свою j-ю стратегию использовал -раз. В (k+1)-й партииигрок 1 будет использовать ik+1-стратегию, а игрок 2 -jk+1 стратегию. Запишем следующие соотношения: ; . Если рассмотреть как соответственно верхнее и нижнее приближённые значения за k- партий, то приближённые оптимальные смешанные стратегии соответственно 1 и 2 го игроков заk- партий можем записать как: и . Значение игры Vнаходится в диапазоне: . Сходимость представленного алгоритма подтверждается следующей теоремой: Теорема: . Недостатком данного метода является его медленная и немонотонная сходимость. Пример. Найти приближённые оптимальные стратегии игроков и значение матричной игры с матрицей . Видим из написанного, что седловой точки нет и значение игры находится в интервале 1<V<2. Стратегии игрока 1 обозначены как α, β, γ, стратегии игрока обозначены как a, b, c. Вычислительный алгоритм удобнее представить в виде следующей таблицы, в которой на первом шаге взяты первые чистые стратегии игроков:
и
2. МОНОТОННЫЙ АЛГОРИТМ РЕШЕНИЯ МАТРИЧНЫХ ИГР. Алгоритм позволяет находить (точно и приближённо) оптимальную стратегию 1-го игрока и значение матричной игры V. Рассматривается матричная игра ГА с матрицей размерности m×n. Обозначим через Шаг 0: игрок 1 выбирает произвольную свою чистую стратегию i0, т.е. , и вспомогательный вектор строка матрицы А. Приближённое значение игры на шаге 0 будем определять, как Замечание: на последующих шагах алгоритма соотношения (1) и (2) будем определять аналогично, лишь изменяя верхний индекс 0 на индекс соответствующего шага, т.е. для N шага эти значения будем обозначать соответственно: VN, JN. Шаг N-1:допустим, что выполнена N-1 итерация и полученыxN-1, cN-1, VN-1. Шаг N:тогда xN, cN вычисляются по следующим формулам: (3) (4), Пусть на Nшаге рассматривается игра ГNÌГАcматрицей АN= , где , т.е. это матрица А только с частью столбцов, определяемых на N-1 шаге по формулам (1)и (2). Решаем подыгру ГN и находим для этой игры оптимальную стратегию 1-го игрока . Вектор определяем по формуле: , где aiстроки матрицы А. Далее решаем (2×n)-игру с матрицей: (5)и находим для этой игры оптимальную стратегию 1-го игрока (1-αN, αN), значения которых подставляем в уравнения (3), (4) для нахождения xN, cN. Вычислительный процесс продолжается до тех пор, пока не будет выполнено условие αN =0 или не будет достигнута требуемая точность вычисления. Условие αN =0 говорит о том, что в матрице (5) первая строка доминирует вторую и, следовательно, в качествеоптимальной стратегии 1-го игрока в исходной задаче можно взять х*=xN=xN-1. Сходимость алгоритма гарантируется следующей теоремой: Теорема: если - итеративные последовательности, значения которых получаются согласно формулам соответственно (1), (3), тогда выполняются следующих 3 условия: 1. VN=VN-1, т.е. последовательность монотонно возрастет с ростом итераций; 2. , где V – цена исходной задачи; 3. , х*ÎХ* - оптимальная стратегия первого игрока. Рассмотрим пример. Дана игра ГА с платёжной матрицей . Найти ситуацию равновесия в данной игре. Решение: шаг 0.В качестве х0 выберем первую чистую стратегию 1-го игрока, т.е. Шаг 1.Для нахождения , рассмотрим подыгру Г1ÌГА c матрицей А1= , равной второму столбцу матрицы А. Оптимальной стратегией этой игры есть выбор третьей чистой стратегии 1-го игрока, как лучший выигрыш из 1, 0, 2, т.е. =(0,0,1). , т.е. третья строка матрицы А. Решаем (2×3) игру с матрицей . Так как элементы третьего столбца а3данной матрицы³ элементов первого столбца а1, то он доминируем первым столбцом, следовательно его можно убрать из решения, не нарушая спектр оптимальных стратегий. Имеем (2×2) игру с матрицей . Эта игра вполне смешанная, поэтому решая эту игру по известным формулам прямого счёта, получим оптимальную стратегию 1-го игрока (1-α1, α1)= . Так как α1¹0, то вычисления продолжаем. Вычислим формулы (3) и (4): ; ; , т.е. 1 и 2-й столбцы матрицы А. Шаг 2.Для нахождения , рассмотрим подыгру Г2ÌГА c матрицей А2= , равной первому и второму столбцам матрицы А. Так как доминируема и её можно вычеркнуть из спектра оптимальных стратегий. Имеем (2×2) игру с матрицей . Эта игра вполне смешанная, поэтому решая эту игру по известным формулам прямого счёта, получим для игры с матрицей оптимальную стратегию 1-го игрока = . Добавлением 0 в качестве первой координаты в получим = оптимальную стратегию 1-го игрока для игры с матрицей А2. . Решаем (2×3) игру с матрицей а2доминируемаа1Þ Имеем V=V1= , х*=x2=x1= Þх*А Þх*Ау*=VÞ = Þ , а так как Þ Þу*=(h*,1-h*,0), где h*Î[0,1]. Самостоятельно решить матричные игры с платёжными матрицами: и итерационными методами Брауна-Робинсона и монотонным методом, когда по первому методу в матрице А на первом шаге выбрать вторые чистые стратегии игроков, а в матрице В – выбрать четвёртую чистую стратегию 1-го игрока и вторую чистую стратегию 2-го игрока и найти приближённые оптимальные стратегии игроков и интервал, в котором находится значение игры, сделав по 20 итераций. Для второго метода на 0-м шаге в качестве чистой стратегии для матрицы А выбрать третью чистую стратегию 1-го игрока, а для матрицы В четвёртую чистую стратегию 1-го игрока. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее изменение этой страницы: 2018-04-12; просмотров: 250. stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда... |