Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Этап 1: выбор начальных приближений УКУ на основе построения ортогональной равномерной сети




4.3.1. Формирование ортогональной равномерной сети

Рассмотрим скалярные кусочно-непрерывные управления  коалиций вида

       (4.16а)

где , а  и  определяются значениями сети параметров .

Управление (4.16а) является параметризованной программой вида (4.14) на r-м интервале ПКЗУ при r = 1

          .  (4.16б)

На каждом интервале ПКЗУ формируется (n – r) наборов mK-мерной ортогональной сети шагов управлений (или mK наборов (nr)-мерной ортогональной сети каждого управления).

Тогда для выбора начальных приближений УКУ для ПКЗУ вида (4.16а) для каждого i-го шага управления

                                                                  (4.17)

формируется mK -мерная совместная ортогональная сеть.

На областях параметров  определяется множество (nr) равномерных ортогональных сетей точек размерности mK и густоты , на множестве которых и вычисляются области стабильного по УКУ взаимодействия коалиций [55].

Множество точек этой сети размерности  отображаются в пространство показателейJ, формируя таким образом ее допустимый вид.

Если рассматривается двухкоалиционное взаимодействие, то на каждом i-м шаге изменения управления формируется совместная двухмерная ортогональная равномерная сеть, представленная на рис. 4.1.

Рис. 4.1. Формирование ортогональной сети на пространстве параметров

В том случае, когда имеет место вырожденное управление, постоянное на всем интервале взаимодействия , сеть формируется перед началом игры и остается неизменной при взаимодействии (не зависит от i).

Густота сети li (длина шага сети) неявно характеризует точность определения области показателей Jв целом, а также области УКУ-равновесных точек в частности. В каждом конкретном случае «густота» достаточная в смысле точности области J определяется свойствами сжатия функционалов J. При этом густота сети и размерность области q непосредственно связаны с временем оптимизации – уменьшение шага сети ведет к значительному увеличению продолжительности работы алгоритма поиска УКУ-оптимальных решений, так как количество «ячеек» сети  и точек сети  определяется из выражения

,

где  – размерность области параметров q; li – густота сети на i-м шаге;  – нижняя и верхняя границы i-й компоненты  вектора параметров.

Так как УКУ-решения, полученные на первом этапе алгоритма оптимизации методом УКУ, используются только для формирования начальных приближений для дальнейшей оптимизации, то возможен выбор достаточно большого значения шага (малой густоты) сети l. При этом имеет место увеличение быстродействия алгоритма.

Например, для ряда приложений имеет место

                                               .

На втором этапе для рассматриваемых в работе приложений трактовка (4.16) является начальным приближением ПКЗУ многошагового взаимодействия, когда  где . Очевидно обобщение сетей для векторных управлений коалиций

4.3.2. Алгоритм получения сетевых УКУ-решений

Алгоритм вычисления сетевых УКУ-решений является итерационным и в общем случае имеет следующий вид:

Шаг 1: задается модель конфликта, определяются параметры системы;

Шаг 2: для r-го интервала ПКЗУ формируется ортогональная равномерная сеть c  и  для ;

Шаг 3: для точки в сети c координатами  проверяется наличие «угрозы» коалиции K, т.е. точки с координатами , для которой выполняется условие (4.9);

Шаг 4: а) если «угроза» существует, проверяется наличие «контругрозы» коалиции N/K, т.е. точки с координатами , для которой выполняются условие (4.10); б) если «угрозы» не существует, то переходим на шаг 6б;

Шаг 5: а) если «контругроза» существует, то переходим на шаг 6а;
б) если «контругрозы» не существует, то данная точка не является УКУ-оптимальной и происходит переход на шаг 7;

Шаг 6: а) точка  является УКУ-решением; б) точка имеет признаки равновесия.

Шаг 7: а) переходим к следующей точке сети на шаг 3; б) если перебраны все точки сформированной сети, то переходим к шагу 2 для (r+1)-го интервала ПКЗУ.

4.4. Этап 2: оптимизация управления ММС на основе модифицированных достаточных условий локальных УКУ (ЛУКУ) [50] и метода моментов Н.Н. Красовского [129]

4.4.1. Общий вид достаточных условий ЛУКУ Э. Вайсборда
и В. Жуковского [32]

В соответствии с общими принципами формирования коалиционной структуры [32] вводится коалиционное разбиение

                                    ,

где P – множество коалиционных структур при частичном объединении Kl из P. Показатель потерь коалиции Kl:

       ,  (4.18)

где

                  .            (4.19)

Коалиционное динамическое описание системы:

             .        (4.20)

Здесь, как и ранее, множество  обладает свойствами [32]:

1) для любого набора уравнений  существует единственное решение  системы (4.20);

2) компоненты ni-мерных вектор-функций  являются кусочно-непрерывными функциями, имеющими конечное число точек разрыва (свойства 1, 2 определяют множество )

                                              ;

3) управление  называется допустимым, если ;

4) множество  является открытым в смысле: для любого подмножества  при  управление  также принадлежит , если

                                           ,

где  – малая положительная константа.

Локальной угрозой коалиции (или  по некоторым  из  или из ) является возможность замены коалицией K управления uK(t) на ,  так, чтобы

                                   .                             (4.21)

Локальной контругрозой контркоалиции N/K является возможность замены контркоалицией N/K управления  на ,  так, чтобы

                                   ,

                               .                         (4.22)

Локальный характер угроз и контругроз принят к рассмотрению для уточнения сетевых УКУ в промежутках между узлами сети.

Определение 4.5.Локальной угрозой и контругрозой для коалиции K называется набор управлений , для которого существует постоянная e > 0 такая, что на любую локальную угрозу коалиции K у контркоалиции N/K имеется локальная контругроза.

Определение 4.6.Если один и тот же набор управлений является локальной угрозой и контругрозой для любой допустимой коалиции K, тоu(t) называется локальной угрозой и контругрозой коалиционной игры.

Стабильные свойства ЛУКУ обобщают известные свойства равновесия по Нэшу, при которых контругроза реализуется уже для соотношения (4.21) с изменением знака.

Для получения достаточных условий класс допустимых вариаций uK(t) и  ограничивается допустимыми управлениями вида

                              

где , а gK,gN/K – постоянные.

Постоянные gK,gN/K можно выбрать настолько малыми по абсолютной величине, что при ограниченных  имеет место:

                  .            (4.23)

Вводятся системы вида

                                            (4.24)

где  (j = K, N/K) – матрицы Якоби, Y(t) – матрица фундаментальных решений. Далее для удобства будем обозначать УКУ-решение, как .

Теорема 4.1 [32]. Для того чтобы  было локальной угрозой и контругрозой для коалиции K, достаточно, чтобы

а) векторы g1(K) = gK,N/K(tg2(K) = gN/K,N/K(t) были линейно независимы (равенство a1×g1(t)+a2×g2(t) = 0 возможно лишь при a1 = a2 = 0),

б) для любых допустимых  имело место неравенство , где  – скалярное произведение,

                     

Как и в общем случае, данные достаточные условия локальных УКУ также являются сложными для практических применений.

Действительно, для выполнения условия а) существует, в свою очередь, необходимое условие: если g1 и g2 линейно независимы, то определитель Грамма [32]

                                        ,

где ,  – скалярное произведение.

Во-первых, если это условие выполняется, то функции могут и не быть линейно-независимы, во-вторых, это условие трудно проверяется.

Для проверки условия б) необходимо решить интегральное уравнение

                                         

и убедиться, что кроме тривиального решения , которое не должно входить в , для всех  решения нет, при этом ядро уравнения gK,K(t) имеет сложный вид.

И, наконец, необходимо во всех случаях применения иметь точное описание функции перехода  системы (4.24).

Три данных фактора делают трудноприменимым данный вид достаточных условий и требуют их модификации.

4.4.2. Модифицированные достаточные условия ЛУКУ

Теорема 4.2. Для того чтобы набор  был локальной угрозой и контругрозой для коалиции K, достаточно, чтобы для любых допустимых  выполнялась система неравенств:

                          ,                    (4.25)

где

                                   (4.26)

где

                            (4.27)

                                                   (4.28)

                        (4.29)

– реализация угроз и контругроз,  принадлежат , вектор малых величин gj выбираем из условия

                 , где  – малая величина.           (4.30)

Если показатели имеют смысл показателей эффективности, то знаки второго и третьего неравенств в (4.25) меняются на противоположные.

Доказательство приведено в работе [54]. Показано, что если задана постоянная  и для управлений  и  условия теоремы выполняются, то, введя допустимые вариации управлений,

                         

где  и , из первого условия (4.25) следует, что управление  реализует локальную угрозу коалиции K

           ,      (4.31)

а из второго и третьего условия (4.25) следует, что управление  реализует контругрозу

. (4.32)

4.4.3. Метод оптимизации

Условия теоремы 4.2 предполагают, что неравенства (4.25) выполняются на множестве допустимых управлений  коалиции . Следовательно, каждое из трех скалярных произведений выражения (4.26) представляет собой произведение вектора, зависящего от оптимального управления и траектории, на любой вектор из допустимого множества.

Если в первом слагаемом множество  имеет смысл множества достижимости при t = T [129], то в интегральном члене (4.26) имеет место ансамбль траекторий  и множество управлений .

Один из вариантов методического упрощения структуры алгоритма на втором этапе заключается в сведении исходной задачи к такому виду, когда для получения  достаточно использовать лишь области достижимости.

Для этого вводятся дополнительные координаты

  (4.33)

и исходная задача сводится к задаче с терминальным показателем

  , (4.34)

где  – расширенный вектор.

Тогда

                                (4.35)

              ;        (4.36)

                              ,                         (4.37)

где последняя система имеет вид

                               (4.38)

В данной трактовке достаточные условия принимают вид системы

                                        (4.39)

при наличии связей (4.36) – (4.38).

Здесь и далее рассматриваются кусочно-непрерывные скалярные (или векторные ) управления  вида (4.16) или

                    ,               (4.40)

а также параметризованные стратегии .

Таким образом, необходимо найти пару , которая на множествах допустимых управлений  и  и, как следствие, на множествах  обеспечивает систему неравенств (4.39).

Общую алгоритмическую структуру этапа 2 теперь можно базировать на основе следующей геометрической трактовки.

Примем для рассуждений без ограничения общности результата, что размерность систем (4.36) и (4.37) .

Тогда система (4.39) является системой скалярных неравенств следующего вида (прочерки над переменными опускаем):

                (4.41)

Вектора a, b являются векторами, однозначно зависящими от u0. Вектора  заполняют соответствующие области достижимости (ОД) (рис. 4.2).

Рис. 4.2. Топология алгоритма на основе ОД

Утверждение 4.4. Для того чтобы третье неравенство системы (4.41) выполнялось на всей , достаточно, чтобы вектор нормали bгипер-
плоскости, проходящей через начало координат, находился «внутри» конуса (I0II), гдеI и II – вектора внешней нормали касательных гиперплоскостей к .

Доказательство. Достаточно учесть знак скалярного произведения  при всех возможных положениях векторов  в .

Утверждение 4.5. Для того чтобы второе неравенство системы (4.41) выполнялось на всей , достаточно, чтобы вектор нормалиaгиперплоскости находился «внутри» конуса (–ℓI 0 – ℓII).

Доказательство базируется на учете знака скалярного произведения  при всех .

Утверждение 4.6.Первое неравенство системы (4.41) ограничивает область допустимых значений нормали aгиперплоскости второго неравенства системы пересечением конусов (–I 0 – II) и (–IV0 – III), где III и IV – нормали к гиперплоскостям, касающимся  и конуса (–II 0 III).

Доказательство. Рассмотрим от обратного нормаль a в зачерченном секторе (–III0 – IV). Тогда всегда найдется вектор , который обеспечит равенство , т.е. .

Полученная система конусов (I0II) по b и (–IV0 – I), (–II 0 III)по а(выделены ярко на рис. 4.2) при данном расположении ОДj является алгоритмической основой для получения  из достаточных условий теоремы 4.2.

Область ( ) может деформироваться в двух основных направлениях:

1. «Приближаться» к началу координат, разворачивая касательные гиперплоскости.

2. «Вырождаться» в фигуру с малым конусом при вершине при уменьшении угла между касательными гиперплоскостями или увеличении пространственного угла конуса (I0II).

Утверждение 4.7. При касании  начала координат или при включении начала координат во внутреннюю точку области ( ) задача решения не имеет.

Доказательство. Действительно, при «приближении» границы  к началу координат касательные гиперплоскости «расходятся», конический угол (I0II) уменьшается и в «момент» касания направлениеI и II совпадает и внутренних точек не имеется, а следовательно, решения нет. Если начало координат попадает внутрь области ОД, то не существует касательных гиперплоскостей, проходящих через начало координат, и решение отсутствует.

Для реализации алгоритма применяется метод моментов Н.Н. Красовского [129], так как он апеллирует к ОД и позволяет найти нормали касательных к ОД гиперплоскостей.

Теорема 4.3[50]. Оптимальное управление, приводящее траекторию  системы

                                                        (4.42)

в точку касания ОД и гиперплоскости, а также вектор нормали в точке касания определяются при решении задачи

                          ,                    (4.43)

где  – матрица фундаментальных решений системы (матрица перехода):

                               .                          (4.44)

Доказательство. На основании необходимых и достаточных условий разрешимости задачи об управлении [129, стр. 381], сформулированной в [129] в форме проблемы моментов, область достижимости имеет вид

             ,       (4.45)

где  – ограниченное, выпуклое, замкнутое множество ОД,

                              ,

 – начальные условия,  – возмущение, приложенное к системе (4.42), – некоторый вектор , m – размерность G в позиционной задаче управления (m – размерность позиции),

         .       (4.46)

Для каждой точки q, лежащей на границе области G, условие (45) выполняется со знаком равенства.

Минимизация (4.46) позволяет получить управление, переводящее систему (4.42) из начального состояния в некоторую точку границы G.

Вектор нормали ℓ = ℓ0 к гиперплоскости, проведенной в точку касания, определяется из условия максимума равенства в выражении (4.45).

Совместное решение этих задач [129, стр. 385] позволяет получить уравнение гиперплоскости (рис. 4.3)

            .

В данной задаче , возмущение  не учитывается, поэтому .

Рис. 4.3. Касательная гиперплоскость к Gx

В достаточных условиях рассматриваются лишь касательные гиперплоскости, проходящие через начало координат (рис. 4.2). Поэтому  и .

Следовательно, выражение (4.45) для точек границы G принимает вид

                                    .

Раскрывая, при полной позиции m = n получим

        ,

что и требовалось доказать.

В соответствии с полученными результатами общая структура этапа 2 метода оптимизации управлений на основе объединения модифицированных достаточных условий ЛУКУ (МДУ ЛУКУ) и метода моментов Н.Н. Красовского можно представить итерационным процессом, основой которого являются следующие шесть шагов:

Шаг 1: приведение исходной постановки к виду (4.34) – (4.38);

Шаг 2: формирование системы неравенств (4.39) (МДУ ЛУКУ);

Шаг 3: итерация 1: задание начальных приближений  и «ячейки»  допустимых значений  на основе сетевых решений этапа 1;

итерация i > 1: формирование текущих приближений

Шаг 4: формирование системы (4.42) (A,B,X(T,t)) на основе приближений ; решение задачи (4.43) для определения границ конусов нормалей Con ℓ (рис. 4.2), удовлетворяющих МДУ ЛУКУ:

                      

а также соответствующих конусов , образованных векторами  касательных к ОДx;

Шаг 5: решение задачи Парето–оптимизации  (или W-оптимизации) для набора коалиций K и N/K на множестве , начальных или текущих приближениях  и дополнительных ограничениях, сформированных на шаге 4 в одном из двух видах: – ; – , т.е. удовлетворяют системе неравенств (4.39) МДУ ЛУКУ при  и  – векторах касательных, соответствующих ОДx и являющихся границами множеств ;

Шаг 6: а) задача решена, если управление  оптимизирует (экстремизирует) набор  внутри «ячейки»  сети при удовлетворении неравенств МДУ ЛУКУ; б) если ограничения не выполняются, то возвращаемся к шагу 3 на итерации i > 1.

Рис. 4.4. Итерационная процедура 2-го этапа

Структурная схема алгоритма в обобщенном виде приведена на рис. 4.4.

4.5. Применение двухэтапного метода получения
УКУ-оптимального управления прогнозом динамики конфликта
ЛС СВН – ЛС ПВО

4.5.1. Постановка задачи

Рассмотрим этап задачи противодействия локальной системы воздушного нападения (ЛС СВН) и локальной системы ПВО (ЛС ПВО) [173]. Противодействие ЛС СВН – ЛС ПВО состоит в том, что ЛС СВН стремится преодолеть ЛС ПВО для поражения защищаемого объекта, а ЛС ПВО препятствует прорыву.

Задача получения программно-корректируемого закона управления активными средствами при взаимодействии ЛС СВН–ЛС ПВО представляет собой итерационную процедуру, на каждой итерации которой выполняются четыре шага [54]:

Шаг 1. формирование конфигурации конфликта;

Шаг 2. целераспределение АС СВН и ПВО по активным и пассивным средствам ПВО и СВН соответственно;

Шаг 3. имитация конфликта;

Шаг 4. прогнозирование динамики конфликта.

Далее рассматривается упрощенный вариант последнего шага прогноза динамики конфликта (полное исследование задачи дано в главе 10).

Рис. 4.5. Структура взаимодействия в ММС:
АС – совокупность активных средств коалиции,
ПС – совокупность пассивных средств коалиции

В данной задаче естественным является поиск таких режимов функционирования ЛС СВН – ЛС ПВО, которые были бы конфликтно-оптимальными.

Каждая система состоит из двух подсистем: активной и пассивной. Активные средства каждой коалиции воздействуют на активные и пассивные средства противоположной коалиции. Для ЛС СВН активными средствами являются истребители-перехватчики с ракетами «воздух-земля» и противорадиолокационными ракетами, а для ЛС ПВО – зенитно-ракетные комплексы. Пассивные средства для ЛС СВН – бомбардировщики, для ЛС ПВО – радиолокационные станции [173].

На рис. 4.5 приведена структура взаимодействия сторон.

Система задается следующим образом:

                                      (4.47)

где Pij – эффективность воздействия одного объекта i-го вида одной системы на один объект j-го типа другой системы, ; qi – доли активных средств воздействия на активные средства партнера, ; (1 – qi) – доля активных средств воздействия на пассивные средства партнера;
xi – текущая средняя численность объектов i-го типа.

                                              

Рассмотрим данную систему в пошаговом варианте. Шаг – конечный интервал времени; число шагов конечно ( ). Каждое активное средство делает на шаге один ход.

Шаг равен .

В пошаговом варианте система (4.16) преобразуется в систему:

                                       (4.48)

Здесь k = 1, 2,..., 0 £ qi £ 1 (i = 1,2), 0 £ Pij £ 1 (i = 1,3; j = 1,2,3,4); xi > 0, xi(k) – численность к началу k-го шага.

В качестве показателя терминальных потерь (J) выберем показатель, имеющий смысл суммарного перевеса по активным и пассивным средствам и скорости убывания активных средств «партнера».

    (4.49)

JА Þ min; JБ Þ min.

JА – показатель потерь коалиции А. Чем меньше JА, тем больше выигрыш коалиции А; JБ – показатель потерь коалиции Б. Чем меньше JБ, тем больше выигрыш коалиции Б; aij – весовые коэффициенты, определяющие целевой приоритет каждой стороны в поражении активных или пассивных средств противоположной стороны (терминальная составляющая) или в увеличении интегральной скорости убывания активных средств противника (интегральная составляющая). (0 £aij £ 1; ai1 + a i2 + ai3 = 1; i = {1,2}), значения коэффициентов задаются в зависимости от тактики каждой из сторон.

4.5.2. Применение сетевого подхода для получения
начального приближения УКУ

Получение начального приближения УКУ. Для реализации сетевого подхода, используя алгоритм общего вида, базирующийся на определении угроз и контругроз, сформирован алгоритм получения сетевых приближений УКУ-решений для двухкоалиционной, двухкритериальной задачи
(со свёрткой векторных показателей) [50, 55].

На шаге 1 алгоритма формируется двухмерная ортогональная равномерная сеть (см. рис. 4.1).

На шагах 2–8 формируется множество УКУ-оптимальных сетевых решений, которые можно использовать в качестве начальных приближений для 2-го этапа получения оптимального управления ММС. Структура алгоритма (шаги 2–8) показана на рис. 4.6.

Реализация сетевого алгоритма УКУ-оптимизации осуществлена в среде ПС МОМДИС [48, 55], а также см. гл. 9.

В качестве базового рассматривался следующий вариант:

· начальные условия задачи: ;

· эффективности воздействия объектов i-го типа одной системы на объекты j-го типа другой системы: ;

· весовые коэффициенты, определяющие приоритет каждой из систем в поражении активных и пассивных средств противника:

                          ;

· квадратичный критерий (без учета скорости):

                        ,

                        ;

анализ проводился на двух тактах.

Рис. 4.6. Сетевой алгоритм поиска начальных приближений УКУ-решений

На рис. 4.7 показаны область параметров и область показателей для базового варианта. Результаты временных замеров приведены в табл. 4.1.

Рис. 4.7а. Результаты Нэш–Парето–УКУ-оптимизации (область параметров)

Рис. 4.7б. Результаты Нэш–Парето–УКУ-оптимизации (область показателей)

Таблица 4.1

Зависимость времени вычисления области УКУ
от числа точек сети

Число точек 100 625 1600 2500 5625
Время, с. 1 4 15 30 125

k = 1,2; .

Показатели – терминальные квадратичные.

Анализ влияния изменения параметров моделей. Исследования проводились в следующих направлениях (глава 10):

· влияние соотношения весовых коэффициентов вектора показателей  (приближенное положение Парето-оптимальной точки УКУ-СТЭК на ПНОК, данное на рис. 4.7, полностью отражает тактические свойства конфликта ( ), когда ЛС СВН стремится к поражению АС ЛС ПВО (прорыву ЛС ПВО), а ЛС ПВО стремится в основном к поражению ПС ЛС СВН (защите объектов));

· влияние соотношения численностей объектов ;

· влияние соотношения эффективности воздействия ;

· влияние вида показателей ;

· влияние числа шагов DТ.

О пересечении множества УКУ и ПНОК при различных ресурсных соотношениях коалиций. Из анализа прикладных результатов выявляются некоторые общие закономерности, которые сложно получить «прямыми» теоретическими исследованиями.

Среди других следует отметить явно проявившуюся тенденцию не единственности УКУ-решений коалиционной дифференциальной игры. При этом большая часть решений находится внутри области Парето–Нэш- компромиссов (ПНОК) (см. гл. 6).

Если ресурсы коалиций не равные, то на ПНОК имеем небольшое число точек УКУ, которые смещены в пользу коалиции с большими ресурсами.

При выравнивании ресурсов число УКУ-решений увеличивается, а само множество заполняет ПНОК, принимая во многих случаях очертания ПНОК.

Следовательно, может быть сформулировано следующее утверждение общего характера, которое обосновывает более общее утверждение 6.10 (гл. 6):

Утверждение 4.8 [50]. Парето–Нэш-область компромиссов содержит УКУ-оптимальные решения, а при выравнивании ресурсов коалиций число решений возрастает и их множество существенно пересекается с ПНОК. Причем на большом числе вариантов большая часть Парето-границы ПНОК содержит УКУ-решения.

С точки зрения принципа необязательных соглашений Мулена точки Парето-границы могут играть роль начальных приближений при точном отыскании УКУ-решений (см. точку УКУ-СТЭК на рис. 4.7).

4.5.3. Получение точного УКУ-решения на основе МДУ ЛУКУ
и метода моментов Н.Н. Красовского

Получение МДУ ЛУКУ. В соответствии с шагами 1-го и 2-го этапов оптимизации приводим исходную постановку задачи к виду (4.34) – (4.39).

Показатели коалиций JA и JБ примут вид (4.34):

   (4.50)

Тогда из (4.35) – (4.38), учитывая (4.39), получаем

                             ,                        (4.51)

где ,

            ;      (4.52)

                          (4.53)

                                        

Тогда в соответствии с (4.39) МДУ ЛУКУ принимают следующий вид:

· первое неравенство:

           

       

· второе неравенство:

                            (4.54)

· третье неравенство:

     

Рассмотрим случай, когда , т.е. интегральная часть показателей JA и JБ не учитывается.

Вычисление матрицы перехода. В соответствии с шагом 4 сформируем систему (4.42) для варианта с терминальными показателями, т.е. когда . Для этого вычислим матрицы А,BА,BБ,X(T,t). Из (4.51) и (4.53) получаем

                         ,                    (4.55)

                                .                          (4.56)

Для упрощения дальнейших вычислений делаем замену

       .

Переходная матрица X(T,t) имеет вид

     ,

где E – единичная матрица.

Преобразовав элементы матрицы и используя свойства рядов, получим окончательное выражение для матрицы перехода:

    . (4.57)

Реализация метода моментов Н.Н. Красовского.На шаге 4 УКУ-оптимизации для определения границ конусов нормалей, удовлетворяющих МДУ ЛУКУ, необходимо решить задачу (4.43). Для этого вычислим

               ,

где – вектор нормали к ОД,

Тогда для , используя второе выражение (4.43), имеем

     .

При ,0 < q2 < 1 получим

       (4.58)

Если F < 0, то максимум выражения (4.58) достигается при , а при xБ(t0) = 0 имеем xБ(T) = 0, при котором второе и третье неравенство системы (4.54) не выполняются.

Если F ³ 0, то максимум выражения (4.58) достигается при  и на втором этапе решения имеем задачу . Решением этой задачи является . Раскроем последнее выражение:

Окончательно имеем, что нормаль  удовлетворяет выражению

                         ,                   (4.59)

где ,

,

,

,

 – вектор касательной к при .

Таким образом, второе и третье неравенства системы достаточных условий ЛУКУ (4.54) принимают вид:

       (4.60)

Подобным образом на основе метода моментов можно получить, что вектор нормали для области  удовлетворяет выражению

                           ,                      (4.61)

где ,

,

,

    .

Первое неравенство системы достаточных условий ЛУКУ (4.54) принимает следующий вид:

        . (4.62)

Получение УКУ-решений на основе W-оптимизации. Для получения точных УКУ-решений воспользуемся процедурой W-оптимизации программного комплекса МОМДИС. Для реализации этапа 2 оптимизации на основе УКУ в процедуру вычисления необходимо внести изменения.

В качестве начального приближения для выполнения процедуры W–оптимизации будем использовать управление , полученное на этапе 1 вычисления УКУ-решений. В качестве ограничений на управление зададим такую , где , , чтобы допустимые управления находились внутри «клеточки», образованной ближайшими узлами ортогональной равномерной сети, используемой на этапе 1.

В качестве дополнительных ограничений на решения, получаемые в результате W-оптимизации, используются модифицированные достаточные условия ЛУКУ (4.60), (4.62).

Данные ограничения реализованы следующим образом. Во время выполнения процедуры W-оптимизации на каждом шаге вычислений все управления, проверяемые процедурой на удовлетворение условий оптимальности, заложенных в методе W-оптимизации, также проверяются и на соблюдение МДУ ЛУКУ. В случае, если данное управление не удовлетворяет МДУ ЛУКУ, то показателю присваивается заведомо не оптимальное значение, и алгоритм «отбраковывает» данное решение, повторяя итерацию для поиска другого варианта. Результаты W-оптимизации с проверкой на ЛУКУ-оптимальность представлены на рис. 4.8.

JА
JБ

Рис. 4.8. Точное решение УКУ-оптимизации

Получение УКУ-решений дифференциальной игры.Для того, чтобы набор  был локальной угрозой и контругрозой для коалиции K, достаточновыполнения неравенств 4.25 (теорема 5.2). Для коалиции N/K аналогичнодолжны выполняться три неравенства.

Таким образом, для того, чтобы набор  являлся УКУ-решением дифференциальной игры, достаточно, чтобы для любых допустимых векторов управленийвыполнялась система из шести неравенств.

Отсюда аналогично случаю для одной коалиции получаем на основе метода момента Н.Н. Красовского систему из шести неравенств, выполнение которых будем проверять для получения точных УКУ-решений дифференциальной игры.

      

Проверяя неравенства во время выполнения процедуры W-оптимизации, получаем решение дифференциальной игры, которое в данной задаче совпадает с решением для коалиции K (рис. 4.8). Это является следствием того факта, что сетевые решения – начальные приближения УКУ-решений дифференциальной игры.

Таким образом реализуется двухэтапный метод определения УКУ-решения. На первом этапе приближенного сетевого анализа на множестве показателей практически решается вопрос существования УКУ-решений, в частности, для рассмотренной конфликтной задачи было обнаружено, что множество УКУ-решений имеет существенное пересечение с Парето–Нэш- областью компромиссов.

На втором этапе вновь решается задача определения точных
УКУ-решений в форме управления нелинейной динамической системой на основе предложенной комбинации полученных в работе достаточных условий для локальных УКУ и метода моментов Н.Н. Красовского.

Данный метод формирует класс стабильно-эффективных компромиссов (СТЭК) на базовом Парето–Нэш-множестве компромиссов. СТЭК на основе УКУ обладает дополнительной эффективностью по сравнению с Нэш-решением и сохраняет свойства равновесной стабильности в условиях необязательных соглашений.










Последнее изменение этой страницы: 2018-04-12; просмотров: 519.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...