Детерминированные процедуры управления с поводырем в дифференциальных играх нескольких лиц
Разработка процедуры управления с поводырем для антагонистических дифференциальных игр двух лиц, которая свободна от этого недостатка. Применение на практике процедуры управления движением, являющейся модификацией процедуры управления с поводырем.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 26.04.2019 |
Размер файла | 221,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Пермский государственный национальный исследовательский университет
Детерминированные процедуры управления с поводырем в дифференциальных играх нескольких лиц
С.В. Лутманов
Результаты, полученные в данной статье, позволили в условиях отсутствия у игроков полной информации о реализующемся фазовом векторе доказать альтернативное утверждение относительно исхода дифференциальной игры нескольких лиц, аналогичное тому, что было доказано в работе [2].
Доказательство альтернативного утверждения основывается на сведении дифференциальной игры лиц к вспомогательным антагонистическим дифференциальным играм двух лиц, происходящим на попарно непересекающихся областях пространства исходной игры.
В рассматриваемых антагонистических играх применяется процедура управления движением, являющаяся модификацией процедуры управления с поводырем [1].
1. Постановка дифференциальной игры "наведения-уклонения" нескольких лиц
Динамика конфликтно-управляемого объекта описывается обыкновенным векторным дифференциальным уравнением
, (1.1)
где - текущее время, - фазовый вектор объекта, - вектор управляющих параметров i-го игрока, - вектор-функция, описывающая как внутреннее устройство объекта, так и воздействие различных внешних факторов. Будем предполагать, что множества компактны, а функция непрерывна по совокупности переменных .
Относительно правых частей дифференциальных уравнений (1.1) принимаются стандартные в теории дифференциальных игр предположения:
1) локальные условия Липшица
,
;
2) условия продолжимости решения
.
3) выполнено условие существования седловой точки в "маленькой игре" нескольких лиц, т. е. для всех номеров и векторов выполняется равенство
,
, (1.2)
где .
Условие (1.2), в частности, имеет место для функций вида
.
В пространстве -му игроку ставится в соответствие компактное множество , которое будем называть целевым множеством этого игрока. Неформальная цель игрока состоит в приведении фазового вектора игры в конечный момент времени на свое целевое множество. В случае если в конечный момент времени фазовый вектор игры не принадлежит ни одному из целевых множеств, то считается, что в игре достигнут компромисс.
В предположении, что целевые множества игроков попарно не пересекаются, в работе [2] было доказано альтернативное утверждение относительно исходов игры. Аналогичное утверждение доказывается и в данной статье. Однако в отличие от работы [2] здесь игроки не располагают полной информацией о реализующемся фазовом векторе. При этом предполагается, что результат измерения фазового вектора один и тот же для всех игроков и погрешность измерения не превышает величину .
Таким образом, имеет место неравенство , где действительное, а измеренное значение фазового вектора игры.
2. Управление с поводырем в антагонистической дифференциальной игре двух лиц
Рассмотрим антагонистическую дифференциальную игру двух лиц наведения-уклонения , где некоторое компактное множество. Пусть стабильный мост первого игрока. Символом обозначим сечение множества в момент времени .
Опишем модифицированную процедуру управления с поводырем первого игрока.
Рассмотрим отображение , ставящее каждой тройке в соответствие вектор по следующему правилу:
если и , то вектор удовлетворяет равенству
; (2.1)
если или , но , то вектор произвольный элемент множества .
Пусть разбиение промежутка времени на полуинтервалы .
Символом обозначим процедуру управления первого игрока, предписывающую ему выбирать свои управляющие воздействия из условия
,
где наблюдаемое значение фазового вектора игры в момент времени .
Векторы определяются по следующему правилу (построение производится только в те моменты времени для которых ). В начальный момент времени вектор находится из равенства
(2.2)
причем если вектор определяется из равенства (2.2) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству.
Пусть вектора уже построены. Если , то полагается . В противном случае вектор определяется в зависимости от значения . Когда , вектор находим из равенства
(2.3)
причем если вектор определяется из равенства (2.3) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Когда , строится вспомогательное движение , определенное на полуинтервале . Оно отождествляется на нем с интегральной кривой дифференциального уравнения в контингенциях
,
где вектор удовлетворяет равенству
.
Относительно интегральной кривой требуется, чтобы выполнялось включение . Существование такой интегральной кривой гарантируется свойством стабильности множества .
Рассмотрим функцию , кусочно-непрерывную, допускающую разрывы лишь в точках и непрерывную слева в точках разрыва. На полуинтервале она отождествляется со вспомогательным движением , если оно существует на этом полуинтервале.
В противном случае полагается, что функция на полуинтервале совпадает с таким решением дифференциального уравнения в контингенциях
,
для которого выполняется .
Определение 1. Процедуру управления будем называть модифицированной детерминированной процедурой управления с поводырем первого игрока в игре .
Определение 2. Движением , выходящим из позиции и порожденным процедурой управления первого игрока, будем называть решение дифференциального уравнения
.
Здесь произвольная интегрируемая функция со значениями в множестве .
На рисунке приводится графическая иллюстрация модифицированной детерминированной процедуры управления с поводырем.
Можно показать [3], что модифицированная процедура управления с поводырем, как и исходная, удерживает порожденное ею движение в малой окрестности стабильного моста. Другими словами, справедливо следующее утверждение.
Теорема 1. Для любых и найдутся числа и , такие, что для движения будет выполнено включение
,
если и
.
В частности, если , то из теоремы 1 следует включение , т.е. первый игрок решает задачу наведения на окрестность своего целевого множества.
3. Управление с поводырем в дифференциальной игре нескольких лиц
Пусть разбиение пространства позиций дифференциальной игры нескольких лиц на множества . При этом
1) множества открыты и попарно не пересекаются;
2) множество замкнуто и ;
3) для всех множество
является стабильным мостом [2].
Рассмотрим отображение , ставящее каждой тройке в соответствие набор векторов по следующему правилу:
- если при некотором номере и , то набор векторов удовлетворяет равенству
,
, (3.1)
вектор полагается произвольным вектором из ;
- если , то набор векторов полагается произвольным набором векторов из множества .
Пусть разбиение промежутка времени на полуинтервалы .
Символом обозначим процедуру управления игроков, которая предписывает им выбирать свои управляющие воздействия из условия
,
где наблюдаемое значение фазового вектора игры в момент времени . Векторы определяются по следующему правилу (построение производится только в те моменты времени , для которых ).
В начальный момент времени вектор находится из равенства
(3.2)
причем если вектор определяется из равенства (3.2) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству.
Пусть вектора уже построены.
Если , то полагается .
Если (т.е. для некоторого номера ), то вектор определяется в зависимости от значения . В случае вектор находится из равенства
(3.3)
причем если вектор определяется из равенства (3.3) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству. В случае строится вспомогательное движение , определенное на полуинтервале . Оно отождествляется на нем с интегральной кривой дифференциального уравнения в контингенциях
,
где символ замкнутой выпуклой оболочки, а вектор удовлетворяет равенству
.
Относительно интегральной кривой требуется, чтобы выполнялось включение . Существование такой интегральной кривой гарантируется свойством 4) разбиения . В рассматриваемом случае полагаем .
Определение 4. Процедуру управления будем называть детерминированной процедурой управления с поводырем всех игроков в дифференциальной игре нескольких лиц.
Определение 5. Движением , выходящим из позиции и порожденным процедурой управления , будем называть решение дифференциального уравнения
,
. (3.4)
Уклонение какого-либо игрока от процедуры управления с поводырем будем моделировать тем, что в правой части дифференциального уравнения (3.4) постоянный на каждом промежутке времени вектор следует заменить произвольной интегрируемой реализацией вектора управляющих параметров соответствующего игрока, подчиненной ограничению . Пучок движений, получающийся в результате такого уклонения, обозначим символом
.
Теорема 2. Пусть разбиение пространства позиций дифференциальной игры нескольких лиц со свойствами 1)-3). Тогда для любых и достаточно малого числа найдутся числа и , такие, что для всех и всякого движения будет выполнено .
Доказательство. От противного приходим к существованию начальной позиции и числа , таких, что для любых чисел и найдется номер и движение , для которых выполняется условие
.
Процедура управления в рассматриваемой области фазового пространства представляет собой модифицированную процедуру управления с поводырем первого игрока в антагонистической дифференциальной игре . В силу теоремы 1 она обеспечивает включение для достаточно малых величин . Получили противоречие, которое доказывает утверждение теоремы.
Из доказанной теоремы 2, в частности, следует, что если , , то для всех движений будет выполнено . Таким образом, с точностью до величины в дифференциальной игре "наведения-уклонения" нескольких лиц имеет место компромисс.
4. Альтернативное утверждение относительно исходов игры
Пусть в дифференциальной игре, описанной в п. 1, целевые множества игроков попарно не пересекаются. Тогда справедливо следующее альтернативное утверждение.
Теорема 3. Для всякой начальной позиции либо существует номер , что для любого числа найдутся числа и , такие, что всякое движение , порожденное модифицированной процедурой управления первого игрока в антагонистической дифференциальной игре [2], будет удовлетворять включению .
Либо для достаточно малого числа найдутся числа и , такие, что процедура управления с поводырем всех игроков для всех и всякого движения обеспечивает выполнение условия .
Доказательство. Пусть для некоторого номера позиция принадлежит максимальному -стабильному мосту. Тогда в силу теоремы 1 имеет место первая возможность доказываемой альтернативы.
По условию теоремы целевые множества игроков попарно не пересекаются. Тогда попарно не пересекаться и максимальные -стабильные мосты игроков. Из работы [2] следует, что для любого существует разбиение пространства позиций игры на множества , удовлетворяющее свойствам 1)-3). В случае когда величина достаточно мала, разбиение будет дополнительно удовлетворять условию .
Тогда в силу теоремы 2 реализуется вторая возможность альтернативы.
Теорема доказана.
Список литературы
дифференциальный игра управление поводырь
1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.
2. Лутманов С.В. Об одном альтернативном утверждении относительно исхода дифференциальной игры "наведения-уклонения" нескольких лиц в классе "чистых" и "смешанных" стратегий // Вестн. Перм. ун-та. Математика. Механика. Информатика. 2011. Вып. 1(5). С. 53-61.
3. Лутманов С.В. Управление с поводырем в дифференциальных играх нескольких лиц // Деп. ВИНИТИ № 2773-81, 08.06.81. 47 с.
Размещено на Allbest.ru
...Подобные документы
Анализ модели информационно-телекоммуникационной системы предприятия. Виды угроз информационной безопасности. Цели и задачи защиты информации на предприятии. Разработка процедур контроля системы управления защитой информации в корпоративной сети.
дипломная работа [3,6 M], добавлен 30.06.2011Исследование основных требований к системе управления взаимоотношениями с клиентами. Разработка логической структуры базы данных. Хранимые процедуры и триггеры. Особенности их использования. Настройка репликации в СУБД Postgres. Настройка сервера LDAP.
курсовая работа [926,8 K], добавлен 26.01.2013Разработка структуры базы данных библиотеки для улучшения качества обслуживания, создания информационной базы и упрощения работы персонала. Создание объектов базы на языке sql-запросов. Создание хранимой процедуры с курсором, демонстрация процедуры.
курсовая работа [1,3 M], добавлен 28.12.2012Функции планировщика процессов: добровольный вызов, переключение между процессами, анализ нажатия клавиш Ctrl-D. Составление алгоритма работы программы, разработка процедуры планировщик и процедуры анализа клавиш. Организация интерфейса пользователя.
курсовая работа [480,2 K], добавлен 20.01.2015Работа с файлами на языке Pascal. Типы файлов: типизированные, текстовые, нетипизированные. Сущность процедуры и функции. Использование процедуры Read и Write для операций чтения и записи в типизированном файле. Листинг программы и экранные формы.
лабораторная работа [38,4 K], добавлен 13.02.2009Разработка нового технического оборудования. Изготовление и эксплуатация цифровых устройств. Модель элемента дискретного устройства. Алгоритм загрузки логического элемента из файла и процедуры моделирования. Используемые методы, процедуры и функции.
курсовая работа [306,1 K], добавлен 24.06.2012Разработка база данных в виде таблицы, включающей поля: ФИО, адрес, номер телефона, наименование услуги, сумма оплаты, срок выполнения. Процедуры программы и соответствующие им пункты в меню. Описание исходных данных, интерфейса и работы каждой процедуры.
курсовая работа [997,3 K], добавлен 08.06.2014Внедрение информационных технологий в работу органов государственного управления, бизнеса. Юридическая сила электронного документа, его электронно-цифровая подпись. Применение системы автоматизации документооборота. Процедуры разрешения конфликтов.
контрольная работа [21,0 K], добавлен 14.03.2014Основные примеры работы процедуры слияния и обеспечение его стабильности. Листинг реализации процедуры слияния на языке программирования C++. Формализация алгоритма рекурсивным и итерационным способомами. Восходящая, гибридная и естественная сортировка.
курсовая работа [363,9 K], добавлен 24.05.2015Возможности библиотеки OpenGL, создание матрицы и эффекта тумана. Разработка процедуры визуализации трехмерной модели "Корабль", интерфейса пользователя и подсистемы управления событиями. Логическая структура и функциональная декомпозиция проекта.
курсовая работа [507,2 K], добавлен 02.07.2011Понятие и содержание процедур и функций среды TP как логически самостоятельных фрагментов программы. Описание списка формальных параметров процедуры Pascal и преобразование подпрограммы в массив. Локализация имен и правила работы с модулями среды TP.
презентация [154,6 K], добавлен 10.10.2013Основные понятия структур сложной программы. Инкапсуляция программ со сложной структурой, особенности их реализации и предъявляемые требования, подходы к проектированию в целом, объектно-ориентированные языки. Процедуры, их типизация, основные параметры.
курсовая работа [48,6 K], добавлен 09.04.2013Анализ предметной области. Этапы организации хранилища информации об оплате услуг. Проектирование базы данных. Модели представления системы. Обобщенный алгоритм работы клиента. Контекстные диаграммы, таблицы, хранимые процедуры, интерфейс пользователя.
дипломная работа [2,0 M], добавлен 17.07.2017Запись макроса в VBA в Excel. Структура редактора, основные окна и элементы управления. Правила создания процедуры, функций. Коды задания командных кнопок. Виды условных операторов. Циклическая обработка инструкций. Разработка пользовательских приложений.
методичка [2,4 M], добавлен 18.11.2011Процедурные средства манипулирования данными, расширения. Управляющие конструкции: условные операторы, передача управления. Функции, возвращающие таблицу inline. Триггеры в MS SQL Server, последовательность срабатывания. Использование inserted, deleted.
презентация [67,7 K], добавлен 06.01.2014Классификация информационных систем и технологий в организационном управлении. Методы и организация создания ИС и ИТ. Состав, структура, внутримашинного информационного обеспечения. Информационные технологии и процедуры обработки экономической информации.
контрольная работа [28,9 K], добавлен 25.07.2012Принцип работы основных операторов языка программирования Turbo-Paskal: оператор присваивания, выбора Case, безусловного перехода, цикла, уловный, составной. Формальное описание и вызов функции и процедуры. Требования к списку фактических параметров.
реферат [261,8 K], добавлен 09.02.2011Реализация решения нелинейного уравнения с заданными параметрами в виде процедуры-подпрограммы. Графический метод отделения корней уравнения. Основные методы уточнения корней уравнения. Описание процедур и функций, общий алгоритм и текст программы.
курсовая работа [1,7 M], добавлен 27.03.2011Принципиальные, функциональные схемы системы многоступенчатых, регенеративных прогревателей: оценка наблюдаемости, управляемости и устойчивости математической модели. Синтез САУ методом последовательной коррекции с подчиненным, оптимизационные процедуры.
курсовая работа [397,0 K], добавлен 15.11.2009Типовая структура информационно-вычислительной сети. Функции, процедуры, механизмы и средства защиты ИВС. Технология виртуальных частных сетей. Разработка алгоритмов управления интенсивностью информационного обмена удаленных сегментов распределенной ИВС.
дипломная работа [2,1 M], добавлен 21.12.2012