Детерминированные процедуры управления с поводырем в дифференциальных играх нескольких лиц

Разработка процедуры управления с поводырем для антагонистических дифференциальных игр двух лиц, которая свободна от этого недостатка. Применение на практике процедуры управления движением, являющейся модификацией процедуры управления с поводырем.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 26.04.2019
Размер файла 221,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Пермский государственный национальный исследовательский университет

Детерминированные процедуры управления с поводырем в дифференциальных играх нескольких лиц

С.В. Лутманов

Результаты, полученные в данной статье, позволили в условиях отсутствия у игроков полной информации о реализующемся фазовом векторе доказать альтернативное утверждение относительно исхода дифференциальной игры нескольких лиц, аналогичное тому, что было доказано в работе [2].

Доказательство альтернативного утверждения основывается на сведении дифференциальной игры лиц к вспомогательным антагонистическим дифференциальным играм двух лиц, происходящим на попарно непересекающихся областях пространства исходной игры.

В рассматриваемых антагонистических играх применяется процедура управления движением, являющаяся модификацией процедуры управления с поводырем [1].

1. Постановка дифференциальной игры "наведения-уклонения" нескольких лиц

Динамика конфликтно-управляемого объекта описывается обыкновенным векторным дифференциальным уравнением

, (1.1)

где - текущее время, - фазовый вектор объекта, - вектор управляющих параметров i-го игрока, - вектор-функция, описывающая как внутреннее устройство объекта, так и воздействие различных внешних факторов. Будем предполагать, что множества компактны, а функция непрерывна по совокупности переменных .

Относительно правых частей дифференциальных уравнений (1.1) принимаются стандартные в теории дифференциальных игр предположения:

1) локальные условия Липшица

,

;

2) условия продолжимости решения

.

3) выполнено условие существования седловой точки в "маленькой игре" нескольких лиц, т. е. для всех номеров и векторов выполняется равенство

,

, (1.2)

где .

Условие (1.2), в частности, имеет место для функций вида

.

В пространстве -му игроку ставится в соответствие компактное множество , которое будем называть целевым множеством этого игрока. Неформальная цель игрока состоит в приведении фазового вектора игры в конечный момент времени на свое целевое множество. В случае если в конечный момент времени фазовый вектор игры не принадлежит ни одному из целевых множеств, то считается, что в игре достигнут компромисс.

В предположении, что целевые множества игроков попарно не пересекаются, в работе [2] было доказано альтернативное утверждение относительно исходов игры. Аналогичное утверждение доказывается и в данной статье. Однако в отличие от работы [2] здесь игроки не располагают полной информацией о реализующемся фазовом векторе. При этом предполагается, что результат измерения фазового вектора один и тот же для всех игроков и погрешность измерения не превышает величину .

Таким образом, имеет место неравенство , где действительное, а измеренное значение фазового вектора игры.

2. Управление с поводырем в антагонистической дифференциальной игре двух лиц

Рассмотрим антагонистическую дифференциальную игру двух лиц наведения-уклонения , где некоторое компактное множество. Пусть стабильный мост первого игрока. Символом обозначим сечение множества в момент времени .

Опишем модифицированную процедуру управления с поводырем первого игрока.

Рассмотрим отображение , ставящее каждой тройке в соответствие вектор по следующему правилу:

если и , то вектор удовлетворяет равенству

; (2.1)

если или , но , то вектор произвольный элемент множества .

Пусть разбиение промежутка времени на полуинтервалы .

Символом обозначим процедуру управления первого игрока, предписывающую ему выбирать свои управляющие воздействия из условия

,

где наблюдаемое значение фазового вектора игры в момент времени .

Векторы определяются по следующему правилу (построение производится только в те моменты времени для которых ). В начальный момент времени вектор находится из равенства

(2.2)

причем если вектор определяется из равенства (2.2) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству.

Пусть вектора уже построены. Если , то полагается . В противном случае вектор определяется в зависимости от значения . Когда , вектор находим из равенства

(2.3)

причем если вектор определяется из равенства (2.3) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Когда , строится вспомогательное движение , определенное на полуинтервале . Оно отождествляется на нем с интегральной кривой дифференциального уравнения в контингенциях

,

где вектор удовлетворяет равенству

.

Относительно интегральной кривой требуется, чтобы выполнялось включение . Существование такой интегральной кривой гарантируется свойством стабильности множества .

Рассмотрим функцию , кусочно-непрерывную, допускающую разрывы лишь в точках и непрерывную слева в точках разрыва. На полуинтервале она отождествляется со вспомогательным движением , если оно существует на этом полуинтервале.

В противном случае полагается, что функция на полуинтервале совпадает с таким решением дифференциального уравнения в контингенциях

,

для которого выполняется .

Определение 1. Процедуру управления будем называть модифицированной детерминированной процедурой управления с поводырем первого игрока в игре .

Определение 2. Движением , выходящим из позиции и порожденным процедурой управления первого игрока, будем называть решение дифференциального уравнения

.

Здесь произвольная интегрируемая функция со значениями в множестве .

На рисунке приводится графическая иллюстрация модифицированной детерминированной процедуры управления с поводырем.

Можно показать [3], что модифицированная процедура управления с поводырем, как и исходная, удерживает порожденное ею движение в малой окрестности стабильного моста. Другими словами, справедливо следующее утверждение.

Теорема 1. Для любых и найдутся числа и , такие, что для движения будет выполнено включение

,

если и

.

В частности, если , то из теоремы 1 следует включение , т.е. первый игрок решает задачу наведения на окрестность своего целевого множества.

3. Управление с поводырем в дифференциальной игре нескольких лиц

Пусть разбиение пространства позиций дифференциальной игры нескольких лиц на множества . При этом

1) множества открыты и попарно не пересекаются;

2) множество замкнуто и ;

3) для всех множество

является стабильным мостом [2].

Рассмотрим отображение , ставящее каждой тройке в соответствие набор векторов по следующему правилу:

- если при некотором номере и , то набор векторов удовлетворяет равенству

,

, (3.1)

вектор полагается произвольным вектором из ;

- если , то набор векторов полагается произвольным набором векторов из множества .

Пусть разбиение промежутка времени на полуинтервалы .

Символом обозначим процедуру управления игроков, которая предписывает им выбирать свои управляющие воздействия из условия

,

где наблюдаемое значение фазового вектора игры в момент времени . Векторы определяются по следующему правилу (построение производится только в те моменты времени , для которых ).

В начальный момент времени вектор находится из равенства

(3.2)

причем если вектор определяется из равенства (3.2) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству.

Пусть вектора уже построены.

Если , то полагается .

Если (т.е. для некоторого номера ), то вектор определяется в зависимости от значения . В случае вектор находится из равенства

(3.3)

причем если вектор определяется из равенства (3.3) неоднозначно, то берется любой вектор, удовлетворяющий этому равенству. В случае строится вспомогательное движение , определенное на полуинтервале . Оно отождествляется на нем с интегральной кривой дифференциального уравнения в контингенциях

,

где символ замкнутой выпуклой оболочки, а вектор удовлетворяет равенству

.

Относительно интегральной кривой требуется, чтобы выполнялось включение . Существование такой интегральной кривой гарантируется свойством 4) разбиения . В рассматриваемом случае полагаем .

Определение 4. Процедуру управления будем называть детерминированной процедурой управления с поводырем всех игроков в дифференциальной игре нескольких лиц.

Определение 5. Движением , выходящим из позиции и порожденным процедурой управления , будем называть решение дифференциального уравнения

,

. (3.4)

Уклонение какого-либо игрока от процедуры управления с поводырем будем моделировать тем, что в правой части дифференциального уравнения (3.4) постоянный на каждом промежутке времени вектор следует заменить произвольной интегрируемой реализацией вектора управляющих параметров соответствующего игрока, подчиненной ограничению . Пучок движений, получающийся в результате такого уклонения, обозначим символом

.

Теорема 2. Пусть разбиение пространства позиций дифференциальной игры нескольких лиц со свойствами 1)-3). Тогда для любых и достаточно малого числа найдутся числа и , такие, что для всех и всякого движения будет выполнено .

Доказательство. От противного приходим к существованию начальной позиции и числа , таких, что для любых чисел и найдется номер и движение , для которых выполняется условие

.

Процедура управления в рассматриваемой области фазового пространства представляет собой модифицированную процедуру управления с поводырем первого игрока в антагонистической дифференциальной игре . В силу теоремы 1 она обеспечивает включение для достаточно малых величин . Получили противоречие, которое доказывает утверждение теоремы.

Из доказанной теоремы 2, в частности, следует, что если , , то для всех движений будет выполнено . Таким образом, с точностью до величины в дифференциальной игре "наведения-уклонения" нескольких лиц имеет место компромисс.

4. Альтернативное утверждение относительно исходов игры

Пусть в дифференциальной игре, описанной в п. 1, целевые множества игроков попарно не пересекаются. Тогда справедливо следующее альтернативное утверждение.

Теорема 3. Для всякой начальной позиции либо существует номер , что для любого числа найдутся числа и , такие, что всякое движение , порожденное модифицированной процедурой управления первого игрока в антагонистической дифференциальной игре [2], будет удовлетворять включению .

Либо для достаточно малого числа найдутся числа и , такие, что процедура управления с поводырем всех игроков для всех и всякого движения обеспечивает выполнение условия .

Доказательство. Пусть для некоторого номера позиция принадлежит максимальному -стабильному мосту. Тогда в силу теоремы 1 имеет место первая возможность доказываемой альтернативы.

По условию теоремы целевые множества игроков попарно не пересекаются. Тогда попарно не пересекаться и максимальные -стабильные мосты игроков. Из работы [2] следует, что для любого существует разбиение пространства позиций игры на множества , удовлетворяющее свойствам 1)-3). В случае когда величина достаточно мала, разбиение будет дополнительно удовлетворять условию .

Тогда в силу теоремы 2 реализуется вторая возможность альтернативы.

Теорема доказана.

Список литературы

дифференциальный игра управление поводырь

1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.

2. Лутманов С.В. Об одном альтернативном утверждении относительно исхода дифференциальной игры "наведения-уклонения" нескольких лиц в классе "чистых" и "смешанных" стратегий // Вестн. Перм. ун-та. Математика. Механика. Информатика. 2011. Вып. 1(5). С. 53-61.

3. Лутманов С.В. Управление с поводырем в дифференциальных играх нескольких лиц // Деп. ВИНИТИ № 2773-81, 08.06.81. 47 с.

Размещено на Allbest.ru

...

Подобные документы

  • Анализ модели информационно-телекоммуникационной системы предприятия. Виды угроз информационной безопасности. Цели и задачи защиты информации на предприятии. Разработка процедур контроля системы управления защитой информации в корпоративной сети.

    дипломная работа [3,6 M], добавлен 30.06.2011

  • Исследование основных требований к системе управления взаимоотношениями с клиентами. Разработка логической структуры базы данных. Хранимые процедуры и триггеры. Особенности их использования. Настройка репликации в СУБД Postgres. Настройка сервера LDAP.

    курсовая работа [926,8 K], добавлен 26.01.2013

  • Разработка структуры базы данных библиотеки для улучшения качества обслуживания, создания информационной базы и упрощения работы персонала. Создание объектов базы на языке sql-запросов. Создание хранимой процедуры с курсором, демонстрация процедуры.

    курсовая работа [1,3 M], добавлен 28.12.2012

  • Функции планировщика процессов: добровольный вызов, переключение между процессами, анализ нажатия клавиш Ctrl-D. Составление алгоритма работы программы, разработка процедуры планировщик и процедуры анализа клавиш. Организация интерфейса пользователя.

    курсовая работа [480,2 K], добавлен 20.01.2015

  • Работа с файлами на языке Pascal. Типы файлов: типизированные, текстовые, нетипизированные. Сущность процедуры и функции. Использование процедуры Read и Write для операций чтения и записи в типизированном файле. Листинг программы и экранные формы.

    лабораторная работа [38,4 K], добавлен 13.02.2009

  • Разработка нового технического оборудования. Изготовление и эксплуатация цифровых устройств. Модель элемента дискретного устройства. Алгоритм загрузки логического элемента из файла и процедуры моделирования. Используемые методы, процедуры и функции.

    курсовая работа [306,1 K], добавлен 24.06.2012

  • Разработка база данных в виде таблицы, включающей поля: ФИО, адрес, номер телефона, наименование услуги, сумма оплаты, срок выполнения. Процедуры программы и соответствующие им пункты в меню. Описание исходных данных, интерфейса и работы каждой процедуры.

    курсовая работа [997,3 K], добавлен 08.06.2014

  • Внедрение информационных технологий в работу органов государственного управления, бизнеса. Юридическая сила электронного документа, его электронно-цифровая подпись. Применение системы автоматизации документооборота. Процедуры разрешения конфликтов.

    контрольная работа [21,0 K], добавлен 14.03.2014

  • Основные примеры работы процедуры слияния и обеспечение его стабильности. Листинг реализации процедуры слияния на языке программирования C++. Формализация алгоритма рекурсивным и итерационным способомами. Восходящая, гибридная и естественная сортировка.

    курсовая работа [363,9 K], добавлен 24.05.2015

  • Возможности библиотеки OpenGL, создание матрицы и эффекта тумана. Разработка процедуры визуализации трехмерной модели "Корабль", интерфейса пользователя и подсистемы управления событиями. Логическая структура и функциональная декомпозиция проекта.

    курсовая работа [507,2 K], добавлен 02.07.2011

  • Понятие и содержание процедур и функций среды TP как логически самостоятельных фрагментов программы. Описание списка формальных параметров процедуры Pascal и преобразование подпрограммы в массив. Локализация имен и правила работы с модулями среды TP.

    презентация [154,6 K], добавлен 10.10.2013

  • Основные понятия структур сложной программы. Инкапсуляция программ со сложной структурой, особенности их реализации и предъявляемые требования, подходы к проектированию в целом, объектно-ориентированные языки. Процедуры, их типизация, основные параметры.

    курсовая работа [48,6 K], добавлен 09.04.2013

  • Анализ предметной области. Этапы организации хранилища информации об оплате услуг. Проектирование базы данных. Модели представления системы. Обобщенный алгоритм работы клиента. Контекстные диаграммы, таблицы, хранимые процедуры, интерфейс пользователя.

    дипломная работа [2,0 M], добавлен 17.07.2017

  • Запись макроса в VBA в Excel. Структура редактора, основные окна и элементы управления. Правила создания процедуры, функций. Коды задания командных кнопок. Виды условных операторов. Циклическая обработка инструкций. Разработка пользовательских приложений.

    методичка [2,4 M], добавлен 18.11.2011

  • Процедурные средства манипулирования данными, расширения. Управляющие конструкции: условные операторы, передача управления. Функции, возвращающие таблицу inline. Триггеры в MS SQL Server, последовательность срабатывания. Использование inserted, deleted.

    презентация [67,7 K], добавлен 06.01.2014

  • Классификация информационных систем и технологий в организационном управлении. Методы и организация создания ИС и ИТ. Состав, структура, внутримашинного информационного обеспечения. Информационные технологии и процедуры обработки экономической информации.

    контрольная работа [28,9 K], добавлен 25.07.2012

  • Принцип работы основных операторов языка программирования Turbo-Paskal: оператор присваивания, выбора Case, безусловного перехода, цикла, уловный, составной. Формальное описание и вызов функции и процедуры. Требования к списку фактических параметров.

    реферат [261,8 K], добавлен 09.02.2011

  • Реализация решения нелинейного уравнения с заданными параметрами в виде процедуры-подпрограммы. Графический метод отделения корней уравнения. Основные методы уточнения корней уравнения. Описание процедур и функций, общий алгоритм и текст программы.

    курсовая работа [1,7 M], добавлен 27.03.2011

  • Принципиальные, функциональные схемы системы многоступенчатых, регенеративных прогревателей: оценка наблюдаемости, управляемости и устойчивости математической модели. Синтез САУ методом последовательной коррекции с подчиненным, оптимизационные процедуры.

    курсовая работа [397,0 K], добавлен 15.11.2009

  • Типовая структура информационно-вычислительной сети. Функции, процедуры, механизмы и средства защиты ИВС. Технология виртуальных частных сетей. Разработка алгоритмов управления интенсивностью информационного обмена удаленных сегментов распределенной ИВС.

    дипломная работа [2,1 M], добавлен 21.12.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.