Командная работа агентов в реальном времени

Анализ вопросов управления работой команды интеллектуальных агентов. Подход к обеспечению работы команды агентов в условиях временных ограничений (в реальном времени), основанный на комбинировании моделей приближенных вычислений и anytime-алгоритмов.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 16.01.2018
Размер файла 102,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

Командная работа агентов в реальном времени

И. В. Котенко

Л. А. Станкевич

В статье рассматриваются вопросы управления работой команды интеллектуальных агентов. Определяются обобщенные модели командной работы. Предлагается подход к обеспечению работы команды агентов в условиях временных ограничений (в реальном времени), основанный на комбинировании моделей приближенных вычислений и anytime-алгоритмов. Описываются примеры моделей построения команд агентов, реализующих данный подход, для двух приложений: симуляционного футбола роботов и моделирования боевых действий, реализуемых группой беспилотных летательных аппаратов.

команда интеллектуальный агент

1. Введение

Командная работа агентов актуальна для множества приложений (программные поисковые агенты в сети Интернет, управление коллективом совместно работающих мобильных объектов, компьютерное моделирование различных форм боевых действий, футбол роботов и т.д.).

Согласно современным представлениям, управление командной работой должно выполняться распределенными иерархическими системами с развитыми функциями координации и управления. Ключевой проблемой в таких системах является координация в реальном времени коллективного поведения членов команды, распределено решающих общую задачу. Специфика проблемы заключается в том, что агенты, составляющие команду, обладают общими и частными навыками и собственным поведением, неполными знаниями об окружающей среде и ограниченными ресурсами. При этом должны быть способны выполнить общую задачу посредством реализации индивидуальных задач и коммуникации. Каждый такой агент действует в динамически меняющейся среде, и его действия привязаны ко времени и пространству. Члены команды при выполнении запланированных операций могут объединяться в подгруппы и подчиняться лидеру (назначенному или выбранному). Они функционируют внутри антагонистической среды, которая может мешать их командным действиям.

Существует несколько подходов к описанию и формализации командной работы агентов [7]. Один их них, известный под названием “Теория общих намерений”, предложенный в работе [3], формулирует, в основном, общие рамки, определяющие командное поведение и характер взаимодействия членов команды. Второй, более формализованный подход, описанный в работе [8], известен под названием “Теория общих планов”. В работе [18] ключевые идеи обоих подходов обобщены, частично объединены и использованы при создании программного инструментария для разработки приложений в области командной работы агентов.

Одним из важнейших требований к командной работе агентов является обеспечение гарантированного решения задач в режиме реального времени (при временных ограничениях). Существующие подходы к решению проблемы обеспечения временных ограничений основываются на применении следующих архитектур:

(1) реактивные архитектуры (называемые также рефлективными), в которых элементы вывода построены в виде множества пар “стимул реакция” ([1], [4] и др.);

(2) архитектуры, базирующиеся на использовании нескольких асинхронно действующих подсистем ([10], [15] и др.);

(3) простые “делиберативные” архитектуры (например, как в системе PRS [12]), в которой механизмы поиска определенным образом ограничены для обеспечения предсказуемости общего времени реакции (отклика) системы;

(4) более сложные делиберативные архитектуры, основанные на использовании механизмов приближенных вычислений [14], “гибких” вычислений [11], делиберативного планирования вычислений [2], планирования вычислений “проектирование ко времени” [5], планирования вычислений “проектирование по критериям” [19], контрактных anytime-алгоритмов ([20], [21] и др.) и прерываемых anytime-алгоритмов ([9] и др.), которые базируются на инкрементных методах улучшения решения;

(5) комбинированные архитектуры, построенные путем интеграции различных делиберативных механизмов планирования вычислений и других механизмов ([6], [13] и др.).

Целью настоящей статьи является разработка архитектур и моделей принятия решений, которые позволят командам агентов решать сложные поведенческие задачи в реальном времени. В статье рассмотрена обобщенная модель управления командной работой, раскрыт предлагаемый подход к обеспечению командной работы в условиях временных ограничений, представлена реализующая данный подход модель агента-футболиста, обеспечивающая симуляцию командной игры, а также кратко описана модель агента-пилота, которая может обеспечить командную работу группы беспилотных летательных аппаратов.

2. Управление командной работой

Команда агентов должна обеспечивать достижение общих целей в динамической внешней среде в присутствии шума и противодействия со стороны соперника. Командная работа есть нечто большее, чем просто скоординированное множество индивидуальных действий отдельных агентов. Принято говорить, что в командной работе агенты “сотрудничают”. Сотрудничество есть специальный вид скоординированной деятельности агентов, в которой они совместно решают некоторую задачу для достижения общей цели. Основной вопрос при организации командной работы агентов состоит в том, каким образом можно обеспечить работу агентов как единой команды в ситуации, когда каждый из агентов реализует собственные намерения с помощью индивидуальных действий, исполняемых параллельно или последовательно с действиями других агентов.

Настоящая работа базируется на идеях, изложенных в работе [18]. Предполагается, что командная работа агентов организуется (рис.1) с помощью общего (группового) плана действий, особенности которого заключаются в следующем: (1) групповой план действий требует, чтобы команда агентов пришла к согласию выполнять предписание (множество заданных инструкций); (2) агенты должны принять на себя обязательства по отношению не только к своим индивидуальным действиям, но также к действиям других агентов и действиям группы в целом; (3) план групповой деятельности может иметь в качестве компонентов как планы индивидуальных агентов для назначенных действий, так и планы подгрупп; (4) при выполнении командной работы агенты команды должны с помощью коммуникаций прийти к согласию с предписанием, а также согласовать собственные намерения друг с другом (рис.1).

Каждый агент команды должен иметь механизм для принятия решений о том, кто именно будет выполнять отдельные действия (рис.2). Агент может иметь два вида планов: полный общий план и частичный общий план.

Полный общий план детально описывает все аспекты последовательности совместных действий команды агентов, что включает совместные убеждения агентов команды и общее согласие команды выполнять совместные действия согласно некоторому исчерпывающе описанному предписанию. Это предписание содержит в себе описание множества отдельных действий и множества условий их выполнения. Полный общий план должен описывать все множество взаимосвязанных намерений и убеждений агентов, вовлеченных в команду.

Однако на практике команда не имеет полного общего плана, а располагает только частичным общим планом, который представляет собой только некоторый “срез” ментального состояния команды в частной ситуации, возникающей в процессе командной работы.

В рамках общего плана агенты могут иметь план подгруппы, в которой они должны тесно взаимодействовать при выполнении запланированной последовательности действий, а также собственные индивидуальные планы. Коммуникации агентов имеют целью восполнить условия полного общего плана. В процессе коммуникации групповые намерения согласуются с групповыми убеждениями, в результате чего вырабатывается согласие выполнять предписание по планируемой последовательности действий группы агентов. Кроме того, согласуются индивидуальные намерения и убеждения агентов подгрупп, в результате чего вырабатывается согласие выполнять предписанное агенту действие из планируемой последовательности.

Существенное влияние на качество командной работы оказывает тип и архитектура реализуемых агентов. Предполагается, что агенты могут быть гетерогенными и иметь реактивную, делиберативную или когнитивную архитектуру. Реактивные агенты реализуют командную работу в соответствии с набором правил, определяющих текущее взаимодействие агентов по типу “стимул-реакция”. Делиберативные или разумные агенты используют модель мира в символьной форме и принимают координированные решения о действиях на основе формальных рассуждений. Когнитивные агенты являются интеллектуальными агентами, построенными как когнитивные системы, имеющие нервно-системную организацию структур, функций и поведения [16]. Они решают задачи координации и выбора поведения с использованием когнитивных структур, которые способны обучаться и принимать решения ассоциативно.

3. Обеспечение временных ограничений

Каждый агент, входящий в состав команды, должен получать информацию о внешней среде и непосредственно влиять на нее через свои действия, выполняя заданную подцель функционирования. Для адекватного взаимодействия с внешней средой агент должен удовлетворять требованию функционирования в реальном масштабе времени. Это требование подразумевает реализацию агентом процедуры выбора и принятия решений о своих действиях за выделенное время, гарантируя соответствие между скоростями реакции агента и изменений среды при максимально достижимом качестве решений. Выполнению этого требования препятствует то, что агенты обладают ограниченной “рациональностью” и “реактивностью”, так как они имеют ограниченное быстродействие и память.

Управление командной работой в условиях временных ограничений предлагается осуществлять путем интеграции различных делиберативных механизмов планирования вычислений, в том числе полных моделей и алгоритмов решения задач, приближенных вычислений, контрактных и прерываемых anytime-алгоритмов. Приближенные вычисления реализуют модели решения задач и подзадач, различные по времени и качеству. Прерываемые алгоритмы основываются на том, что их выполнение может быть прервано в любой момент, причем к моменту прерывания обеспечивается получение определенного результата, качество которого возрастает с ростом предоставляемого времени. Контрактные алгоритмы обеспечивают получение решения к назначенному времени, а затем могут улучшать решение. Преимущество anytime-алгоритмов заключается в том, что при их использовании агент имеет некоторый вариант решения в любое заданное время после получения первого (грубого) решения.

В соответствии с данным подходом предполагается, что в состав агента кроме компонентов, свойственных соответствующей архитектуре агента, входят также библиотеки {L} алгоритмов решения задач принятия решений, разделенные по уровням и выполняемые агентом, а также модули MPMR планирования, мониторинга и перепланирования процесса принятия решений, также разделенные по уровням.

Библиотеки {L} могут включать полные и приближенные модели решения задач и подзадач, обладающие различной вычислительной сложностью, точностью, определенностью и полнотой учета различных факторов, а также контрактные и прерываемые anytime-алгоритмы.

Каждому алгоритму из {L} ставятся в соответствие так называемые условные профили их выполнения. Эти профили в общем случае задают условие применения алгоритма (выполняемую задачу, ситуацию предметной области и имеющиеся вычислительные ресурсы) и вероятностные (возможностные) показатели качества решений в зависимости от выделенного времени и показателей качества исходных данных.

Общую модель принятия решений агентом с учетом удовлетворения временных ограничений зададим в виде:

TC=<M, C, R, T, S, P, A, RA>,

где M={mi} - множество задач, реализуемых агентом;

C={cj} - множество выделенных ситуаций предметной области, в которых может находиться агент;

R={rl} - вычислительные ресурсы агента (rl - количество ресурсов l-го типа);

T - временное ограничение на принятие решения;

P={ps} - профили алгоритмов из {L};

A=({(ar, tr, qr)}, p) - структура алгоритмов из {L}, используемых для принятия решений (ar - r-й алгоритм из {L}, tr - время выполнения ar, qr - показатель качества выполнения ar, p - отношение порядка, заданное на структуре алгоритмов);

RA: MCRTP max Q A - правила выбора структуры алгоритмов из {L} за заданное время T с наилучшим возможным качеством, реализуемых MPMR,

Q - показатель качества принятия решений.

На рис.3 показана обобщенная схема, отражающая процесс реализации предлагаемой техники принятия решений агентом. Здесь модуль МPMR включает три компоненты: планирования МP , мониторинга МM и перепланирования МR. На общие входы этих компонент приходят значения параметров от блока ограничений на компьютерные ресурсы. Последний получает информацию о текущем состоянии управляемого объекта и среды, формируемую модулем анализа текущей ситуации, который, в свою очередь, перерабатывает информацию, появляющуюся в моделях внутреннего состояния и мира объекта. При появлении новой информации на входах компонента МP формирует на выходе сигналы, определяющие заранее запланированные действия при выборе подходящих алгоритмов принятия решений, и подает их на входы компоненты МM. Компонента МR может корректировать запланированный выбор алгоритма принятия решения, если это необходимо. Компонента МM реализует откорректированный выбор алгоритма принятия решения из библиотеки алгоритмов. Выбранный таким образом алгоритм реализуется модулем принятия решений.

Реализация механизмов удовлетворения временных ограничений при принятии решений командой агентов предполагается на трех уровнях:

(1) уровне решения общей задачи команды, предписывающей последовательность выполнения отдельных подзадач;

(2) уровне отдельных подзадач, каждая из которых выполняется отдельным агентом и требует реализации последовательности определенных алгоритмов;

(3) уровне реализации агентом конкретных алгоритмов.

Обобщенный алгоритм принятия решений агентом с учетом временных ограничений выполняется в виде непрерывного цикла и состоит из следующих шагов:

(1) выбор, генерация и (или) модификация модели (плана) решения задачи;

(2) прогнозирование требуемого времени и параметров качества формируемого решения;

(3) определение, будет ли выполнена задача за отведенное время, и будут ли варианты решений удовлетворять заданным требованиям. Если ответ - отрицательный, выполняется переход на шаг 5;

(4) реализация принятия решений в соответствии с выбранной моделью. Динамическое прогнозирование и отслеживание времени, требуемого для завершения решения задачи и показателей качества формируемого решения (для сравнения текущих и спрогнозированных значений). В случае расхождения значений - переход на шаг 3. Иначе - завершение алгоритма;

(5) идентификация состояния процесса принятия решений и выбор (генерация) наиболее приемлемой Ап модели решения задачи, ее отдельных подзадач и алгоритмов. Переход на шаг 2.

4. Приложения командной работы агентов и реализации механизмов обеспечения временных ограничений

В качестве первого приложения командной работы агентов рассмотрим функционирование команды виртуальных роботов-футболистов. Агенты-футболисты работают в стандартной игровой среде симуляционной лиги RoboCup [17].

Поскольку цикл симуляции ограничен, эта среда является весьма показательной для исследования алгоритмов принятия решений агентами в условиях временных ограничений. Первые реализованные авторами агенты-футболисты имели реактивную архитектуру [16]. Принятие решений о действиях в текущей ситуации такими агентами осуществлялось с помощью системы правил, образующих сложное дерево решений. В некоторых наиболее сложных случаях, например, при выполнении пасов, принятие решений приводило к очень большому объему вычислений, которые не укладывались в симуляционный цикл. Это приводило к задержкам действий и снижению эффективности игры команды.

Разрабатываемые в настоящее время агенты-футболисты с когнитивной архитектурой содержат дополнительные обучаемые средства планирования командной работы и ее реализации с учетом временных ограничений при принятии решений.

Представим краткое описание архитектуры когнитивного агента, разработанного с целью существенного повышения эффективности игры. Когнитивный агент включает три уровня (рис.4):

(1) физических действий (“Действия”);

(2) индивидуального поведения (“Поведение”);

(3) координированного поведения (“Координация”).

На уровне физических действий используются модули, вырабатывающие команды управления игроком через актуаторы сервера: библиотека алгоритмов (аппроксимаций); модуль управления планом (MPMR) - для формирования управляющих воздействий на другие модули этого уровня в соответствии с планом, выбранным на среднем уровне; модуль управления движением - для управления игроком с помощью выработки соответствующей последовательности команд turn (поворот) и dash (ускорение); модуль управления ударами и пасами - для координированного управления игроком при выполнении ударов по воротам и пасов, реализуемых с помощью команды kick (удар); модуль обработки сенсорной информации - для получения информации от сервера с помощью команд sense_body (позиция тела), change_view (изменение угла обзора); модуль управления обменом - для координирующего управления приемом и передачей сообщений через канал связи с помощью команд коммуникации say (говорить) и hear (слышать).

Уровень индивидуального поведения представляет собой средний уровень управления игроком, вырабатывающий и исполняющий план поведения игрока, действующего в индивидуальном режиме. Этот уровень включает следующие модули: база знаний (БЗ) агента - для накопления и хранения планов и аппроксимаций индивидуального поведения игрока в различных игровых ситуациях; модуль мониторинга и выбора текущего плана (MPMR) - для отслеживания текущей ситуации и генерации плана действий при игре в индивидуальном режиме или выполнении сценария координации при выполнении задания в группе игроков.

Уровень координированного поведения является высшим уровнем управления игроком. На данном уровне вырабатывается сценарий действий группы игроков, решающих общую задачу. Сюда включены следующие модули: локальная часть распределенной БЗ - для накопления и хранения определенной для данного игрока, как члена группы, части БЗ, необходимой для выполнения своего задания при реализации сценария (включая аппроксимации); база сценариев - для накопления и хранения набора сценариев координированного поведения игрока в группе при выполнении своего задания; модуль мониторинга и выбора сценария - для отслеживания текущей ситуации и генерации сценария; модуль коммуникации - для передачи и приема сообщений от других игроков своей команды и команды противника.

Для обеспечения работы агента на всех уровнях используются дополнительные компоненты: модели мира и внутреннего состояния агента, модули представления поля, выбора стратегии игры, распознавания ситуаций и синхронизации.

Пример применения приближенных вычислений при принятии решения агентом-футболистом о пасе проиллюстрирован на рис.5. Здесь pi P (i = 1, ..., 11; i N) - набор возможных партнеров для выполнения паса от игрока N; oi O (i = 1, ..., 11; i N) - набор возможных оппонентов. При выполнении паса введена концепция “точки паса”, привязанной к партнеру, которому предполагается дать пас. Для каждого партнера pi имеется фиксированное для текущей ситуации число точек паса, которое может меняться от ситуации к ситуации. Обозначим набор таких точек с использованием обозначения Api для pi P, и отметим все точки как aij Api (j = 1, ..., T). Каждая точка паса aij характеризуется двумя векторами pN pj и pN aMj . Эти векторы определяют путь, который должен быть пройден i-м партнером, чтобы поймать мяч. Для каждой точки aij имеется оценка Eaij качества паса, вычисляемая как функция векторов pN pj и pN aMj, т.е.

Eaij = f(pN pj, pN aMj, O).

Эта функция является взвешенной суммой частных оценок:

Eaij = wp Ep(aij, O) + wi Ei(aij, O) + wk Ek(pN, pj) + ws Ep Ei Ek ,

где Ep - некоторая функция “плотности” оппонентов в зоне мяча; Ei - функционал “захватываемости” мяча; Ek - функционал относительной позиции пасующего игрока и игрока, который получает пас; wp, wi, wk, ws - фиксированные веса компонентов.

Наилучшая оценка определяется как

Ebest = maxj(maxi Eaij) (i = 1, ..., 11; i N; j = 1, ..., T) .

На основе наилучшей оценки выбирается партнер jbest и точка паса ibest .

Анализ процедуры вычисления наилучшей оценки показал, что время ее реализации для полного набора партнеров и оппонентов может существенно превысить максимальное время, отведенное на принятие решения. Это приводит к неправильному поведению игрока и, в результате, команда может потерять мяч. Применение anytime-алгоритмов позволяет уменьшить при необходимости время принятия решений и выполнить пас с качеством, зависящим от лимита времени.

В качестве приближенных алгоритмов принятия решений при выборе параметров пасов (номер партнера и номер точки паса) используются следующие алгоритмы:

С уменьшенным числом кандидатов паса - при незначительной потере качества паса может быть отброшено до 30-50% возможных решений, если использовать такие простые критерии выбора кандидатов, как “слишком далеко” (пас невозможен) и (или) “слишком близко” (пас не имеет смысла);

С уменьшенным числом точек паса - уменьшение числа точек паса позволяет уменьшить набор текущих решений на 25-40% с потерей качества паса около 10-20%;

С переменным числом точек паса - разделение набора точек паса на поднаборы T2, ..., TM , покрывающие весь набор, позволяет использовать приближенные оценки паса с изменяемыми поднаборами точек паса (сначала наиболее предпочтительные, а затем оставшиеся).

В качестве другого приложения авторами разрабатывается система моделирования координированных действий группы беспилотных летательных аппаратов в динамических условиях (определяемых отказами аппаратов и противодействием противника). Эффективное достижение общих целей команды требует реализации аппроксимаций действий отдельных агентов-пилотов, аппроксимаций действий агентов-пилотов в команде и перепланирования операций при отказе или поражении аппаратов.

Используется следующий вариант децентрализованного управления: каждый агент-пилот оценивает обстановку и принимает решения о возможном изменении плана в реальном времени, согласуя свои действия с другими членами команды и получая подтверждение от агента-лидера.

Агент-пилот, как и агент-футболист, имеет трехуровневую архитектуру, включающую уровни физических действий, индивидуального поведения и координации. Агент генерирует управляющие сигналы на актуаторы аппарата посредством обработки сенсорной и командной информации. Группа из нескольких аппаратов разделяется на подгруппы, каждая из которых имеет лидера. Лидер выступает в роли координатора. Подгруппы имеют иерархическую структуру. Планирование операций команды выполняется рекурсивно для каждой подгруппы, пока не будут сформированы итоговые планы каждого агента. Когда команда обнаруживает выход из строя одного из агентов, план корректируется за счет использования оставшихся агентов.

Пример, показывающий возможности принятия решений агентом-пилотом в зависимости от текущей ситуации, показан на рис.6. Рассматривается ситуация отражения атаки ракет и самолетов противника на группу самолетов, выполняющую боевое задание. Самолет 2 имеет меньше времени на принятие решений о маневре или уничтожении ракеты, чем самолет 4, так как он располагается ближе к ракетам и, к тому же, выполняет добавочную задачу анализа параметров ракет. Поэтому при генерации плана действий он выбирает более “быстрый”, но менее точный вычислительный алгоритм, чем самолет 4. Еще более строгие ограничения по времени принятия решения имеет самолет 1, так как он находится в непосредственной близости от самолетов противника. Поэтому принятие решений его агентом-пилотом должно быть основано на использовании еще более “убыстренной” аппроксимации на основе грубых данных и знаний. Самолет 3 находится в более “благоприятных” условиях с точки зрения временных ограничений. Поэтому он может принять на себя функции координации командной работы группы.

Заключение

В данной работе рассмотрены обобщенные модели реализации командной работы агентов, и предложены дополнительные средства обеспечения принятия решений в реальном времени. Разработанные модели приближенных вычислений, не допускающие потери решений в циклах управления, могут использоваться для разработки команд агентов, функционирующих в различных предметных областях.

Описанные методы управления командной работой агентов-футболистов были применены для создания программного обеспечения агента Era-Polytech, который участвовал в соревнованиях по виртуальному футболу (German Open, April 2002; RoboCup02, June 2002). Его исходный и бинарный код размещен на сайте http:\\www.robocup.org. Программный прототип системы моделирования воздушных операций беспилотных летательных аппаратов, управляемых когнитивными агентами-пилотами, находится на стадии разработки.

Список литературы

1. Agre P.E., Chapman D. Pengi: An implementation of a theory of activity // Proceedings of the Sixth National Conference on Artificial Intelligence, Seattle, July 1987.

2. Boddy M., Dean T. Deliberation scheduling for problem solving in time­constrained environments // Artificial Intelligence, Vol.67, N 2, 1993.

3. Cohen P., Levesque H. Teamwork // Nous, 25, 1991.

4. Firby R.J. An investigation into reactive planning in complex domains // Proceedings of the Sixth National Conference on Artificial Intelligence, Seattle, July 1987.

5. Garvey A., Lesser V. Design­to­time real­time scheduling // IEEE Transactions on Systems, Man and Cybernetics, Vol.23, N 6, 1993.

6. Garvey A., Lesser V. A Survey of Research in Deliberative Real-Time Artificial Intelligence // Journal of Real-Time Systems, Vol.6, N 3, 1994.

7. Городецкий В.И., Карсаев О.В., Котенко И.В. Многоагентные системы: Обзор. СПб: СПИИРАН, 2002.

8. Grosz B., Kraus S. Collaborative plans for complex group actions // Artificial Intelligence, Vol.86, 1996.

9. Hansen E.A., Zilberstein S. Monitoring and control of anytime algorithms: A dynamic programming approach // Artificial Intelligence, Vol.26, N 1-2, 2001.

10. Hayes­Roth B., Collinot A. Scalability of real­time reasoning in intelligent agents. Technical Report KSL 91­08, Knowledge Systems Laboratory, Stanford University, 1991.

11. Horvitz E.J., Rutledge G. Time­dependent utility and action under uncertainty // Proceedings of the Sixth Conference on Uncertainty in Artificial Intelligence, Los Angeles, CA, July 1991.

12. Ingrand F.F., Georgeff M.P. Managing Deliberation and Reasoning in Real-Time AI Systems // Proceedings of the Workshop Innovative Approaches to Planning, Scheduling, and Control, 1990.

13. Котенко И.В. Модели и алгоритмы обеспечения гарантированного времени решения задач системами, основанными на знаниях // Международная конференция по мягким вычислениям и измерениям. SMC'2000. Сборник докладов. СПб, 2000.

14. Lesser V.R., Pavlin J., Durfee E. Approximate Processing in Real-Time Problem Solving // AI Magazine, Vol.9, N 1, 1988.

15. Musliner D.J., Durfee E.H., Shin K.G. CIRCA: A cooperative intelligent real­time control architecture // IEEE Trans. on Systems, Man and Cybernetics, Vol.23, N 6, 1993.

16. Stankevitch L.A. A cognitive agent for soccer game // Proceeding of First Workshop of Central and Eastern Europe on Multi-agent Systems. CEEMAC'99. S-Petersburg, 1999.

17. Stone P. Layered learning in multiagent systems. A winner approach to Robotic Soccer. The MIT Press, 2000.

18. Tambe M. Towards flexible teamwork // Journal of Artificial Intelligence Research, N 7, 1997.

19. Wagner T., Lesser V. Design-to-Criteria Scheduling: Real-Time Agent Control // Proceedings of AAAI 2000 Spring Symposium on Real-Time Autonomous Systems, Stanford, CA, March, 2000.

20. Zilberstein S., Charpillet F., Chassaing P. Real-Time Problem-Solving with Contract Algorithms // Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence. IJCAI 99. Morgan Kaufmann, 1999.

21. Zilberstein S., Charpillet F., Chassaing P. Optimal Sequencing of Contract Algorithms // Annals of Mathematics and Artificial Intelligence, 2001.

Рис.5. Пример реализации паса агентом-футболистом

Рис.6. Пример командной работы агентов-пилотов

Размещено на Allbest.ru

...

Подобные документы

  • Технология программных агентов. Форматы метаданных, использующиеся для описания электронных ресурсов. Разработка интеллектуальных агентов. Среда разработки Jadex для построения интеллектуальных агентов. BDI модель интеллектуального агента ресурсов.

    курсовая работа [279,8 K], добавлен 20.02.2011

  • Характеристика алгоритмов и программных реализаций поведения агентов в двумерной среде. Исследование разработки структур данных и знаний. Особенность создания интерфейса и карты лабиринта. Экспериментальное тестирование и отладка модулей программы.

    дипломная работа [2,4 M], добавлен 12.08.2017

  • Значение астрофизических исследований. Международные космические проекты. Инфокоммуникационные технологии удаленного доступа к компьютеру. Основные возможности и достоинства Team Viewer. Порядок работы с астрофизическим комплексом в реальном времени.

    дипломная работа [4,8 M], добавлен 12.11.2013

  • Разработка вычислительной системы обработки данных в реальном времени, состоящей из устройства ввода и ПЭВМ. Назначение данной разработки и основные требования к ее качеству и функциональности. Этапы создания данной системы и анализ результатов.

    курсовая работа [223,5 K], добавлен 05.01.2010

  • Разработка программного решения по созданию мобильного приложения. Изучение технологий для разработки приложений. Анализ работы торговых агентов. Обоснование выбора языка программирования. Проектирование интерфейса структуры и верстка, листинг программы.

    дипломная работа [2,2 M], добавлен 08.06.2017

  • Возможность ведения информации об агенте и заявках, привязка заявки к агенту. Формирование отчета в pdf по итогам месяца. Хранение и загрузка списков в XML-формате. Создание форм для авторизации, агентов, бухгалтера, добавления заказа и для почты.

    курсовая работа [1,3 M], добавлен 05.01.2013

  • Основные команды для работы с файлами. Текстовый редактор vim. Простейшие команды для работы с текстом. Команды для управления процессами. Настройка оболочки и сценариев. Монтирование и демонтирование файловых систем. Базовые регулярные выражения.

    лабораторная работа [2,7 M], добавлен 14.07.2012

  • Создание программы для автоматизации процесса управления и контроля торговых агентов ООО "Журавли плюс". Использование мобильной системы "Агент +" для чтения файлов выгрузки со смартфонов; создания файлов импорта; редактирования данных о торговых агентах.

    дипломная работа [2,9 M], добавлен 12.09.2012

  • Принципы работы архитектур агентов. Классификация агентных архитектур. Реагирующая агентная архитектура, ее практическое применение. Консультационная агентная архитектура. Гибридная агентная архитектура. Многоуровневая архитектура для автономного агента.

    курсовая работа [616,9 K], добавлен 24.02.2014

  • Создание программ в Borland C++ Builder 6.0. Разработка программы для построения графика временной функции, работающей, как в машинном, так и в реальном времени. Использование алгоритма Горнера для вычисления корня квадратного и нелинейного уравнений.

    контрольная работа [925,2 K], добавлен 05.01.2016

  • Разработка архитектуры программы и пользовательского интерфейса. Ознакомление с минимальными требованиями к программному обеспечению. Анализ особенностей жанров и технологий видеоигр. Характеристика основных преимуществ выставок для представления игры.

    дипломная работа [5,6 M], добавлен 26.07.2017

  • Анализ особенностей жанров и технологий видеоигр. Обзор средств разработки видеоигр. Требования к разрабатываемому программному обеспечению. Разработка архитектуры программы и пользовательского интерфейса. Бизнес-модель внедрения видеоигры на рынок.

    дипломная работа [1,7 M], добавлен 25.06.2017

  • Назначение команды "diskcomp". Текст и запуск командного файла. Сравнение команды в Windows 7 и Windows XP. Разработка файла-сценария в ОС Linux. Создание файла в подкаталоге. Создание файла "oglavlenie.txt" с отсортированным по времени списком файлов.

    курсовая работа [1,6 M], добавлен 22.08.2012

  • Выбор, обоснование и описание используемых алгоритмов и понятий машинной графики. Типы, структуры данных и функции, использованные при реализации программного комплекса. Тип и структура файла для хранения ландшафта. Связи между модулями программы.

    курсовая работа [2,8 M], добавлен 24.06.2009

  • Составление схемы алгоритма и программы для построения графика временной функции, работающей как в машинном, так и в реальном времени. Выбор и обоснование методов расчета. Разработка основной программы. Блок-схемы алгоритмов. Распечатка листинга.

    курсовая работа [1,5 M], добавлен 21.11.2013

  • Виды компьютерной графики. Программные средства для работы с фрактальной графикой. Базовые команды черчения. Основные и дополнительные сервисные команды AutoCAD. Растровая, векторная, фрактальная и трёхмерная графика. Команды редактирования чертежа.

    курсовая работа [41,8 K], добавлен 22.04.2016

  • Построение схемы алгоритма и программы для создания графика временной функции, работающей в машинном и реальном времени. Выбор методов решения и их обоснование. Значение коэффициентов и временной функции. Реализация временных задержек в программе.

    курсовая работа [6,2 M], добавлен 09.03.2012

  • Анализ и виды интеллектуальных агентов в системе дистанционного обучения и их характеристики. Построение интеллектуального агента глоссария на платформе Jadex с помощью XML формата. Среда разработки и описание интеллектуального агента с помощью BDI.

    курсовая работа [113,6 K], добавлен 10.02.2011

  • Распространение DVD-дисков в современном мире. Физика работы привода и носители DVD. Характеристики и требования к существующим приводам. Запись и воспроизведение высококачественного видео и аудио в реальном времени. Безопасные приемы работы на ПК.

    дипломная работа [1,4 M], добавлен 26.06.2010

  • Прерывание и его природа. Контролер прерываний. Обработка прерываний в реальном режиме. Характеристики реального режима работы микропроцессора. Схема обработки прерываний в реальном режиме. Написание собственного прерывания. Разработка в общем случае.

    доклад [347,0 K], добавлен 22.09.2008

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.