Повышение устойчивости к аномалиям интеллектуального агента с ограниченным временным ресурсом: метакогнитивный подход
Подход к повышению устойчивости рационального агента, функционирующего в жёстком реальном времени, к возникновению непредвиденных ситуаций, связанных с его функционированием. Использование концепции метапознания, их реализация средствами активных логик.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 19.01.2018 |
Размер файла | 24,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Повышение устойчивости к аномалиям интеллектуального агента с ограниченным временным ресурсом: метакогнитивный подход
Введение
метапознание логика рациональный
Одной из наиболее важных и сложных проблем теории интеллектуальных многоагентных систем является обеспечение устойчивости («неуязвимости») интеллектуальных агентов к непредвиденным заранее ситуациям («аномалиям» Anderson et al., 2005). Аномалии возникают как из-за непредусмотренных изменений, происходящих во внешней среде (частью которой являются другие агенты многоагентной системы), так и из-за несовершенства имеющихся у агента знаний о ней и отрицательно влияют на его функционирование. Особенно важна устойчивость агентов к аномалиям в так называемых системах жёсткого реального времени, для которых характерно существование критического временного порога (deadline) решения стоящей перед многоагентной системой задачи, превышение которого чревато катастрофическими последствиями. Типичным примером аномалии для таких систем является ситуация, когда событие, ожидаемое в назначенное время, тем не менее, не наступило. Это событие может быть связано не только с состоянием внешней среды, но и с текущим состоянием знаний агента. В обоих случаях можно говорить о возникновении угрозы превышения времени, отпущенного на решение задачи, то есть о катастрофическом ухудшении качества функционирования как самого агента, так и всей многоагентной системы в целом. Ясно, что в многоагентных системах жёсткого реального времени временной ресурс каждого агента строго ограничен. В докладе далее речь пойдёт о подходе к повышению устойчивости к аномалиям агентов с ограниченным ресурсом времени на основе использования концепции метапознания, реализованной средствами специально разработанного для этой цели семейства так называемых активных логик.
1. Метапознание в когнитивной психологии
Термин «метапознание» (metacognition) был введён Д. Флэйвеллом Flavell, 1979, Flavell, 1987 и определён им как осведомлённость индивидуума о своих когнитивных процессах и связанных с ними стратегиях, или, говоря его словами, как "знание и познание относительно познавательных явлений". В других источниках метапознание часто определяют просто как размышления о размышлениях (например, в Metcalfe et al., 1994), имея в виду при этом «познание второго порядка». В дальнейшем в докладе вместо термина «размышление» (thinking) будет использоваться термин «рассуждение» (reasoning), более привычный в использовании применительно к проблематике систем искусственного интеллекта.
Исследования метапознания расширили теорию обработки информации, которая была представлена, прежде всего, в теоретических работах таких исследователей как Ньюэлл Newell, 1990. Ключевым в этой новой психологической парадигме было представление о мышлении как о потоке информации внутри и вне системы ментальных структур. Вопросы относительно того, как информация сохраняется и восстанавливается в ментальных структурах, как эти структуры развиваются с возрастом, как происходит управление хранением и коррекцией, привлекали внимание многих исследователей.
Модель метапознания и познавательного контроля, предложенная Флэйвеллом, позволяет ответить на многие из этих вопросов. Согласно его модели, способность человека управлять "широким разнообразием познавательных инициатив происходит через действия и взаимодействия между четырьмя классами явлений " Flavell, 1979:
· метакогнитивное знание,
· метакогнитивное ощущение,
· цели (или задачи),
· действия (или стратегии).
Модель включает знание трех общих факторов:
знание особенностей функционирования “когнитивного процессора”;
знание задачи, ее требований и как эти требования могут быть выполнены при изменении условий;
знание стратегий для выполнения этой задачи, (познавательные стратегии, призванные достигать целей, и метапознавательные стратегии, призванные контролировать продвижение (прогресс) познавательных стратегий).
Метакогнитивное знание может влиять на направление познавательных инициатив через преднамеренный и сознательный поиск в памяти или через несознательные и автоматические когнитивные процессы.
Следует отметить разницу между познавательными и метапознавательными стратегиями. Первые помогают индивиду достичь специфической познавательной цели (например, понять текст), а вторые используются для контроля достижения этой цели (например, самоопрос на предмет понимания этого текста). Метакогнитивные компоненты, как правило, активизируются, когда познание терпит неудачу (в данном случае это может быть непонимание текста с первого прочтения). Такая неудача активизирует метакогнитивные процессы, позволяющие индивиду исправить ситуацию. Таким образом, метапознание отвечает за активный контроль и последовательное регулирование познавательных процессов.
2. Метакогнитивный цикл
Понятие «метакогнитивный» цикл было предложено в Anderson et al., 2006 в контексте использования принципов метапознания для улучшения устойчивости к аномалиям рационального агента с ограниченным временным ресурсом. Он определяется как циклическое выполнение следующих трёх этапов:
1. самонаблюдение (мониторинг);
2. самооценка (анализ выявленной аномалии) ;
3. самосовершенствование (регуляция познавательного процесса).
Заметим, что и в других работах, посвящённых метарассуждениям или, более общё, метапознанию в многоагентных системах (Brown, 1987, Cox et al., 2007, Raja et al., 2007), метакогнитивный цикл указанного вида также подразумевается. Общим во всех перечисленных работах является подход, основанный на том, что этап самонаблюдения, на котором выявляется наличие аномалий, строится с привязкой возможных действий агента, влияющих на внешнюю среду, к ожидаемым последствиям этих действий. Признаком наличия аномалии при этом является несоответствие ожиданий агента с поступающей информацией о внешней среде. Заметим, что выполнение этапов метакогнитивного цикла ни в коем случае не предполагает каких-либо изощрённых раздумий, таких глубоких, что агент может «увязнуть» в них самих. Метарассуждения агента таковыми не должны быть. На этапе самонаблюдения они сводятся к проверке на наличие в рассуждениях агента формальных признаков присутствия аномалий в рассуждениях агента, решающего некоторую задачу. Этими формальными признаками нередко являются так называемые прямые противоречия в знаниях агента. Формально прямым противоречием называется наличие контрарной пары формул, выражающих текущие знания агента. В связи с тем, что, как указывалось во введении, в системах жёсткого реального времени аномалии в основном связаны с запаздыванием появления ожидаемых реакций внешней среды на действия агента, то именно такого рода ситуации должны выявляться в процессе мониторинга в первую очередь. На этапе самооценки устанавливается степень угрозы для качества функционирования агента, которую таит в себе выявленная аномалия, а на этапе самосовершенствования, если угроза реальна, происходит выбор новой стратегии решения задачи, стоящей перед агентом. Типовым выходом из такого рода ситуаций, является переход к новой стратегии, требующей для своего осуществления меньшего временного ресурса, но обеспечивающий хотя и приемлемый, но меньший по сравнению со «старой» стратегией, уровень качества решения стоящей перед агентом задачи.
Таким образом, логическая система, формализующая рассуждения агента с ограниченными ресурсами, должна давать ему возможность оценивать имеющийся у агента временной ресурс в каждый момент времени таким образом, чтобы в зависимости от результатов оценки агент мог менять ход своих рассуждений (темпоральная чувствительность Elgot-Drapkin, 1998). Кроме того, агент должен быть толерантен к противоречиям в своих знаниях и быть способен их выявлять. Необходимым условием также является способность агента оценивать в каждый момент времени полноту имеющихся у него знаний и осознавать не только то, что он знает, но и то, чего именно он не знает. Логические системы, дающие агентам такие возможности, будут рассмотрены ниже.
3. Рассуждения во времени и метарассуждения на основе активной логики
Для того чтобы дать возможность наблюдать за процессом рассуждения агента и оценивать этот процесс во время его осуществления, была предложена концепция, получившая название «шаговая логика» Elgot-Drapkin, 1988, впоследствии переименованная в «активную логику», хотя это, скорее, семейство различных логик, объединённых общими принципами. Сохраняя возможность рассуждать об агентах, как бы «глядя на них со стороны» (как это имеет место, например, в случае динамической эпистемической логики Fagin et al., 1988), в то же время, активная логика позволяет самому агенту соотносить процесс своего рассуждения с событиями, происходящими во внешней среде в результате деятельности этого агента или помимо нее.
Систему активной логики образуют пары вида <SLn, SLn>, где SLn - метатеория поведения агента, соответствующая его «внутренней» (далее собственной) теории, SLn (n - параметр, характеризующий уровень сложности теорий, о котором будет сказано ниже). Как модель дедукции, активная логика характеризуется языком, множеством дедуктивных правил, а также множеством «наблюдений». Использование так называемой функции наблюдения позволяет моделировать динамическую среду, информация о которой поступает к агенту по мере происходящих в этой среде изменений.
Рассуждение во времени характеризуется выполнением циклов дедукции, называемых шагами. Так как в основе активной логики лежит дискретная модель времени, то эти шаги играют роль временного эталона - время измеряется в шагах. Знания агента ассоциируются с индексом шага, на котором они были впервые получены.
Принципиальное отличие активной логики от других темпоральных эпистемических логик состоит в том, что темпоральные аргументы введены в язык собственных теорий агентов Elgot-Drapkin, 1988. Таким образом, временной параметр связывается не только с каждым утверждением (формулой), которое эксплицитно знает агент, но и с дедуктивными правилами вывода. То, что узнал агент на шаге t (t-знания), используется для вывода новых знаний на шаге (t +1). Дедуктивные правила вывода в активной логике имеют следующий вид:
наследование,
modus ponens.
Для иллюстрации осуществляемого по шагам процесса рассуждений предположим, что агент изначально знает (на шаге t), что и и на шаге (t + 1) он наблюдает . В приведенной ниже таблице показано, какие новые формулы появляются на каждом шаге при использовании агентом дедуктивных правил наследования и modus ponens.
t : … , …
t + 1 : … …
t + 2 : … …
t + 3 : … …
Различные уровни сложности теорий активной логики связаны с вовлечением в процесс рассуждения агентов трех различных механизмов: отсчета времени, обеспечивающего темпоральную чувствительность рассуждений агентов, самопознания (способности агентов осознавать как то, что они на данный момент времени знают, так и то, чего они на данный момент времени не знают), и обнаружения противоречий в текущих знаниях.
Отсчет времени достигается благодаря специальному одноместному предикату now (.). В отношении его действует следующее правило вывода:
,
причем, now (t) не наследуется на шаге t+1 обычным образом. Самопознание достигается благодаря правилу вывода:
,
где - любая формула, не известная агенту i на шаге t, но являющаяся подформулой некоторой известной ему формулы , то есть осознаваемая агентом, sub (.,.) - двухместный метапредикат, выражающий отношение «быть подформулой», - нотация, означающая, что формула отсутствует в текущих знаниях агента на шаге t. K(.,.) - двухместный метапредикат, выражающий тот факт, что агенту известна некоторая формула в некоторый момент времени.
Обнаружение и устранение противоречий достигается благодаря правилу вывода:
Ниже приведён пример процесса метарассуждений, когда факт, что вопреки ожиданиям агента, некоторое событие А не стало вовремя ему известно (момент времени 2), проявляется в виде прямого противоречия.
Пример 3.1.
0: … now (0), now (1) K (2, A ) …
1: … now (1), now (1) K (2, A ), K (0, A ) …
2: … now (2), now (1) K (2, A ), K (0, A ) , K (1, A ),
K (2, A ) …
3: … now (3), now (1) K (2, A ), K (0, A ) , K (1, A ),
K (2, A ), K (2, A ) …
4: … now (4), now (1) K (2, A ), K (0, A ) , K (1, A ),
K (2, A ), K (2, A ), contra (3, K (2, A ), K (2, A ) ) …
В моменты времени 0, 1, 2, 3 сработало правило самопознания, в результате чего были последовательно выведены формулы K (0, A ) , K (1, A ), K (2, A ), K (2, A ). В момент времени 1 сработало правило now (1) K (2, A ) , выражающее ожидание, что в момент времени 2 агент будет знать, что произошло событие А. В момент времени 4 сработало правило обнаружения противоречия, в данном случае, между ожиданием агента , что он узнает о наступлении события А в момент времени 2 и фактом, что в указанный момент времени информации о наступлении события А агенту не поступила.
Таким образом, концепции активной логики отвечают логические системы, которые могут быть охарактеризованы следующими свойствами, в совокупности отличающими их от других логических систем:
1. Формализация рассуждений, протекающих во времени (reasoning situated in time).
2. Темпоральная чувствительность.
3. Самопознание.
4. Допустимость противоречий.
Указанные свойства не встречаются одновременно в логических системах, не отвечающих концепции активной логики. Метакогнитивный подход, основанный на концепции активной логики, был успешно применен в ряде проблемных областей, среди которых:
1. Планирование действий в жёстком реальном времени Purang et al., 1999;
2. Обучение с подкреплением Anderson et al., 2006;
3. Исправление ошибок диалога Anderson et al., 2004;
4. Рассуждение о других агентах Elgot-Drapkin, 1998.
5. Управление потоками ресурсов Емельянов, 1999.
Заключение
Рассмотренный в данном докладе метакогнитивный подход, ориентирован для применения в многоагентных системах жёсткого реального времени, чем и обусловлена его специфика. Опыт практического применения метакогнитивного подхода к построению различных интеллектуальных систем уже показал, что устойчивость таких систем к аномалиям выше, чем у аналогичных систем, в которых данный подход не применялся Anderson et al., 2006. Вместе с тем, этот подход нельзя рассматривать в качестве панацеи, решающей все проблемы, связанные с обеспечением устойчивости к аномалиям интеллектуальных систем. Однако не вызывает сомнений, что на пути решения этих проблем метакогнитивный подход является необходимым звеном.
Благодарности. Работа выполнена при финансовой поддержке РФФИ (проект № 09-01-00877).
Список литературы
1.Емельянов, 1999 Емельянов В.В. Многоагентная модель децентрализованного управления потоком производственных ресурсов// Труды Международной конференции "Интеллектуальное управление: новые интеллектуальные технологии в задачах управления" (ICIT'99, Переславль-Залесский, 6-9 декабря, 1999). - М.: Наука. Физматлит, 1999.
2.Anderson et al., 2005 Anderson M. L., Perlis D. Logic, self-awareness and self-improvement: The metacognitive loop and the problem of brittleness, in Journal of Logic and Computation. 2005. №15 (1).
3.Anderson et al., 2004 Anderson M. L., Lee B. Empirical results for the use of meta-language in dialog management. // Proceedings of the 26th Annual Conference of the Cognitive Science Society. 2004.
4.Brown, 1987 Brown A. Metacognition, executive control, self control, and other mysterious mechanisms. In F. Weinert and R. Kluwe (Eds.), Metacognition, Motivation, and Understanding. Hillsdale, NJ: Erlbaum. 1987.
5.Cox et al., 2007 Cox, Raja. Metareasoning: Manifesto, in BBN Technical Memo TM-2028, 2007.
6.Elgot-Drapkin, 1998 J. Elgot-Drapkin. Step Logic: Reasoning situated in time. PhD thesis. Department of computer science, University of Maryland, Colledge-Park, Maryland, 1988.
7.Fagin et al., 1988 Fagin R. and. Halpern J. Y. Belief, awareness and limited easoning, Artificial Intelligence 34 (1988).
8.Flavell, 1979 Flavell J. H. Speculations about the nature and development of metacognition. In F. Weinert & R. Kluwe, eds., Metacognition and Motivation. Hillsdale, NJ: Lawrence Erlbaum Associates. 1979.
9.Flavell, 1987 Flavell J. H. Metacognition and cognitive monitoring: A new era in cognitive-developmental inquiry. American Psychologist. 1987. №34(10)
10.Metcalfe et al., 1994 Metcalfe J. & Shimamura A. P. Metacognition: knowing about knowing. Cambridge, MA: MIT Press. 1994.
11.Newell, 1990 Newell F. Unified Theories of Cognition. Cambridge, MA: Cambridge University Press, 1990.
12.Purang et al., 1999 Purang K., Purushothaman D., Traum D., Andersen C., Traum D., Perlis D. // Practical Reasoning and Plan Executing with Active Logic. 1999. Proceedings of the IJCAI'99 Workshop on Practical Reasoning and Rationality
Размещено на Allbest.ru
...Подобные документы
Анализ и виды интеллектуальных агентов в системе дистанционного обучения и их характеристики. Построение интеллектуального агента глоссария на платформе Jadex с помощью XML формата. Среда разработки и описание интеллектуального агента с помощью BDI.
курсовая работа [113,6 K], добавлен 10.02.2011Технология программных агентов. Форматы метаданных, использующиеся для описания электронных ресурсов. Разработка интеллектуальных агентов. Среда разработки Jadex для построения интеллектуальных агентов. BDI модель интеллектуального агента ресурсов.
курсовая работа [279,8 K], добавлен 20.02.2011Компоненты и архитектура интеллектуального агента, его дополнение средствами обучения. Различные подходы к созданию искусственного интеллекта, перспективы его развития. Этические и моральные последствия разработки интеллектуальных машин и программ.
реферат [708,9 K], добавлен 02.03.2014Объектный подход как метод реализации программных систем. Проектирование и программная реализация стратегической системы, реализующей процессы создания и взаимодействия группы объектов. Разработка объектной модели. Назначение элементов интерфейса.
курсовая работа [4,1 M], добавлен 11.05.2012Методы исследования устойчивости замкнутой САР. Изучение устойчивости линейной САР на электронной вычислительной машине. Использование программы Matlab. Работа на Simulink/Matlab. Снятие переходных процессов относительно возмущающего воздействия.
лабораторная работа [994,2 K], добавлен 24.04.2014Моделирование различных систем событий. Особенности мультиагентной платформы JADE. Использование агентов, нарушающих принятый порядок работы системы. Реализация программы на языке Java. Вычислительная модель агента. Моделирование игры в "наперстки".
курсовая работа [423,6 K], добавлен 30.01.2016Моделирование передвижения муравьев. Метод ветвей и границ, ближайшего соседа. Ограничения, накладываемые на агента в стандартной постановке задачи коммивояжера. Использование графа видимости в алгоритме муравья. Структура данных алгоритма муравья.
дипломная работа [1,7 M], добавлен 07.02.2013Значение астрофизических исследований. Международные космические проекты. Инфокоммуникационные технологии удаленного доступа к компьютеру. Основные возможности и достоинства Team Viewer. Порядок работы с астрофизическим комплексом в реальном времени.
дипломная работа [4,8 M], добавлен 12.11.2013Разработка вычислительной системы обработки данных в реальном времени, состоящей из устройства ввода и ПЭВМ. Назначение данной разработки и основные требования к ее качеству и функциональности. Этапы создания данной системы и анализ результатов.
курсовая работа [223,5 K], добавлен 05.01.2010Использование агентными технологиями спектра типологий агентов и их модулей, архитектур МАС, агентных библиотек и средств поддержки разработки типов МАС. Набор базовых характеристик агента. Уровни в архитектуре. Многоагентская система, агент-координатор.
презентация [255,0 K], добавлен 25.06.2013Создание программ в Borland C++ Builder 6.0. Разработка программы для построения графика временной функции, работающей, как в машинном, так и в реальном времени. Использование алгоритма Горнера для вычисления корня квадратного и нелинейного уравнений.
контрольная работа [925,2 K], добавлен 05.01.2016Использование совокупных универсальных средств управления функциями системы. Основные возможности антивирусных программ. Совместное использование ресурсов сети. Оптимизация размещения информации. Периферийные устройства персонального компьютера.
отчет по практике [31,5 K], добавлен 25.06.2012Классификация компьютерных сетей по распространенности и скорости передачи информации. Спутниковый или оптоволоконный канал связи с сервером Интернета. Использование браузера, программного обеспечения для просмотра веб-сайтов. Общение в реальном времени.
презентация [1,5 M], добавлен 16.04.2015Процессный подход как технология формализации предметной области. Описание бюро труда и экономического планирования. Анализ затрат рабочего времени бюро. Описание документации для учета трудозатрат. Разработка и реализация проекта информационной системы.
курсовая работа [3,2 M], добавлен 12.10.2013Общий алгоритм сравнения двух изображений. Метод максимальных площадей. Метод гистограмм. Подготовка изображения к распознаванию. Моделирование многомерной функции. Распределение векторов. Деформируемые модели. Реализация программного обеспечения.
дипломная работа [384,2 K], добавлен 29.09.2008Особенности использования инструкций SELECT. Задание критериев отбора (WHERE). Объединение нескольких источников данных. Групповые операции и вычисляемые поля. Формирование и выполнение запросов в реальном времени. Параметрические запросы. Сортировка.
контрольная работа [31,1 K], добавлен 14.02.2009Синтез и реализация процедур управления объектами как главная идея интеллектуального управления. Основные определения, степени интеллектуальности. Свойства интеллектуальных систем управления (ИСУ) с "интеллектуальностью в целом", принципы их организации.
презентация [51,8 K], добавлен 25.06.2013Построение схемы алгоритма и программы для создания графика временной функции, работающей в машинном и реальном времени. Выбор методов решения и их обоснование. Значение коэффициентов и временной функции. Реализация временных задержек в программе.
курсовая работа [6,2 M], добавлен 09.03.2012Создание классов, их реализация: формализация задачи, проектирование абстракции данных, определение семантики и определение отношений между классами. Реализация концепции контейнеров и итераторов с помощью языка объектно-ориентированного программирования.
курсовая работа [175,5 K], добавлен 25.03.2015Базовые характеристики агента, требования к программированию. Особенности архитектуры, организуемой в виде нескольких уровней, представляющих разные функциональные характеристики. Проблемы многоагентных систем при реализации идеи коллективного поведения.
презентация [255,2 K], добавлен 25.06.2013