Вариант динамического метода автоматического порождения гипотез для обучения мобильного робота

Создание адаптивного робота, обучение которого реализовано с помощью динамического метода автоматического порождения гипотез. Эксперименты с роботом, который был построен в Лаборатории робототехники и искусственного интеллекта Политехнического музея.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 18.01.2018
Размер файла 127,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Вариант динамического метод автоматического порождения гипотез для обучения мобильного робота

В настоящий момент наблюдается активное внедрение методов искусственного интеллекта в робототехнику в таких областях, как распознавание изображений, планирование, коллективное поведение.

В работе [Добрынин и др., 2006] приведена классификация роботов:

Программные роботы (действующие по заранее заданной программе);

Адаптивные роботы (способные изменять поведение под воздействием окружающей среды);

Интеллектуальные роботы (способные выполнять задачу, поставленную в общем виде).

Из самых известных адаптивных роботов современности стоит упомянуть известных шагающих роботов Big Dog и Little Dog компании Boston Dynamics. Обзор современного состояния интеллектуальных роботов изложен в статье [Добрынин, 2006b].

Особую роль в создании адаптивных и интеллектуальных роботов играют методы машинного обучения. Одним из наиболее развитых методов машинного обучения является ДСМ-метод.

Постановка задачи обучения

Робот должен обучаться, чтобы совершенствовать своё поведение с накоплением опыта. Робот существует в среде, все объекты которой имеют описание (пусть X - множество всех описаний объектов) и принадлежат к некоторым классам из множества Y. Робот может сам получать факты из окружающей среды, поэтому обучение должно быть индуктивным, то есть основанным на выявлении закономерностей в эмпирических данных. Задачей будет являться построение индуктивного классификаторапо модели «стимул-реакция» (выработка условного рефлекса).

В качестве обучающей выборки возьмем множество пар «обстановка - действие». Под обстановкой понимается состояние окружающей среды, зафиксированное рецепторами робота - освещенность, цвет поверхности, наличие препятствия, угол по отношению к некоторому ориентиру (маяку). Под действием будем понимать влияние эффекторов робота на окружающую среду - вращение колес, свет, звук. Возможны более сложные действия, состоящие из простых: например, действие «Атака» является комбинацией езды вперед и света фонариком, а «Защита» - комбинацией езды назад и звука.

Обучение будет осуществляться на примерах (положительных и отрицательных), которые выдаёт учитель. Формирование положительного примера назовём поощрением, отрицательного примера - наказанием. Обобщение нескольких примеров (только положительных или только отрицательных) назовём гипотезой.

Фазы обучения (обобщения, получения гипотез) и действия (применения гипотез) повторяются циклически. Кроме того, должен существовать некоторый критерий, показывающий, что обучение достаточно и теперь можно перейти к фазе работы.

Обучение является интерактивным, то есть сигналы поощрения и наказания выдаются непосредственно в ходе работы системы.

ДСМ-метод

В данной работе в качестве метода обучения используется ДСМ-метод автоматического порождения гипотез. Данный метод обобщает в гипотезах информацию, полученную из обучающей выборки (шаг индукции), затем применяет эти гипотезы для классификации неизвестных объектов (шаг аналогии), а также имеет критерий достаточного основания правдоподобного вывода (шаг абдукции).

Классический ДСМ-метод использует внешние истинностные значения t и f, а также множество внутренних истинностных значений V={+, , 0, t}.

Обучающая выборка состоит из множества объектов, множество имён которых образует множество O. Имена исследуемых свойств образуют множество P. Для описания того, какими свойствами какой объект обладает, мы можем представить обучающую выборку с помощью матрицы F: OЧP>V. Если F (o, p)=+, то говорят, что объект o обладает свойством p. Аналогично для F (o, p)=. Если F (o, p)=0, то это значит, что сведения об обладании o свойством p противоречивы. Случай F (o, p)=t соответствует объекту, о котором неизвестно, обладает ли он свойством p.

Совокупность значений признаков образует фрагмент с объекта o. На множестве всех фрагментов должна быть задана бинарная операция сходства, обладающая свойствами коммутативности, ассоциативности и идемпотентности. Вычисляются пересечения фрагментов всех подмножеств объектов. Все такие пересечения образуют множество потенциальных причин С.

Рис. 1. Блок-схема классического ДСМ-метода

адаптивный робот автоматический

На шаге индукции из потенциальных причин для разных свойств порождается матрица H: CЧP>V. Если H (c, p)=+, то говорят, что фрагмент с является причиной наличия свойства p. Если H (c, p)=, то говорят, что фрагмент с является причиной отсутствия свойства p. H (c, p)=0 означает, что сведения о c как о причине свойства p противоречивы. Случай H (c, p)=t соответствует отсутствию информации.

На шаге аналогии с использованием причин из матрицы H формируется новая матрица F': OЧP>V, в которой t-значения исходной матрицы F могут быть заменены на {+, , 0}.

Также с помощью матрицы H могут быть объяснены все значения в матрице F. Эта процедура называется абдуктивным объяснением и служит критерием достаточного основания для правдоподобного вывода. С другой стороны, процедура абдукции может быть использована для пополнения обучающей выборки: «уникальные» примеры, которые не объясняются абдукцией, могут быть дополнены новыми примерами.

ДСМ-метод предназначен для поиска причинно-следственных зависимостей в базе фактов предметной области и является качественным, а не количественным методом анализа данных. В настоящее время ДСМ-метод успешно применяется в фармакологии, медицине, социологии, почерковедении. Подробные сведения о ДСМ-методе, его теории и практическом применении изложены в сборниках статей [Аншаков и др., 2009], [Панкратова и др., 2009].

В отличие от других методов, ДСМ обеспечивает быстрое обучение. Так, в большинстве широко применяемых методов (нейронные сети, автоматы, генетические алгоритмы) для обучения какому-либо рефлексу роботу требуется как минимум 1012 тактов обучения (для сравнения, 12 такта требуется в ДСМ-методе). ДСМ выдаёт полученные правила в явном виде, что облегчает интерпретацию результатов обучения. Из недостатков ДСМ-метода отмечается неприменимость в условиях противоречий в обучающих примерах. Идеи о том, как данная проблема могла бы быть решена, содержатся и в настоящей работе.

Динамический ДСМ-метод

Существующие ДСМ-системы работают с заранее заданным набором примеров. Примеры могут добавляться экспертом, если оказывается, что их недостаточно, но в этом случае каждый раз происходит перезапуск системы. Для робота такой вариант неприемлем из-за большой вычислительной сложности.

В работе [Добрынин, 2006a] была предложена модель динамического ДСМ-метода, в котором примеры могут добавляться в процессе функционирования системы. «В отличие от классического ДСМ-метода, который работает с замкнутым множеством исходных примеров и заранее определенными их свойствами, динамический ДСМ-метод позволяет работать в открытой среде с неизвестным заранее количеством примеров».

Такая особенность динамического ДСМ-метода накладывает определённые требования на алгоритм поиска пересечений. Очевидно, что он должен быть пошаговым, а не пакетным множество пересечений не должно полностью пересчитываться каждый раз. Исходя из этого, в данной работе был выбран алгоритм Норриса с некоторыми модификациями [Kuznetsov et al., 2002]. Ключевой проблемой метода Норриса является определение каноничности порождения пересечения: пересечение объектов называется каноничным, если оно порождается из родителей в порядке возрастания их номеров. Это необходимо для того, чтобы не порождать одно и то же пересечение многократно.

Самым же существенным отличием динамического ДСМ-метода от классического является отсутствие критерия завершения. В классическом ДСМ-методе им является достижение насыщения невозможность породить новые гипотезы. В динамическом варианте база фактов постоянно расширяется, и требуется сформулировать другое условие. Им может стать абдукция - познавательная процедура ДСМ-метода.

Модельная задача

В мире робота существуют объекты, которые он учится классифицировать. Например, объектами могут быть совокупности параметров окружающей среды в некоторые моменты времени.

Для обучения робота была выбрана несложная модельная задача, которую можно было решить с имеющимся набором датчиков и исполнительных механизмов. Учитель, в роли которого выступает человек, обучает робота правилам вида «если то» например, «если темно и не видно маяка - входи в режим защиты».

Признаки:

«Робот на черном/на белом»

«Темно/светло»

«Препятствие впереди/нет препятствия»

«Видит маяк под углом a»

Свойства (сложные действия)

Атака (Ехать вперед и светить фонариком)

Защита (Ехать назад и пищать)

Поиск (Повернуться влево на 90 градусов)

Для применения ДСМ-метода необходимо задать операции сходства на фрагментах и на множествах свойств. Обычно фрагменты и свойства представляются битовыми строками. Поэтому операция сходства соответствует побитовому умножению (рис. 3).

Рис. 2. Операция пересечения

Программная реализация обучения

В статье [Добрынин и др., 2006] вводится реализация схемы поощрения и наказания, при которой после окончания действия робот ждет оценки учителя некоторое время. В настоящей работе использован тот же принцип: процесс жизнедеятельности робота разделён на фазы действия и ожидания.

Рис. 3. Схема обучения робота

В фазе действия робот фиксирует обстановку и выбирает правило, которое подходит для данного случая; если такое правило не находится, то робот совершает случайное действие. Правильный поступок робота учитель поощряет. Если же робот ошибается, то учитель наказывает его (робот получает отрицательный пример). Возможна реализация, при которой учитель предъявляет положительный пример (говорит, как нужно поступать в этой ситуации). Это нужно для того, чтобы робот с самого начала обучения мог набрать достаточное количество положительных примеров.

Постановка задачи «забывания»

Максимальное число примеров экспоненциально зависит от количества признаков, поэтому возникает проблема хранения примеров в памяти робота. «Забывание примеров» существенно и по другой причине. Хотелось бы, чтобы с течением времени старая обучающая выборка не участвовала в порождении новых гипотез.

Замечено, что большинство примеров совпадает с пересечениями, у которых 1 родитель. Совместно с Д.В. Виноградовым (ВИНИТИ РАН) был разработан вариант ДСМ-метода, где примеры сохраняются как пересечения с одним родителем. После этого примеры могут быть забыты.

Для проверки каноничности итерация по примерам заменяется итерацией по пересечениям (недостаток потенциально высокая вычислительная сложность). Однако имеется выигрыш по объему занимаемой памяти: в классическом ДСМ в худшем случае мы имеем 2n пересечений и 2n примеров, тогда как в настоящей реализации - только 2n пересечений, среди которых есть и примеры.

Таким образом, данный вариант можно использовать, когда признаков мало, а примеров много. У робота примеры непрерывно поступают, поэтому использование такой модификации оправданно.

Некоторые пересечения «скрывают» примеры: их фрагмент совпадает с фрагментом примера. Такие пересечения должны рассматриваться наравне с пересечениями с одним родителем. Обычно число пересечений со «скрытыми родителями» не превосходит трети от всех.

Была разработана модификация метода Норриса. В ней на стадии проверки на относительную и абсолютную каноничность итерация по предыдущим примерам заменяется итерацией по пересечениям со «скрытыми родителями». При добавлении нового пересечения или модификации старого проверяется, совпадают ли фрагмент текущего примера и фрагмент текущего пересечения. В этом случае у пересечения ставится флаг «скрытые родители». Такой же флаг ставится и при добавлении одноэлементного пересечения.

Учёт числа примеров

Робот живет в изменяющейся среде (по терминологии Д.А. Поспелова, мире с «переключающимися средами»). Он должен быть способен адаптироваться к изменениям - переобучаться при поступлении сигнала поощрения или наказания, причем максимально быстро.

Но есть и в некотором смысле противоположное утверждение: робот должен быть устойчивым к шумам и выбросам в данных. Это накладывает ограничения на используемые методы обучения: они должны быть устойчивы к одиночным (редким) ошибкам, таким как ложное срабатывание одного из датчиков или недосмотр учителя.

В классическом ДСМ-методе существует стратегия «запрет на контрпример», в которой гипотеза уничтожается, если в обучающей выборке находится более чем n контрпримеров (порог n задается экспертом эмпирически). Контрпримером называется пример, который объясняется гипотезой, но имеет отличный от нее знак. «Запрет на контрпример» позволяет избавляться от противоречивых гипотез; в нашем случае такой запрет необходим, чтобы робот мог переучиваться - исключать старые и неактуальные гипотезы и приобретать новые.

Такой вопрос не стоял в задаче с обучением робота езде по линии [Добрынин и др., 2006], так как в той модели не было отрицательных примеров, а, следовательно, гипотезы не могли уничтожаться.

В существующих ДСМ-системах новый пример проверяется на уникальность. Повторные примеры не рассматриваются, так как они не интересуют эксперта. В случае с роботом повторные примеры стоит учитывать: чем больше встретилось примеров, удовлетворяющих некоторой гипотезе, тем больше следует доверять гипотезе. Примеры приходят роботу постоянно, поэтому часто встречаются дубликаты.

Если использовать «запрет на контрпример», остается открытым вопрос о том, как назначать пороги для отсеивания контрпримеров: назначение их постоянными не представляется разумным.

Эксперименты

Эксперименты проводились на мобильном роботе «Навигатор», который представляет собой автономную тележку с микроконтроллером, рецепторами и эффекторами. Интеллектуальная система находится на компьютере и передает управляющие сигналы роботу по Bluetooth. Архитектура всего программного комплекса изображена на рис. 4.

Рис. 4. Архитектура системы

В результате эксперимента робот успешно обучился нескольким стратегиям поведения. Кроме того, были проведены эксперименты по адаптации робота в искусственно измененной ситуации.

Вот пример обучения. Мы хотим научить робота, как вести себя при встрече с препятствием:

Сперва научим его поведению в случае отсутствия препятствия. Выдадим 2 положительных примера: «если темно и нет препятствия - атака» и «если светло и нет препятствия - атака». Робот породит гипотезу «если нет препятствия - атака».

Аналогично робот породит гипотезы «если темно и есть препятствие - защита» и «если светло и есть препятствие - поиск».

Теперь допустим, что среда изменилась, и робот должен при отсутствии препятствия всегда входить в режим поиска. Выдадим роботу хотя бы один контрпример: «если темно и нет препятствия - не атака», и полученная ранее гипотеза «если нет препятствия - атака» будет уничтожена. Теперь, как и в пункте 1, робот может быть научен новому правилу поведения в данной ситуации.

Пример хорошо иллюстрирует описанную выше проблему: гипотеза, подразумеваемая учителем и порожденная из двух примеров, уничтожается одним-единственным контрпримером.

Проведенные эксперименты показывают, что простой перенос существующих ДСМ-систем был бы неэффективен из-за особенностей робота как системы реального времени.

Результаты работы могут быть использованы для наглядной демонстрации ДСМ-обучения в экспозиции Политехнического музея.

В ближайшей перспективе предполагается разработать схему оценивания гипотез и реализовать специфическую для робота абдукцию.

В дальнейшем мы планируем применить и другие методы машинного обучения для адаптации робота.

Список литературы

1. Аншаков О.М., Фабрикантова Е.Ф. ДСМ-метод автоматического порождения гипотез: Логические и эпистемологические основания. - М.: Книжный дом «Либроком», 2009.

2. Динамический ДСМ-метод в задаче управления интеллектуальным роботом. Десятая национальная конференция по искусственному интеллекту с международным участием КИИ-2006 (25-28 сентября 2006 г., Обнинск): Труды конференции. В 3-т. Т.2. - М: Физматлит, 2006.

3. Добрынин Д.А. Интеллектуальные роботы вчера, сегодня, завтра //X национальная конференция по искусственному интеллекту с международным участием КИИ-2006 (25-28 сентября 2006 г., Обнинск): Труды конференции. В 3-т. Т.2. - М: Физматлит, 2006.

4. Добрынин Д.А., Карпов В.Э. Моделирование некоторых форм адаптивного поведения интеллектуальных роботов. Информационные технологии и вычислительные системы №2, 2006.

5. Панкратова Е.С., Финн В.К. Автоматическое порождение гипотез в интеллектуальных системах. - М.: Книжный дом «Либроком», 2009.

6. Kuznetsov S.O., Obiedkov S.A. Comparing Performance of Algorithms for Generating Concept Lattices, Journal of Experimental and Theoretical Artificial Intelligence, vol. 14 (2002).

Размещено на Allbest.ru

...

Подобные документы

  • Описание ДСМ-метода автоматического порождения гипотез. Исследование результатов влияния компонентов ДСМ-метода на качество определения тональности текстов. Алгоритм поиска пересечений. N-кратный скользящий контроль. Программная реализация ДСМ-метода.

    курсовая работа [727,0 K], добавлен 12.01.2014

  • История возникновения и развития современной робототехники, применение технологий искусственного интеллекта. Разработка структурной схемы системы навигации мобильного робота, коррекция траектории его движения, методы управления локальными перемещениями.

    дипломная работа [1,1 M], добавлен 18.05.2011

  • Сущность и особенности выполнения метода динамического программирования. Решение математической задачи, принцип оптимальности по затратам, ручной счёт и листинг программы. Применение метода ветвей и границ, его основные преимущества и недостатки.

    курсовая работа [38,9 K], добавлен 15.11.2009

  • Понятие адаптивного управления как совокупности действий и методов, характеризующихся способностью управляющей системы реагировать на изменения внешней среды. Применение метода сетевого оператора для синтеза адаптивного управления мобильным роботом.

    дипломная работа [1,4 M], добавлен 17.09.2013

  • Сущность и проблемы определения искусственного интеллекта, его основных задач и функций. Философские проблемы создания искусственного интеллекта и обеспечения безопасности человека при работе с роботом. Выбор пути создания искусственного интеллекта.

    контрольная работа [27,9 K], добавлен 07.12.2009

  • Обзор задач, решаемых методом динамического программирования. Составление маршрута оптимальной длины. Перемножение цепочки матриц. Задача "Лестницы". Анализ необходимости использования специальных методов вероятностного динамического программирования.

    курсовая работа [503,3 K], добавлен 28.06.2015

  • Анализ поисковых систем. Работа виртуального каталога. Поисковая система с большим количеством проиндексированных документов. Требования к экспертной системе по автоматическому порождению поисковых эвристик. Методы автоматического подбора эвристик.

    курсовая работа [809,9 K], добавлен 25.07.2012

  • Обзор схемы конструкции автоматизированного мобильного робота. Выбор компонентов конструкции. Общая классификация роботов; виды двигателей. Выбор типа микроконтроллера. Осуществление программирования на основе расчётов по математической модели робота.

    курсовая работа [1,2 M], добавлен 20.05.2015

  • Сущность искусственного интеллекта, сферы человеческой деятельности, в которых он распространен. История и этапы развития данного явления. Первые идеи и их воплощение. Законы робототехники. Использование искусственного интеллекта в коммерческих целях.

    реферат [40,8 K], добавлен 17.08.2015

  • Разработка и условия использования автоматического строительного робота, который кладет кирпич, использует раствор и 3D-сканнер для определения расположения стен дома. Принцип работы Hadrian, устройство и функции. Создание роботов-термитов, их действие.

    презентация [2,9 M], добавлен 24.04.2016

  • Принципы построения и программирования игр. Основы 2-3D графики. Особенности динамического изображения и искусственного интеллекта, их использование для создания игровых программ. Разработка логических игр "Бильярд", "Карточная игра - 50", "Морской бой".

    отчет по практике [2,3 M], добавлен 21.05.2013

  • Виды и принципы компьютерного моделирования. Среда моделирования Microsoft Robotic Studio. Моделирование пространства и объектов рабочей области с помощью визуальной среды Visual Simulation Environment. Создание программы управления мобильным роботом.

    дипломная работа [5,0 M], добавлен 15.06.2014

  • Создание дискретной системы автоматического управления кистью руки робота андроида. Технические характеристики; выбор и обоснование элементной базы: микропроцессора, датчиков, усилителя. Синтез аппаратного и программного корректирующего устройства.

    курсовая работа [925,3 K], добавлен 09.03.2012

  • Анализ существующих стандартов образовательных сред в системах адаптивного компьютерного обучения. Краткая характеристика и оценка состояния рассматриваемой проблемы. Стандарты и спецификации ЭО. Обоснование выбранного метода направления исследования.

    научная работа [8,3 K], добавлен 29.01.2009

  • Преобразование формулы и решение ее с помощью Метода Эйлера. Моделирование метода оптимизации с функцией Розенброка. Поиск модели зашумленного сигнала. Нахождение минимума заданной целевой функции методом покоординатного спуска нулевого порядка.

    курсовая работа [1,2 M], добавлен 21.12.2013

  • Разработка приложения для проверки использования времен глаголов в английском языке. Создание базы данных. Анализ используемых средств для реализации автоматического разбора текста. Проектирование мобильного приложения с помощью диаграмм деятельности.

    дипломная работа [2,6 M], добавлен 13.09.2017

  • Порядок и назначение разработки подсистемы планирования действий интеллектуального робота. Задачи, решаемые данной подсистемой и функциональные требования к ней. Информационное моделирование функционирования интеллектуального робота и управление им.

    дипломная работа [864,0 K], добавлен 10.06.2010

  • Понятие искусственного интеллекта как свойства автоматических систем брать на себя отдельные функции интеллекта человека. Экспертные системы в области медицины. Различные подходы к построению систем искусственного интеллекта. Создание нейронных сетей.

    презентация [3,0 M], добавлен 28.05.2015

  • Методика составления типовых звеньев, этапы расчета передаточных функций элементов. Определение устойчивости системы, критерии оценки данного показателя. Проведения синтеза системы автоматического регулирования при получении дополнительных условий.

    курсовая работа [54,1 K], добавлен 10.01.2015

  • Особенности метода неопределенных множителей Лагранжа, градиентного метода и метода перебора и динамического программирования. Конструирование алгоритма решения задачи. Структурная схема алгоритма сценария диалога и описание его программной реализации.

    курсовая работа [1010,4 K], добавлен 10.08.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.