Планирование диалога для речевого интерфейса системы управления интерактивной робототехнической системой
Механический и речевой интерфейс при взаимодействии человека и робота. Функциональная структурная схема речевого интерфейса в составе робототехнической системы. Анализ решения задачи управления диалогом. Прогнозирование последующих действий оператора.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 19.01.2018 |
Размер файла | 31,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
6
Размещено на http://www.allbest.ru/
Московский государственный техническитй университет им. Н.Э. Баумана
Планирование диалога для речевого интерфейса системы управления интерактивной робототехнической системой
Морозов Д.Н., аспирант
1. Введение
При взаимодействии человека и робота основными видами интерфейса являются механический и речевой. При всей простоте первого, существует рад приложений, когда речевое взаимодействие является более предпочтительным. К таким случаям относится использование роботов при выполнении ответственных и сложных задач (спасательные операции, медицинское обслуживание и др.), а также использование роботов в повседневной деятельности человека (робот-официант, робот-компаньон и др.) В первом случае использование речевого интерфейса продиктовано необходимостью разнесения каналов передачи информации для человека-оператора, а во втором - необходимостью обеспечить максимальную естественность взаимодействия для человека. В последнем случае такая естественность делает задачу создания речевого интерфейса чрезмерно сложной, из-за высокой вариативности реализаций речевой деятельности человека. Под вариативностью здесь понимается языковой процесс, отражающий способность говорящего человека к экспрессии, к свободе выражения своих мыслей и чувств в звучащей речи. Это обстоятельство диктует необходимость наложения ограничений на речевое взаимодействие, и привидению его к форме управляемого диалога между человеком и модулем речевого взаимодействия робота. Такие ограничения относятся как способу реализации единиц диалога, так и к определению конкретной предметной области, для которой создается сам робот, и которой - следовательно - ограничивается лексическое наполнение языка.
В результате, формируется близкий в естественному проблемно-ориентированный язык. Используя этот язык, человек-оператор формулирует команды управления на верхнем уровне. Задача планирования действий из элементарных операций возлагается уже на робота, а точнее - робототехническую систему. На нее же возлагается и задача управления диалогом, что позволяется называть ее интерактивной робототехнической системой (ИРТС). Ниже рассмотрен ряд вопросов, связанный с задачами понимания естественно-языковой (ЕЯ) команды и управления диалогом.
2. Структура речевого интерфейса
Функциональная структурная схема речевого интерфейса в составе ИРТС представлена на рисунке 1.
Рис. 1. Функциональная схема речевого интерфейса.
На вход системы поступает речевая команда на проблемно-ориентированном языке. Подробное описание структуры и принципа формирования команд можно найти в [1]. После обработки в модуле распознавания речи данные передаются в модуль понимания речи в виде последовательности отдельных слов. Модуль понимания речи представляет команду в виде фрейма, структура которого основана на вербоцентрическом подходе и более подробно также описана в нашей предыдущей работе. В зависимости от результатов заполнения слотов фрейма-команды, она может быть передана из речевого интерфейса в модуль планирования операций, или - в случае возникновения проблем - использована для формирования уточняющего запроса к оператору. В модуль формирования ответа передается фрейм-запрос, на основе которого строится ЕЯ-запрос оператору. Этот запрос воспроизводится модулем реализации ответа.
3. Задача управления диалогом
Как уже отмечалось выше, определенной предметной области функционирования робота соответствует ограниченная модель мира. Наличие у робота определенных функций в рамках такой модели обуславливает конечное число целей коммуникации человек-ИРТС. Требования к структуре командного языка управления в совокупности с вышеуказанными факторами сводят возможное многообразие реализаций диалога к нескольким сценариям. Под сценарием диалога здесь понимается совокупность состояний диалога от начального до конечного (целевого) и переходов между ними. В основе исходного состояния диалога лежит первая команда человека-оператора как инициирующее действие для начала фактической работы ИРТС. Целевым состоянием диалога, в данном случае, является обретение информации, необходимой ИРТС для выполнения действий в соответствии с коммуникативным замыслом оператора.
В зависимости от полноты и корректности данных, предоставляемых оператором в виде команды, необходимость в ведении диалога может и не возникать. В этом случае ИРТС получает достаточно данных для немедленного планирования и выполнения операции. С точки зрения построения диалога, такая ситуация является вырожденной. То же самое относится и к командам безусловного выполнения (например, "стоп"). Еще один вид операций, характерный для ИРТС, работающей в недоопределенной среде, это гностические операции. Он также может сопровождаться выдачей речевых команд, но диалогичность в данном случае отсутствует, поскольку основным источником внешней информации является сенсорная система робота. Команды оператора - даже в речевой форме - являются принципиально схожими с другими способами задания действий, включая механические, и не представляет интереса в данном контексте. Таким образом, диалогу в данной задаче отводится роль корректирующего средства. В этом случае возможно развитие диалога по одному из следующих сценариев: (1) уточнение состава команды, (2) уточнение операции. Данные сценарии возникают в случае некорректности задания команды на лингвистическом и ситуативном уровне, соответственно. Тогда в первом случае речь идет ситуации, когда полученная команда является "узнаваемой" для модуля понимания речи на синтаксическом уровне, но предоставленных в составе команды данных не достаточно для перехода на семантический уровень с последующим планированием операции. В этом случае соответствующая информация передается в модуль управления диалогом (см. рисунок 1). В модуле управления диалогом в зависимости от конкретного сценария формируется набор данных, необходимых для формулировки запроса к человеку-оператору для непосредственного указания на недостающую информацию.
В случае некорректности на ситуативном уровне, команда является абсолютно достаточной с точки зрения синтаксиса и семантики, однако существуют ситуативные противоречия при планировании соответствующей операции (например, объект перемещения недоступен для манипулятора).
Для формализации двух указанных сценариев в данной работе использована фреймовая модель, как позволяющая полное описание типовой ситуации при некотором ограничении неопределенности естественно-языкового диалога. В этом случае сам сценарий описывается прото-фреймом, а конкретная реализация диалога фиксируется в виде фрейма-экземпляра. Так, для сценария "уточнение состава команды" прото-фрейм имеет следующий вид: "< (1) исходный текст команды>, < (2) недостающий компонент>, < (3) фокусирующий запрос оператору о недостающем компоненте>, < (4) вторичный текст команды>, < (5) число итераций>, < (6) окончательный вид команды>". Возможность включения в структуру фрейма процедурной информации позволяет - в случае неудовлетворительного уточнения оператора - организовать цикл по заполнению содержимого слотов 1-4 фрейма-сценария.
интерактивная оператор робот речевой интерфейс
Для сценария "уточнение операции" прото-фрейм выглядит следующим образом: "< (1) окончательный вид команды>, < (2) конфликтный компонент команды>, < (3) фокусирующий запрос оператору с указанием на причину конфликта>, < (4) вторичный текст команды>, < (5) число итераций>, < (6) окончательный вид команды>". Здесь понятие конфликт обозначает противоречие между реальной ситуацией, в рамках которой задана команда, и ситуацией, необходимой для выполнения команды, как это понимается, например, в [2]. Со стороны оператора в этом случае могут последовать два действия: подтверждение команды на выполнение или задание новой команды. В первом случае оператор уверен в корректности задания. Во втором случае новая команда будет направлена на выполнение действий по разрешению противоречия.
Применительно к задаче управления диалогом с учетом планирования операций следует оговориться о необходимости введения двух представлений команды: внешнем (вводится оператором) и внутреннем. Последнее используется непосредственно при планировании операции и помимо данным, указанных оператором в виде команды, содержит информацию об условиях выполнимости операции, заложенных на этапе создания системы. Эти данные не зависят от конкретной реализации ЕЯ-команды и относятся к "родовым" свойствам каждой операции. Например, для команды переместить необходимо, чтобы объект перемещения не содержал других предметов на верхней грани.
В подобных задачах недостатком аппарата фреймов, как отмечается, например, в [3], является отсутствие хронологической информации и невозможность учета истории диалога. В этом случае возникает необходимость введения внешнего менеджера диалога, задачей которого является выход из тупиковых веток диалога, если оператор, например, не способен предоставить необходимую уточняющую информацию. В этом случае, по инициативе системы, могут быть предложены возможные готовые варианты ответа, задание другой команды или переход в режим гностических операций. В общем случае можно сказать, что задачей менеджера диалога является ведение фрейма-сценария на основе содержащейся в последнем процедурной информации.
4. Заключение
Наличие описанных выше моделей диалога повышает эффективность речевого интерфейса, так как дает возможность прогнозирования последующих действий оператора в рамках речевого взаимодействия. В самом простом случае прогнозирование может быть основано на данных, удовлетворяющих уточняющему запросу системы, имеющихся в самой системе, но не указанных оператором при инициации диалога. Перечень наиболее вероятных ответов можно использовать, например, в качестве "опорной" информации на этапе распознавания речевого сигнала.
Литература
1. Морозов Д.Н. Фреймовое представление естественно-языковых запросов в задачах управления мобильным манипуляционным роботом // Труды IV Международной научно-практической конференции "Интегрированные модели и мягкие вычисления в искусственном интеллекте" - М.: Физматлит, 2007. - С.333-339.
2. Ющенко А.С. Интеллектуальное планирование в деятельности роботов. - Мехатроника, 2005. - №3. - С.5-18.
3. Ли И.В. Локальный и глобальный уровни управления диалогом // Труды международной конференции "Диалог 2007", С.382-387.
Размещено на Allbest.ru
...Подобные документы
Разработка программы-модели в среде "Adamview" для имитации стратегии и наглядной иллюстрации работы программы. Настройка сети; описание эмулятора стратегии и экранных форм интерфейса оператора. Структурная схема распределённой системы управления.
курсовая работа [2,6 M], добавлен 21.01.2013Диалоговые системы как составляющая компьютерной лингвистики. Их характеристики и типы. Использование сценариев при их создании. Структура ДС с интеллектуальным интерфейсом на естественном языке. Способ и система для предоставления речевого интерфейса.
курсовая работа [195,8 K], добавлен 23.01.2014Понятие пользовательского интерфейса, требования к его разработке. Понятие диалога, типы диалога. Критерии хорошего диалога. Эвристические правила Якоба. Принципы построения интерфейсов. Факторы, влияющие на удобство работы с программным обеспечением.
презентация [2,9 M], добавлен 19.09.2016Понятие и виды пользовательского интерфейса, его совершенствование с помощью новых технологий. Характеристика приборной панели управления современного автомобиля и пультов дистанционного управления. Использование клавиатуры, особенности интерфейса WIMP.
курсовая работа [1,4 M], добавлен 15.12.2011Характеристика гостиничного комплекса и существующей системы управления. Структурная схема предприятия. Информационные потоки. Цели создания автоматизированной системы управления. Локальные сети. Описание информационной базы и интерфейса пользователя.
дипломная работа [4,9 M], добавлен 16.10.2012Электронные средства, с помощью которых осуществляется взаимодействие депутатов и общества. Цели использования вычислительной техники для решения задачи по реализации Интернет-приемной. Программное обеспечение web-интерфейса системы городской Думы.
дипломная работа [3,3 M], добавлен 13.02.2013Описание салона-магазина по предоставлению услуг оператора мобильной связи. Обоснование создания автоматизированной информационной системы "Оператор". Выбор программного обеспечения, проектирование реляционной базы данных. Описание основ интерфейса.
дипломная работа [1,9 M], добавлен 27.05.2015Понятие электронных курсов. Описание программных и языковых средств разработки. Технология создания компьютерной обучающей системы, пакета вопросов в редакторе Excel. Разработка интерфейса ЭС. Организация диалога пользователя с экспертной системой.
дипломная работа [10,8 M], добавлен 20.06.2014Изучение возможностей системы YouTrack. Аналитический обзор ее аналогов и их функциональности. Анализ требований к системе управления проектами и надстройке. Визуализация данных. Проектирование интерфейса надстройки. Определение технологий реализации.
курсовая работа [2,3 M], добавлен 13.09.2017Операционная система Windows фирмы Microsoft во всех ее проявлениях. Ее интерфейс как универсальный механизм управления любым приложением ОС. Свойства анимационного пользовательского интерфейса. Настройка программного продукта, его адаптация к технике ПК.
контрольная работа [50,5 K], добавлен 03.05.2009Модификация системы управления пользователями прокси-сервера SQUID. Выбор средств разработки программного обеспечения. Структура базы данных MySQL. Построение web-интерфейса. Авторизация в системе управления пользователями, страница администрирования.
курсовая работа [456,2 K], добавлен 23.07.2011Описание технологического процесса выделения фракции ароматических углеводородов из бензола. Протоколы межуровневого взаимодействия интегрированной системой управления. Описание прикладного программного обеспечения, алгоритмов и интерфейса оператора.
дипломная работа [3,8 M], добавлен 21.10.2012Функции системы и обоснование выбора контроллера. Обработка данных по web–технологии клиент-сервер. Организация Web–интерфейса в инструментальном пакете Trace Mode. Методика расчета показателей надежности. Структурная схема с цифровым регулятором.
дипломная работа [1,6 M], добавлен 30.09.2013Определение функциональности программного продукта. Проектирование интерфейса автоматизированной информационной системы администратора. Страница просмотра основных сведений о клиенте. Отображение комплектации автомобиля. Интерфейс формы учёта продаж.
курсовая работа [1,0 M], добавлен 09.12.2014Создание тестирующих и игровых программ. Степень сложности и художественного оформления интерфейса пользователя. Создание справочной системы. Корректное отображение символов. Создание системы управления базами данных в среде Delphi и таблиц базы данных.
методичка [1,0 M], добавлен 24.10.2012Структурная схема моделируемой системы и её описание. Временная диаграмма и Q-схема системы. Укрупнённая и детальная схема моделирующего алгоритма. Описание машинной программы решения задачи. Описание возможных улучшений и оптимизации в работе системы.
курсовая работа [69,2 K], добавлен 02.07.2011Автоматизированная система управления, важные компоненты. Описание SCADA-системы WinCC v6. Graphics Designer как редактор для разработки кадров пользовательского интерфейса. Alarm Logging как редактор для конфигурирования и архивации аварийных сообщений.
презентация [415,0 K], добавлен 06.08.2013Критерии и порядок выбора интерфейса веб-сайта. Характеристики, которые определяют успешность пользовательского интерфейса. Структура навигационной системы. Графический дизайн и выбор цветовой схемы. Техническая реализация интерфейса сайта на сегодня.
реферат [164,8 K], добавлен 24.02.2011Разработка операторского интерфейса системы мониторинга и управления объекта, обладающего инерционными свойствами. Создание программного обеспечения для отображения данных системы в среде программирования ST. Моделирование имитаторов объекта управления.
курсовая работа [3,1 M], добавлен 14.02.2016Дизайн интерфейса приложения как связь человека и персонального компьютера. Adobe Photoshop и его возможности, анализ функциональности и содержание главных операций. Используемые инструменты для разработки дизайна интерфейса текстового редактора.
контрольная работа [407,5 K], добавлен 12.10.2015