Интеллектуальные информационные системы
Назначение, методология разработки и принципы построения интеллектуальных информационных систем. Направления искусственного интеллекта: экспертные системы; общение на естественном языке; обработка визуальной информации; речевое общение; машинный перевод.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | учебное пособие |
Язык | русский |
Дата добавления | 14.09.2017 |
Размер файла | 729,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Отметим, что дуги определяют отношения между сказуемым «давать» и понятиями (такими, как «Ольга» и «подарок»), связанными с этим сказуемым.
Представление через семантическую сеть обеспечивает стандартный метод анализа смысла предложения. Кроме того, оно указывает сходства в смысле предложений, тесно связанных, но обладающих разной структурой. Хотя рассмотренные предложения выглядят очень отличающимися друг от друга, но семантические сети, представляющие смысл этих предложений, похожи. В самом деле, семантическая сеть рисунка 23 целиком содержится в сети рисунка 24.
Рисунок 23. Представление семантической сетью предложения «Михаил дает Ольге подарок»
Рисунок 24. Представление семантической сетью сложного предложения «Михаил сказал Маше, что он дал Ольге подарок»
Представление знаний с использованием фреймов. В области искусственного интеллекта термин «фрейм» относится к специальному методу представления общих концепций и ситуаций. Марвин Минский, первый, кто выдвинул идею фреймов, описывает данный термин следующим образом: «Фрейм -- это структура данных, представляющих стереотипную ситуацию, вроде нахождения внутри некоторого рода жилой комнаты или сбора на вечеринку по поводу дня рождения ребенка. К каждому фрейму присоединяется несколько видов информации. Часть этой информации -- о том, как использовать фрейм. Часть -- о том, чего можно ожидать далее. Часть -- о том, что следует сделать, если эти ожидания не подтвердились» (цит по: [9, с. 124]).
Фрейм по своей организации во многом похож на семантическую сеть (фактически мы рассматриваем и семантические сети, и фреймы как системы, основанные на фреймах). Фрейм является сетью узлов и отношений, организованных иерархически, где верхние узлы представляют общие понятия, а нижние узлы -- частные случаи этих понятий. В системе, основанной на фреймах, понятие о письменном отчете может быть организовано и так, как показано на рисунке 25.
Рисунок 25. Понятие письменного отчета
Это представление выглядит точно так же, как семантическая сеть. Но в системе, основанной на фреймах, понятие в каждом узле определяется набором атрибутов (например, имя, цвет, размер) и значениями этих атрибутов, которые называются слотами. Каждый слот может быть связан с процедурами (произвольными машинными программами), которые выполняются, когда информация в слотах (значения атрибутов) меняется. Пример такого узла показан на рисунке 26.
С каждым слотом можно связывать любое число процедур. Три типа процедур, чаще всего соотносимых со слотами, перечислены ниже.
1. Процедура «если -- добавлено» выполняется, когда новая информация добавляется в слот.
2. Процедура «если -- удалено» выполняется, когда информация удаляется из слота.
3. Процедура «если -- нужно» выполняется, когда запрашивается информация из слота, а он пустой.
Рисунок 26. Узел во фреймовых системах
Эти процедуры могут следить за добавлением информации к данному узлу и проверять, производятся ли соответствующие действия при изменении значения. Как ясно из их структуры, системы, основанные на фреймах, хороши в тех предметных областях, где ожидания относительно формы и содержания данных играют важную роль, например при интерпретации визуальной информации или понимании речи. Чтобы понять, как работает система, основанная на фреймах, рассмотрим рисунок 27, где фреймы представлены на этот раз со всеми слотами, их значениями и процедурами. Для упрощения допустим, что некоторые слоты имеют значения по умолчанию; например, пока нет информации об обратном, автор отчета о продвижении разработки считается руководителем проекта.
1. Уведомить лицо из слота «автор», что отчет по теме из слота «тема» объемом число страниц из слота «объем» должен быть представлен к дате из слота «дата представления».
2. Уведомить лицо из слота «автор», что отчет по теме из слота «тема» отменяется.
3. Поместить в слот «автор» имя руководителя проекта для «IP телефония» из слота «тема».
4. Поместить в слот «дата представления» либо «31 марта», либо «31 июня», либо «30 сентября», либо «31 декабря» в зависимости от того, какая дата ближе, но не более раннюю, чем текущая дата.
Рисунок 27. Система, основанная на фреймах
Как подобным образом можно использовать организованные знания? Предположим, ведущий специалист по программному обеспечению в некой корпорации имеет доступ через настольный терминал к системе, основанной на фреймах, допустим, данный специалист связывается с системой через программный интерфейс, который позволяет общаться с ней на языке, весьма близком к естественному. Специалист запрашивает: «Мне нужен отчет о продвижении проекта IP телефонии». Интерфейсная программа анализирует это предложение и вносит «проект IP телефонии», «тема» в следующий пустой узел «отчет о продвижении».
Далее все происходит автоматически.
1. Процедура «если -- добавлено», связанная со слотом «тема», выполняется, поскольку в слот было введено некое значение. Эта процедура осуществляет поиск (в базе данных системы) руководителя проекта IP телефонии. Допустим, что имя руководителя проекта Иван Иванов. Процедура вписывает это имя в слот «автор» отчета о продвижении работ.
2. Процедура «если -- добавлено», связанная со слотом «автор», выполняется, т.к. в слот было только что вписано значение. Эта процедура начинает составлять сообщение, чтобы отправить его в слот «Иван Иванов», но обнаруживает, что у нее нет нужного значения «дата исполнения».
3. Процедура «если -- добавлено» просматривает слот «дата исполнения» и, найдя его пустым, активизирует процедуру «если -- нужно», связанную с этим слотом. Процедура «если -- нужно» найдет текущую дату, используя календарь в базе данных, и решит, что дата «30 сентября» -- ближайшая к ней. Процедура затем впишет «30 сентября» в слот с датой исполнения.
4. Теперь процедура «если -- добавлено», связанная со слотом «автор», установит, что еще одно значение, которое нужно включить в сообщение, т.е. объем отчета, отсутствует. Слот «объем» не связан с процедурами, он ничем не может помочь. Однако выше существует узел общей концепции отчета о продвижении работ, содержащий значение объема. Процедура использует его значение и составляет следующее сообщение: «Иван Иванов, пожалуйста, окончите отчет о продвижении по проекту IP телефонии к 30 сентября. Предполагаемый объем отчета равен двум страницам».
Если в какой-то момент имя Иван Иванов удаляется из слота «автор», то система автоматически отправит сообщение, что отчет не требуется (поскольку сработает процедура «если -- удалено».
1.7 Особенности различных представлений знаний
Различные способы представления знаний, обсуждались так, как будто они совершенно не связаны между собой, что совершенно не верно. Это отражает лишь тот факт, что все разработки велись по различным концепциям. Однако всегда оставалась общая цель -- представление знаний и их использование в решении проблем, поэтому можно сказать, что взаимное различие способов представления заключается, скорее, в их внешнем виде, а существо не изменяется. Конечно, уровень достижения цели, уровень системного развития будут неодинаковы для каждого соответствующего способа представления, хотя в методологическом отношении весьма желательна легкость достижения цели при проведении выводов. Значит, если задаться вопросом, какова цель, которой должна достичь система представления знаний, то ответ на него не всегда будет ясен. Прежде инженерией знаний ставилась задача успешно применять знания. О современных системах инженерии знаний можно также сказать, что их практическое воплощение достигло еще только экспериментальной стадии. Чтобы обеспечить полноценное развитие технологии обработки знаний, необходимо на самых ранних этапах поставить ту цель, которую должна преследовать эта технология. Задачей обработки знаний является поддержка интеллектуальной деятельности человека, и поэтому необходимо начинать с анализа методов решения проблем человеком.
Различные способы представления знаний имеют присущие только им характерные черты. Сначала обсудим их очевидные особенности.
Продукционные правила. Представление знаний с помощью продукционных правил весьма просто, а выводы, которые проводятся на основе формализма вида, если -- то, легко понимаемы и аналогичны всем тем силлогизмам, что мы усвоили еще в детскую пору. Кроме того, ярко выраженная модульность правил позволяет задавать новые значения, не вдаваясь в смысл других знаний. Благодаря этому, а также возможности построения выводов, в однородной форме получаемые системы становятся несложными и легко понимаемыми. С другой стороны, нетрудно видеть, что такая простота, являющаяся следствием немного красочного представления всех описаний, направлена на решение легких, однородных по свойствам задач и приводит к резкому падению эффективности решения таких проблем, которые состоят из нескольких разнородных задач. Но даже если проблема является простой, не удается построить систему для управления знаниями как единым целым, поэтому целиком весь процесс управления должен осуществляться человеком. Если проблема становится сложнее, то и управление становится сложным. В частности, особенность системы знаний состоит в том, что человек может в течение длительного времени накапливать или же тщательно отрабатывать знания. Однако в этом случае возможно, что по некоторым причинам, будь источником этих причин человек или время, возникнут знания, противоречащие полученным ранее. Человеку свойственны некоторые ограничения, касающиеся управления этим процессом, что, в свою очередь, накладывает ограничения на масштаб и многообразие решаемых проблем.
Семантические сети. Семантические сети -- это общее название методов описания, использующих сети, ими же называют один из способов представления знаний. Характерная особенность семантической сети -- в наглядности отображения знаний системы. Каждое отдельное знание рассматривается как некое отношение между сущностями и понятиями, и формально, так же как и в продукционных системах, определенные заранее и уже имеющиеся внутри системы знания можно наращивать независимо от сохранения их модульности. В то же время все знания, относящиеся к одинаковым сущностям и понятиям, могут быть изображены в виде отношений между различными узлами, описывающими эти сущности, и это дает основание говорить о легкости понимания такого представления. На основе данных сетей осуществляются выводы, однако для этого необходимы специальные алгоритмы вывода. В продукционных системах выводы определяются для ограниченного формализма, если -- то, поэтому алгоритмы вывода также формализованы и наряду со своей простотой достаточно точны. Поскольку семантические сети являются собирательным названием систем представления, использующих сети, нет смысла определять для них специфические алгоритмы вывода, и потому сравнивать сети c другими способами представления весьма трудно. Однако из-за того что форма представления сетями не устанавливается, для каждого конкретного формализма будут определены свои собственные правила вывода, значит, усиливается элемент произвольности, вносимый человеком. Выводы, которые достаточно тщательно не проверены, таят в себе угрозу создания противоречий. Следовательно, в семантических сетях необходимо больше, чем в продукционных системах, уделять внимания устранению противоречий. Сама система такими возможностями не обладает, и поэтому во многих случаях эта функция возлагается на человека. Просматривая все знания, человек способен управлять их противоречивостью, однако если объем знаний будет увеличиваться, то их представление резко усложнится, что ограничит круг решаемых проблем сравнительно небольшими проблемами.
Фреймовые системы. Фреймовые системы, как и продукционные, определяют форму представления знаний и отличаются от других аналогичных систем тем, что предоставляют пользователю большую степень свободы. Фреймовая система не только описывает знания, но и может также использоваться человеком для написания алгоритмов вывода. С точки зрения пользователя, который очень хорошо разбирается в обработке знаний, это выглядит преимуществом, однако для рядового потребителя -- это большая нагрузка. Фреймовая система является расширением традиционных систем процедурного типа. Благодаря подобным свойствам можно формально строить фреймовые системы в самом широком диапазоне, поэтому и оценки, получаемые средствами фреймов систем, должны, вероятно, быть самыми различными.
Фрейм как структура описывает одну из единиц обработки, обладающую до некоторой степени независимостью, и может представлять средства, связывающие между собой эти структурные единицы. Следовательно, если сравнивать фреймовую систему с традиционной программной системой, где весь смысл обработки должен описываться группой последовательно соединенных операций, то можно говорить о частичном снятии ограничений процесса обработки за счет описания обрабатываемых единиц в виде фреймов, которые (по крайней мере, часть из них) не обязательно следуют один за другим. Однако то обстоятельство, что здесь знания задаются, по существу, процедурами, усложняет по сравнению с другими методами приобретение знаний и обедняет возможности динамической адаптации к изменениям внешней среды. Кроме того, предполагается, что в сложных проблемах отношения между фреймами также становятся сложными.
Во фреймовых системах имеется еще один существенный недостаток, связанный с их структурой. Сам по себе фрейм является множеством описаний (слотов), находящихся в некоторых взаимных отношениях. То, что слоты связаны с процедурами, а также то, что они передают друг другу управление посредством обмена сообщениями, означает, что структура фреймовой системы описывает структуру управления процедурной обработкой. Однако во многих случаях описание некоей сущности рассматривается как единое целое, и поэтому зачастую фрейм есть представление этой сущности. Когда все сходные между собой сущности собраны воедино и это множество оформлено в виде фрейма как сущность класса, то между полученным фреймом и фреймами каждой отдельной сущности будут сформированы структурные отношения.
На базе этой структуры, которая может рассматриваться как структура данных, будет порождено наследование. В конечном итоге фреймовая система приводится к форме представления единиц управляющих структур и единиц структур данных в общих фреймах, поэтому иногда необходимо прибегать к довольно надуманным приемам; при этом теряется легкость интуитивного понимания, являющаяся особенностью данной системы. Подобное ограничение допустимо для проблем сравнительно небольшого масштаба, но если проблема несколько расширяется, то описание и управление во фреймовой системе становятся более сложными, чем в системах традиционного процедурного представления, и тогда о ней трудно говорить как об универсальной системе обработки знаний.
Таким образом, для большинства используемых сегодня представлений знаний и созданных на их основе систем характерно усложнение описания проблемы при разрастании ее масштабов. Этот недостаток трудно будет устранить, не лишившись одновременно преимуществ соответствующих методов.
Когда в какой бы то ни было области, включая и системы искусственного интеллекта, предлагается новая методология, чрезвычайно важно установить, подходит или нет эта методология для решения сложных проблем в той степени, как это требуется в действительности. Применительно к системам искусственного интеллекта методология системного проектирования, которая годилась бы для крупномасштабных проблем, весьма далека от идеи простого количественного расширения методологии, созданной для небольших проблем, и в этом проявляется существенное различие таких методологий.
В процессе оценки пригодности экспертных или других систем инженерии знаний для решения реальных проблем прибегали к количественному наращиванию технологии и алгоритмов, используемых в этих системах. В итоге оказалось, что на некоторых этапах наращивания или в самом его конце ЭС действительно полезны в решении проблем и этим отличаются от любых других используемых сегодня методов.
искусственный интеллектуальный информационный экспертный
2. РАЗДЕЛ. СИСТЕМЫ ОБЩЕНИЯ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
2.1 Назначение и область применения естественно-языковых систем
В конце 60-х годов в исследованиях по ИИ сформировалось самостоятельное направление, получившее название «обработка естественного языка». Задачей данного направления является изучение методов и разработка систем, обеспечивающих реализацию процесса общения с ЭВМ на естественном языке (систем ЕЯ-общения, или ЕЯ-систем).
Следует отметить, что проблематика коммуникативного взаимодействия, и в частности ЕЯ-общения, находится в центре внимания многих наук, например лингвистики, психологии, логики и философии. Однако все они исследуют лишь отдельные аспекты процесса общения. В отличие от них ИИ как прикладная дисциплина вынуждена моделировать в рамках ЕЯ-систем все или, по крайней мере, основные аспекты ЕЯ-общения, правда, может быть, не на столь глубоком уровне.
Проблема взаимодействия человека с ЭВМ существует с момента появления средств вычислительной техники. На начальном этапе непосредственное взаимодействие с ЭВМ осуществляли только программисты, а специалисты других областей -- потребители результатов, полученных на ЭВМ, выступали в роли косвенных конечных пользователей, т.е. общались с ЭВМ через программистов. По мере расширения сферы использования ЭВМ и увеличения масштабов их применения конечные пользователи стали вовлекаться в процесс непосредственного взаимодействия с ЭВМ, что привело к появлению массовой категории прямых конечных пользователей, работающих в диалоговом режиме. К пользователям этой категории относятся специалисты в различных проблемных областях, которые решают свои профессиональные задачи, непосредственно используя ЭВМ, т.е. прикладные программы и пакеты (прикладные системы), входящие в программное обеспечение ЭВМ. Как правило, такие пользователи не обладают знаниями в области электронной обработки данных и не умеют (и не должны) программировать. Поэтому часто их называют неподготовленными конечными пользователями. В дальнейшем термины «пользователь» и «конечный пользователь» будут использоваться в смысле «неподготовленный конечный пользователь».
Сложность создания средств общения, предназначенных для конечных пользователей, обусловлена в значительной степени отсутствием единой теории языкового общения, охватывающей все аспекты взаимодействия коммуникантов. Поэтому при разработке средств общения конечных пользователей на процесс взаимодействия часто налагаются различные «спонтанные» ограничения, последствия которых не до конца осознаются разработчиками. Эти ограничения приводят к тому, что многие человеко-машинные системы, на разработку которых тратятся огромные средства (например, корпоративные информационные системы), не удовлетворяют требованиям конечных пользователей.
Прежде чем приступить к рассмотрению ЕЯ-систем, остановимся на определении некоторых исходных понятий, которые будут широко использоваться.
Общение -- коммуникативное взаимодействие. Диалог -- процесс достижения участниками общения определенных согласованных целей путем обмена связанными высказываниями, выраженными в языке, о некотором реальном или гипотетическом мире (предметной области). Говоря об общении человека с ЭВМ, обычно считают, что цель ЭВМ состоит в том, чтобы способствовать достижению целей пользователя, которые определяются его информационными потребностями. Поэтому применительно к диалогу между пользователем и ЭВМ под общением понимают процесс обмена взаимосвязанными высказываниями, выраженными в языке, направленный на достижение целей пользователя, т.е. на удовлетворение информационных потребностей пользователя (ИПП).
В общем случае процесс общения не может быть сведен к обмену изолированными парами высказываний «вопрос -- ответ». Высказывания участников общения образуют связный текст -- дискурс, имеющий, как правило, достаточно сложную структуру. Связность дискурса обеспечивается и лингвистическими (родовидовыми, анафорическими, модальными, стилистическими согласованиями, согласованиями пресуппозиций и т.п.), и экстралингвистическими (ситуативными) средствами, т.е. с помощью временных, причинно-следственных и других связей, существующих в предметной области. Следует подчеркнуть, что разговорный естественный язык гораздо более компактен, чем литературный, «письменный» язык, т.к. при общении широко используются разнообразные умолчания (эллипсисы, анафоры пресуппозиции и др.), восстанавливаемые (раскрываемые) участниками исходя из текущих целей диалога.
Если участники достигли цели, поставленной в начале общения, то говорят, что общение завершилось успехом (глобальным успехом), в противном случае -- неудачей (глобальной неудачей). В процессе общения могут возникать локальные неудачи, вызванные, например, неправильностью высказываний участников (нарушением грамматических норм), непониманием друг друга из-за различных представлений о теме диалога или о предметной области и языке общения и т.п. Большая часть локальных неудач не приводит к глобальной неудаче; они преодолеваются участниками общения гибкой (в ходе диалога) корректировкой текущих целей.
Цели, преследуемые участниками общения, определяют структуру диалога, которая может рассматриваться, по крайней мере, на трех уровнях: глобальном, тематическом и локальном. На глобальном уровне (структура) определяются общие свойства решаемых пользователями задач. На тематическом уровне структура диалога зависит от конкретных особенностей решаемой задачи -- от алгоритма ее решения (разбиения задач на подзадачи) и распределения ролей (активная или пассивная роль) между участниками общения при решении отдельных подзадач. На локальном уровне рассматриваются отдельные шаги диалога, образуемые взаимосвязанными высказываниями его участников. Шаг диалога трактуется как пара «действие -- реакция», где высказывание активного (т.е. владеющего инициативой) участника соответствует действию, а пассивного -- реакции. Основными параметрами структуры диалога на этом уровне являются: инициатор шага и вид инициирования (вид действия); способ влияния действия на реакцию; способ спецификации задачи (подзадачи), решаемой на данном шаге. Действие и реакция, образующие шаг диалога, могут в общем случае не соответствовать соседним (во временной последовательности) высказываниям участников. Соответствие нарушается при перехвате инициативы.
Перехват инициативы возникает в тех случаях, когда пассивный участник вместо цели (подцели), предложенной активным участником, выбирает иные цели (подцели), в частности подцели, предусматривающие преодоление локальных неудач. Например, вместо ответа на вопрос (что соответствовало бы стандартной реакции) второй участник может задать встречный вопрос (т.е. совершить действие и тем самым взять на себя активную роль) и лишь после получения ответа на него ответить на первоначально заданный вопрос (и тем самым вернуть инициативу). Таким образом, перехват инициативы как бы разрывает первоначально инициированный шаг диалога и открывает поддиалог -- происходит смена цели (темы) диалога, в котором инициативой владеет ранее пассивный участник.
Переходя к рассмотрению человеко-машинного общения, подчеркнем, что взаимодействие конечных пользователей с системой происходит на всех стадиях существования человеко-машинной системы, т.е. на стадиях использования, разработки и развития приложений. Традиционные средства общения, которые вплоть до настоящего времени широко применяются на практике, ориентированы, как правило, либо только на использование ранее разработанных и неизменяемых приложений (например, система по продаже авиационных или железнодорожных билетов), либо на использование, создание и развитие приложений. В первом случае процесс взаимодействия сводится к трем этапам: определение параметров работы системы (вход в систему); определение решаемой задачи и исходных данных; получение результатов решения задачи -- и принципиально не может удовлетворить пользователей с изменяющейся информационной потребностью, не знающих способа представления и использования в системе информации, которой обмениваются участники общения. Во втором случае взаимодействие осуществляется с помощью процедурного языка программирования, что также не удовлетворяет большинство конечных пользователей, обычно не умеющих (и не желающих) программировать.
Низкая эффективность, а часто неприемлемость традиционных средств общения в большинстве случаев вызвана тем, что в них не учитываются важнейшие особенности процесса общения, направленного на удовлетворение реальных ИПП. Эти особенности независимо от специфики решаемых пользователями задач сводятся к следующим.
1. Изменяемость ИПП. Данная потребность не может быть заранее четко определена в спецификациях на разработку системы общения. Напротив, ИПП неизбежно изменяется в ходе разработки и эксплуатации системы.
2. Несовпадение взглядов на мир. Представления, имеющиеся у пользователя и системы о языке общения и предметной области, относительно которой ведется общение, могут не совпадать. Исходя из этого, процесс общения должен предусматривать разъяснение смысла неизвестных терминов, обнаружение и устранение несовпадающих представлений, а также предупреждение ошибочных толкований, т.е. установление общих точек зрения на обсуждаемые в процессе общения сущности.
3. Связность общения. Процесс общения не может быть ограничен обменом изолированными парами «вопрос -- ответ», т.к. в большинстве реальных случаев ИПП не может быть выражена в виде одного вопроса (предложения). Часто требуется определить ситуацию возникновения ИПП, т.е. предпослать запросу на решение конкретной задачи контекст, в котором эту задачу необходимо решать. Кроме того, процесс удовлетворения ИПП в ходе решения некоторой задачи в большинстве реальных приложений требует взаимодействия, основанного на смешанной инициативе участников. Поэтому процесс общения должен иметь сложную, разветвленную структуру и состоять из обмена связанными высказываниями.
4. «Неправильность» высказываний пользователя. Для выражения своих информационных потребностей пользователь может применять как «правильные» предложения, т.е. такие, которые будут однозначно поняты и верно обработаны системой, так и «неправильные». Неправильности могут быть вызваны, во-первых, невозможностью учета пользователем всех ограничений системы общения, в частности уровня ее возможностей и знаний (в большей степени это касается экономико-математических моделей), во-вторых, использованием умолчаний, характерных для естественного общения и допускающих неоднозначное толкование высказываний, и, в-третьих, отклонением предложений от грамматической нормы.
Недостатки традиционных средств общения обусловили создание средств нового поколения, которые должны быть способны настраиваться на реализацию ИПП и адаптироваться к их изменению, представлять и объяснять свою точку зрения на предметную область, а также учитывать точку зрения пользователя, поддерживать тесный диалог и уметь обрабатывать «неправильные» высказывания. Разработка этих средств ведется в настоящее время по двум основным направлениям. Первое направление, развиваемое преимущественно специалистами по системам обработки экономической информации, ставит своей целью повышение уровня и увеличение непроцедурности формализованных языков общения. Второе направление развивается в рамках ИИ и предполагает использование конечными пользователями для взаимодействия с ЭВМ естественного языка, семантически и прагматически ограниченного проблемной областью, относительно которой ведется общение. Рассматриваемые далее ЕЯ-системы разработаны в рамках второго направления.
2.2 Обобщенная схема естественно-языковой системы
Традиционные средства общения не позволяют обеспечить должного уровня взаимодействия конечных пользователей с создаваемыми системами. Чтобы быть полноправным участником общения, ЕЯ-система должна выполнять некоторые обязательные функции. К этим функциям относятся, по крайней мере следующие: ведение диалога -- определение его структуры и той роли, которую система и пользователь выполняют на текущем шаге диалога; понимание -- преобразование поступающих от пользователя высказываний на ЕЯ в высказывания на языке внутреннего представления; обработка высказываний -- формирование или определение заданий для решения задач или подзадач на данном шаге диалога; генерация -- формирование выходных высказываний на ЕЯ. Приведенные функции имеют обобщенный характер. Поэтому необходимо подчеркнуть, что при реализации конкретных ЕЯ-систем суть этих функций может в значительной степени варьироваться.
В соответствии с выделенными функциями обобщенная схема ЕЯ-системы (рисунок 1.) может быть представлена в виде трех компонентов: диалогового, компонента понимания высказываний, компонента генерации высказываний.
К основным задачам диалогового компонента относятся: ведение диалога, формирование или обработка перехватов инициативы.
Ведение диалога направлено на обеспечение целесообразных (т.е. способствующих достижению конечных целей пользователя) действий системы на текущем шаге диалога.
Рисунок 1. Обобщенная схема ЕЯ-системы
В связи с тем, что возможности существующих ЕЯ-систем не позволяют им самостоятельно формировать целесообразное поведение, в систему обычно вводится информация, определяющая общую и тематическую структуры диалога. По структуре и текущему состоянию диалога диалоговый компонент формирует (если инициатива принадлежит системе) или определяет (если инициатива принадлежит пользователю) задание, выполняемое системой на текущем шаге (например, генерация вопроса, понимание ответа и его обработка, генерация утверждения и т.п.).
Ведение диалога выполняется по одной из двух схем: диалог ведет пользователь, диалог ведет система. В первом случае инициатива в основном (за исключением сообщений об ошибках) находится у пользователя, а система только реагирует на его требования, определяя по виду требования тип задания. Разбиение задачи на подзадачи и распределение ролей осуществляет пользователь, т.е. для системы весь диалог сводится к выработке реакций на текущие высказывания пользователя. Можно сказать, что в этом варианте работы функции диалогового компонента практически отсутствуют. Во втором случае инициатива в основном принадлежит системе. Она ведет диалог в соответствии с имеющимися у нее представлениями о структуре диалога (т.е. о разбиении задач на подзадачи и о том, кто из участников, когда и какую подзадачу решает) и о способе обмена высказываниями.
Если роли участников неизменны, однозначны и предопределены заранее, то структуру диалога называют жесткой. В простейшем случае такая структура диалога сводится к двум взаимосвязанным высказываниям участников (вопрос -- ответ) с указанием участника, владеющего инициативой. Развитием жесткой структуры является альтернативная структура, которая задает множество возможных (но ранее предписанных) направлений течения диалога. Выбор одного из возможных направлений осуществляет пассивный участник. Если роли участников общения распределяются в ходе общения, то структуру диалога называют гибкой. Гибкие структуры подразделяются по степени свободы выбора момента перехвата (предопределенные моменты, произвольные моменты) и способу перехвата (предопределенный способ перехвата, произвольный способ).
Вторая задача диалогового компонента связана с тем, что реакции одного участника могут не соответствовать ожиданиям другого. В зависимости от того, кто осуществляет перехват инициативы, система либо формирует перехват, либо обрабатывает его. Формирование происходит в тех случаях, когда система определяет, что текущая ситуация не соответствует ситуации, предусмотренной структурой диалога. Если же перехват инициативы осуществляет пользователь, то задача системы -- обработать его, т.е. распознать наличие перехвата инициативы, определить новую тему (цель), на которую перешел пользователь, и выбрать структуру диалога, соответствующую новой теме.
Компонент понимания высказываний предназначен для выделения смысла входного высказывания и выражения этого смысла на внутреннем языке системы. Под смыслом высказывания обычно понимается вся та семантико-прагматическая информация, которую пользователь хотел передать системе. Внутреннее представление смысла должно содержать, по крайней мере, следующую информацию: сущности предметной области, вовлекаемые в зону рассмотрения данным высказыванием; свойства и отношения, приписанные этим сущностям; коммуникативные намерения говорящего, выраженные в данном высказывании. Выявление смысла высказывания в общем случае требует его рассмотрения в контексте всего диалога.
Традиционно задача понимания высказываний подразделяется на два этапа: анализ и интерпретацию. На этапе анализа выделяются описания сущностей и отношения между ними. Анализ обычно выполняется отдельным блоком-анализатором, служащим ядром компонента понимания. Анализаторы, разрабатываемые для ЕЯ-систем, различаются по ряду параметров. Основные из них: тип анализируемых предложений; выделяемые описания сущностей; глубина проникновения в смысл; используемые для анализа средства. Возможные значения этих параметров приведены в таблице. При рассмотрении данной таблицы следует учитывать, что тот или иной параметр в случае конкретного анализатора может принимать одно или несколько из указанных в таблице значений.
Интерпретация заключается в отображении входного высказывания на знания системы. Основными задачами данного этапа являются: буквальная интерпретация высказывания в контексте диалога; интерпретация высказывания на намерения говорящего.
Буквальная интерпретация состоит в учете контекста диалога, идентификации образов тех сущностей области интерпретации, которые имел в виду говорящий. В качестве области интерпретации могут использоваться: предметная область; область языка общения (если высказывание пользователя касается языка общения); область системы (если пользователь интересуется возможностями и состояниями системы; интерпретация на эту область особенно важна при возникновении «непонимания» между пользователем и системой); область пользователя (если высказывание содержит сведения о знаниях или намерениях пользователя); область дискурса (если в высказывании содержатся ссылки на предыдущие или последующие высказывания).
Основные параметры ЕЯ-системы
Параметр |
Возможные значения |
|||
Типы анализируемых предложений |
Повествовательные, вопросительные, отрицательные, полные, неполные, простые, сложные, распространенные, нераспространенные и др. |
|||
Выделяемые описания сущностей |
Понятия |
Конкретные (индивидуальные), абстрактные, метапонятия |
||
Отношения |
Предикаты |
Вспомогательные, предикаты-состояния, предикаты-действия, функциональные и др. |
||
Кванторы |
Отсутствие кванторов, кванторы существования всеобщности, отрицания |
|||
Модальности |
Отсутствие модальностей, объективная и субъективная |
|||
Пресуппозиции |
Отсутствие пресуппозиций, экзистенциональные, семантические, прагматические |
|||
Глубина проникновения в смысл |
Множество ключевых слов, имя события и описания участников события (их роли и характеристики), сценарий с отсылками к связанным подсценариям, пространственно-временное или причинное представление ситуации |
|||
Используемые средства |
Морфологический, синтаксический, семантический, прагматический анализ |
Вторая задача интерпретации состоит в том, чтобы, применяя имеющиеся у системы методы вывода, определить, как обрабатываемое высказывание соотносится с целями и планами участников общения. Строго говоря, данная задача решается совместно диалоговым компонентом и компонентом понимания высказываний. Как отмечалось, одной из функций диалогового компонента является определение отношения входного высказывания к текущей цели. При выполнении этой функции текущая цель (т.е. ее описание в форме внутреннего представления) передается компоненту понимания, который пытается интерпретировать на нее входное высказывание. Решение данной задачи в общем случае представляет собой чрезвычайно сложную проблему. Пока даже не ясен механизм (модель) формирования текущих целей диалоговым компонентом. Положение усугубляется тем, что одно и то же высказывание может использоваться для достижения целей, относящихся к различным областям.
Компонент генерации высказываний решает в соответствии с результатами, полученными остальными компонентами системы, две основные задачи: генерация смысла, т.е. определение типа и смысла выходного высказывания системы во внутреннем представлении; синтез высказывания, т.е. преобразование смысла в высказывание на естественном языке.
Первая из указанных задач является сложной и малоизученной. Тип высказывания зависит от состояния системы и результатов, полученных предыдущими компонентами. Так, если система должна генерировать ответ на вопрос, то необходимо определить по состоянию системы, будет ответ прямой или косвенный. Прямой ответ (т.е. по существу заданного вопроса) может быть дан только в том случае, если обработка вопроса завершилась успешно. Если в процессе обработки вопроса возникают какие-то затруднения, то более уместным будет косвенный ответ, раскрывающий суть возникших затруднений и объясняющий невозможность прямого ответа.
В общем случае при решении задачи формирования смысла выходного высказывания необходимо учитывать прагматический аспект, т.е. цели участников общения. Однако в большинстве существующих систем данная задача решается с помощью достаточно простых подходов. В промышленных системах общения генерация смысла обычно заключается в редактировании значений атрибутов и (или) выборе шаблона ответа. В экспериментальных системах для выражения смысла генерируется полное семантическое представление, включающее одно или несколько связанных событий (понятий) с одним или несколькими исполнителями на каждую роль.
Вторая задача компонента генерации высказываний состоит в синтезе естественно-языкового выражения, соответствующего внутреннему представлению выходного высказывания. Данная задача подразделяется на этапы семантического, синтаксического и морфологического синтеза. Сложность синтеза определяется требованиями естественности и выразительной мощности выходных высказываний. Под естественностью обычно понимается степень близости к естественному языку, т.е. наличие таких свойств, как синонимия и омонимия слов и словосочетаний, свободный порядок слов и т.п. Под выразительной мощностью понимается возможность выразить разнообразные понятия, отношения, кванторы, процедуры и т.п. Естественность и выразительная мощность выходных высказываний в существующих системах различны. Например, высказывания могут фактически не синтезироваться, а выбираться из заранее заготовленного списка либо имеется шаблон ответа, в который подставляются некоторые слова, представляющие собой значения искомых атрибутов; при этом часто используется морфологический синтез. Большая естественность достигается, если выходное высказывание формируется из семантического представления события (или понятия) с применением морфологии, синтаксиса (для определения порядка и формы слов) и семантики (для выбора лексем и обеспечения семантической сочетаемости слов в синтезируемом высказывании).
Для понимания принципов построения ЕЯ-систем важен также вопрос об используемых в системе знаниях, поскольку именно знания, представленные в различных формах, являются той базой, на которой осуществляется решение рассмотренных выше задач.
Знания ЕЯ-систем можно классифицировать по различным основаниям. Будем придерживаться следующей классификации (рисунок ). На верхнем уровне выделяются: собственно знания; способ представления знаний.
Собственно знания классифицируются по областям и по видам знаний. Наиболее существенными с точки зрения процесса ЕЯ-общения являются следующие области знаний: предметная область; область языка; область системы; область пользователя; область диалога (дискурса). Разнообразие областей определяет множество возможных интерпретаций входных высказываний.
К основным видам знаний относятся факты (фактические знания) и операционные знания. Факты представляют собой возможные знания о сущностях, составляющих некоторую область знаний.
Размещено на http://www.Allbest.ru/
Рисунок 2. Знания ЕЯ-систем
Операционные знания -- это информация о способах изменения фактических знаний. Иначе говоря, эти знания задают процедуры преобразования. Часто для их обозначения используется термин «процедурные знания», однако следует иметь в виду, что операционные знания могут быть представлены как в процедурной, так и в декларативной форме.
Способ представления знаний включает два аспекта: способ организации знаний и модель представления. Способы организации знаний различаются по уровням представления и уровням детальности. По уровням представления выделяют знания нулевого уровня (конкретные и абстрактные знания) и знания более высоких уровней (метазнания). Первый уровень составляют знания о том, как в системе представлены знания нулевого уровня. Число уровней представления может быть продолжено. Разделение знаний по уровням представления обеспечивает возможность гибкой настройки и адаптации ЕЯ-системы. Организация знаний по уровням детальности позволяет рассматривать знания с различной степенью подробности. Количество уровней детальности зависит от специфики решаемых задач, количества знаний и способа их представления. Обычно выделяется не менее трех уровней, отражающих общую организацию знаний, логическую и физическую организацию частных структур знаний. Введение нескольких уровней детальности обеспечивает дополнительную гибкость системы, т.к. изолирует изменения одного уровня от других. Модели представления знаний обычно подразделяются на логические и эвристические.
2.3 Настройка естественно-языковых систем
Гибкость ЕЯ-систем. Ограниченность предметной области имеет принципиальное значение, поскольку позволяет наложить вполне «естественные» для каждой из проблемных областей ограничения на лексику, синтаксис, семантику и прагматику языка общения. Это дает возможность рассматривать процесс ЕЯ-общения не во всем многообразии и сложности, а в более узкой (и, следовательно, более простой) постановке. Вместе с тем, чтобы обеспечить общение относительно различных проблемных областей, каждая из которых характеризуется собственными, отличающимися от других областей ограничениями, а также проблемных областей, изменяющихся во времени, ЕЯ-система должна допускать возможность модификации своих знаний, зависящих от специфики предметной области, в которой функционирует система.
Процесс извлечения знаний из некоторого источника и передачи их ЕЯ-системе называют приобретением знаний. В качестве источника знаний может выступать как человек, так и текст, в котором содержатся сведения о предметной области. Если знания ЕЯ-системы не могут приобретаться без участия ее разработчиков (или программистов), то такие системы называются жесткими. Очевидно, что жесткие ЕЯ-системы не удовлетворяют требованиям конечных пользователей к средствам общения.
Гибкие ЕЯ-системы допускают возможность приобретения знаний без привлечения программистов или разработчиков. Степень гибкости ЕЯ-системы определяется по крайней мере следующими факторами: составом (номенклатурой) приобретаемых знаний; пределами, в которых допускается модификация знаний; инициатором процесса приобретения знаний (пользователь или система); требованиями к уровню профессиональной подготовки лиц, участвующих в процессе приобретения знаний.
Возможности приобретения знаний в гибких ЕЯ-системах основаны на использовании различных способов представления проблемно-независимых и проблемно-ориентированных знаний. Предполагается, что знания ЕЯ-системы могут быть разделены на проблемно-независимые, используемые в любом из возможных приложений, и проблемно-ориентированные, определяемые спецификой конкретных приложений. Проблемно-независимые знания вводятся в ЕЯ-систему при ее разработке. Большая их часть представляется процедурно (т.е. в виде программ). Поэтому они не могут модифицироваться без участия программистов или разработчиков системы. Проблемно-ориентированные знания представляются декларативно (т.е. в виде фреймов, семантических сетей, выражений на языке исчисления предикатов, продукций и т.д.). Наиболее важное общее свойство декларативных представлений состоит в том, что механизм интерпретации декларативных знаний (т.е. программы ЕЯ-системы) не зависит от содержания этих знаний. Поэтому модификация декларативно представленных проблемно-ориентированных знаний может осуществляться без участия программистов или разработчиков системы.
Таким образом, состав приобретаемых знаний, а также пределы, в которых допускается модификация знаний, в каждой ЕЯ-системе зависят от масштабов использования в ней декларативно представленных знаний. Следует отметить, что применение декларативных представлений ведет в общем случае к ухудшению временных и объемных характеристик ЕЯ-системы. Поэтому при разработке конкретных ЕЯ-систем, особенно ориентированных на промышленное или коммерческое использование, часто приходится идти на компромиссы, т.е. искусственно «уменьшать» гибкость (за счет сокращения состава декларативно представленных знаний) для получения приемлемых технических характеристик.
Различаются два основных способа приобретения знаний: настройка и адаптация. Настройка обычно выполняется при первоначальном развертывании ЕЯ-системы на конкретном объекте эксплуатации и значительных изменениях предметной области, относительно которой ведется общение. Как правило, настройка ЕЯ-системы осуществляется в отсроченном режиме. Состав и объем приобретаемых в процессе настройки знаний, а также требования к уровню профессиональной подготовки персонала, выполняющего настройку, зависят от особенностей конкретной ЕЯ-системы. Адаптация заключается в оперативном приобретении знаний ЕЯ-системой в процессе решения задач пользователя. Инициатором адаптации обычно является система. При этом поскольку адаптация выполняется в процессе взаимодействия с пользователем, то никаких специальных требований к его знаниям не предъявляется.
В существующих ЕЯ-системах предусматривается настройка по различным параметрам (видам проблемно-ориентированных знаний). К основным из них относятся: знания о языке общения и сущностях предметной области; знания о пользователе, решаемых им задачах и структуре диалога, направленного на решение этих задач; знания об особенностях прикладной системы, взаимодействие с которой поддерживается ЕЯ-системой. Большинство ЕЯ-систем имеет определенную прикладную ориентацию (общение с базой данных, диалоговое решение задач, обработка связного текста). Это позволяет исключить необходимость настройки по некоторым из параметров и улучшить временные и объемные характеристики системы. Так, общение с базой данных (БД) характеризуется относительной устойчивостью решаемых пользователями задач. Поэтому в большинстве ЕЯ-систем для общения с БД предусматривается настройка по первому и третьему параметрам. Для систем обработки связных текстов характерна жесткая «привязка» к средствам хранения информации, поэтому системы данного класса допускают настройку по первому и (в значительной степени) по второму параметрам. Системы диалогового решения задач в принципе должны иметь возможность настраиваться по всем трем указанным параметрам. Однако в настоящее время большинство из них ориентируется на заранее определенные средства решения задач (в частности, на экспертные системы). Поэтому настройка систем диалогового решения задач, как правило, допускается по первому и второму параметрам.
В зависимости от требований, предъявляемых к уровню профессиональной подготовки лиц, осуществляющих настройку, системы ЕЯ-общения могут быть подразделены на классы:
1) системы, для создания которых требуется знание лингвистики;
2) системы, настраиваемые администратором базы данных;
3) системы, настраиваемые специалистом в прикладной предметной области (прикладным специалистом) или непосредственно конечным пользователем. Системы, составляющие последний класс, получили название «переносимых».
Необходимость знания лингвистики для настройки системы характерна для ранних ЕЯ-систем. Настройка подавляющего большинства современных ЕЯ-систем может выполняться администратором базы данных или прикладным специалистом (т.е. людьми, от которых не требуется знание лингвистики). Типичным примером ЕЯ-системы, настройка которой осуществляется администратором БД, может служить система INTELLECT. Эта система осуществляет поиск из одного файла БД по запросам пользователя на английском языке. Настройка системы заключается в фиксации положения (или изменении) ее словаря. Словарь содержит слова двух типов: функциональные, они поставляются вместе с системой, и слова, которые вводятся в процессе настройки или адаптации. К функциональным словам относятся: что, когда, в, все, какие, сколько, напечатать и т.д. Сематика этих слов заранее известна системе и не может изменяться при использовании системы в любом из приложений. Слова второго типа отражают специфику конкретной предметной области, содержащейся в файле БД. К ним относятся и слова типа служащий, фамилия, город, зарплата и т.п. Эти слова, а также их синонимы определяются администратором БД и с помощью специального языка вводятся в систему. Поскольку администратор базы данных не может заранее предусмотреть всех слов, соответствующих значениям атрибутов, то они записываются в словарь в процессе адаптации системы в результате уточняющих поддиалогов, инсценируемых системой.
Примером переносимых систем могут служить такие, как АИСТ, TEAM или IRUS. В отличие от системы INTELLECT они обеспечивают ЕЯ-общение не с одним, а с несколькими связанными файлами БД. При этом настройка допускается не только на язык общения и сущности предметной области, но и на логическую структуру БД и тип СУБД (в рамках заданного класса СУБД).
...Подобные документы
Возможность поиска информации в режиме продвинутого диалога на естественном языке. Системы с интеллектуальным интерфейсом. Экспертные, самообучающиеся и адаптивные системы. Интеллектуальные базы данных. Системы контекстной и когнитивной помощи.
презентация [224,2 K], добавлен 16.10.2013Понятие искусственного интеллекта. Представление знаний и разработка систем, основанных на знаниях. Распознавание образов и машинный перевод. Нейрокомпьютеры и сети. Экспертные системы, их структура,классификация и инструментальные средства построения.
курсовая работа [922,1 K], добавлен 12.01.2009Информация, как сырье и как товар: абсолютная, относительная и аналитическая информация. Автоматизированные системы распознавания образов. Система искусственного интеллекта. Признаки и этапы жизненного цикла интеллектуальных информационных систем.
шпаргалка [60,4 K], добавлен 10.06.2009История развития искусственного интеллекта. Экспертные системы: их типы, назначение и особенности, знания и их представление. Структура идеальной и инструменты построения экспертных систем. Управление системой продукции. Семантические сети и фреймы.
реферат [85,7 K], добавлен 20.12.2011Понятие искусственного интеллекта как свойства автоматических систем брать на себя отдельные функции интеллекта человека. Экспертные системы в области медицины. Различные подходы к построению систем искусственного интеллекта. Создание нейронных сетей.
презентация [3,0 M], добавлен 28.05.2015Информация: свойства, измерение, передача; характеристики информационных каналов. Обработка и формы представления информации. Понятие "искусственного интеллекта". Назначение экспертных систем: оценки, фреймы, семантические сети и реляционные графы.
контрольная работа [74,0 K], добавлен 03.12.2012Экспертные системы как наиболее значительное практическое достижение в области искусственного интеллекта, их современная известность и применение. Назначение систем и обоснование их важности, структура и обязательные элементы, требования к системам.
контрольная работа [144,6 K], добавлен 02.09.2009Определение экспертных систем, их достоинство и назначение. Классификация экспертных систем и их отличие от традиционных программ. Структура, этапы разработки и области применения. Классификация инструментальных средств и технология разработки систем.
курсовая работа [78,0 K], добавлен 03.06.2009Понятие базы знаний для управления метаданными. Особенности баз знаний интеллектуальной системы. Языки, используемые для разработки интеллектуальных информационных систем. Классические задачи, решаемые с помощью машинного обучения и сферы их применения.
реферат [16,9 K], добавлен 07.03.2010Предмет и основные понятия информационных систем. Базовые стандарты корпоративных информационных систем. Характеристика входящих и исходящих потоков информации. Основные понятия искусственного интеллекта. Обеспечение безопасности информационных систем.
курс лекций [295,6 K], добавлен 11.11.2014История развития компьютерного анализа текста на естественном языке; выделение его проблем. Принципы извлечения информации и обработки разговорной речи. Ознакомление с программными продуктами, реализующими машинный перевод и проверку орфографии.
реферат [371,0 K], добавлен 13.02.2011Построение баз знаний для семантической сети. Цели создания и язык представления онтологий. Структура исследований в области многоагентных интеллектуальных информационных систем, архитектура агента. Экономическое обоснование разработки базы знаний.
дипломная работа [1,6 M], добавлен 29.09.2013Экспертные системы как направление исследований в области искусственного интеллекта по созданию вычислительных систем, умеющих принимать решения, схожие с решениями экспертов в заданной предметной области. Принципы построения алгоритма и его оценка.
курсовая работа [517,2 K], добавлен 12.06.2015Искусственный интеллект – научное направление, связанное с машинным моделированием человеческих интеллектуальных функций. Черты искусственного интеллекта Развитие искусственного интеллекта, перспективные направления в его исследовании и моделировании.
реферат [70,7 K], добавлен 18.11.2010Основные виды и технологии интеллектуальных информационных систем. Аспекты представления знаний. Функциональная структура использования ИИС. Интеллектуальная поддержка дистанционного образования и экстерната. Электронные учебники и тесты.
контрольная работа [93,8 K], добавлен 29.11.2006История развития интеллектуальных информационных технологий. Основные виды экономической деятельности, в которых применяются информационные технологии. Наиболее известные на отечественном экономическом рынке интеллектуальные информационные технологии.
курсовая работа [580,5 K], добавлен 10.06.2014Понятие искусственного интеллекта и интеллектуальной системы. Этапы развития интеллектуальных систем. Модели представления знаний, процедурный (алгоритмический) и декларативный способы их формализации. Построение концептуальной модели предметной области.
презентация [80,5 K], добавлен 29.10.2013Эволюция систем искусственного интеллекта. Направления развития систем искусственного интеллекта. Представление знаний - основная проблема систем искусственного интеллекта. Что такое функция принадлежности и где она используется?
реферат [49,0 K], добавлен 19.05.2006Особенности построения и функционирования информационных систем. Понятие, цель и задачи информационной логистики, информационные потоки и системы. Виды и принципы построения логистических информационных систем. Повышение качества логистического процесса.
контрольная работа [25,4 K], добавлен 11.11.2010Задачи информационных потоков в логистике. Виды и принципы построения, структура и элементы информационных логистических систем, основные требования к ним. Рекомендации по созданию, внедрению и режиму работы информационных систем в сфере логистики.
реферат [25,9 K], добавлен 14.01.2011