Применение онтологий при создании предметно-ориентированных электронных ресурсов

Организация электронных ресурсов на основе онтологий. Онтология (информ.) – набор определений (на формальном языке) фрагмента декларативных знаний, ориентированный на совместное многократное использование различными пользователями в своих приложениях.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 25.08.2020
Размер файла 30,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Применение онтологий при создании предметно-ориентированных электронных ресурсов

Аверченков В.И.,

Казаков П.В.

Современное развитие информационных технологий оказывает постоянно возрастающее влияние практически на все сферы человеческой деятельности. Особое место здесь занимают образовательные процессы, информатизация которых позволяет повысить их качество по сравнению с традиционными (неэлектронными) формами.

Одной из главных электронных сред, предоставляющих образовательную информацию, является глобальная компьютерная сеть Интернет. Опыт работы в этой сети позволяет наряду с очевидными достоинствами ощутить и недостатки, свойственные ей, главным из которых является проблема поиска информации, часто плохо структурированной и содержащей большой информационный шум. Проблема осложняется еще и тем, что различные группы людей, занимающиеся сбором и поиском информации, используют для общения с поисковыми системами как свои специальные термины, так и термины, широко используемые другими сообществами, но в ином контексте. Вследствие этого может возникнуть проблема несовместимости используемых терминов, так как современные поисковые машины используют в основном механизмы поиска по ключевым словам, не учитывающие контекст, в котором существует информация. В итоге результатом работы таких машин поиска являются множество ссылок, большинство из которых указывают на документы, не относящиеся к делу, что затрудняет восприятие и выбор полезной информации.

Для преодоления такой проблемы разработан ряд подходов, общей идей которых является добавление к хранимым данным дополнительной метаинформации о семантических связях между ними. Другими словами, речь идет о переходе от пространства данных к пространству знаний. И одним из главных таких направлений интеллектуального доступа к информации является организация электронных ресурсов на основе онтологий.

Изначально термин онтология имел исключительно философскую основу, согласно которой онтология (филос.) - философское учение о бытии, его основах, принципах, структуре и закономерностях. И лишь в последнее время он был переосмыслен с позиций информатики. Онтология (информ.) - набор определений (на формальном языке) фрагмента декларативных знаний, ориентированный на совместное многократное использование различными пользователями в своих приложениях. Из этого определения следует, что онтология включает в себя комплекс понятий от самых общих до наиболее конкретных, охватывающих полный спектр объектов и отношений, включая события и процессы, а также значения (атрибутов и отношений), определяемые, если необходимо, во времени и пространстве. Эта система объектов связывается как универсальными зависимостями типа "общее-частное", "часть-целое", "причина-следствие" и т.п., так и специфическими для соответствующей предметной области.

Процесс создания онтологии неразрывно связан с составлением тезауруса предметной области для описания используемых в ней понятий. Слово тезаурус имеет лингвистическую основу и определяется как словарь, в котором максимально полно представлены все слова языка с исчерпывающим перечнем примеров их употребления в текстах. В информатике тезаурус - полный систематизированный набор данных в какой-либо области знаний, позволяющий человеку или вычислительной машине в ней ориентироваться.

Можно выделить следующие причины, когда возникает потребность в создании онтологий: онтология электронный пользователь

- для совместного использования людьми или программными агентами общего понимания структуры информации;

- для возможности повторного использования знаний в предметной области;

- для того, чтобы сделать допущения в предметной области явными;

- для анализа знаний в предметной области.

Онтологии включают описание как очень общих, так и специфических для конкретной предметной области терминов и могут быть формализовано записаны как

O = <X, R, F>,

где X - конечное, непустое множество понятий (терминов) предметной области;

R - конечное множество отношений между понятиями X;

F - конечное множество функций интерпретации, заданных на понятиях X и (или) отношениях R.

Для такой формализации онтологии возможны следующие частные случаи.

1. R = Ш, F = Ш. В этом случае онтология представляет собой простой словарь и ее практическое использование целесообразно в том случае, если термины принадлежат очень узкой предметной области и их смыслы уже заранее согласованы в пределах некоторого сообщества. Примером такой ситуации могут служить индексы поисковых машин сети Интернет.

2. R = Ш, F ? Ш. Здесь каждому элементу множества X может быть поставлена соответствующая функция интерпретации. При этом часть таких интерпретирующих терминов задается процедурно, а не декларативно. То есть смыл терминов предметной области может динамически меняться в зависимости от перехода между прикладными областями.

В общем случае (X ? Ш, R ? Ш, F ? Ш) основной акцент в онтологии делается на задание семантических отношений, имеющихся в предметной области вместе с созданием единой иерархии понятий, унификации терминов и правил их интерпретации.

Одной из главных проблем, связанных с онтологиями, является создание способа (по возможности автоматизированного) добавления семантической информации в имеющиеся документы. Под документами здесь понимается электронная информация, доступная в сети Интернет через имеющиеся поисковые системы.

Наиболее популярным подходом к такой интеллектуализации Интернет является дополнение специальными семантическими тэгами стандартного HTML для того, чтобы "внести знания" прямо в страницы. Такие модифицированные HTML-документы несут информацию о взаимосвязях понятий и их семантических атрибутах в HTML-подобном формате, то есть не требуют внутреннего языка представления знаний.

Однако отметим, что процесс создания онтологий по такому принципу очень трудоемок, прежде всего, из-за дублирования информации, и вопрос его автоматизации остается пока открытым. Поэтому в настоящее время реализация этого процесса для инвариантных к предметной области хранилищ данных, используемых известными поисковыми системами Интернет, достаточно проблематична.

В качестве компромисса в подобной ситуации можно предложить подход, основанный на создании онтологий под конкретную предметную область. В этом случае среда Интернет выступает в качестве источника неструктурированной информации, которой наполняется хранилище данных поисковой системы. Пользователь в свою очередь по запросу к такой системе получает систематизированные данные за счет предварительного формирования онтологии для данной предметной области (рис.1).

Рисунок 1 - Обобщенная структура информационной системы на основе онтологий

В результате взаимодействие пользователя осуществляется уже не с хранилищем данных, а (в совокупности с онтологией) - с базой знаний, что подразумевает следующие возможности:

- наполнение хранилища данных отраслевой информацией из сети Интернет;

- хранение информации о свойствах, связях и отношениях между объектами предметной области;

- пополнение базы знаний параллельно с информационно-поисковым тезаурусом, предназначенным для классификации и унификации понятий в заданной предметной области;

- формирование локального информационно-поискового пространства сети Интернет в виде хранилища данных;

- структурирование информации в базе знаний на основе хранилища данных с учетом семантических связей между объектами, формализованных в виде онтологий.

Подобный подход был использован при создании онтологии предметной области "искусственный интеллект".

Процесс создания онтологии неразрывно связан с концепцией информационно-поискового тезауруса, который является внутренним представлением онтологии. Для создания тезауруса предметная область должна быть разбита на разделы (категории) для возможности классификации ее понятий. На рис.2 представлена структура такого тезауруса.

Рисунок 2 - Структура тезауруса

Задача определения категорий предметной области является достаточно сложной, поэтому в данном случае за основу при создании онтологии был взят рубрикатор интеллектуальных систем (РИС 2004-02.1-И). Дальнейший шаг связан с выделением понятий каждой категории и организации связей между ними, его выполнение осуществляется непосредственно экспертом в данной предметной области, поскольку автоматическая генерация онтологий в настоящее время затруднительна. При этом уровень выполнения данной работы в дальнейшем будет иметь большое влияние на качество работы поисковой системы. Поэтому важным здесь является создание специализированного программного комплекса, который должен предоставлять эксперту возможность в автоматизированном режиме формировать и заполнять необходимые категории, а также обладать функциями интеллектуального поиска информации в сети Интернет с последующей ее систематизацией.

Таким образом, применение онтологий является перспективным направлением в области структуризации и классификации информации, что особенно важно для представления электронных форм различных образовательных ресурсов.

Литература

1. Шемакин. Ю.И. Тезаурус в автоматизированных системах управления и обработки информации. Москва.: Воениздат, 1974. - 192 с.

2. Аверченков В.И., Мирошников В.В., Рощин С.М. Информационный поиск в сети Интернет: Учеб. пособие. - Брянск: БГТУ, 2001. - 204 с.

3. Майкевич Н.В. От информационного пространства к пространству знаний. Онтологии в Интернет. //Труды конференции КИИ-98, Россия. - С.152-158

4. Онтология и Web // Computer World. 2001. №44.

5. Материалы сайта ассоциации искусственного интеллекта http://www.raai.org/

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.