Применение онтологий при создании предметно-ориентированных электронных ресурсов
Организация электронных ресурсов на основе онтологий. Онтология (информ.) – набор определений (на формальном языке) фрагмента декларативных знаний, ориентированный на совместное многократное использование различными пользователями в своих приложениях.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 25.08.2020 |
Размер файла | 30,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Применение онтологий при создании предметно-ориентированных электронных ресурсов
Аверченков В.И.,
Казаков П.В.
Современное развитие информационных технологий оказывает постоянно возрастающее влияние практически на все сферы человеческой деятельности. Особое место здесь занимают образовательные процессы, информатизация которых позволяет повысить их качество по сравнению с традиционными (неэлектронными) формами.
Одной из главных электронных сред, предоставляющих образовательную информацию, является глобальная компьютерная сеть Интернет. Опыт работы в этой сети позволяет наряду с очевидными достоинствами ощутить и недостатки, свойственные ей, главным из которых является проблема поиска информации, часто плохо структурированной и содержащей большой информационный шум. Проблема осложняется еще и тем, что различные группы людей, занимающиеся сбором и поиском информации, используют для общения с поисковыми системами как свои специальные термины, так и термины, широко используемые другими сообществами, но в ином контексте. Вследствие этого может возникнуть проблема несовместимости используемых терминов, так как современные поисковые машины используют в основном механизмы поиска по ключевым словам, не учитывающие контекст, в котором существует информация. В итоге результатом работы таких машин поиска являются множество ссылок, большинство из которых указывают на документы, не относящиеся к делу, что затрудняет восприятие и выбор полезной информации.
Для преодоления такой проблемы разработан ряд подходов, общей идей которых является добавление к хранимым данным дополнительной метаинформации о семантических связях между ними. Другими словами, речь идет о переходе от пространства данных к пространству знаний. И одним из главных таких направлений интеллектуального доступа к информации является организация электронных ресурсов на основе онтологий.
Изначально термин онтология имел исключительно философскую основу, согласно которой онтология (филос.) - философское учение о бытии, его основах, принципах, структуре и закономерностях. И лишь в последнее время он был переосмыслен с позиций информатики. Онтология (информ.) - набор определений (на формальном языке) фрагмента декларативных знаний, ориентированный на совместное многократное использование различными пользователями в своих приложениях. Из этого определения следует, что онтология включает в себя комплекс понятий от самых общих до наиболее конкретных, охватывающих полный спектр объектов и отношений, включая события и процессы, а также значения (атрибутов и отношений), определяемые, если необходимо, во времени и пространстве. Эта система объектов связывается как универсальными зависимостями типа "общее-частное", "часть-целое", "причина-следствие" и т.п., так и специфическими для соответствующей предметной области.
Процесс создания онтологии неразрывно связан с составлением тезауруса предметной области для описания используемых в ней понятий. Слово тезаурус имеет лингвистическую основу и определяется как словарь, в котором максимально полно представлены все слова языка с исчерпывающим перечнем примеров их употребления в текстах. В информатике тезаурус - полный систематизированный набор данных в какой-либо области знаний, позволяющий человеку или вычислительной машине в ней ориентироваться.
Можно выделить следующие причины, когда возникает потребность в создании онтологий: онтология электронный пользователь
- для совместного использования людьми или программными агентами общего понимания структуры информации;
- для возможности повторного использования знаний в предметной области;
- для того, чтобы сделать допущения в предметной области явными;
- для анализа знаний в предметной области.
Онтологии включают описание как очень общих, так и специфических для конкретной предметной области терминов и могут быть формализовано записаны как
O = <X, R, F>,
где X - конечное, непустое множество понятий (терминов) предметной области;
R - конечное множество отношений между понятиями X;
F - конечное множество функций интерпретации, заданных на понятиях X и (или) отношениях R.
Для такой формализации онтологии возможны следующие частные случаи.
1. R = Ш, F = Ш. В этом случае онтология представляет собой простой словарь и ее практическое использование целесообразно в том случае, если термины принадлежат очень узкой предметной области и их смыслы уже заранее согласованы в пределах некоторого сообщества. Примером такой ситуации могут служить индексы поисковых машин сети Интернет.
2. R = Ш, F ? Ш. Здесь каждому элементу множества X может быть поставлена соответствующая функция интерпретации. При этом часть таких интерпретирующих терминов задается процедурно, а не декларативно. То есть смыл терминов предметной области может динамически меняться в зависимости от перехода между прикладными областями.
В общем случае (X ? Ш, R ? Ш, F ? Ш) основной акцент в онтологии делается на задание семантических отношений, имеющихся в предметной области вместе с созданием единой иерархии понятий, унификации терминов и правил их интерпретации.
Одной из главных проблем, связанных с онтологиями, является создание способа (по возможности автоматизированного) добавления семантической информации в имеющиеся документы. Под документами здесь понимается электронная информация, доступная в сети Интернет через имеющиеся поисковые системы.
Наиболее популярным подходом к такой интеллектуализации Интернет является дополнение специальными семантическими тэгами стандартного HTML для того, чтобы "внести знания" прямо в страницы. Такие модифицированные HTML-документы несут информацию о взаимосвязях понятий и их семантических атрибутах в HTML-подобном формате, то есть не требуют внутреннего языка представления знаний.
Однако отметим, что процесс создания онтологий по такому принципу очень трудоемок, прежде всего, из-за дублирования информации, и вопрос его автоматизации остается пока открытым. Поэтому в настоящее время реализация этого процесса для инвариантных к предметной области хранилищ данных, используемых известными поисковыми системами Интернет, достаточно проблематична.
В качестве компромисса в подобной ситуации можно предложить подход, основанный на создании онтологий под конкретную предметную область. В этом случае среда Интернет выступает в качестве источника неструктурированной информации, которой наполняется хранилище данных поисковой системы. Пользователь в свою очередь по запросу к такой системе получает систематизированные данные за счет предварительного формирования онтологии для данной предметной области (рис.1).
Рисунок 1 - Обобщенная структура информационной системы на основе онтологий
В результате взаимодействие пользователя осуществляется уже не с хранилищем данных, а (в совокупности с онтологией) - с базой знаний, что подразумевает следующие возможности:
- наполнение хранилища данных отраслевой информацией из сети Интернет;
- хранение информации о свойствах, связях и отношениях между объектами предметной области;
- пополнение базы знаний параллельно с информационно-поисковым тезаурусом, предназначенным для классификации и унификации понятий в заданной предметной области;
- формирование локального информационно-поискового пространства сети Интернет в виде хранилища данных;
- структурирование информации в базе знаний на основе хранилища данных с учетом семантических связей между объектами, формализованных в виде онтологий.
Подобный подход был использован при создании онтологии предметной области "искусственный интеллект".
Процесс создания онтологии неразрывно связан с концепцией информационно-поискового тезауруса, который является внутренним представлением онтологии. Для создания тезауруса предметная область должна быть разбита на разделы (категории) для возможности классификации ее понятий. На рис.2 представлена структура такого тезауруса.
Рисунок 2 - Структура тезауруса
Задача определения категорий предметной области является достаточно сложной, поэтому в данном случае за основу при создании онтологии был взят рубрикатор интеллектуальных систем (РИС 2004-02.1-И). Дальнейший шаг связан с выделением понятий каждой категории и организации связей между ними, его выполнение осуществляется непосредственно экспертом в данной предметной области, поскольку автоматическая генерация онтологий в настоящее время затруднительна. При этом уровень выполнения данной работы в дальнейшем будет иметь большое влияние на качество работы поисковой системы. Поэтому важным здесь является создание специализированного программного комплекса, который должен предоставлять эксперту возможность в автоматизированном режиме формировать и заполнять необходимые категории, а также обладать функциями интеллектуального поиска информации в сети Интернет с последующей ее систематизацией.
Таким образом, применение онтологий является перспективным направлением в области структуризации и классификации информации, что особенно важно для представления электронных форм различных образовательных ресурсов.
Литература
1. Шемакин. Ю.И. Тезаурус в автоматизированных системах управления и обработки информации. Москва.: Воениздат, 1974. - 192 с.
2. Аверченков В.И., Мирошников В.В., Рощин С.М. Информационный поиск в сети Интернет: Учеб. пособие. - Брянск: БГТУ, 2001. - 204 с.
3. Майкевич Н.В. От информационного пространства к пространству знаний. Онтологии в Интернет. //Труды конференции КИИ-98, Россия. - С.152-158
4. Онтология и Web // Computer World. 2001. №44.
5. Материалы сайта ассоциации искусственного интеллекта http://www.raai.org/
Размещено на Allbest.ru
...Подобные документы
Анализ существующих программных средств для автоматического отображения онтологий, их практического применения в зависимости от поставленной задачи и сложности входных онтологий. Отображение сложных онтологий с помощью алгоритма повышенной точности.
дипломная работа [1,5 M], добавлен 14.06.2012Понятие и виды электронных ресурсов муниципальных библиотек. Организация и использование электронных ресурсов в муниципальных библиотеках РФ. Анализ современного состояния и основные тенденции развития электронных ресурсов муниципальных библиотек.
курсовая работа [77,9 K], добавлен 16.05.2017Система классов и свойств языка RDFS. Реификация или материализация утверждений. Возможности RDF, RDF Schema в представлении онтологий. Способы представления RDF-описаний. Структура и базовые элементы OWL-онтологии. Языки запросов к RDF-хранилищам.
презентация [312,1 K], добавлен 01.09.2013Характеристика общих вопросов организации электронных ресурсов. Принципы взаимодействия Интернет-ресурсов и процесса формирования каталогов электронных изданий. Анализ концепции построения электронных библиотек и организации информационных ресурсов в них.
дипломная работа [111,4 K], добавлен 24.11.2012Проблема выбора товара в Интернете. Типы и свойства онтологий как части концепции Semantic Web. Разработка web-приложения для выбора музыкального инструмента: создание иерархии онтологий для предметной области "Гитара", формирование SPARQL-запроса.
дипломная работа [2,2 M], добавлен 20.04.2012Построение баз знаний для семантической сети. Цели создания и язык представления онтологий. Структура исследований в области многоагентных интеллектуальных информационных систем, архитектура агента. Экономическое обоснование разработки базы знаний.
дипломная работа [1,6 M], добавлен 29.09.2013Тезаурус для автоматического концептуального индексирования как особый вид тезауруса. Подходы к описанию отношений при разработке онтологий. Родовидовое отношение выше-ниже. Семантическое смещение. Формальная онтология. Сравнение поисковых механизмов.
презентация [721,9 K], добавлен 19.10.2013Оценка качества поисковых систем. Индексирование по ключевым словам. Внутренние представления запросов и документов на информационно-поисковом языке. Способы улучшения поиска при помощи тезаурусов и онтологий. Ранжированный поиск (vector-space model).
лекция [31,5 K], добавлен 19.10.2013Разработка web-сервиса как услуги, предоставляемой пользователю. Продажа товара (автомобилей) в Интернете, проблема выбора. Онтологии как часть концепции Semantic Web. Применение онтологий, их основные типы и свойства. Особенности реализации онтологии.
курсовая работа [57,4 K], добавлен 17.04.2012Построение онтологии предметной области для анализа глобальных процессов на основе информации, получаемой из новостных лент. Средства разработки онтологий, используемых для поиска событий, фактов, извлечённых из СМИ; моделирование экономических рисков.
курсовая работа [3,4 M], добавлен 27.08.2017Программные средства выполнения, обращения и хранения электронных документов на предприятии. Правовое и методическое обеспечение сохранности информационных ресурсов в организациях Республики Беларусь. Создание электронной регистрационной карточки.
реферат [25,4 K], добавлен 17.04.2015Формализации в онтологии областей знаний с помощью концептуальной схемы. Определение атрибутов класса и свойств экземпляров. Создание экземпляров класса и DL-Query запросов. Методика использования для разработки онтологии среды разработки Protege.
курсовая работа [2,0 M], добавлен 18.06.2014Место и содержание компьютерного моделирования в курсе информатики. Применение цифровых образовательных ресурсов на уроках и для самостоятельного изучения в соответствии с возможностями электронных программ. Программная реализация "Транспортной задачи".
курсовая работа [4,6 M], добавлен 04.05.2014Концепция развития образовательных электронных изданий и ресурсов. Разработка модуля электронного учебного издания на тему "Компьютерные сети. Принципы, технологии, протоколы". Представление страницы учебника в Paint. Теги для создания документа HTML.
курсовая работа [1,3 M], добавлен 17.10.2012Определение основных требований к разрабатываемой системе учета работ по созданию электронных образовательных ресурсов, характеристика их основных видов. Структура базы данных, разработка пользовательского интерфейса, экономическая эффективность проекта.
дипломная работа [3,8 M], добавлен 06.03.2010История появления электронных книг, их виды, характеристика. Использование электронных книг в библиотеках, их достоинства и недостатки. Формирование электронных библиотек и коллекций. Критерии предоставления электронных книг пользователям, хранение фонда.
курсовая работа [66,9 K], добавлен 05.02.2017Язык запросов SPARQL. Система классов и свойств языка RDFS. Интенсионал и экстенсионал. Парадокс Рассела. Списки, коллекции и контейнеры ресурсов, текстовые комментарии для создания удобных для чтения примечаний. Утверждение об авторстве утверждения.
презентация [355,8 K], добавлен 19.10.2013Сущностное содержание процесса проектирования электронных образовательных ресурсов; информационно-коммуникационные технологии. Инструментальные средства формирования моделей использования ЭОР и обеспечения информационной безопасности в учебном процессе.
курсовая работа [2,7 M], добавлен 10.06.2014Основные критерии выбора инструментальных средств создания электронных учебников. Структурная организация и режимы работы электронных учебников. Создание электронного учебника "Табличный процессор MS Excel". Расчет экономической эффективности проекта.
курсовая работа [2,9 M], добавлен 01.06.2015Понятие и назначение электронных таблиц. Сравнительная характеристика редакторов электронных таблиц Microsoft Excel, OpenOffice.org Calc, Gnumeric. Требования к оформлению электронных таблиц. Методика создания электронных таблиц в MS Word и MS Excel.
контрольная работа [1,5 M], добавлен 07.01.2015