Разработка проблемно-ориентированных онтологий

Исследование понятия онтологии, которая активно используются в качестве средства структурирования и представления информации в системах управления знаниями. Рассмотрение методов решения проблем связанных с поиском и получением корпоративной информации.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 17.01.2018
Размер файла 243,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Санкт-Петербургский Государственный Политехнический Университет

Разработка проблемно-ориентированных онтологий

Д. В. Кудрявцев dk@big.spb.ru

195251, г. Санкт-Петербург, ул. Политехническая, 29

Аннотация

Онтологии Работа поддержана грантом РФФИ 04-01-00466. активно используются в качестве средства структурирования и представления информации в системах управления знаниями. Существующие подходы к разработке онтологий с одной стороны указывают на необходимость учета назначения онтологии при ее разработке, а с другой не предоставляют конкретных методик реализации такого учета. В данной статье предлагается концептуальная модель и элементы методики для разработки онтологии с учетом функций и целей организации, на поддержку которых направлена система управления знаниями организации.

Введение

По оценкам исследований от 15 до 35% времени сотрудников компании уходит на поиск информации [Feldman, 2004]. Для решения проблем связанных с поиском и получением корпоративной информации в организациях создаются системы управления знаний (СУЗ) в форме корпоративной памяти, корпоративной базы знаний или корпоративного портала знаний [Попов, 2005]. Такие решения, в узком смысле, можно рассматривать как электронные хранилище гетерогенной информации из различных источников предприятия, которые поддерживают развитые механизмы поиска и распределения доступа к информации.

В качестве основного информационно-поискового механизма СУЗ, могут использоваться онтологии, которые описывают и классифицируют информационные ресурсы и обеспечивают пользователям удобство и эффективность поиска и навигации [Abecker, 1998; Гаврилова, 2003].

В статье предлагаются элементы методического подхода к созданию проблемно-ориентированных онтологий для СУЗ, которые поддерживают выполнения определенных функций и достижение определенных целей организации.

1. Взаимосвязь разработки онтологии с назначением онтологии

Онтология - формальное явное описание понятий (классов) в рассматриваемой предметной области, свойств каждого понятия, описывающих различные свойства и атрибуты понятия, и ограничений, наложенных на свойства (фасетов) [Ной, 2001].

В настоящий момент существует ряд методологических подходов к разработке онтологий [Fernandez-Lopez, 2002]. Рассматриваемые методологии предлагают начать построение онтологии с ответа на ряд основных вопросов:

· Какую область будет охватывать онтология?

· Для чего мы собираемся использовать онтологию?

То есть на первом шаге авторы предлагают определить область и масштаб онтологии. В существующих методологиях утверждается, что в дальнейшем ответы на вышеуказанные вопросы будут оказывать влияние на:

· Формирование иерархия понятий

· Выбор свойств и классов

· Целесообразность создания классов и использование свойств

2. Постановка задачи

Несмотря на то, что в существующих методологиях разработки онтологий присутствует предварительный этап определения области и масштаба онтологии (или похожий по смыслу) и указывается его влияние на дальнейшую разработку онтологии, взаимосвязь между разработкой онтологии и ее назначением остается неоднозначной и недостаточно определенной.

Основными задачами данной статьи являются:

1. Разработка модели взаимосвязи составляющих элементов онтологии с ее назначением

2. Разработка основных элементов методики создания проблемно-ориентированной онтологии на основе модели взаимосвязи элементов онтологии с ее назначением

3. Модель взаимосвязи онтологии с ее назначением

Для разработки эксплицитной модели взаимосвязи составляющих элементов онтологии с ее назначением целесообразно применить некоторые элементы функционально-стоимостного анализа (ФСА) [Моисеева и Карпунин, 1988]. При функциональном подходе специалист-проектировщик отвлекается от реальной конструкции анализируемой (разрабатываемой) системы и сосредоточивает внимание на ее функциях. Далее на основе функциональной модели разрабатывается оптимальная конструкция (структура) системы. Такой подход к проектированию материальных и организационных структур может быть адаптирован к разработке онтологий.

Для определения состава функций, выполняемых на предприятии, которые будут поддерживаться с использованием онтологии, целесообразно рассматривать систему процессов и проектов, которые объединяют отдельные функции в комплексы действий ориентированных на результат - достижения целей предприятия. Тогда как оценка достижения целей производится с помощью показателей. С учетом предлагаемых идей предлагается следующая концептуальная модель взаимосвязи онтологии с ее назначением (Рис. 1): онтология информация корпоративный

Рис. 1 Концептуальная модель взаимосвязи онтологии с ее назначением

В соответствии с данной моделью требования к онтологии формируются

· на основе Функций, информационная поддержка которых осуществляется с использованием онтологий, а также

· на основе Целей организации и сотрудников.

Необходимо отметить, что Цели с одной стороны непосредственно влияют на элементы онтологии, а с другой опосредованно, определяя требования к выполнению функций через процессы и проекты.

Для практической разработки онтологии - определения классов, атрибутов и отношений - необходимо перейти от концептуальной к расчетной модели взаимосвязи онтологии и ее назначения. Для этого необходимо вначале определить исходную методику разработки онтологии, которая будет дополнена анализом назначения онтологии.

Атрибутивный подход к разработке онтологий

Рассмотрим основные этапы предлагаемого метода:

Э1. Определение основных атрибутов понятия

Допустим, в качестве понятия выбран «Документ», являющийся классом, в который входят все документы системы управления знаниями организации.

При выполнении данного этапа можно обратиться к существующим стандартам метаданных (Dublin Core, Learning Objects Metadata (LOM).

Э2. Определение фасетов для атрибутов

Под фасетом понимается область допустимых значений атрибута. С помощью фасетов задается структура, используемая для описания рассматриваемого понятия, в нашем случае «Документа». Фасеты отражают взаимоисключающие и коллективно исчерпывающие аспекты рассматриваемого понятия, см. рис. 2:

Рис. 2 Атрибуты и фасеты понятия «Документ»

Фасеты можно рассматривать как классы, которые описываются с помощью своих собственных онтологий.

Э3. Описание фасетов

После того, как определены «стартовые» фасеты нужно переходить к их структуризации - описанию каждого фасета. В результате получаем атрибутивно-фасетное дерево, см. рис. 3:

Рис. 3 Описание фасета и детализация атрибутивно-фасетного дерева

Такое дерево может являться основой для разработки онтологии и выделения понятий. Понятия онтологии будут формироваться на основе значений наиболее значимых атрибутов и фасетов. Также на основе значимости атрибута или фасета будет определяться уровень иерархии понятий в онтологии.

Для отбора наиболее значимых атрибутов и фасетов проводится оценка и ранжирование атрибутов и фасетов.

4. Расчетная модель взаимосвязи онтологии и ее назначения

В соответствие с концептуальной моделью взаимосвязи онтологии и ее назначения (Рис. 1) для оценки и ранжирования атрибутов и фасетов необходимо выполнить следующие шаги:

1. Оценка и Ранжирование целей (определяются веса целей)

2. Оценка и Ранжирование функций

3. Функциональная оценка и ранжирование атрибутов и фасетов

4. НЕФункциональная оценка и ранжирование атрибутов и фасетов

5. Уточнение оценок и рангов Свойств / атрибутов с учетом Взаимовлияния

Шаги со 2 по 5 производятся одинаково с помощью взвешенных оценок.

Для создания методики разработки проблемно-ориентированных онтологий представленную выше расчетную модель необходимо дополнить целым рядом рекомендаций, правил и принципов.

5. Элементы методики создания проблемно-ориентированной онтологии

Организация ранжирования и использования атрибутов и фасетов.

В зависимости от выбора того или иного значения атрибутов / фасетов для верхнего уровня онтологии будут по-разному строиться нижние уровни (см. Рис. 4):

Рис. 4 Влияние верхних уровней онтологии на разработку нижних

В данном случае для дальнейшего структурирования Материалов семинаров наиболее важен фасет - Предметная область, а для Материалов проектов - Тип документа. Разница в значимости атрибутов и фасетов для одного и того же уровня иерархии объясняется тем, что Материалы семинаров и Материалы проектов используются при выполнении разных функций. Тогда как эти функции определяют дальнейший выбор атрибутов и фасетов. С учетом такой закономерности предлагается следующая организация работ по оценке и ранжированию атрибутов и фасетов:

1. Ранжирование атрибутов и фасетов

2. Выбор наиболее значимого атрибута или фасета

3. Заполнение верхнего уровня онтологии значениями наиболее значимого фасета или атрибута

4. Производится «реверс» - для каждого элемента на верхнем уровне онтологии определяются функции, для которых важен данный элемент

5. Ранжирования атрибутов и фасетов - этап 2, который производится отдельно для каждого элемента верхнего уровня онтологии причем для ранжирования атрибутов используются только отобранные на предыдущем шаге функций.

Далее задачи со 2 по 5 повторяются необходимое число раз.

6. Правило ранжирования атрибутов и фасетов понятия в онтологии

Выполнение ранжирования атрибутов и фасетов может вызывать затруднения (например, Как определить какое свойство/атрибут понятия в онтологии важнее для выполнения функции?). Поэтому рекомендации по организации ранжирования целесообразно дополнить правилами ранжирования, см. Табл. 1.:

Табл. 1 Правило ранжирования атрибутов и фасетов понятия в онтологии

Правило (неформализованное):

При прочих равных условиях более важным будет тот атрибут, изменения значений которого оказывают наибольшее влияние на степень достижения цели.

Дано:

А - атрибут с набором значений а1, а2, а3 (А={а1,а2,а3})

В - атрибут с набором значений b1, b2, b3 (В={b1,b2,b3})

Ф1- Функция, поддерживаемая СУЗ, при выполнении которой используется онтология

Ц1 - Цель, достигаемая с помощью функции

П1 - Показатель достижения цели Ц1

Пусть:

П1(Ф1, аi), П1(Ф1, bi) - результирующее значение показателя П1 при выполнении функции

?П1(А)=MAX (Значение П1(Ф1,а1), Значение П1(Ф1,а2), Значение П1(Ф1,а3),…) -

-MIN (Значение П1(Ф1,а1), Значение П1(Ф1,а2), Значение П1(Ф1,а3),…)

?П1(В)=MAX (Значение П1(Ф1,b1), Значение П1(Ф1,b2), Значение П1(Ф1,b3),…) -

- MIN (Значение П1(Ф1,b1), Значение П1(Ф1,b2), Значение П1(Ф1,b3),…)

Правило (формализованные):

Если ?П1(А)=0, то А - не релевантен для онтологии поддерживающей выполнение функции Ф1

Если ?П1(В)=0, то В - не релевантен для онтологии поддерживающей выполнение функции Ф1

Если ?П1(А) > ?П1(В), то А важнее, чем В для создания онтологии поддерживающей выполнения функции Ф1

Правило ранжирования атрибутов понятия в онтологии. ПРИМЕР:

Дано:

Ф1= Разработка методики оценки персонала; Ц1= Повышение скорости выполнения работ; П1= Время с момента начала этапа до закрытия работ по этапу

Атрибутами и фасетами «Информации» (=понятие верхнего уровня для онтологии в СУЗ) являются:

А= Объект рассмотрения {Показатели, Процессы, Подразделения,…}

В=Отрасль {Пищевая, Металлургия, Упаковочная…}

Рассмотрим П1(А):

Значение П1(Ф1,а1)=30 дней; Значение П1(Ф1,а2)=45 дней; Значение П1(Ф1,а3)=45 дней

?П1(А)=15 дней (используя имеющуюся информацию по Показателям выполнить работы можно на 15 дней быстрее, чем используя только информацию по Процессам и Подразделениям)

Рассмотрим П1(В)

Значение П1(Ф1,b1)=30 дней; Значение П1(Ф1,b2)=30 дней; Значение П1(Ф1,b3)=30 дней

?П1(В)=0 (длительность выполнения работ проекта не изменяется в зависимости от того имеем ли мы информацию по предприятиям пищевой промышленности, Металлургической или упаковочной)

Вывод:

Для выполнения Функции «Разработка методики оценки персонала» с Целью (требованием) Повышение скорости выполнения работ атрибут информации А, важнее чем В

Полученная информация о составе и важности атрибутов понятий онтологии станет основой для разработки онтологии СУЗ, поддерживающей определенный набор функций и целей организации.

Перспективные работы

Данная статья отражает промежуточные результаты продолжающейся работы. Перспективными этапами работ являются:

1. Разработка методических рекомендаций по разработке онтологий с учетом выбранных и отранжированных атрибутов понятий верхнего уровня (в т.ч. анализ совместимости атрибутов - анализ дерева признаков [Рубашкин, 1989])

2. Разработка дополнительных правил, поддерживающих выполнение отдельных этапов методики разработки проблемно-ориентированных онтологий

3. Определение требований к программному инструментарию для поддержки методики разработки проблемно-ориентированных онтологий

Заключение

В статье была предложена модель взаимосвязи элементов проблемно-ориентированной онтологии с целями и функциями организации, для поддержки которых создается СУЗ. Представленная модель позволила предложить методику анализа и отбора атрибутов понятий онтологии СУЗ. Такая методика вместе с методикой разработки онтологий на основе атрибутивной структуры (перспективная работа) представляют комплексную методику разработки проблемно-ориентированных онтологий для СУЗ. Такие онтологии с одной стороны повысят эффективность поиска информации, а с другой уменьшат затраты на подготовку информации для СУЗ, поскольку смогут указать необходимый и достаточный объем информации для выполнения функций и достижения целей организации.

Список литературы

1. Гаврилова, 2003 Гаврилова Т. Онтологический подход к управлению знаниями при разработке корпоративных информационных систем // Ж. «Новости искусственного интеллекта», 2003, №2.

2. Моисеева, 1988 Моисеева Н., Карпунин М. Основы теории и практики функционально-стоимостного анализа. М: Высшая школа,1988.

3. Ной, 2001 Ной Н. , МакГиннесс Д.. Разработка онтологий 101: руководство по созданию вашей первой онтологии Стэнфордский Университет, Калифорния, 2001 http://ifets.ieee.org/russian/depository/ontology101_rus.doc

4. Попов, 2005 Попов Э., Фоминых И., Харин Н., Виньков М. Управление знаниями // РФФИ, 2005, Аналитический обзор http://www.rfbr.ru/default.asp?doc_id=20742

5. Рубашкин, 1989 Рубашкин В. Ш., Представление и анализ смысла в интеллектуальных информационных системах. - М.: Наука, 1989.

6. Fernandez-Lopez, 2002 Fernandez-Lopez M., Gomez-Perez A. Overview and analysis of methodologies for building ontologies. The Knowledge Engineering Review, Vol. 17:2, 129-156. © 2002, Cambridge University Press

7. Gruninger, 1995 Gruninger, M. and Fox, M.S. (1995). Methodology for the Design and Evaluation of Ontologies. In:Proceedings of the Workshop on BasicOntological Issues in Knowledge Sharing, IJCAI-95, Montre

Размещено на Allbest.ru

...

Подобные документы

  • Проблема представления знаний в компьютерных системах – одна из основных проблем в области искусственного интеллекта. Исследование различных моделей представления знаний. Определения их понятия. Разработка операции над знаниями в логической модели.

    курсовая работа [51,9 K], добавлен 18.02.2011

  • Построение онтологии предметной области для анализа глобальных процессов на основе информации, получаемой из новостных лент. Средства разработки онтологий, используемых для поиска событий, фактов, извлечённых из СМИ; моделирование экономических рисков.

    курсовая работа [3,4 M], добавлен 27.08.2017

  • Система классов и свойств языка RDFS. Реификация или материализация утверждений. Возможности RDF, RDF Schema в представлении онтологий. Способы представления RDF-описаний. Структура и базовые элементы OWL-онтологии. Языки запросов к RDF-хранилищам.

    презентация [312,1 K], добавлен 01.09.2013

  • Технология сбора информации традиционными методами. Правила сбора оффлайновой информации. Технические средства сбора информации. Операции для быстрого восстановления данных в системах хранения. Технологический процесс и процедуры обработки информации.

    курсовая работа [304,5 K], добавлен 02.04.2013

  • Исследование понятия и классификации видов и методов несанкционированного доступа. Определение и модель злоумышленника. Организация защиты информации. Классификация способов защиты информации в компьютерных системах от случайных и преднамеренных угроз.

    реферат [115,1 K], добавлен 16.03.2014

  • Анализ особенностей восприятия человеком окружающего мира. Обзор процессов, связанных с получением, хранением, обработкой и передачей информации. Описания технических устройств для автоматической обработки информации. Роль информации в жизни человека.

    доклад [10,9 K], добавлен 20.09.2012

  • Основные положения теории защиты информации. Сущность основных методов и средств защиты информации в сетях. Общая характеристика деятельности и корпоративной сети предприятия "Вестел", анализ его методик защиты информации в телекоммуникационных сетях.

    дипломная работа [1,1 M], добавлен 30.08.2010

  • Анализ технологий обработки информации. Построение системы защиты информации, порядок контроля за ее состоянием, определение и анализ угроз. Защита информации, которая циркулирует в системах звукоусиления. Техническая защита банковских операций.

    дипломная работа [474,0 K], добавлен 19.10.2011

  • Понятие и компоненты онтологии. Назначение и использование рубрикаторов в интернет-системах по товарам. Автоматическая рубрикация по товарам. Фрагмент описания рубрики "Автозапчасти". Проблемы пословного поиска в системе Ontoseek и средства их решения.

    презентация [1,2 M], добавлен 01.09.2013

  • Разработка web-сервиса как услуги, предоставляемой пользователю. Продажа товара (автомобилей) в Интернете, проблема выбора. Онтологии как часть концепции Semantic Web. Применение онтологий, их основные типы и свойства. Особенности реализации онтологии.

    курсовая работа [57,4 K], добавлен 17.04.2012

  • Анализ существующих программных средств для автоматического отображения онтологий, их практического применения в зависимости от поставленной задачи и сложности входных онтологий. Отображение сложных онтологий с помощью алгоритма повышенной точности.

    дипломная работа [1,5 M], добавлен 14.06.2012

  • Виды угроз безопасности в экономических информационных системах: цель, источники, средства реализации. Основные пути несанкционированного доступа к информации. Методы и средства защиты, используемые в АИТ маркетинговой деятельности, их классификация.

    реферат [30,1 K], добавлен 12.03.2011

  • Анализ модели информационно-телекоммуникационной системы предприятия. Виды угроз информационной безопасности. Цели и задачи защиты информации на предприятии. Разработка процедур контроля системы управления защитой информации в корпоративной сети.

    дипломная работа [3,6 M], добавлен 30.06.2011

  • Формы и системы представления информации для ее машинной обработки. Аналоговая и дискретная информация, представление числовой, графической и символьной информации в компьютерных системах. Понятие и особенности файловых систем, их классификация и задачи.

    реферат [170,3 K], добавлен 14.11.2013

  • Анализ нормативно-правовой базы, обоснование направлений создания обеспечения комплексной защиты информации в автоматизированных системах. Разработка методики оценки, выбор путей повышения эффективности защитных мероприятий в автоматизированных системах.

    дипломная работа [368,5 K], добавлен 17.09.2009

  • Электронно-вычислительная машина (ЭВМ) как средство обработки информации. Аппаратные и программные средства ЭВМ. Системы счисления и представления информации. Элементы структурного программирования. Построение блок-схем алгоритмов решения задач.

    презентация [152,5 K], добавлен 26.07.2013

  • Автоматизированная обработка информации: понятия и технология. Организация размещения, обработки, поиска, хранения и передачи информации. Защита информации от несанкционированного доступа. Антивирусные средства защиты информации. Сетевые технологии.

    методичка [28,8 K], добавлен 14.01.2009

  • Принципы управления знаниями на современном промышленном предприятии, совершенствование методов поиска и обработки информации. Оптимизация баз данных. Обоснования необходимости и цели использования вычислительной техники, программное обеспечение.

    дипломная работа [129,5 K], добавлен 21.08.2014

  • Формализации в онтологии областей знаний с помощью концептуальной схемы. Определение атрибутов класса и свойств экземпляров. Создание экземпляров класса и DL-Query запросов. Методика использования для разработки онтологии среды разработки Protege.

    курсовая работа [2,0 M], добавлен 18.06.2014

  • Сбор и анализ информации, используемой в ФОМС. Анализ программных и аппаратных средств, которые используются при обработке и хранении информации. Изучение проблем, которые имеют место в ФОМС, построение функциональной модели. Оценка экологичности проекта.

    дипломная работа [112,9 K], добавлен 25.11.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.