Разработка проблемно-ориентированных онтологий
Исследование понятия онтологии, которая активно используются в качестве средства структурирования и представления информации в системах управления знаниями. Рассмотрение методов решения проблем связанных с поиском и получением корпоративной информации.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 17.01.2018 |
Размер файла | 243,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Санкт-Петербургский Государственный Политехнический Университет
Разработка проблемно-ориентированных онтологий
Д. В. Кудрявцев dk@big.spb.ru
195251, г. Санкт-Петербург, ул. Политехническая, 29
Аннотация
Онтологии Работа поддержана грантом РФФИ 04-01-00466. активно используются в качестве средства структурирования и представления информации в системах управления знаниями. Существующие подходы к разработке онтологий с одной стороны указывают на необходимость учета назначения онтологии при ее разработке, а с другой не предоставляют конкретных методик реализации такого учета. В данной статье предлагается концептуальная модель и элементы методики для разработки онтологии с учетом функций и целей организации, на поддержку которых направлена система управления знаниями организации.
Введение
По оценкам исследований от 15 до 35% времени сотрудников компании уходит на поиск информации [Feldman, 2004]. Для решения проблем связанных с поиском и получением корпоративной информации в организациях создаются системы управления знаний (СУЗ) в форме корпоративной памяти, корпоративной базы знаний или корпоративного портала знаний [Попов, 2005]. Такие решения, в узком смысле, можно рассматривать как электронные хранилище гетерогенной информации из различных источников предприятия, которые поддерживают развитые механизмы поиска и распределения доступа к информации.
В качестве основного информационно-поискового механизма СУЗ, могут использоваться онтологии, которые описывают и классифицируют информационные ресурсы и обеспечивают пользователям удобство и эффективность поиска и навигации [Abecker, 1998; Гаврилова, 2003].
В статье предлагаются элементы методического подхода к созданию проблемно-ориентированных онтологий для СУЗ, которые поддерживают выполнения определенных функций и достижение определенных целей организации.
1. Взаимосвязь разработки онтологии с назначением онтологии
Онтология - формальное явное описание понятий (классов) в рассматриваемой предметной области, свойств каждого понятия, описывающих различные свойства и атрибуты понятия, и ограничений, наложенных на свойства (фасетов) [Ной, 2001].
В настоящий момент существует ряд методологических подходов к разработке онтологий [Fernandez-Lopez, 2002]. Рассматриваемые методологии предлагают начать построение онтологии с ответа на ряд основных вопросов:
· Какую область будет охватывать онтология?
· Для чего мы собираемся использовать онтологию?
То есть на первом шаге авторы предлагают определить область и масштаб онтологии. В существующих методологиях утверждается, что в дальнейшем ответы на вышеуказанные вопросы будут оказывать влияние на:
· Формирование иерархия понятий
· Выбор свойств и классов
· Целесообразность создания классов и использование свойств
2. Постановка задачи
Несмотря на то, что в существующих методологиях разработки онтологий присутствует предварительный этап определения области и масштаба онтологии (или похожий по смыслу) и указывается его влияние на дальнейшую разработку онтологии, взаимосвязь между разработкой онтологии и ее назначением остается неоднозначной и недостаточно определенной.
Основными задачами данной статьи являются:
1. Разработка модели взаимосвязи составляющих элементов онтологии с ее назначением
2. Разработка основных элементов методики создания проблемно-ориентированной онтологии на основе модели взаимосвязи элементов онтологии с ее назначением
3. Модель взаимосвязи онтологии с ее назначением
Для разработки эксплицитной модели взаимосвязи составляющих элементов онтологии с ее назначением целесообразно применить некоторые элементы функционально-стоимостного анализа (ФСА) [Моисеева и Карпунин, 1988]. При функциональном подходе специалист-проектировщик отвлекается от реальной конструкции анализируемой (разрабатываемой) системы и сосредоточивает внимание на ее функциях. Далее на основе функциональной модели разрабатывается оптимальная конструкция (структура) системы. Такой подход к проектированию материальных и организационных структур может быть адаптирован к разработке онтологий.
Для определения состава функций, выполняемых на предприятии, которые будут поддерживаться с использованием онтологии, целесообразно рассматривать систему процессов и проектов, которые объединяют отдельные функции в комплексы действий ориентированных на результат - достижения целей предприятия. Тогда как оценка достижения целей производится с помощью показателей. С учетом предлагаемых идей предлагается следующая концептуальная модель взаимосвязи онтологии с ее назначением (Рис. 1): онтология информация корпоративный
Рис. 1 Концептуальная модель взаимосвязи онтологии с ее назначением
В соответствии с данной моделью требования к онтологии формируются
· на основе Функций, информационная поддержка которых осуществляется с использованием онтологий, а также
· на основе Целей организации и сотрудников.
Необходимо отметить, что Цели с одной стороны непосредственно влияют на элементы онтологии, а с другой опосредованно, определяя требования к выполнению функций через процессы и проекты.
Для практической разработки онтологии - определения классов, атрибутов и отношений - необходимо перейти от концептуальной к расчетной модели взаимосвязи онтологии и ее назначения. Для этого необходимо вначале определить исходную методику разработки онтологии, которая будет дополнена анализом назначения онтологии.
Атрибутивный подход к разработке онтологий
Рассмотрим основные этапы предлагаемого метода:
Э1. Определение основных атрибутов понятия
Допустим, в качестве понятия выбран «Документ», являющийся классом, в который входят все документы системы управления знаниями организации.
При выполнении данного этапа можно обратиться к существующим стандартам метаданных (Dublin Core, Learning Objects Metadata (LOM).
Э2. Определение фасетов для атрибутов
Под фасетом понимается область допустимых значений атрибута. С помощью фасетов задается структура, используемая для описания рассматриваемого понятия, в нашем случае «Документа». Фасеты отражают взаимоисключающие и коллективно исчерпывающие аспекты рассматриваемого понятия, см. рис. 2:
Рис. 2 Атрибуты и фасеты понятия «Документ»
Фасеты можно рассматривать как классы, которые описываются с помощью своих собственных онтологий.
Э3. Описание фасетов
После того, как определены «стартовые» фасеты нужно переходить к их структуризации - описанию каждого фасета. В результате получаем атрибутивно-фасетное дерево, см. рис. 3:
Рис. 3 Описание фасета и детализация атрибутивно-фасетного дерева
Такое дерево может являться основой для разработки онтологии и выделения понятий. Понятия онтологии будут формироваться на основе значений наиболее значимых атрибутов и фасетов. Также на основе значимости атрибута или фасета будет определяться уровень иерархии понятий в онтологии.
Для отбора наиболее значимых атрибутов и фасетов проводится оценка и ранжирование атрибутов и фасетов.
4. Расчетная модель взаимосвязи онтологии и ее назначения
В соответствие с концептуальной моделью взаимосвязи онтологии и ее назначения (Рис. 1) для оценки и ранжирования атрибутов и фасетов необходимо выполнить следующие шаги:
1. Оценка и Ранжирование целей (определяются веса целей)
2. Оценка и Ранжирование функций
3. Функциональная оценка и ранжирование атрибутов и фасетов
4. НЕФункциональная оценка и ранжирование атрибутов и фасетов
5. Уточнение оценок и рангов Свойств / атрибутов с учетом Взаимовлияния
Шаги со 2 по 5 производятся одинаково с помощью взвешенных оценок.
Для создания методики разработки проблемно-ориентированных онтологий представленную выше расчетную модель необходимо дополнить целым рядом рекомендаций, правил и принципов.
5. Элементы методики создания проблемно-ориентированной онтологии
Организация ранжирования и использования атрибутов и фасетов.
В зависимости от выбора того или иного значения атрибутов / фасетов для верхнего уровня онтологии будут по-разному строиться нижние уровни (см. Рис. 4):
Рис. 4 Влияние верхних уровней онтологии на разработку нижних
В данном случае для дальнейшего структурирования Материалов семинаров наиболее важен фасет - Предметная область, а для Материалов проектов - Тип документа. Разница в значимости атрибутов и фасетов для одного и того же уровня иерархии объясняется тем, что Материалы семинаров и Материалы проектов используются при выполнении разных функций. Тогда как эти функции определяют дальнейший выбор атрибутов и фасетов. С учетом такой закономерности предлагается следующая организация работ по оценке и ранжированию атрибутов и фасетов:
1. Ранжирование атрибутов и фасетов
2. Выбор наиболее значимого атрибута или фасета
3. Заполнение верхнего уровня онтологии значениями наиболее значимого фасета или атрибута
4. Производится «реверс» - для каждого элемента на верхнем уровне онтологии определяются функции, для которых важен данный элемент
5. Ранжирования атрибутов и фасетов - этап 2, который производится отдельно для каждого элемента верхнего уровня онтологии причем для ранжирования атрибутов используются только отобранные на предыдущем шаге функций.
Далее задачи со 2 по 5 повторяются необходимое число раз.
6. Правило ранжирования атрибутов и фасетов понятия в онтологии
Выполнение ранжирования атрибутов и фасетов может вызывать затруднения (например, Как определить какое свойство/атрибут понятия в онтологии важнее для выполнения функции?). Поэтому рекомендации по организации ранжирования целесообразно дополнить правилами ранжирования, см. Табл. 1.:
Табл. 1 Правило ранжирования атрибутов и фасетов понятия в онтологии
Правило (неформализованное): |
|
При прочих равных условиях более важным будет тот атрибут, изменения значений которого оказывают наибольшее влияние на степень достижения цели. |
|
Дано: |
|
А - атрибут с набором значений а1, а2, а3 (А={а1,а2,а3}) В - атрибут с набором значений b1, b2, b3 (В={b1,b2,b3}) Ф1- Функция, поддерживаемая СУЗ, при выполнении которой используется онтология Ц1 - Цель, достигаемая с помощью функции П1 - Показатель достижения цели Ц1 |
|
Пусть: |
|
П1(Ф1, аi), П1(Ф1, bi) - результирующее значение показателя П1 при выполнении функции ?П1(А)=MAX (Значение П1(Ф1,а1), Значение П1(Ф1,а2), Значение П1(Ф1,а3),…) - -MIN (Значение П1(Ф1,а1), Значение П1(Ф1,а2), Значение П1(Ф1,а3),…) |
|
?П1(В)=MAX (Значение П1(Ф1,b1), Значение П1(Ф1,b2), Значение П1(Ф1,b3),…) - - MIN (Значение П1(Ф1,b1), Значение П1(Ф1,b2), Значение П1(Ф1,b3),…) |
|
Правило (формализованные): |
|
Если ?П1(А)=0, то А - не релевантен для онтологии поддерживающей выполнение функции Ф1 Если ?П1(В)=0, то В - не релевантен для онтологии поддерживающей выполнение функции Ф1 Если ?П1(А) > ?П1(В), то А важнее, чем В для создания онтологии поддерживающей выполнения функции Ф1 |
Правило ранжирования атрибутов понятия в онтологии. ПРИМЕР:
Дано:
Ф1= Разработка методики оценки персонала; Ц1= Повышение скорости выполнения работ; П1= Время с момента начала этапа до закрытия работ по этапу
Атрибутами и фасетами «Информации» (=понятие верхнего уровня для онтологии в СУЗ) являются:
А= Объект рассмотрения {Показатели, Процессы, Подразделения,…}
В=Отрасль {Пищевая, Металлургия, Упаковочная…}
Рассмотрим П1(А):
Значение П1(Ф1,а1)=30 дней; Значение П1(Ф1,а2)=45 дней; Значение П1(Ф1,а3)=45 дней
?П1(А)=15 дней (используя имеющуюся информацию по Показателям выполнить работы можно на 15 дней быстрее, чем используя только информацию по Процессам и Подразделениям)
Рассмотрим П1(В)
Значение П1(Ф1,b1)=30 дней; Значение П1(Ф1,b2)=30 дней; Значение П1(Ф1,b3)=30 дней
?П1(В)=0 (длительность выполнения работ проекта не изменяется в зависимости от того имеем ли мы информацию по предприятиям пищевой промышленности, Металлургической или упаковочной)
Вывод:
Для выполнения Функции «Разработка методики оценки персонала» с Целью (требованием) Повышение скорости выполнения работ атрибут информации А, важнее чем В
Полученная информация о составе и важности атрибутов понятий онтологии станет основой для разработки онтологии СУЗ, поддерживающей определенный набор функций и целей организации.
Перспективные работы
Данная статья отражает промежуточные результаты продолжающейся работы. Перспективными этапами работ являются:
1. Разработка методических рекомендаций по разработке онтологий с учетом выбранных и отранжированных атрибутов понятий верхнего уровня (в т.ч. анализ совместимости атрибутов - анализ дерева признаков [Рубашкин, 1989])
2. Разработка дополнительных правил, поддерживающих выполнение отдельных этапов методики разработки проблемно-ориентированных онтологий
3. Определение требований к программному инструментарию для поддержки методики разработки проблемно-ориентированных онтологий
Заключение
В статье была предложена модель взаимосвязи элементов проблемно-ориентированной онтологии с целями и функциями организации, для поддержки которых создается СУЗ. Представленная модель позволила предложить методику анализа и отбора атрибутов понятий онтологии СУЗ. Такая методика вместе с методикой разработки онтологий на основе атрибутивной структуры (перспективная работа) представляют комплексную методику разработки проблемно-ориентированных онтологий для СУЗ. Такие онтологии с одной стороны повысят эффективность поиска информации, а с другой уменьшат затраты на подготовку информации для СУЗ, поскольку смогут указать необходимый и достаточный объем информации для выполнения функций и достижения целей организации.
Список литературы
1. Гаврилова, 2003 Гаврилова Т. Онтологический подход к управлению знаниями при разработке корпоративных информационных систем // Ж. «Новости искусственного интеллекта», 2003, №2.
2. Моисеева, 1988 Моисеева Н., Карпунин М. Основы теории и практики функционально-стоимостного анализа. М: Высшая школа,1988.
3. Ной, 2001 Ной Н. , МакГиннесс Д.. Разработка онтологий 101: руководство по созданию вашей первой онтологии Стэнфордский Университет, Калифорния, 2001 http://ifets.ieee.org/russian/depository/ontology101_rus.doc
4. Попов, 2005 Попов Э., Фоминых И., Харин Н., Виньков М. Управление знаниями // РФФИ, 2005, Аналитический обзор http://www.rfbr.ru/default.asp?doc_id=20742
5. Рубашкин, 1989 Рубашкин В. Ш., Представление и анализ смысла в интеллектуальных информационных системах. - М.: Наука, 1989.
6. Fernandez-Lopez, 2002 Fernandez-Lopez M., Gomez-Perez A. Overview and analysis of methodologies for building ontologies. The Knowledge Engineering Review, Vol. 17:2, 129-156. © 2002, Cambridge University Press
7. Gruninger, 1995 Gruninger, M. and Fox, M.S. (1995). Methodology for the Design and Evaluation of Ontologies. In:Proceedings of the Workshop on BasicOntological Issues in Knowledge Sharing, IJCAI-95, Montre
Размещено на Allbest.ru
...Подобные документы
Проблема представления знаний в компьютерных системах – одна из основных проблем в области искусственного интеллекта. Исследование различных моделей представления знаний. Определения их понятия. Разработка операции над знаниями в логической модели.
курсовая работа [51,9 K], добавлен 18.02.2011Построение онтологии предметной области для анализа глобальных процессов на основе информации, получаемой из новостных лент. Средства разработки онтологий, используемых для поиска событий, фактов, извлечённых из СМИ; моделирование экономических рисков.
курсовая работа [3,4 M], добавлен 27.08.2017Система классов и свойств языка RDFS. Реификация или материализация утверждений. Возможности RDF, RDF Schema в представлении онтологий. Способы представления RDF-описаний. Структура и базовые элементы OWL-онтологии. Языки запросов к RDF-хранилищам.
презентация [312,1 K], добавлен 01.09.2013Технология сбора информации традиционными методами. Правила сбора оффлайновой информации. Технические средства сбора информации. Операции для быстрого восстановления данных в системах хранения. Технологический процесс и процедуры обработки информации.
курсовая работа [304,5 K], добавлен 02.04.2013Исследование понятия и классификации видов и методов несанкционированного доступа. Определение и модель злоумышленника. Организация защиты информации. Классификация способов защиты информации в компьютерных системах от случайных и преднамеренных угроз.
реферат [115,1 K], добавлен 16.03.2014Анализ особенностей восприятия человеком окружающего мира. Обзор процессов, связанных с получением, хранением, обработкой и передачей информации. Описания технических устройств для автоматической обработки информации. Роль информации в жизни человека.
доклад [10,9 K], добавлен 20.09.2012Основные положения теории защиты информации. Сущность основных методов и средств защиты информации в сетях. Общая характеристика деятельности и корпоративной сети предприятия "Вестел", анализ его методик защиты информации в телекоммуникационных сетях.
дипломная работа [1,1 M], добавлен 30.08.2010Анализ технологий обработки информации. Построение системы защиты информации, порядок контроля за ее состоянием, определение и анализ угроз. Защита информации, которая циркулирует в системах звукоусиления. Техническая защита банковских операций.
дипломная работа [474,0 K], добавлен 19.10.2011Понятие и компоненты онтологии. Назначение и использование рубрикаторов в интернет-системах по товарам. Автоматическая рубрикация по товарам. Фрагмент описания рубрики "Автозапчасти". Проблемы пословного поиска в системе Ontoseek и средства их решения.
презентация [1,2 M], добавлен 01.09.2013Разработка web-сервиса как услуги, предоставляемой пользователю. Продажа товара (автомобилей) в Интернете, проблема выбора. Онтологии как часть концепции Semantic Web. Применение онтологий, их основные типы и свойства. Особенности реализации онтологии.
курсовая работа [57,4 K], добавлен 17.04.2012Анализ существующих программных средств для автоматического отображения онтологий, их практического применения в зависимости от поставленной задачи и сложности входных онтологий. Отображение сложных онтологий с помощью алгоритма повышенной точности.
дипломная работа [1,5 M], добавлен 14.06.2012Виды угроз безопасности в экономических информационных системах: цель, источники, средства реализации. Основные пути несанкционированного доступа к информации. Методы и средства защиты, используемые в АИТ маркетинговой деятельности, их классификация.
реферат [30,1 K], добавлен 12.03.2011Анализ модели информационно-телекоммуникационной системы предприятия. Виды угроз информационной безопасности. Цели и задачи защиты информации на предприятии. Разработка процедур контроля системы управления защитой информации в корпоративной сети.
дипломная работа [3,6 M], добавлен 30.06.2011Формы и системы представления информации для ее машинной обработки. Аналоговая и дискретная информация, представление числовой, графической и символьной информации в компьютерных системах. Понятие и особенности файловых систем, их классификация и задачи.
реферат [170,3 K], добавлен 14.11.2013Анализ нормативно-правовой базы, обоснование направлений создания обеспечения комплексной защиты информации в автоматизированных системах. Разработка методики оценки, выбор путей повышения эффективности защитных мероприятий в автоматизированных системах.
дипломная работа [368,5 K], добавлен 17.09.2009Электронно-вычислительная машина (ЭВМ) как средство обработки информации. Аппаратные и программные средства ЭВМ. Системы счисления и представления информации. Элементы структурного программирования. Построение блок-схем алгоритмов решения задач.
презентация [152,5 K], добавлен 26.07.2013Автоматизированная обработка информации: понятия и технология. Организация размещения, обработки, поиска, хранения и передачи информации. Защита информации от несанкционированного доступа. Антивирусные средства защиты информации. Сетевые технологии.
методичка [28,8 K], добавлен 14.01.2009Принципы управления знаниями на современном промышленном предприятии, совершенствование методов поиска и обработки информации. Оптимизация баз данных. Обоснования необходимости и цели использования вычислительной техники, программное обеспечение.
дипломная работа [129,5 K], добавлен 21.08.2014Формализации в онтологии областей знаний с помощью концептуальной схемы. Определение атрибутов класса и свойств экземпляров. Создание экземпляров класса и DL-Query запросов. Методика использования для разработки онтологии среды разработки Protege.
курсовая работа [2,0 M], добавлен 18.06.2014Сбор и анализ информации, используемой в ФОМС. Анализ программных и аппаратных средств, которые используются при обработке и хранении информации. Изучение проблем, которые имеют место в ФОМС, построение функциональной модели. Оценка экологичности проекта.
дипломная работа [112,9 K], добавлен 25.11.2009