Онтологический подход к автоматическому выявлению компетенций на основе анализа научных работ

Задача автоматического выявления компетенций, ее отношение к области управления знаниями в организациях. Управление знаниями как "идентификация умений, знаний, образа действий и возможностей, которые требуются и могут потребоваться для подбора персонала".

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 02.11.2018
Размер файла 14,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Институт Проблем Управления им. В.А. Трапезникова РАН

Онтологический подход к автоматическому выявлению компетенций на основе анализа научных работ

Крюков К.В.

Основное содержание исследования

Задача автоматического выявления компетенций относится к области управления знаниями в организациях. Управление знаниями определяется как "идентификация умений, знаний, образа действий и возможностей, которые требуются или могут потребоваться для подбора персонала" [1]. Задачу подбора персонала можно условно разбить на три подзадачи [2]:

1) Моделирование компетенций: выявление, описание и соотнесение компетенций;

2) Выявление требований: определение, обладание какими компетенциями требуется для выполнения каких работ;

3) Диагностика: выявление профилей компетенций возможных экспертов в терминах модели компетенций.

Далее осуществляется подбор экспертов, который тоже может состоять из нескольких шагов [3]. В данной работе рассматривается третья подзадача из перечисленных, то есть модель компетенций уже составлена, и в качестве такой модели предлагается использовать онтологию тем предметной области, в которой ищутся возможные эксперты.

В качестве материала, на основе которого строятся профили компетенций экспертов, были взяты научные работы. Таким образом, задачей является нахождение компетенций авторов научных работ, посвященных некоторой предметной области, на основе текста этих работ, при помощи онтологии этой области.

Существующие методы выявления компетенций на основе документов используют методы поисковых машин. Запрашиваемая компетенция выражается совокупностью терминов. Далее происходит расширение запроса - на основе онтологии [4] или тезауруса к исходным терминам запроса добавляются синонимы, гипонимы, гиперонимы и т.д. После этого все термины запроса ищутся в тексте документа (ов).

автоматическая компетенция управление знание

На основе встречаемости терминов и их расположения и вычисляется компетенция. Например [5]:

C - кандидат; Q - запрос; d - документ; R (Q) - набор документов; релевантных запросу Q; profile (C) - набор документов кандидата C; rankd - ранг документа d; score_cand (C,Q) - оценка компетенции кандидата С относительно запроса Q.

В данной работе используется онтология тем предметной области, а не самой предметной области, как делается, например, в работе [4]. Это обосновывается несколькими факторами:

1) Сложность формулировки требований: обычно требуется знание какой-то темы, а не понятия. Например, под компетентностью в "онтологиях" подразумевают знание всей тематики онтологий - теоретических и практических разработок, средств создания онтологий и т.д., а не просто знания определения понятия "онтология";

2) Реально близкие вещи - например, понятия какой-то темы и теоремы из этой темы, в онтологии предметной области будут относиться к разным ветвям онтологии, тогда как они говорят о знании одной темы;

3) В онтологии тем предметной области используются только отношения вида тема-подтема, что облегчает построение;

Наименования тем онтологии будем называть терминами онтологии. При выборе метода обработки документов были использованы следующие гипотезы:

1) Использование термина в документе говорит о том, что пользователь компетентен в теме, которой соответствует этот термин;

2) Чем больше пользователь использует термин, тем лучше он знает тему, которой соответствует этот термин;

3) Если пользователь компетентен в некоторой теме, то он компетентен и в близких темах;

4) Близость тем можно определить на основе онтологии предметной области с использованием семантической близости.

Мера семантической близости (СБ) - числовой коэффициент, означающий сходство двух объектов онтологии. Обзор мер семантической близости дан в [6]. Использование СБ помогает, когда на основе документов нельзя сказать, компетентен ли автор в некоторой теме, зато можно утверждать, что автор компетентен в семантически близкой теме. Рассмотрим пример: и логика высказываний, и логика предикатов принадлежат к более общей области "логика", поэтому можно предположить, что они семантически близки и знание одной из этих областей говорит нам о знании другой области.

Поскольку области, находящиеся близко к корню дерева являются достаточно широкими, значение семантической близости между ними должно быть совсем небольшим по сравнению с областями, находящимися далеко от корня. Поэтому была выбрана мера СБ, которая уже учитывалась в онтологии тем-подтем [7]:

(1)

где i, j - темы в онтологии; S (i, j) - семантическая близость i-той и j-той тем; P (i), P (j) - все предки тем i и j соответственно.

Работа по определению компетенций проводится в два этапа: сначала происходит аннотирование документов терминами онтологии, затем происходит собственно определение компетенций.

Пусть O - множество всех терминов онтологии.

- научная компетентность автора А,

- компетенция автора А по i-той теме.

- множество всех документов автора А.

Каждый документ аннотируется терминами онтологии O, в результате чего получается - аннотация документа d, где - встречаемость i-того термина (то есть сколько раз этот термин встречается в документе).

Пример аннотации документа, относящегося к теории графов: граф (2), ребро (5), вершина (66), петля (4), ориентированный граф (1).

Для определения компетенций на основе аннотированных документов используется подход, аналогичный [4]:

где i - тема, компетенция в которой ищется; j - тема из онтологии; б - коэффициент; S (i,j) - функция семантической близости, вычисляемая по формуле (1).

Данный подход позволяет определять компетенции в тех темах, названия которых в статьях не встречаются, но которые автор документов должен знать в силу того, что они очень близки к известным ему темам. В вышеприведенном примере в документе отсутствует упоминание "теории графов", однако, за счет использования термина "вершина", тема "теория графов" получит ненулевое значение компетенции.

Данный подход был реализован программно и показал результаты, на наш взгляд, соотносящиеся с действительностью. Основным недостатком явилось смешение тем и понятий.

Например, "теория графов" - это тема, и в ней можно измерять компетенцию, а "вершина" - это понятие, и о нем принято говорить только знают его или нет. В дальнейшем работа будет посвящена устранению этого недостатка.

Список литературы

1. Georgeta Bordea. Concept Extraction Applied to the Task of Expert Finding The Semantic Web: Research and Applications/ Springer, 2010, V.6089, p.451-456.

2. Braun S., Schmidt A. People Tagging & Ontology Maturing: Towards Collaborative Competence Management/ 8th International Conference on the Design of Cooperative Systems, France, 2008.

3. Ackerman M, McDonald D., Lutters W., Muramatsu J. Recommenders for Expertise Management/ Proc. of ACM SIGIR'99 Workshop on Recommender Systems: Algorithms and Evaluation. Berkeley: University of California, 1999.

4. Ranwez Sylvie et al. User Centered and Ontology Based Information Retrieval System for Life Science/ Available from Nature Precedings, 2010. http://precedings. nature.com/documents/5408/version/1/files/npre20105408-1. pdf (28/03/2011).

5. Macdonald C., Ounis, I. Voting for candidates: adapting data fusion techniques for an expert search task/ CIKM 2006: Proc. of the 15th ACM International Conference on Information and Knowledge Management. ACM, New York (2006), pp.387-396.

6. Крюков К. В, Панкова Л.А., Пронина В.А., Суховеров В.С., Шипилина Л.Б. "МЕРЫ СЕМАНТИЧЕСКОЙ БЛИЗОСТИ В ОНТОЛОГИИ"/ "Проблемы управления", 2010, т.5, с.2.

7. Stojanovic N. et al. SEAL - A framework for developing semantic portals/ Proc. of the 1st international ACM conferences on knowledge capture K-CAP'01, Canada, 2001.

Размещено на Allbest.ru

...

Подобные документы

  • Проблема представления знаний в компьютерных системах – одна из основных проблем в области искусственного интеллекта. Исследование различных моделей представления знаний. Определения их понятия. Разработка операции над знаниями в логической модели.

    курсовая работа [51,9 K], добавлен 18.02.2011

  • Паспорт проекта: идентификация, назначение, исполнители, контрагенты, официальные документы. Объем проекта, ограничения и условия, риски, стадии разработки. Устав, матрица ответственности. Иерархическая структура работ по разработке Web-приложения.

    курсовая работа [180,1 K], добавлен 14.08.2011

  • Разработка алгоритмов и программных средств поддержки взаимодействия компетентностно-ориентированных моделей в обучающих ИЭС (АТ-ТЕХНОЛОГИЯ). Анализ функциональных возможностей базовой версии компонента выявления текущего уровня компетенций обучаемого.

    отчет по практике [1,6 M], добавлен 28.04.2015

  • Совершенствование информационной базы подбора персонала на основе концепции баз данных резюме. Недостатки и достоинства существующей системы, предложения по ее улучшению. Разработка модуля корпоративной информационной системы управления предприятием.

    курсовая работа [1,0 M], добавлен 11.11.2013

  • Принципы управления знаниями на современном промышленном предприятии, совершенствование методов поиска и обработки информации. Оптимизация баз данных. Обоснования необходимости и цели использования вычислительной техники, программное обеспечение.

    дипломная работа [129,5 K], добавлен 21.08.2014

  • Анализ поисковых систем. Работа виртуального каталога. Поисковая система с большим количеством проиндексированных документов. Требования к экспертной системе по автоматическому порождению поисковых эвристик. Методы автоматического подбора эвристик.

    курсовая работа [809,9 K], добавлен 25.07.2012

  • Понятия в области метрологии. Представление знаний в интеллектуальных системах. Методы описания нечетких знаний в интеллектуальных системах. Классификация интеллектуальных систем, их структурная организация. Нечеткие системы автоматического управления.

    курсовая работа [768,2 K], добавлен 16.02.2015

  • Идентификация моделей каналов преобразования координатных воздействий объекта управления. Реализация моделей на ЦВМ и их адекватность. Формулирование задач управления, требований к их решению и выбор основных принципов построения автоматических систем.

    курсовая работа [1,4 M], добавлен 10.04.2013

  • Информационное обеспечение научных исследований в университете. Разработка онтологии в области управления. Создание глоссария по менеджменту, списка персоналий. Семантическая разметка массива документов. Методика работы с базой научных публикаций.

    дипломная работа [3,5 M], добавлен 13.01.2015

  • Теория автоматического управления - совокупность целесообразных действий, направленных на достижение поставленных целей. Объект управления - техническое устройство, в котором протекает управляемый процесс. Алгебраические критерии устойчивости Гурвица.

    курсовая работа [338,1 K], добавлен 03.10.2008

  • Теория автоматического управления как наука, предмет и методика ее изучения. Классификация систем автоматического управления по различным признакам, их математические модели. Дифференциальные уравнения систем автоматического управления, их решения.

    контрольная работа [104,1 K], добавлен 06.08.2009

  • Понятие об управлении, основные его принципы и цели в технических системах. Сущность отрицательной обратной связи, основы построения и требования к системам автоматического регулирования и управления. Проблемы управления как многокритериальная задача.

    реферат [992,7 K], добавлен 16.03.2009

  • Совершенствование работы процесса подбора персонала в ООО "Медиа Технологии" для повышения уровня автоматизации и упрощения процедуры передачи данных. Сравнительная характеристика АИС подбора персонала. Реализация внедренного программного обеспечения.

    дипломная работа [4,1 M], добавлен 19.11.2015

  • Динамические характеристики типовых звеньев и их соединений, анализ устойчивости систем автоматического управления. Структурные схемы преобразованной САУ, качество процессов управления и коррекции. Анализ нелинейной системы автоматического управления.

    лабораторная работа [681,9 K], добавлен 17.04.2010

  • Внедрение средств новых информационных технологий в систему образования. Формирование ключевых компетенций, обобщенных и прикладных предметных умений, жизненных навыков. Основные средства, понятия и классификация интерактивного профессионального обучения.

    курсовая работа [950,1 K], добавлен 20.08.2014

  • Анализ существующей системы подбора персонала в ООО "Дататех". Место автоматизируемого процесса в его деятельности. Имитационное моделирование существующего и предлагаемого процессов. Разработка модуля корпоративной информационной системы управления.

    курсовая работа [2,6 M], добавлен 27.03.2011

  • Инструменты анализа академического стиля английского языка. Проектирование архитектуры портала для анализа и оценки стиля научных публикаций на основе методов корпусной лингвистики. Моделирование жизненного цикла системы и взаимодействия её компонентов.

    дипломная работа [2,4 M], добавлен 27.08.2017

  • Методология проектирования информационной системы. Обоснование выбора платформы. Определение цели и области действия программного проекта. Структура пооперационного перечня работ. Идентификация задач и действий. Прототипы пользовательского интерфейса.

    дипломная работа [3,8 M], добавлен 30.11.2010

  • Понятие системы управления, ее виды и основные элементы. Критерии оценки состояния объекта управления. Классификация структур управления. Особенности замкнутых и разомкнутых систем автоматического управления. Математическая модель объекта управления.

    контрольная работа [1,0 M], добавлен 23.10.2015

  • Подсистема анализа изображения отпечатка пальца в составе системы идентификации личности по отпечаткам пальцев на основе папиллярного узора для дальнейшего распознавания личности. Характеристика функциональных возможностей системы и код програмы.

    дипломная работа [3,1 M], добавлен 01.07.2008

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.