Разработка онтологической модели публикаций

В работе предложена онтологическая модель знаний, построенная на основе российских стандартов, регламентирующих основные виды изданий в РФ. Проведена оценка компетентности онтологии и показаны ее возможности для анализа наукометрических показателей.

Рубрика Журналистика, издательское дело и СМИ
Вид статья
Язык русский
Дата добавления 07.03.2019
Размер файла 690,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Разработка онтологической модели публикаций

Галимов Алексей Азатович

магистр, Волгоградский государственный технический университет

400005, Россия, Волгоградская область, г. Волгоград, пр. Ленина, 28, ауд. 1406

Аннотация

Деятельность организаций, занимающихся издательской работой, а также людей, работающих в научно-исследовательской области, тесно связана с публикациями. В настоящее время в свободном доступе существует комплекс онтологий Semantic Publishing and Referencing Ontology (SPAR), который предназначен для работы с публикациями. Однако этот комплекс является англоязычным и ориентирован на работу с зарубежными источниками литературы, а прямой перевод комплекса на русский язык не решает проблему работы с российскими публикациями. В работе предложена онтологическая модель знаний, построенная на основе российских стандартов, регламентирующих основные виды изданий в РФ. Для описания классов и слотов выбраны основные типы публикаций, наиболее часто используемые в научных исследованиях. Онтология разработана в редакторе онтологий Protйgй. Проведена оценка компетентности онтологии и показаны ее возможности для анализа наукометрических показателей, заполнения различных отчетов и рейтингов, составления библиографических записей.

Ключевые слова: публикация, онтология, Protйgй, библиография, библиографический стиль, база знаний, управление знаниями, SPAR, издательская работа, OWL

онтологический российский издание наукометрический

Galimov Aleksei Azatovich

student, Department of CAD , Volgograd State Technical University

400005, Russia, Volgogradskaya oblast', g. Volgograd, pr. Lenina, 28, aud. 1406

alexey.galimov.34@gmail.com

Abstract

Activities of publishing organizations, as well as researches is closely related to publication. Currently, there are some complex Semantic Publishing and Referencing Ontology (SPAR) ontologies in free access, designed to work with publications. However, this complex is English-based and designed to work with foreign sources of literature. Direct translation of the complex into Russian does not solve the problem of working with Russian publications. The paper presents an ontological model of knowledge, built on the basis of Russian standards regulating the main types of publications in the Russian Federation. To describe the classes and slots the author selects main types of publications, most commonly used in scientific research. Ontology developed in Protйgй ontology editor. The article evaluates the competence of the ontology and show its capabilities for analyzing scientometric indicators, filling a variety of reports and ratings, make a bibliographic records.

Keywords:

knowledge base, bibliographic style, bibliography, Protйgй, ontology, publication, knowledge management, SPAR, publishing work, OWL

Организации, занимающиеся издательской работой, стремятся решить становящиеся всё более острыми проблемы формализации, структуризации и формы хранения накопленных знаний для дальнейшего удобного доступа к ним и получения всей необходимой информации одним запросом к базе знаний.

Подавляющее большинство людей, занимающихся научно-исследовательской работой, также активно работают с публикациями. В соответствии с требованиями к оформлению, каждая публикация должна список использованных источников литературы. Эти списки составляются в соответствии с библиографическими стилями, причём в разных журналах требуются разные стили.

Для эффективной работы с публикациями можно использовать онтологию. Созданная онтология может использоваться, например, в целях создания частной библиотеки публикаций; составления библиографических записей, ссылок и списков литературы по атрибутам публикаций; в процессе издательской работы.

Анализ существующих онтологий публикаций

Онтологией называется формализация некоторой области знаний с помощью такой структуры, которая содержит классы объектов (физических или абстрактных), их слоты и связи, принятые в этой области. Класс -- это абстрактная группа, коллекция или набор объектов. Он может включать в себя экземпляры конкретных объектов, другие классы, либо же сочетания и того, и другого. Каждый слот (свойство, атрибут) имеет по крайней мере имя и значение и используется для хранения информации, которая специфична для объекта и привязана к нему. В качестве связей между классами обычно выступают такие атрибуты классов, значением которых является другой объект.

В настоящее время в свободном доступе существует комплекс онтологий SPAR - Semantic Publishing and Referencing Ontology [1]. Он обеспечивает достаточно детальную категоризацию отношений, которые могут возникать между научными материалами в электронном виде, и воплощающими их связями. Комплекс онтологий SPAR включает онтологии семантической публикации и онтологии ссылок.

Онтологии семантической публикации[2]:

? FRBR-aligned Bibliographic Ontology (FaBiO) - это библиографическая онтология, совместимая с FRBR, предназначена для записи и публикации в Semantic Web библиографических научных записей;

? Publication Roles Ontology (PRO) характеризует роли агентов (людей, организаций и вычислительных средств; например, автор, редактор, обозреватель, издатель, библиотекарь) в процессе публикации, позволяет записывать информацию даты/времени о том, когда исполняются эти роли;

? Publications Status Ontology (PSO) описывает статус документов и других библиографических сущностей на различных этапах процесса публикации (например, представленные рукописи, отклонение рукописи, прием рукописи, версия записи);

? Publications Workflow Ontology (PWO) характеризует основные этапы в рабочем процессе, связанном с публикацией документа (например, в рассмотрении, в XML формате, дизайн страницы, публикация в Интернете).

Онтологии ссылок:

? Citation Typing Ontology (CiTO) необходима для описания природы цитат в научно-исследовательских статьях и других академических работах, как из других публикаций, так и из информационных ресурсов Web, и для публикации этих описаний в Semantic Web;

? Bibliographic Reference Ontology (BiRO) нужна для описания библиографических записей и ссылок, и их сбора в библиографические сборники и списки литературы;

? Citation Counting and Context Characterization Ontology (C4O) характеризует библиографические ссылки с точки зрения их количества и контекста;

? Document Components Ontology (DoCO). описывает составные части библиографического документа. Предоставляет структурированную лексику компонентов документа (например, введение, обсуждение, благодарность, список литературы, рисунки, приложения).

Онтологии FaBiO, CiTO, BiRO и C4O в настоящее время находятся в открытом доступе и уже могут быть использованы, а онтологии DoCO, PRO, PSO и PWO находятся в разработке. Комплекс онтологий SPAR является англоязычным и ориентирован на работу с зарубежными источниками. Прямой перевод комплекса на русский язык не решает проблему работы с русскоязычными публикациями, так как классы и слоты комплекса отличны от тех, наличие которых необходимо для соответствия российским стандартам описания материалов, готовящихся к публикации [3,4]. Для решения этой проблемы необходима разработка новой онтологии.

Разработка русскоязычной онтологии публикаций

Разработка онтологии включает в себя следующие шаги:

- определение области и масштаба онтологии;

- выделение основных терминов онтологии;

- определение классов и иерархии классов;

- определение свойств классов - слотов;

- определение фацетов (ограничения) слотов.

Для определения классов и слотов русскоязычной онтологической модели, ориентированной на работу с российскими публикациями, проведен анализ российских стандартов, регламентирующих основные виды изданий в РФ [3,4].

Для разработки первой версии были выбраны основные типы публикаций, наиболее часто используемые в научных исследованиях. Для каждого типа публикации в онтологии определен соответствующий класс, который может конкретизироваться более низкими уровнями иерархии (подклассами).

В корне иерархии классов расположен абстрактный класс "Базовый класс публикации", от которого наследуются все остальные (как абстрактные, так и не абстрактные) классы. Этот класс имеет следующие слоты, которыми описываются все типы публикаций, включенные в первую версию онтологии:

- "авторы";

- "заглавие публикации";

- "сведения о заглавии";

- "универсальная десятичная классификация";

- "библиотечно-библиографическая классификация";

- "дата публикации";

- "страницы" (общее количество страниц или интервал страниц с публикацией);

- "состояние публикации" (принята к публикации, в процессе создания, опубликована, отклонена);

- "количество ссылок в публикации" (количество источников использованной литературы).

Иерархия классов онтологии показана на рисунке 1.

Рисунок 1 - Иерархия классов онтологии

Слоты остальных классов дополняются к слотам базового класса, и, такой набор слотов позволяет описывать конкретные экземпляры.

Например, класс "Книжная публикация" помимо "базовых" слотов будет иметь такие:

- "повторность издания";

- "место издания";

- "издательство";

- "под редакцией";

- "ISBN";

- "рецензенты".

Диаграмма классов показана на рисунке 2.

Рисунок 2 - Диаграмма классов онтологии

Онтология разработана в редакторе онтологий и фреймворке для построения баз знаний Protйgй версии 3.5 [5]. Онтология представлена в виде файла проекта Protйgй. Такой файл можно конвертировать в файл OWL, что позволяет использовать онтологию в других редакторах и фреймворках, например DOE [6], Fluent Editor [7].

Тестирование онтологии

Для проверки компетентности онтологии был составлен набор запросов. Экранные формы этих запросов, выполненных в Protйgй 3.5, приведены на рисунках 3-6.

Рисунок 3 - Реализация запроса "Какие книги были опубликованы в 2013 году?"

Рисунок 4 - Реализация запроса "Какие публикации являются зарубежными?"

Рисунок 5 - Реализация запроса "Научным руководителем каких диссертаций является сотрудник Орлов?".

Рисунок 6 - Реализация запроса "Какие публикации публикуются еженедельно?".

Результаты запросов показали, что разработанная онтологическая модель может быть использована сотрудниками кафедр вузов для анализа наукометрических показателей, заполнения различных отчетов и рейтингов, составления библиографических записей. Работа с онтологией позволяет также существенно упростить и ускорить составление библиографических списков при подготовке статей к публикации.

Заключение

В настоящее время проводится работа над развитием онтологии. Для формирования библиографических списков из найденных публикаций в следующую версию онтологии будет добавлен класс "Ссылки" со следующими атрибутами: "авторы", "заглавие" и "тип ссылки" (возможные значения: «прямая ссылка», «косвенная ссылка»). Добавление слота "содержит" позволит установить связь "Базовый класс публикации СОДЕРЖИТ Ссылки". По такому же принципу будет образована связь "Базовый класс публикации ИМЕЕТ Компоненты". Для этого будет добавлен класс "Компоненты" с атрибутами "тип компонента" (возможные значения: "структурные", "риторические") и "компоненты", а также слот "имеет". Добавление новых классов, описывающих типы публикаций, расширит возможности практического применения онтологии. В числе этих классов следующие: "Тезисы докладов", "Отчет о НИР", "Методическое пособие", "Составная часть документа" и "Рецензия". Расширенная версия онтологии будет полностью соответствовать российским стандартам [3,4]. Это позволит генерировать библиографические списки, включающие любые издания, опубликованные в российских источниках информации.

Библиография

1. Semantic Publishing and Referencing Ontologies (SPAR) [Электронный ресурс] - Режим доступа: http://sempublishing.sourceforge.net/

2. В. А. Резниченко, Г. Ю. Проскудина, О. М. Овдий. Формальная модель научной публикации. [Электронный ресурс] / Ин-т прогр. систем НАН Украины - Режим доступа: http://nbuv.gov.ua/j-pdf/Progr_2012_2-3_41.pdf

3. ГОСТ 7.60-2003. Издания. Основные виды. [Электронный ресурс] - Режим доступа: http://www.ifap.ru/library/gost/7602003.pdf

4. ГОСТ 7.1-2003. Библиографическая запись. Библиографическое описание. Общие требования и правила составления. [Электронный ресурс] - Режим доступа: http://www.ifap.ru/library/gost/712003.pdf

5. Protйgй [Электронный ресурс] - Режим доступа: http://protege.stanford.edu

6. DOE-The Differential Ontology Editor [Электронный ресурс] - Режим доступа: http://www.eurecom.fr/~troncy/DOE/

7. Cognitum. Fluent Editor 2014 [Электронный ресурс] - Режим доступа: http://www.cognitum.eu/semantics/FluentEditor/Default.aspx

Размещено на Allbest.ru

...

Подобные документы

  • Мониторинг публикаций в СМИ как способ изучения общественного мнения. Особенности влияния на общественное мнение публикаций в СМИ на спортивную тематику. Характеристика спортивных публикаций в основных федеральных СМИ в период Олимпиады в Сочи 2014.

    реферат [81,1 K], добавлен 29.12.2016

  • Проблема адресата в музыкальной журналистике, жанр музыкального репортажа. Основные тенденции в сегодняшних СМИ, наличие черт репортажа и рецензии в данном жанре. Анализ музыкальных репортажей в газете и на сайтах неспециализированных интернет-изданий.

    курсовая работа [46,7 K], добавлен 12.12.2011

  • Сущность, структура и функции семьи как социального института. Анализ ведущих российских периодических изданий разного формата с целью определения объективности и полноты освещения проблем современной семьи. Исследование прессы с помощью контент-анализа.

    дипломная работа [737,1 K], добавлен 08.06.2011

  • Общая характеристика электронных изданий; формирование дефиниции "электронный образовательный ресурс". Определение понятия компетенции, построение специальной модели предметных, управленческих, инновационных компетенций редактора электронных изданий.

    курсовая работа [107,3 K], добавлен 14.10.2012

  • Умения и навыки редактирования текстов. Виды изданий: рекламные; информационные, научные, учебные, переиздания. Требования по редактированию газетно-журнальных изданий. Работа редактора с рекламными изданиями. Редактирование информационных изданий.

    реферат [28,9 K], добавлен 15.12.2010

  • Приемы анализа публикаций в прессе. Обзорный подход и исторический аспект, использовавшийся В.Г. Белинским в его обоих "Взглядах на русскую литературу". Наиболее заметные публикации в журнале "Библиотека". Продвижение книги и чтения в библиотеках.

    реферат [26,1 K], добавлен 24.03.2013

  • Факт и событие: разграничение понятий. Понятие события в журналистике. Анализ публикаций в газетах "Известия" и "Челябинский рабочий": информационные материалы, журналистские комментарии. Оценка публикаций, тематически связанные с "Законом Димы Яковлева".

    курсовая работа [38,4 K], добавлен 06.07.2014

  • Причины возникновения глянцевых изданий, первые издания мира. Направления, жанры и аудитория современных глянцевых изданий, прогноз их положения на современном рынке прессы. Типология женских изданий России, изменение их содержания на протяжении времени.

    дипломная работа [3,6 M], добавлен 11.07.2015

  • Основные виды женской прессы. Способы классификации женских изданий, их главные задачи. Жанровые особенности специализированных изданий для женщин. Анализ журнала "Vogue" как специализированного женского журнала. Женские издания на территории Украины.

    курсовая работа [67,2 K], добавлен 01.06.2014

  • Особенности развития и основные понятия онлайновой журналистики. Принципы создания сетевых изданий. Характер и форма онлайновых сетевых изданий Югры на примере веб-сайтов ugrainform.ru и ugra.info. Факторы повышения конкурентоспособности Интернет-изданий.

    дипломная работа [84,3 K], добавлен 17.05.2011

  • Функции, выполняемые изданиями по интеллектуальной игре, их классификация. Определение специфики читательского восприятия и особенностей процесса чтения на основе проведённого социологического исследования. Особенности изданий по интеллектуальной игре.

    курсовая работа [45,4 M], добавлен 30.03.2019

  • Оценка соответствия справочного аппарата периодических изданий теоретическим требованиям. Определение аппарата издания. Определение по количеству баллов, какие журналы отвечают стандартам периодических изданий по оформлению, качеству справочного аппарата.

    курсовая работа [4,2 M], добавлен 11.01.2010

  • Особенности типа качественной газеты. Критерии качества, разновидности подачи новостных услуг. Разбор типа качественной газеты на примере 2 газет: "Вятский край" и "Российская газета". Оценка изданий по показателям, рейтинг среди печатных изданий РФ.

    курсовая работа [249,8 K], добавлен 29.03.2010

  • Виды информации и источники ее получения. Функциональное назначение официальных изданий. Научные, нормативное производственно-практические издания и общетипологическая классификация учебных изданий. Соотношение газет и журналов в системе журналистики.

    курсовая работа [37,4 K], добавлен 21.12.2011

  • Изучение художественных конвенций по материалам периодических изданий "Всемирная иллюстрация" и "Аполлон", критическим обзорам выставок и произведений искусства. Анализ влияния массовых периодических изданий на культурную жизнь российского общества.

    реферат [32,3 K], добавлен 03.09.2016

  • Понятие "справочный аппарат" в различных видах изданий. Оформление каждого книжного издания в соответствии с существующими стандартами. Оценка редактором логических качеств текста рукописи, контроль за соблюдением основных законов логического мышления.

    контрольная работа [20,3 K], добавлен 13.01.2009

  • Теоретические аспекты СМИ. История, особенности и оценка рынка автомобильной прессы. Позиционирование прессы и классификация автомобильных изданий. Тиражи и аудитория. Разработка рекламной кампании журнала "За рулем". Основные способы его продвижения.

    курсовая работа [41,1 K], добавлен 01.06.2013

  • История развития интернет-изданий, специфика их аудитории. Восприятие средств массовой информации в Интернете населением. Формирование Интернет-изданий благодаря новым возможностям и потребностям аудитории. Конкуренция печатных и Интернет-изданий.

    курсовая работа [48,7 K], добавлен 06.05.2014

  • Место и роль вузовских изданий в системе средств массовой информации. Основные функции студенческих изданий. Редакционная коллегия газеты "Зеркало". Основные источники сведений для журналиста. Жанрово-тематические особенности вузовской газеты "Зеркало".

    дипломная работа [32,7 K], добавлен 11.06.2012

  • Основные этапы производства периодических изданий. Технологическая схема производства. Какая бумага применяется в полиграфии. Подборка 20-ти шрифтов и 5-ти линеек. Таблица выходных данных трех периодических изданий. Расчет емкости рукописного текста.

    контрольная работа [30,8 K], добавлен 31.10.2002

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.