Тезаурус библиографических классификаций как онтология информационных ресурсов по полупроводникам и нанотехнологиям

Содержательная онтология предметной области перспективных исследований по физике полупроводников и нанотехнологиям, ее построение на материале множества библиографических классификаций, традиционно используемых в современной информационной практике.

Рубрика Культура и искусство
Вид статья
Язык русский
Дата добавления 02.02.2019
Размер файла 25,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Тезаурус библиографических классификаций как онтология информационных ресурсов по полупроводникам и нанотехнологиям

В.Н. Белоозеров, ВИНИТИ РАН, Москва, Россия

Н.Н. Шабурова, ИФП СО РАН, Новосибирск, Россия

Аннотации

В докладе показано, что содержательная онтология предметной области перспективных исследований по физике полупроводников и нанотехнологиям может быть эффективно построена на материале множества библиографических классификаций, традиционно используемых в современной информационной практике. Наиболее общей схемой, отражающей систему классов информационных ресурсов с их связями и отношениями, является стандартная схема информационно-поискового тезауруса. Тематические рубрики различных классификаций связываются в едином тезаурусе полииерархической сетью родовидовых отношений, что объективно отражает многообразие семантических связей информационных ресурсов. Описана процедура и результаты построения тезауруса тематических рубрик по физике полупроводников и нанотехнологий на материале основных библиографических классификаций, используемых в этой области - Библиотечно-библиографической классификации, Универсальной десятичной классификации, Государственного рубрикатора НТИ, Рубрикатора информационных изданий ВИНИТИ, Рубрикатора Федерального портала "Нанотехнологии и наноматериалы", Схемы классификации по физике и астрономии Американского физического общества.

Ключевые слова: библиографические классификации, онтология информационных ресурсов, тезаурус тематических рубрик, физика полупроводников, нанотехнологии

The paper shows that substantial ontology of the subject domain of perspective researches in physics of semiconductors and nanotechnology can be effectively constructed on the material of bibliographic classifications, traditionally used in now-days information practice. The most general scheme reflecting the system of classes of information resources with their connections and relations is the standard scheme of the information retrieval thesaurus. Subject headings of the different classifications are linked in a single thesaurus with poly-hierarchical network of genus-species relations, which objectively reflects the diversity of the semantic relations of information resources. The procedure of constructing the thesaurus of thematic headings for physics of semiconductors and nanotechnology on the material of the main bibliographic classifications used in this field is described. These classificatiuons are: Russian Library-Bibliographical Classification, Universal Decimal Classification, Russian State Rubricator for STI, Rubricator for VINITI Information Publications, Rubricator of the Federal portal "Nanotechnologies and nanomaterials", Physics and Astronomy Classification Scheme of the American Physical Society. At the beginning of 2014 thesaurus consisted of more than 2100 entries. Hierarchical genus-species relations (about 2600 related descriptor pairs) and the connections of quasi-synonymic type (about 110 descriptor pairs) are installed in the thesaurus. The thesaurus contains more than 11 thousand items of entries including definitions, classification indexes of concepts and descriptor relations.

Keywords: bibliographic classification, ontology of information resources, thesaurus of subject headings, physics of semiconductors, nanotechnology

Основное содержание исследования

Качественный поиск информации в библиотечных фондах, базах данных и сетевых ресурсах по концепции "семантического вэба" требует создания в структуре поискового механизма модели того пространства смыслов, в рамках которого производится поиск. Перед нами поставлена задача формального описания системы информационных ресурсов в сфере физики полупроводников и нанотехнологий с тем, чтобы вложить представление об этой сфере в автоматизированные системы. В области научно-технической информации такими средствами формального описания традиционно являются библиографические классификации. Множественность принятых в современной практике систем описания тематики научных работ создаёт трудность в получении исчерпывающих данных по какой-либо заданной теме исследований, поскольку разные классификационные системы членят предметную область исследований по-разному. С другой же стороны, множественность описаний одной предметной области представляет её онтологию с различных точек зрения, что позволяет надеяться на более объективное отражение физических свойств, явлений и процессов формальной моделью. Необходимость иметь такую модель онтологии в составе поисковых систем для успешного поиска данных является признанным фактом современной информатики (см. напр., [Добров]). Разработчики формальных моделей онтологии в настоящее время озабочены, главным образом, развитием техники представления смысловых связей понятий в среде современного интернета. При этом в стороне остаётся вопрос о том, из какого источники мы будем получать сами эти понятия и их связи. На наш взгляд такие сведения должны черпаться из классических информационно-поисковых языков, действующих в информационно-библиотечной практике. На примере УДК и классов информационных ресурсов образования было показано, что классификационные системы адекватно отражают онтологию своих предметных областей на определённом уровне глубины и широты описания [Белоозеров (2013)]. Также было показано, что наиболее общей схемой, отражающей систему классов информационных ресурсов с их связями и отношениями, является стандартная схема информационно-поискового тезауруса, соответствующая ГОСТ 7.25 [ГОСТ]. Ранее нами был построен на этих основаниях тезаурус тематических рубрик, реализующий формальную онтологию для "титульной" предметной области ИФП СО РАН - для физики полупроводников [Белоозеров (2010)]. Он послужил основой для создания нового тезауруса, описывающего более широкую область реальных исследований института, которая включает вопросы физических основ нанотехнологий и применения их в электронике. Совмещение в единой системе информационно-поискового тезауруса и иерархической классификации тематических рубрик, известно как достаточно эффективное средство описания предметной области (см., например, [Wei]). Оригинальным в нашей концепции является построение тезауруса на материале лексики не публикаций, а на материале рубрик тематических классификаторов, описывающих публикации.

В основу Тезауруса тематических рубрик по физике полупроводников был положен раздел физики полупроводников из Библиотечно-библиографической классификации [ББК], используемой в ИФП СО РАН для систематизации информационных ресурсов. К дескрипторам, полученным из ББК, добавлены наименования классов из разделов электродинамики и физики конденсированного состояния Универсальной десятичной классификации [УДК], которая является международным аналогом ББК и принята в нашей стране как основное средство систематизации данных по естественным и техническим наукам. В тезаурус включены наименования классов раздела физики твёрдого тела из Государственного рубрикатора научно-технической информации [ГРНТИ], принятого в нашей стране для систематизации материала автоматизированных информационных систем. Далее, в тезаурус был влит раздел физики полупроводников Рубрикатора информационных изданий ВИНИТИ [ВИНИТИ], на основе которого ведёт информационное обеспечение науки Всероссийский институт научной и технической информации РАН в качестве головного информационного органа Российской академии наук. Наконец, в тезаурус были включены понятия физики полупроводников, которые удалось найти в Схеме классификации по физике и астрономии [PACS].

Задача расширения тематического охвата тезауруса требует прежде всего включения в него новых разделов классификационных систем. Поскольку нанотехнологии не ограничиваются полупроводниковыми материалами, в тезаурус необходимо включить в полном объёме разделы физики твёрдого тела (конденсированного состояния) из ББК, PACS и Рубрикатора ВИНИТИ, где разделы физики полупроводников составляю лишь часть необходимой тематики. Исходный тезаурус не содержал технологических разделов, поэтому в него необходимо включить классы из разделов твердотельной электроники всех классификаций, поскольку эта тема является естественным обобщением области исконных исследований ИФП СО РАН и новых задач развития технологий построения электронных схем на уровне нанометровых конструкций в твёрдом теле. Масштаб этих конструкций находится в пределах размеров отдельных молекул, и поэтому необходимо также учесть понятия разделов молекулярной физики. Однако модель онтологии информационных ресурсов по нанотехнологиям должна отражать и специфический технологический взгляд на множество имеющихся документов. С этой целью мы включаем в состав исходных классификационных систем рубрикации Федерального интернет-портала "Нанотехнологии и наноматериалы" [Рубрикатор].

В настоящее время тезаурус насчитывает более 2100 словарных статей. В его словнике присутствуют следующие категории лексических единиц, выделенные по признаку способа формирования:

1) полностью совпадающие с наименованием класса оной из классификаций,

2) наименования классов, дополненные указанием на вхождение в ту или иную вышестоящую понятийную единицу,

3) наименования классов, сокращённые за счёт изъятия необязательных элементов,

4) наименования подчинённых классов, подразумеваемых формулировкой класса, присутствующего в исходной классификационной системе,

5) наименования обобщающих классов, подразумеваемых формулировками одного или нескольких классов, присутствующих в исходных классификационных системах. Основной массив дескрипторов относится к первой категории лексических единиц. Примеры лексических единиц разного рода приведены в таблицах 1 - 5.

Таблица 1. Примеры лексических единиц первого рода

Лексическая единица тезауруса (дескриптор)

Исходная классификация и классификационный код

акустика

ББК В32 ВИНИТИ 291.37 ГРНТИ 29.37 УДК 534

баллистическое магнитосопротивление

ВИНИТИ 291.19.36.21.17

взаимодействие между частицами в массивах наночастиц

НАНО09 1.2.8

гальваномагнитные явления

ББК В377.4

Таблица 2. Примеры лексических единиц второго рода.

Дескриптор тезауруса

Исходный класс и его код

Вышестоящие классы

действие излучений на проводимость и сопротивление

УДК 537.312.5 Действие излучений

УДК 537.312 Действие внешних факторов на проводимость и сопротивление

стёкла, ситаллы, керамика для радиоэлектроники

ГРНТИ 47.09.41 Стёкла, ситаллы, керамика

ГРНТИ 47.09 Материалы для электроники и радиотехгники

зонный электронный спектр полупроводников - влияние давления

ВИНИТИ 291.19.31.15.15.15 Влияние давления

ВИНИТИ 291.19.31 Полупроводники ВИНИТИ 291.19.31.15.15 Зонный электронный спектр

предметная область физика полупроводник

Таблица 3. Примеры лексических единиц третьего рода.

Дескриптор тезауруса

Исходный класс и его код

полимеры для радиоэлектроники

ГРНТИ 47.09.51 Полимеры и полимерные материалы для радиоэлектроники

действие механических напряжений на проводимость и сопротивление

УДК 537.312.9 Действие механических напряжений (изгибы, кручения и т.д.) на проводимость и сопротивление

физика конденсированного состояния

УДК 538.9 Физика конденсированного состояния (жидкое и твёрдое состояния) (микроскопическое описание)

Таблица 4. Примеры лексических единиц четвёртого рода.

Дескриптор тезауруса

Исходный класс и его код

ситаллы для радиоэлектроники

ГРНТИ 47.09.41 Стёкла, ситаллы, керамика

керамика для радиоэлектроники

наноуглеродные композиты - получение, обработка, испытание, анализ

PACS 81.05. uj Алмаз и наноуглеродные композиты - получение, обработка, испытание, анализ

поверхности твёрдых тел - взаимодействие с наночастицами

НАНО09 1.2.9 Взаимодействие наночастиц с пленками и поверхностями твердых тел

плёнки - взаимодействие с наночастицами

Таблица 5. Примеры лексических единиц пятого рода.

Дескриптор тезауруса

Исходные классы и их коды

квантовые ямы

PACS 81.07. Pr Квантовые ямы - получение и описание PACS 68.65. Fg Квантовые ямы - структура и неэлектронные свойства PACS 73.21. Fg Квантовые ямы - электронная структура и электрические свойства PACS 73.63. Hs Квантовые ямы - электронный перенос

микроскопия наноматериалов

ВИНИТИ 291.19.22.13.13.17 Ближнеполевая микроскопия наноматериалов ВИНИТИ 291.19.22.13.13.15 Зондовая микроскопия наноматериалов ВИНИТИ 291.19.22.13.13.13 Просвечивающая и растровая электронная микроскопия нанообъектов НАНО 2.4.4 Люминесцентная микроскопия нанообъектов НАНО 2.4.2 Сканирующая электронная микроскопия нанообъектов

наноклетки

PACS 78.67. Ve Наноклетки - оптические свойства

Бьльшая часть лексических единиц тезауруса является дескрипторами, т.е. наименованиями понятий, в словарных статьях которых указаны смысловые связи с другими понятиями предметной области. Кроме того около 130 лексических единиц являются аскрипторами, т.е. альтернативными наименованиями понятий, выраженных указанным в аскрипторной статье дескриптором. Для 188 дескрипторов дано определение, что помогает информационным работникам, не являющимся специалистом в предметной области, ориентироваться в смысле обрабатываемых данных. Для большинства дескрипторов указано их место в той или иной классификационной системе. При этом использованы возможности аналитико-синтетических информационно-поисковых языков УДК и ББК, предусматривающих формирование комбинированных тематических индексов. Между дескрипторами тезауруса установлены иерархические родовидовые связи (около 2600 пар связанных дескрипторов) и связи типа квазисинонимических (около 110 пар дескрипторов). В словарных статьях тезауруса содержится в целом более 11 тыс. элементов. Это означает, что тезаурус более чем для 2 тысяч объектов предметной области информационных ресурсов по физике полупроводников и нанотехнологий даёт смысловую характеристику по одной из шести классификационных систем и устанавливает около четырёх отношений с другими объектами. Это свидетельствует о том, что на материале используемых в практике классификаций удалось построить достаточно содержательное описание онтологии заданной предметной области. Полные списки сущностей онтологии, их свойств и отношений можно легко получить из лексико-семантического указателя тезауруса, который может быть предоставлен заинтересованным лицам.

Библиография

1. ББК, 2013. Библиотечно-библиографическая классификация. Средние таблицы. Вып.1 - 6/Глав. ред. Э.Р. Сукиасян. - М., 2001 - 2013.

2. Белоозеров В.Н., Шабурова Н.Н., 2010. Тезаурус классификационных систем по физике полупроводников // Актуальн. вопросы совр. науки и образования: Материалы V общерос. научно-практ. конф. с междунар. участием. Вып.2 - Красноярск: Научно-инновационный центр, 2010 - С.139-156. - ISBN 978-5-904771-11-9

3. Белоозеров В.Н., 2013. УДК как формальная онтология содержания документальной коллекции // 17-я междунар. конф. и выставка LIBCOM-2013: Информационные технологии, компьютерные системы и издательская продукция для библиотек. - Суздаль, 11-16 нояб. 2013 г.

4. Добров Б.В., Иванов В.В., Лукашевич Н.В., Соловьёв В.Д., 2012. Онтологии и тезаурусы: модели, инструменты, приложения: Учебное пособие. - М., 2012. - 173 с. - ISBN 978-5-9963-0007-5.

5. ГОСТ 7.25-2001. Система стандартов по информации, библиотечному и издательскому делу. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления. - М.: Изд-во стандартов, 2001. - 16 с.

6. ГРНТИ, 2007. Государственный классификатор - рубрикатор научно-технической информации (ГРНТИ), 6-е изд. в 2 тт. / ВИНИТИ РАН, глав. ред. акад. Ю.М. Арский, общ. ред. Т.С. Астахова. - М., 2007. - ISBN 978-5-94577-039-3.

7. ВИНИТИ, 2005. Рубрикатор информационных изданий ВИНИТИ. Тт.1 - 4/ВИНИТИ РАН, глав. ред. акад. Ю.М. Арский, отв. ред.В.Н. Белоозеров. - М., 2005

8. Рубрикатор, 2013. [Федеральный интернет-портал "Нанотехнологии и наноматериалы"] [Электронный ресурс]. - Доступ http: /www.portalnano.ru/rubricator/? show=1.

9. УДК, 2011. Универсальная десятичная классификация. Полное издание на русском языке. Тома 1 - 10/Глав. ред. акад. Ю.М. Арский, общ. ред. Т.С. Астахова. - М.: ВИНИТИ РАН, 2001 - 2011.

10. PACS, 2010. Physics and Astronomy Classification Scheme [Электронный ресурс] / American Institute of Physics. - American Physical Sosiety, 2010. - Доступ: http://publish. aps.org/pacs.

11. Wei Fan, Shuqing Bu, Qing Zou, 2013. Semantic visualization for subject authority data of Chinese Classified Thesaurus /Classification and Visualization: Interfaces to Knowledge. Proceedings of the International UDC Seminar.24 - 25 October 2013. The Hague, The Netherlands. - pp. 191 - 206.

Размещено на Allbest.ru

...

Подобные документы

  • Становление и развитие русской дореволюционной библиографии. Первый именной указатель русских библиографических материалов авторства Г.Н. Геннади. Введение критической функции репертуара, использование аннотаций и выписок в библиографических словарях.

    реферат [37,5 K], добавлен 11.08.2016

  • Структура информационной культуры. Опыт формирования информационной культуры пользователей библиотеки на примере занятий по программе "Основы библиотечно-библиографических и информационных знаний школьников 1-11 классов гимназии № 1 г. Новосибирск".

    курсовая работа [101,2 K], добавлен 25.08.2015

  • Организационная структура библиотеки им. Горького Санкт-Петербургского государственного университета. Состав справочно-библиографического аппарата библиотеки. Фонд справочных и библиографических пособий. Система библиотечных и библиографических каталогов.

    контрольная работа [28,4 K], добавлен 10.12.2012

  • Объект и предмет исследований информационной культурологии. Структуризации предметной области этой науки. Основные направления исследований. Компоненты информационной культуры. Философские основы информационной культурологии как научной дисциплины.

    реферат [11,9 K], добавлен 07.03.2016

  • Анализ роли и места библиографии в информационном обществе на современном этапе. Изучение изменений в библиографической деятельности с появлением информационных и сетевых технологий. Обзор создания электронных информационно-библиографических продуктов.

    курсовая работа [44,4 K], добавлен 27.02.2012

  • Сущность, задачи и функции систематического каталога, его построение. Расстановка библиографических записей в систематическом каталоге. Редактирование систематического каталога. Алфавитно-предметный указатель. Документы на систематический каталог.

    курсовая работа [35,8 K], добавлен 26.05.2008

  • Классификация рекомендательных библиографических пособий для детей. Библиографические ресурсы и Интернет-ресурсы по детской литературе. Анализ потребителей и состояния ресурсов исследуемых пособий в библиотеке им. А.С. Пушкина ЦСДБ г. Волгограда.

    дипломная работа [96,2 K], добавлен 29.06.2013

  • Характеристика методологически приемлемых для педагогических исследований классификаций музыкальной культуры. Различные типологии, сложившиеся в музыковедении и культурологии. Авторское виденье сущности понятия "популярная музыкальная культура".

    статья [19,9 K], добавлен 17.11.2011

  • Библиографическая работа как совокупность процессов по библиографированию и библиографическому обслуживанию. Составление библиографических материалов различного содержания и назначения. Объём библиографической деятельности, используемые формы и методы.

    контрольная работа [22,3 K], добавлен 19.10.2010

  • Объект аналитического библиографического описания, источники информации при его составлении. Понятие идентифицирующего документа. Правила описания сборников, многотомных и сериальных изданий, составления добавочных записей для алфавитного каталога.

    контрольная работа [1,8 M], добавлен 16.10.2011

  • Библиографическая деятельность как область деятельности, направленная на создание, использование и изучение библиографических средств ориентации в пространстве информации и знания. Ее компонентная структура, принципы функционирования, цели и функции.

    реферат [21,8 K], добавлен 22.08.2011

  • Особенности составления библиографического описания периодических изданий: газет, журналов, сборников под общим заглавием и без него. Правила составления добавочных записей для алфавитного каталога. Описание многотомных и сериальных изданий, документов.

    контрольная работа [24,0 K], добавлен 16.10.2011

  • Специфика гармонии человека и предметной среды, причины конфликта между ними в современной культуре. Области проявления этого конфликта в сфере дизайна. Свойства и характеристики гармоничной предметной среды и процесса ее создания, ее проектирование.

    диссертация [2,5 M], добавлен 23.10.2010

  • Классификация объектов библиографической деятельности. Потребители информации в сфере библиографической деятельности. Библиографирование как процесс создания и преобразования библиографической информации. Видовая классификация библиографических пособий.

    реферат [29,2 K], добавлен 24.08.2011

  • Исследование библиотечно-библиографической классификации (ББК), получившей статус Национальной классификационной системы России. Изучение путей развития таблиц ББК на историческом и методическом этапе, их роль и значимость в ряде мировых классификаций.

    реферат [33,2 K], добавлен 14.12.2009

  • Сущность экологического подхода Дж. Гибсона. Основные принципы социальной семиотики излагает Тео ван Лейвена. Теория мультисенсорности и антропологический подход в дизайне. Акторно-сетевая теория и оъектно-ориентированная онтология, их ключевые позиции.

    контрольная работа [68,4 K], добавлен 08.01.2017

  • Понятие, структура и функции мифа. Космогонические мифы и мифы о происхождении. Мифы обновления и конца света. Мифы и время. Мифология, онтология, история. Величие и упадок мифов.

    реферат [15,0 K], добавлен 10.10.2002

  • Сущность символа и символизма, онтология иконы в мировоззрении Павла Флоренского, его отношение к иконописи на основе "Иконостаса". Искусствоведческий аспект и одухотворенность образа в иконописи. Рассмотрение символизма иконописи по отношению к церкви.

    курсовая работа [33,2 K], добавлен 23.07.2010

  • Онтология развития кино Ф. Феллини. Неореализм в творчестве художника. От неореализма к авторскому кино. Реальная действительность в лентах режиссера. Поэтика "индивидуального реализма". Кинолента "Ночи Кабирии". Авторский шедевр. "Восемь с половиной".

    курсовая работа [823,5 K], добавлен 05.03.2016

  • Рассмотрение понятия информационных ресурсов, их классификации. Определение главной задачи Национальной Библиотеки Беларуси в формировании информационных ресурсов. Введение в действие форм виртуально-справочно-информационного обслуживания в библиотеках.

    контрольная работа [23,5 K], добавлен 29.10.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.