Каталогізація ресурсів Інтернету за допомогою Дублінського ядра метаданих
Досвід з каталогізації ресурсів Інтернету за допомогою Дублінського ядра метаданих з подальшою конвертацією даних у бібліографічний формат обміну даними UNIMARC. Аналіз технологічного ланцюжку процесу з використанням онлайнового програмного забезпечення.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | украинский |
Дата добавления | 01.12.2017 |
Размер файла | 54,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
КАТАЛОГІЗАЦІЯ РЕСУРСІВ ІНТЕРНЕТУ ЗА ДОПОМОГОЮ ДУБЛІНСЬКОГО ЯДРА МЕТАДАНИХ
Олег Волохін,
головний інженер з інформаційних технологій
Кіровоградської ОУНБ ім. Д. І. Чижевського
Висвітлюється досвід Кіровоградської ОУНБ ім. Д. І.Чижевського з каталогізації ресурсів Інтернету за допомогою Дублінського ядра метаданих з подальшою конвертацією даних у бібліографічний формат обміну даними UNIMARC. Розглянуто технологічний ланцюжок процесу, в основі якого лежить використання оригінального онлайнового програмного забезпечення «Редактор-конвертор метаданих», розробленого автором.
Ключові слова: Дублінське ядро метаданих, створення метаданих, конверсія метаданих, UNIMARC.
каталогізація інтернет конвертація бібліографічний
Головною метою проекту «Каталогізація ресурсів Інтернету за допомогою Дублінського ядра метаданих» було створення оригінального механізму каталогізації цифрових ресурсів мережі Інтернету. Бібліотекарі-каталогізатори мають значний досвід та теоретичне підґрунтя з каталогізації традиційних, друкованих, джерел інформації (книг, журналів, газет тощо). Природа ж цифрових ресурсів інша порівняно з паперовими джерелами. Тому спроба опрацювання цифрових об'єктів з використанням винятково «паперової» бібліографічної підготовки каталогізатора приречені на невдачу або, принаймні, на недосконалий результат.
Основною новаторською ідеєю наших фахівців стала зміна підходів до каталогізації цифрового об'єкта, а саме, застосування на початковому етапі каталогізації формату метаданих Дублінського ядра (ДЯ). Було запропоновано таку технологічну схему:
Дублінське ядро метаданих --> конвертація в UNIMARC (УКРМАРК) --> імпорт до бібліографічної БД
Ініціатива щодо запровадження Дублінського ядра метаданих виникла у 1995 р. як спроба групи фахівців з бібліотечної, музейної справи та IT-фахівців створити формат опису ресурсів Інтернету. З роками ініціатива поступово переросла в певний набір елементів верхнього рівня, з піделементами (кваліфікаторами) другого рівня та певними правилами їх застосування. У подальшому формат ДЯ був прийнятий в якості стандарту Міжнародною організацією зі стандартизації (ISO), національного стандарту США та багатьох інших країн світу.
Головним у виборі формату ДЯ для нашого проекту став той факт, що з самого початку опису враховується цифрова природа опису інформаційного об'єкта, тобто ДЯ цілком сприймає цифрову природу об'єкта, а не перебудовує традиційні, паперові елементи опису на цифрові, що призводить до певних втрат або викривлення даних.
Для реалізації проекту у відділі IT Кіровоградської обласної наукової бібліотеки було розроблене оригінальне програмне забезпечення, яке доступне безкоштовно в онлайні. Це Редактор-конвертор Дублінського ядра метаданих (http://library.kr.ua/dc/dcedituni.html), який дає змогу створювати, редагувати метадані у форматі ДЯ, а надалі, у разі потреби, конвертувати опис у формат UNIMARC (УКРМАРК) і зберігати його у файлі формату ISO-2709 UNIMARC. У подальшому такий опис інтернет-ресурсу можна імпортувати до бібліографічної бази даних професійної бібліотечної системи, тобто на виході отримати традиційний бібліографічний MARC- опис, який нічим не відрізняється від описів джерел на паперових носіях. Програмний модуль Редактор-конвертор (розробник - головний інженер з IT О. М. Волохін) є базовим ланцюжком такого методу каталогізації. Щоб використати дане програмне забезпечення, його не потрібно встановлювати на конкретний персональний комп'ютер. Воно розміщене у мережі Інтернету і використовується вільно усіма бажаючими. Отже, можливий опис ресурсів, якщо комп'ютер підключений до Інтернету.
Редактор-конвертор вже понад десять років є програмним інструментом, рекомендованим офіційним сайтом ДЯ для добування, створення, редагування та конвертації метаданих. У спеціальному розділі «Інструменти Дублінського ядра» розміщено декілька веб-посилань на цю програму: http://dublincore.org/tools/index.shtml. До речі, це поки що єдине програмне забезпечення, здатне конвертувати метадані Дублінського ядра до формату UNIMARC. Редактор-конвертор надає каталогізатору цілу низку корисних даних вже з першого звернення до ресурсу. Вони є результатом «розмови» між програмою та сервером, де розташований ресурс, на рівні «комп'ютер - комп'ютер», про обсяг цифрового документа, тип файла, кодову таблицю тощо. Для добування цих даних самостійно каталогізатору знадобиться ціла низка нетривіальних дій. У програму вбудовано довідкову систему, яка дає змогу каталогізатору звернутися до головних правил застосування елементів ДЯ в процесі роботи над ресурсом. Спочатку редактор допомогає створити коректний, у сенсі синтаксису html, опис ресурсу в форматі Дублінського ядра метаданих, який можна скопіювати і внести до цифрового документа у разі, якщо ваша установа є власником (видавцем) цього ресурсу.
<META NAME=«DC.Title» СОЫТЕЫТ=«АЛЬМАНАХ. ЛІТЕРАТУРНА КІРОВОГРАДЩИ- НА. 2012 рік.»>
<META NAME=«DC.Creator.CorporateName» СОМТЕМТ=«Кіровогровоградська обласна організація Конгресу літераторів України»>
<META NAME=«DC.Subject» CONTENT=«Кіровоградщина, публіцистика, поезія, гумор, сатира, проза»>
<META NAME=«DC.Subject.topical» CONTENT^X^^^^ література - Українська, 20 ст. - Збірники»>
<META NAME=«DC.Description» CONTENT=«
Альманах містить вірші й прозу авторів Кіровоградщини, що пишуть українською та російською мовами й об'єднані в обласній організації Конгресу літераторів України. Їх різножанрова творчість віддзеркалює думки й почуття сучасної людини, любов до України, рідного краю. Розділ сатири та гумору включає оповідання й вірші, яким властиві всі відтінки цього жанру - від м'яко іронічних до гостро викривальних. В «Антології одного вірша» представлені автори з інших регіонів - у тому числі й ті, хто входить до інших письменницьких спілок. Це четвертий альманах Кіровоградської обласної організації Всеукраїнської творчої спілки «Конгрес літераторів України» (КОО ВТС КЛУ). Попередні альманахи були видані в 2009, 2010 і 2011 рр. Для широкого кола читачів.»>
<META NAME=«DC.Publisher.CorporateName» ШЖЕЖ=«ОУНБ ім.Д.І.Чижевського»> <META NAME=«DC.Contributor.PersonalName.220 Compiler» ШЖЕЖ=«Юрченко, Анатолій Петрович»>
<META NAME=«DC.Contributor.PersonalName.635 Programmer» ШЖЕЖ=«Волохін Олег Михайлович»>
<META NAME=«DC.Date.available» CONTENT=«2013-04-02»>
<META NAME=«DC.Format.medium» CONTENT=«text/html»>
<META NAME=«DC.Format.extent» CONTENT=«5 Kbytes»>
<META NAME=«DC.Format.medium» CONTENT=«charset: windows-1251»>
<META NAME=«DC.Type» CONTENT=«Text»>
<META NAME=«DC.Identifier»
CONTENT=«http://librarykr.ua/elib/almanakh/almanakh2012.html»>
<META NAME=«DC.Source» CONTENT=«ББК 84(4УКР)6я44 УДК 82 Л 64 Літературна Кіровоградщина. Альманах Кіровоградської обласної організації Конгресу літераторів Ук- раїни/Упоряд. Юрченко А.П. - Кіровоград: «Імекс-ЛТД». - 2012. - 146 с. ISBN 978-966189-109-7»>
<META NAME=«DC.Language» CONTENT=«uk»>
<META NAME=«DC.Language» CONTENT=«ru»>
<META NAME=«DC.Rights» CONTENT=«© ОУНБ Кіровоград - 2013»>
Другим етапом роботи з програмою є процес конвертування створеного опису в бібліографічний формат UNIMARC. Процес конвертації запускається окремою кнопкою і є повністю автоматичним. Але перед цим програма, шляхом формально-логічного контрою, перевіряє створені дані на достатність (або повноцінність) щодо конвертації до складнішого формату UNIMARC. А саме: чи вказана мова документа, роль зазначених в описі авторів та ін. Без цих мінімальних параметрів опис у форматі UNIMARC вважатиметься неповноцінним і конвертування не відбудеться. У разі відповідності конвертор відобразить конвертовані дані у форматі UNIMARC для їх загальної оцінки каталогізатором.
001 http://library.kr.ua/elib/almanakh/almanakh2012.html 035 ##$ahttp ://library.kr. ua/elib/almanakh/ almanakh2012. html
100 ##$a20141008j########|||u0rusy0102####ca
101 ##$arus$aukr
200 1#$аАЛЬМАНАХ. ЛІТЕРАТУРНА КІРОВОГРАДЩИНА. 2012 рік.$Жіровогровог-
радська обласна організація Конгресу літераторів України
210 ##$сОУНБ ім.Д.І. Чижевського$ d2013
230 ##$atext/html, 5 Kbytes, charset: windows-1251
300 ##$аПеревірено 08.10.2014
324 ##$аББК 84(4УКР)6я44 УДК 82 Л 64 Літературна Кіровоградщина. Альманах Кіровоградської обласної організації Конгресу літераторів України/Упоряд. А. П. Юрченко - Кіровоград: «Імекс-ЛТД». - 2012. - 146 с. ISBN 978-966-189-109-7
330 ##$аАльманах містить вірші й прозу авторів Кіровоградщини, котрі пишуть українською та російською мовами й об'єднані в обласній організації Конгресу літераторів України. Їх різножанрова творчість віддзеркалює думки й почуття сучасної людини, любов до України, рідного краю. Розділ сатири та гумору включає оповідання й вірші, яким властиві всі відтінки цього жанру - від м'яко іронічних до гостро викривальних. В «Антології одного вірша» представлені автори з інших регіонів - у тому числі й ті, хто входить до інших письменницьких спілок. Це четвертий альманах Кіровоградської обласної організації Всеукраїнської творчої спілки «Конгрес літераторів України» (КОО ВТС КЛУ). Попередні альманахи були видані в 2009, 2010 і 2011 рр. Для широкого кола читачів.
336 ##$atext/html 336 ##$a5 Kbytes 336 ##$acharset: windows-1251 608 ##$aТекст$2Dublin Core
610 0#$аКіровоградщина, публіцистика, поезія, гумор, сатира, проза 610 0#$аХудожня література - Українська, 20 ст. - Збірники 702 #0$аЮрченко, Анатолій Петрович$4220 Compiler 702 #0$аВолохін, Олег Михайлович$4635 Programmer
710 02$аКіровогровоградська обласна організація Конгресу літераторів України 856 4#$uhttp://library.kr.ua/elib/almanakh/almanakh2012.html
А у разі невідповідності каталогізатор має можливість повернутися на попередню сторінку (до редактора ДЯ) і відкорегувати дані, в іншому випадку каталогізатор зберігає дані опису на власному комп'ютері. Конвертор збереже їх у файлі ISO-2709 UNIMARC. У подальшому кожний такий файл з описом цифрового документа можна імпортувати до будь-якої бібліографічної системи. Таким чином, опис, започаткований у форматі ДЯ, в кінцевому варіанті перетворюється на повноцінний MARC-опис професійної бібліографічної системи (див. табл. 1).
Для застосування методу потрібне додаткове навчання персоналу. Каталогізатори вивчають стандарт Дублінського ядра метаданих та отримують навички роботи з онлайновою програмою Редактор-конвертор. На сайті Кіровоградської ОУНБ ім. Д. І. Чижевського вже понад десятиліття застосовуються описи в форматі Дублінського ядра метаданих практично для кожної опублікованої html- сторінки (загальна кількість - понад 7 тис.). Сайт можна вважати найбільшим в українському сегменті Інтернету, де застосовується Дублінське ядро.
Таблиця 1
Відповідності між форматами, реалізовані в алгоритмі конвертора
Dublin Core |
UNIMARC |
||
Title |
200 $а |
Основна назва |
|
(Назва) |
200 $е |
Відомості, що відносяться до назви |
|
517 $а |
Варіант назви |
||
Creator |
700 $а |
Ім'я особи -- первинна інтелектуальна відповідальність |
|
(Створювач, |
701 $а |
Ім'я особи -- альтернативна інтелектуальна |
|
Автор) |
відповідальність |
||
710 $а |
Найменування організації - первинна інтелектуальна відповідальність |
||
711 $а |
Найменування організації - альтернативна інтелектуальна відповідальність |
||
200 $f |
Перші відомості про відповідальність |
||
Subject |
610 $a |
Неконтрольовані предметні терміни |
|
(Предмет) |
60 $a |
Найменування теми як предмета |
|
675 $a |
Універсальна десяткова класифікація (UDC/УДК) |
||
676 $a |
Десяткова класифікація Дьюї (DDC/ДДК) |
||
680 $a |
Класифікація Бібліотеки Конгресу (LCC/КБК) |
||
686 $a |
Індекси інших класифікацій |
||
Description (Опис) |
330 $a |
Резюме або реферат |
|
Publisher (Видавець) |
210 $c |
Ім'я видавця, розповсюджувача і т. д. |
|
Contributor |
702 $a |
Ім'я особи -- вторинна інтелектуальна відповідальність |
|
(Співавтор) |
712 $a |
Найменування організації - вторинна інтелектуальна відповідальність |
|
200 $g |
Наступні відомості про відповідальність |
||
Date |
210 $d |
Дата видання, поширення і т. д. |
|
(Дата) |
210 $h |
Дата виготовлення |
|
$100 |
Біти 9-12 |
||
Type |
608$a |
Форма, жанр, фізичні характеристики документа - |
|
(Тип) |
як точка доступу |
||
Format |
230 $a |
Специфічна область матеріалу: |
|
(Формат) |
характеристика електронного ресурсу |
||
336 $a |
Тип комп'ютерного файла |
||
Identifier |
001 |
Ідентифікатор запису (обов'язкове для UNIMARC) |
|
(Ідентифікатор) |
010 $a |
Міжнародний стандартний книжковий номер (ISBN) |
|
011 $a |
Міжнародний стандартний номер серіального видання (ISSN) |
||
020 $b |
Номер документа в національній бібліографії |
||
035 $a |
Інші системні номери |
||
856 $u |
Уніфікований покажчик ресурсу (URL) |
||
Source (Джерело) |
324 $a |
Примітки факсимільного видання |
|
Language |
101 $a |
Мова документа |
|
(Мова) |
100 |
Біти 22-24 |
|
100 |
Біти 34-35 |
||
Covarage (Охоплення. Покриття) |
300 $a |
Загальні примітки |
|
Relation |
432$1856 $u |
Замінене |
|
(Відношення) |
442$1856 $u |
Замінене на... |
|
488$1856 $u |
Інші взаємопов'язані роботи |
||
451$1856 $u |
Інше видання документа, що каталогізується на аналогічному носії |
||
452$1856 $u |
Видання на іншому носії |
||
461$1856 $u |
Рівень набору |
||
463$1856 $u |
Рівень фізичної одиниці |
||
300 $a |
Загальні примітки |
||
Rights (Авторські права) |
333 $a |
Примітки про особливості поширення і використання |
Наступним етапом пілотного проекту бібліотеки стало створення окремої бібліографічної бази даних у системі ІРБІС з доступом через OPAC бібліотеки до всіх об'єктів цифрової бібліотеки нашого сайта (загальна кількість перевищує 400 об'єктів, станом на осінь 2014 р.).
Цифрова бібліотека - це окремий розділ сайта (http://library.kr.ua/elib), де зібрані оцифровані книги з рідкісного та цінного фондів Кіровоградської обласної бібліотеки, статті з журналів, твори сучасних авторів нашого регіону. Роботу щодо початкового наповнення бази даних цифровими джерелами розпочато у квітні 2014 р. Перший етап проекту завершився створенням бібліографічних описів об'єктів, наявних у цифровій бібліотеці, у грудні 2014 р. У подальшому база даних поповнюватиметься одночасно з новими публікаціями цифрової бібліотеки.
Перші результати від реалізації проекту підтверджують наші очікування стосовно доцільності використання метаданих Дублінського ядра саме у бібліотечній практиці. Хоча дехто з бібліотекознавців стверджує зворотне. Побутують твердження, що набори метаданих є неповноцінними, дуже спрощеними сутностями порівняно з MARC-форматами у сенсі якісного каталогізування суб'єктів, що підлягають бібліографічному опису. Спробуємо довести протилежне за результатами напрацювань, отриманих у ході реалізації нашого проекту.
Дійсно, набір елементів Дублінського ядра версії 1.0 складається лише з 15 елементів. Ми його не застосовуємо, а використовуємо винятково версію 1.1, котра складається з тих же 15 елементів, але багато з них мають низку піделементів другого і, навіть, третього рівня, які називаються кваліфіка- торами. Тому версію 1.1 ДЯ ще називають кваліфікованою. Крім того, низка елементів ДЯ має ще й так звані СХЕМИ, які в бібліотечному світі називають контрольованими словниками.
Розглянемо порівняльну таблицю кількісних характеристик форматів UNIMARC та Дублінського ядра:
Таблиця 2
Порівняння Дублінського ядра та UNIMARC за кількістю полів/підполів
Схема опису |
Кількість елементів / полів |
Кількість кваліфікаторів / підполів |
Сумарно |
|
Дублінське ядро метаданих vl.l |
15 |
43 |
58 |
|
UNIMARC |
189 |
1021 |
1210 |
Размещено на http://www.allbest.ru
Якщо розглядати усі поля, елементи, підполя, кваліфіка- тори обох форматів як прості контейнери для розміщення певних елементів бібліографічного опису, то кількість контейнерів формату UNIMARC у 5 разів перевищує кількість контейнерів ДЯ. Тобто UNIMARC має можливість вміщувати на своїх полях та підполях найбільшу кількість структурних одиниць, куди входить одне або декілька певних бібліографічних відомостей. Різниця суттєва: співвідношення кількості елементарних контейнерів UNIMARC до ДЯ - 1210 до 58 на користь UNIMARC. І це основний аргумент.
Спробуємо довести зворотне, а саме, що каталогізація віддалених ресурсів Інтернету за допомогою метаданих Дублінського ядра на початковому етапі з подальшим конвертуванням даних (за допомогою програмного забезпечення Редактор- конвертор ДЯ) до формату UNIMARC є доцільним і перспективним методом каталогізації.
Стандарт ДСТУ ГОСТ 7.1-2006 визначає правила складання бібліографічного опису документа, набір областей та елементів бібліографічного опису, наповнення і спосіб представлення елементів. Згідно з цим документом, до складу бібліографічного опису входять обов'язкові і факультативні елементи. Елементи бібліографічного запису і є тими контейнерами, якими в форматі UNIMARC є поля і підполя, а в форматі ДЯ - елементи і кваліфікатори. В бібліографічному описі можуть бути тільки обов'язкові елементи або обов'язкові і факультативні.
Розглянемо схему бібліографічного опису, що складається лише з обов'язкових елементів.
Основний заголовок / Перші відомості про відповідальність. - Відомості про видання. - Місце видання, Дата видання. - Обсяг - (Основний заголовок серії). - ISSN.
Схема передбачає наявність 8 (обов'язкових) елементів і, згідно з ДСТУ ГОСТ 7.1-2006, опис стає повноцінним бібліографічним описом. Зазначимо, що це мінімалістична схема. Дуже спрощено Редактор-конвертор утворює вищезазначену схему опису з таких елементів ДЯ:
DC.Title (Заголовок) /DC.Creator (Створювач, Автор). - DC.Format.Medium (Формат). - DC.Publisher (Видавець), DC.Date (Дата). - DC.Format.Extent (Формат). - DC. Identifier (Ідентифікатор).
Звичайно, класичний бібліографічний опис може вміщувати значно більшу кількість елементів (з урахуванням факультативних), але й Дублінське ядро метаданих у своєму арсеналі має ще 50 варіацій елементарних інформаційних контейнерів.
Поглянемо на приклади. Перший приклад є традиційним бібліографічним описом паперової книги з нашого книжкового каталогу:
Літературна Кіровоградщина : поезія, проза, гумор, сатира: літературний альманах / Анатолій Кримський [та ін.] ; редкол.: А. П. Юрченко (відп. ред.) [та ін.] ; укл.: А. П. Юрченко ; Кіровоградська обл. організація Конгресу літераторів України. - Кіровоград : Імекс-ЛТД, 2012. - 145 с. : портр. - Текст: укр., рос. - ISBN 978-966-189-109-7
А ось опис цифрової копії цієї ж книги з сайта бібліотеки. Опис розміщено в каталозі цифрової бібліотеки і створено за допомогою Дублінського ядра метаданих:
Літературна Кіровоградщина, 2012 рік [Електронний ресурс] : поезія, проза, гумор, сатира : альманах / Кіровогровоградська обласна організація Конгресу літераторів України ; укл. Анатолій Юрченко ; прог Олег Волохін. - text/html, charset: windows-1251. - Кіровоград : ОУНБ ім. Д. І. Чижевського, 2013. - 5 Kbytes. - http://library.kr.ua/elib/almanakh/almanakh2012.html Перевірено 03.10.2014.
Очевидно, що опис, створений за допомогою Редактора-конвертора та ДЯ не виглядає менш повноцінним порівняно з традиційним описом паперового документа.
Додамо декілька аргументів на користь такого методу каталогізування цифрових ресурсів Інтернету за допомогою звичайних статистичних розрахунків. У процесі реалізації проекту ми отримали окрему бібліографічну базу даних в автоматизованій системі ІРБІС на документи цифрової бібліотеки нашого сайта, де на сьогодні розміщено понад 400 цифрових книжок, статей з журналів і газет. Кожен опис був створений з використанням ДЯ та онлайнового Редактора-конвертора. Особливо цікаво було отримати порівняння, наприклад, середньої загальної кількості полів / підполів на один запис цієї бази даних з іншими, традиційними, бібліографічними базами даних (наприклад книжок), створених традиційним способом і не тільки нашої бібліотеки, а й інших провідних книгозбірень. Розрахунки виконувалися за такою схемою: в якості професійної автоматизованої системи використовувалася САБ ІРБІС-64. Для аналізу бралися файли, отримані в результаті експорту з бібліографічних баз даних Кіровоградської ОУНБ. Спочатку з бази даних «Книги» були експортовані 3 файли розміром у 1 тис. записів, 3 тис. записів та 10 тис. записів. З ними виконувалися такі дії: вилучалися 4 поля з підполями з другорядними даними: кількість книговидач, дата створення запису, дані про каталогізатора, тип робочого аркуша в системі, тираж та налаштування каталожних карток. Ці дані були відкинуті, щоб «урівняти» записи паперових документів із записами цифрових документів. Такі дії виконувались з усіма іншими файлами даних, що були задіяні в підрахунках.
Потім розраховувалася загальна кількість ПОЛІВ, а також ПІДПОЛІВ у кожному файлі, які, у свою чергу, ділилися на кількість бібліографічних описів у кожному файлі, відповідно. Було виявлено практично постійну величину кількості полів і кількості підполів на середньостатистичний запис для файлів у 1-3-10 тис. записів. Вона дорівнювала, в середньому, - 18 полів/запис та 33 підполя/запис. Далі для тестування бралися файли обсягом 1 тис. записів з декількох баз даних нашої бібліотеки (книг іноземної літератури, аналітичних описів журналів та газет, краєзнавчої періодики, рідкісних книг, навчальної літератури). З інших установ для аналогічного тестування задіювалися два файли обсягом по 100 записів кожний з книжкових баз даних Державної наукової технічної бібліотеки Росії та Бібліотеки Конгресу США (вибірково описи книг видання 2010 р.).
І останньою була аналогічно проаналізована цільова база даних ELIB, яка вміщує бібліографічні описи на документи сайта нашої цифрової бібліотеки, створені винятково за допомогою Редактора- конвертора Дублінського ядра метаданих, перетворені у повноцінні MARC-записи та імпортовані в систему ІРБІС. Остаточні результати зведені до табл. 3:
Таблиця 3
Файли для тестування |
Кількість записів |
Загальна кількість полів |
Загальна кількість підполів |
Середня кількість полів на 1 запис |
Середня кількість підполів на 1 запис |
|
БД «Книги» |
1000 |
18212 |
33959 |
18 |
33 |
|
БД «Книги» |
3000 |
55149 |
100946 |
18 |
33 |
|
БД «Книги» |
10000 |
186250 |
340254 |
18 |
34 |
|
БД «Іноземні книги» |
1000 |
20346 |
34675 |
20 |
34 |
|
БД «Аналітичні статті» |
999 |
11540 |
17274 |
11 |
17 |
|
БД «Краєзнавство» |
1000 |
12780 |
18972 |
12 |
18 |
|
БД «Рідкісні книги» |
1000 |
17297 |
29467 |
17 |
29 |
|
БД «Книги, навчальна літ-ра» |
27818 |
595399 |
1217086 |
21 |
43 |
|
Книги ДПНТБ Росії |
100 |
2599 |
3739 |
26 |
37 |
|
Книги Бібліотеки Конгресу США |
100 |
1402 |
2107 |
14 |
21 |
|
БД «БЫВ» |
402 |
10321 |
14534 |
25 |
36 |
Виявилося, що середня кількість полів/підполів бібліографічних MARC-записів, отриманих у результаті конвертації з описів формату Дублінського ядра метаданих, не тільки не поступається записам, створеним традиційним способом, а й займає лідерські позиції (поступається лише записам книг ДПНТБ Росії).
Таким чином, аналіз створених бібліографічних записів на цифрові джерела з цифрової бібліотеки нашого сайта дає підстави констатувати, що застосування стандарту Дублінського ядра метаданих та розробленого програмного забезпечення для опису ресурсів Інтернету є доцільним і повною мірою уможливлює створення повноцінних бібліографічних описів цифрових ресурсів. Крім того, аналіз записів розвіює міф про неможливість створення повноцінних бібліографічних описів для електронних ресурсів із застосуванням менш потужного формату - метаданих Дублінського ядра.
Список використаних джерел
1. Волохін О. М. Каталогізація цифрових ресурсів Інтернет : Дублінське ядро метаданих : посібник. - Кіровоград, 2003. - 72 с.
2. Волохин О. М. Технологическая модель построения информационного портала библиотеки с использованием метаданных Dublin Core // Науч. и техн. б-ки. - 2004. № 3. - С. 22, 35.
3. ГОСТ 7.82.2001. СИБИД. Библиографическая запись. Библиографическое описание электронных ресурсов. Общие требования и правила составления. - Минск : Изд-во стандартов, 2001. - 26 с.
4. Формат бібліографічного запису (книги та серіальні видання) : структура / НАН України. Національна б-ка України ім. В. І. Вернадського; розроб. : О. В. Ісаєва, І. І. Багрій; наук. ред. А. Г Бровкін. - К., 1998. - 88 с.
5. Негуляев Е. А. Универсальные схемы метаданных и задача описания веб-ресурсов // Библиосфера. - 2006. - № 1. - С. 43-54. - Режим доступа : http://cyberleninka.ru/ article/n/universalnye-shemy-metadannyh-i-zadacha- opisaniya-veb-resursov
6. Каталогізація електронних ресурсів : науково-методичний посібник / І. П. Антоненко, О. В. Баркова ; Нац. б-ка України ім. В. І. Вернадського НАН України. К., 2007. - 114, [2] с.
7. UNIMARC manual / Alan Hopkinson. - Munich : K. G. Saur, 2008. - Mode of access : http://eprints.mdx. ac.uk/2655/1/UNIMARC-2008-AH_final.pdf. - Title from the screen.
Oleh Volokhin,
main engineer in information technology of the Chyzhevskyi Kirovohrad Regional Universal Scientific Library
CATALOGUING OF THE INTERNET RESOURCES BY USING DUBLIN CORE METADATA
The author describes the Project of the Chyzhevskyi Kirovohrad Regional Universal Scientific Library on Cataloguing Internet resources by using Dublin Core metadata with further data conversion to UNIMARC (bibliographic data exchange format). The technological chain is considered, where the original online software «Editor-Converter Dublin Core metadata» developed by the author is used. There is the statistics of the project is provided.
Keywords: Dublin Core metadata, metadata creation, metadata conversion, UNIMARC.
Олег Волохин,
главный инженер по информационным технологиям Кировоградской ОУНБ им. Д. И. Чижевского
КАТАЛОГИЗАЦИЯ РЕСУРСОВ ИНТЕРНЕТА ПРИ ПОМОЩИ ДУБЛИНСКОГО ЯДРА МЕТАДАННЫХ
Освещается проект Кировоградской ОУНБ им. Д. И. Чижевского по каталогизации ресурсов Интернета при помощи Дублинского ядра метаданных с дальнейшей конвертацией данных в библиографический формат обмена данными UNIMARC. Рассмотрена технологическая цепочка процесса, в основе которой лежит использование оригинального онлайнового программного обеспечения «Редактор-конвертор метаданных», разработанного автором. Дается статистика результатов проекта.
Ключевые слова: Дублинское ядро метаданных, создание метаданных, конверсия метаданных, UNIMARC.
Размещено на Allbest.ru
...Подобные документы
Розробка компонентів програмного забезпечення системи збору даних про хід технологічного процесу. Опис програмного забезпечення: сервера, що приймає дані про хід технологічного процесу, КОМ для його імітування, робочої станції для відображення даних.
курсовая работа [1,3 M], добавлен 20.11.2010Цілі та головні задачі систем метаданих, їх структура та елементи, опис словників та класифікаторів. Розробка логіко-функціональної схеми надбудови, її функціональне призначення. Економічне обґрунтування доцільності розробки програмного продукту.
дипломная работа [1,7 M], добавлен 26.10.2012Аналіз об'єктів дослідження, проектування баз даних. Розробка програмного забезпечення для роботи зі спроектованою базою даних. Реалізація індексів, опис метаданих в середовищі MySQL. Специфікація DDL для MySQL, протокол тестування DDL-сценарії.
контрольная работа [389,9 K], добавлен 05.01.2014Оцифровування карти за допомогою програмного продукту ArcGis. Порівняння методів інтерполяції за допомогою програмних продуктів Surfer та ArcGis. Згладжування отриманих сіткових даних за допомогою сплайнів і фільтрації. Застосування сіткових чисел.
курсовая работа [2,1 M], добавлен 31.01.2014Загальна характеристика існуючих методів обміну даними між компонентами MS Office, їх властивості та напрямки використання. Формат даних, що вставляються з буфера обміну. Відмінності у властивостях створених, впроваджених та вставлених даних.
курсовая работа [190,2 K], добавлен 07.02.2003Інтернет – об’єднання комп’ютерних мереж. Хронологія розвитку Інтернету. Протокол — спосіб взаємодії, обміну даними між комп'ютерами при роботі у мережі. Найпопулярніші служби Інтернету. Веб-сторінки, гіперпосилання та домени. Приклад типової IP-адреси.
презентация [1,7 M], добавлен 02.04.2013Переваги технології асинхронного обміну даних (AJAX), огляд створених на її основі Інтернет-проектів. Алгоритм роботи веб-ресурсу, що надає можливість обміну повідомленнями між користувачами за допомогою AJAX-технології. Програмна реалізація веб-додатку.
дипломная работа [398,3 K], добавлен 18.12.2013Автоматизування процесу надходження та продажу товарів магазину за допомогою розробки баз даних (на прикладі магазину з продажу матеріалів для творчості). Вимоги до інформаційного забезпечення. Властивості концептуальної моделі програмного забезпечення.
курсовая работа [1,6 M], добавлен 29.12.2013Аналіз існуючих баз топографічних даних та геоінформаційних ресурсів території. Виконання геоінформаційного аналізу та моделювання ситуацій за допомогою атрибутивних даних. Стан стандартизації створення баз топографічних даних. Збирання статистики.
курсовая работа [4,1 M], добавлен 06.12.2014Аналіз задач, які вирішуються з використанням інформаційної системи. Вибір серверного вирішення, клієнтської частини, мережного вирішення, системного програмного забезпечення. Розробка підсистеми діагностики, керування, забезпечення безпеки даних.
курсовая работа [1,5 M], добавлен 22.04.2011Структура мережевої підсистеми Linux. Створення мережевого інтерфейсу. Передача пакетів та аналіз поведінки інтерфейсу. Протокол транспортного рівня. Використання модулів ядра. Вплив маршрутизації на процес розробки і налагодження мережевих модулів.
курсовая работа [56,2 K], добавлен 23.05.2013Автоматизація процесу зберігання та обробки інформації про перелік собак на виставці. Аналіз предметної області. Створення концептуальної моделі даних, її перетворення в логічну і реалізація. Розробка механізмів управління даними за допомогою тригерів.
курсовая работа [3,0 M], добавлен 25.08.2014Інтернет як система об'єднаних комп'ютерних мереж для зберігання і передачі інформації. Літературні джерела щодо сутності баз даних та їх функціонування. Порівняльний аналіз MySQL, Oracle та Microsoft Access. Створення бази даних за допомогою MySQL.
курсовая работа [1,5 M], добавлен 05.02.2014Загальні відомості про протоколи: Інтернету, управління передачею, користувача. Функції та структури, які беруть участь у реалізації алгоритму передачі даних. Виклик та завантаження, розробка структури програми. Вхідні та вихідні данні з сервера.
курсовая работа [1,5 M], добавлен 01.12.2010Неекспортовані символи ядра. Оптимальний підхід до реалізації пошуку символів у ядрі. Виконання, підміна, додавання та приховання системних викликів. Завантаження модуля ядра із програмного коду та з коду іншого модуля. Робота з UNIX-сигналами.
курсовая работа [84,0 K], добавлен 23.05.2013Розробка гнучкої пошукової системи обліку науково-дослідницької документації за допомогою інструментального засобу прискореної розробки програмного забезпечення Delphi та технології доступу до бази даних ADO з використанням бази даних в форматі MS Access.
дипломная работа [5,2 M], добавлен 22.10.2012Розгляд основ діяльності Державної податкової інспекції м. Болград. Аналіз апаратного та програмного забезпечення комп'ютерних систем і мереж. Принципи використання механізму неіменованих каналів для організації локального міжзадачного обміну даними.
отчет по практике [33,1 K], добавлен 14.05.2015Розробка модулю корпоративної інформаційної системи (КІС) автоматизації аналізу матеріальних ресурсів підприємства за допомогою процедур, що написані на VBA (Visual Basic for Application) для MS Access. "Автоматизація аналізу ресурсів підприємства".
курсовая работа [573,4 K], добавлен 19.03.2009Аналіз властивостей безкоштовних пошукових та поштових серверів Інтернету. Огляд методики ранжирування результатів пошуку в інформаційно-пошукових системах бібліотек. Вивчення можливостей пошукової системи "Мета", пошуку по реєстру українських сайтів.
курсовая работа [142,9 K], добавлен 17.11.2011Етапи розробки проекту. Вимоги до апаратного і програмного забезпечення, до користувача. Специфікація та структура даних, які мають бути розміщеними в системі. Вигляд інтерфейсу системи програмного забезпечення. Розробка бази даних косметичного салону.
дипломная работа [1,8 M], добавлен 21.02.2015