Международные коммуникативные форматы и стандарты библиографической записи

История появления и развития машиночитаемой каталогизации. Особенности хранения и обмена библиографическими данными. Требования к электронному каталогу. Национальная система авторитетных файлов. Международные форматы издательско-книготорговой отрасли.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 29.06.2015
Размер файла 36,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

1. Международные коммуникативные форматы и стандарты библиографической записи

Формат MARC (Machine-readable cataloguing - Машиночитаемая каталогизация) появляется в начале 60-х годов в Соединенных Штатах. Главным его создателем и двигателем являлась и является ныне Библиотека Конгресса Соединенных Штатов Америки. Фактически MARC- это краткий и удобный термин для обозначения процесса маркировки любой части каталогизационной записи так, чтобы она могла быть обработана с помощью компьютера.

Несмотря на то, что формат MARC был первоначально разработан для удовлетворения потребностей библиотек, впоследствии его концепция нашла широкое распространение в различных областях информатики, т.к. она обеспечивает удобный способ хранения библиографических данных и обмена ими. В общих словах, коммуникативный формат MARC должен обеспечивать:

ь возможность его применения для всех видов библиотечных документов,

ь достаточную гибкость для решения разнообразных задач в дополнение к каталогизации,

ь удобство применения в различных автоматизированных системах.

Вслед за Соединенными Штатами другие страны создают свои форматы. Великобритания - UKMARC, Канада - CANMARC, Австралия - AUSMARC. Соответственно, MARC превращается в USMARC. Все эти форматы имеют много общего, поскольку строятся на единой, MARCовской основе, но и разнятся между собой, поскольку, как выясняется, имеют значение не только правила, но и традиции каталогизации, а также различие во взглядах на возможности и требования к электронному каталогу.

В апреле 1978 года представительный форум в Таормине (Сицилия), с участием UNESCO, IFLA, ISO, принимает решение о необходисости создания общего коммуникативного формата (CCF) на базе всех перечисленных выше форматов.

Первое руководство по CCF появляется в 1984 году. Но уже в 1987 году под эгидой IFLA выходит руководство по формату UNIMARC. UNIMARC становится официальным форматом, поддерживаемым IFLA. В октябре 1995 года в рамках программы ЛИБНЕТ Министерства культуры Российской Федерации, под эгидой Российской Библиотечной ассоциации и при поддержке Института «Открытое общество», начаты работы по адаптации формата UNIMARC в качестве российского обменного формата.

В результате разработки появился Российский коммуникативный формат (российская версия UNIMARC), которому Постоянным Комитетом IFLA по формату UNIMARC присвоен международный код RUSMARC как национальной адаптации этого формата.

В 90-х годах Европейский Союз признает формат UNIMARC в качестве официального обменного формата стран, членов ЕС. Итак, UNIMARC становится фактически единственным международно-признанным коммуникативным форматом. Библиографические записи в формате UNIMARC предназначены для использования в автоматизированных библиотечных системах.

В зависимости от уровня универсальности системы ряд взаимосвязанных функций может быть реализован с помощью манипулирования данными. Двумя такими функциями является информационный поиск и вывод данных на дисплей.

Формат UNIMARC также, как и другие версии формата MARC, включает три компонента библиографической записи:

1. структуру записи,

2. определение содержания,

3. содержание данных.

1.1 Структура записи

Структура записи предназначена для контроля за представлением данных при хранении их в форме символьных строк, называемых полями. Все данные в записи должны храниться с использованием одного или более наборов символов. Поскольку компьютеры могут хранить и обрабатывать только цифровую информацию, каждому символу (например, алфавитному) присваивается цифровое значение в соответствии с правилами определённого набора символов.

Так, в одном из наборов символу "К" присвоено число "75". UNIMARC позволяет использовать конкретные наборы символов, утверждённые ISO (Международной Организацией по Стандартизации). Структура записи, установленная в формате UNIMARC, является реализацией международного стандарта Format for bibliographic information interchange on magnetic tape (ISO 2709-1981) / Формат для обмена библиографической информацией на магнитной ленте/.

Эта структура использует маркеры и справочники записи. Поскольку только незначительная часть пользователей нуждается в иллюстрации упомянутых компонентов записи, описание, приведённое ниже в тексте, представляет собой лишь фрагмент записи, подготовленный непосредственно каталогизатором.

1.2 Определение содержания

Для идентификации элементов данных в записи применяются определённые правила. Элементы данных, обеспечивающие поиск по автору, заглавию и тематике, при необходимости могут сопровождаться дополнительными характеристиками, что позволяет оперировать ими в различных целях:

ь обеспечение множества точек доступа к данным при поиске,

ь получение разнообразных издательских форм и макетов,

ь исключение при необходимости отдельных элементов записи.

В основном, UNIMARC обеспечивает определение содержания лишь для тех данных, которые относятся ко всем видам копий определеной работы. Однако информация, относящаяся к отдельным или даже одному виду копий, может представлять интерес не только для организации-хранителя. В таких случаях в формате UNIMARC принимаются специальные поля для приведения более детальной информации. Эти поля используются также в тех случаях, когда информация предназначается только для решения локальных задач.

1.3 Содержание данных

Под содержанием понимаются данные, которые хранятся в полях записи. Данные могут быть кодированными или библиографическими:

Кодированные данные используются для представления таких элементов, как контрольные номера, тип публикации и основной язык текста, а также для представления характеристик специальных видов документов таких, например, как нотные издания.

Библиографические данные определяются правилами Международного стандартного библиографического описания для конкретных видов документов. Кроме того, каждая запись может содержать индекс классификации и предметные рубрики.

В это время появляется IMARC (International MARC). В настоящее время этот формат получил название MARC21 с очевидной претензией на 21 век.

В настоящий момент Великобритания реально подключилась к процессу согласования форматов и в 2003 году объявлено о переходе на MARC21. Но в течение последующих пяти лет Британская библиотека поддерживает отечественных производителей программного обеспечения (UKMARC). Формат RUSMARC, как уже упоминалось, официально признан Постоянным Комитетом IFLA по формату UNIMARC в качестве национальной адаптации в России последнего. Так же как MARC21 и UNIMARC, RUSMARС - это система взаимосвязанных форматов. В настоящее время в нее входят:

Российский коммуникативный формат представления библиографических записей - RUSMARC/B - в принятых международных обозначениях и Российский коммуникативный формат представления авторитетных/нормативных записей (RUSMARC/A).

Формат RUSMARC зарегистрирован Комитетом по Z39.50 как формат, совместимый с этим протоколом. Приказом Министра культуры Российской Федерации № 45 от 27.01.1998 года формат RUSMARC признан обязательным при организации обмена данными для подведомственных библиотек. Другой Приказ № 139 от 29.02.2000 года предписывает считать формат RUSMARC ”обязательным при разработке и внедрении автоматизированных библиотечно-информационных систем для библиотек системы Министерства культуры Российской Федерации”. О внедрении формата.

Российская национальная библиотека проводит текущую каталогизацию в формате RUSMARC. Ассоциация Региональных Библиотечных Консорциумов (АРБИКОН), в который в настоящее время входит 13 региональных библиотечных консорциумов, охватывающих значительную территорию нашей страны, также работает в формате RUSMARC.

Создаются отечественные библиотечные системы современного уровня, поддерживающие формат RUSMARC и как обменный формат, и как формат каталогизации: это OPAC-GLOBAL (ДИТ-М, Москва), РУСЛАН (СПбГУ, Санкт-Петербург) и др. Обучение формату RUSMARC проводилось к настоящему моменту в 17 городах России.

Несколько слов о будущем. Есть только две основных составляющих, которые определяют будущее каждого из трех форматов.

Первая составляющая - это развитие систем форматов и самих форматов, их способность описывать все новые и новые виды документов, взаимодействовать с новыми поисковыми системами и способами передачи данных.

Вторая составляющая - развитие и внедрение программного обеспечения, эти форматы поддерживающего. Системы форматов: MARC21 Как система MARC21состоит из 5 форматов: MARC 21 Format for Authority Data; MARC 21 Format for Bibliographic Data; MARC 21 Format for Classification Data; MARC 21 Format for Community Information и MARC 21 Format for Holdings Data.

В настоящее время UNIMARC состоит из двух форматов: UNIMARC Format for Authority Data; UNIMARC Format for Bibliographic Data. Разработка третьего формата системы UNIMARC for Classification Data практически завершена. Четвертый формат UNIMARC for Holding Data также практически готов.

2. Национальные коммуникативные форматы библиографической записи

Коммуникативный формат - формат, предназначенный для обеспечения возможности обмена данными между автоматизированными системами разных организаций. Является средством согласования состава, структуры и характера записей в информационных массивах, базах данных, метаданных и т.п., служащих объектами передачи, приема и использования в процессах информационного взаимодействия систем.

Требования коммуникативных форматов накладывают определенные ограничения на все форматы более низких уровней иерархии, на которые они распространяются (международных - на государственные, государственных - на общесистемные, общесистемных - на внутренние форматы локальных АИС). Эти ограничения касаются в первую очередь состава, структуры и правил заполнения полей данных, объявленных соответствующим коммуникативным форматом как обязательные.

Поскольку все виды метаданных имеют четко определенные форматы записи, по существу они могут также рассматриваться, как разновидности коммуникативных форматов. Примеры международных библиотечных коммуникативных форматов - формат MARC и его версии UNIMARC, MARC21, которые с учетом выполняемых ими функций являются также описательными метаданными для библиографической информации. Общесистемный формат - разновидность коммуникативного формата, являющегося средством, обеспечивающим обмен данными внутри группы организаций, выделенной по ведомственным, территориальным или другим признакам.

2.1 Форматы MARC

Термин MARC представляет собой акроним названия системы Machine - Readable Catalogue or Cataloguing (Машиночитаемый каталог или каталогизация). Однако это название не совсем точно, поскольку MARC не является ни каким-либо видом каталога, ни методом каталогизации. Фактически MARC - это краткий и удобный термин для обозначения процесса маркировки любой части каталогизационной записи так, чтобы она могла быть обработана с помощью компьютера.

Стандарт MARC позволяет найти любую книгу, которая имеется в библиотеке, в считанные секунды. Например, если читатель забыл, или не знает какого - либо нужного описания книги (автор, название и т.п.), то MARC даёт возможность найти эту книгу по ключевым словам. К достоинствам MARCа следует отнести и то, что он требует минимум один компьютер, то есть все те каталоги с карточками становятся ненужными.

Использование стандарта MARC предотвращает дублирование работы, и помогает библиотекам лучше распорядится библиотечными ресурсами. Выбор для работы формата MARC даёт библиотекам возможность приобретать надёжные каталогизационные данные, представленные в правильной форме.

Применение стандарта MARC при управлении библиотечными операциями позволяет библиотекарям использовать имеющиеся автоматизированные библиотечные системы.

Несмотря на сотрудничество стран в этой области появилось несколько версий формата MARC таких, как UKMARC, INTERMARC, USMARC, расхождения в которых были вызваны различиями в национальных правилах и практике каталогизации.

2.2 Описание формата USMARC

Ведение библиографического формата USMARC, также как и официальной документации USMARC, осуществляется Библиотекой Конгресса.

2.3 Термины USMARC и их определения

Указатели данных: Чтобы считывать и интерпретировать библиографическую запись, компьютеру необходима помощь.

Наименованиями указателей данных являются: ПОЛЕ, МЕТКА, ИНДИКАТОР, ПОДПОЛЕ, КОД ПОДПОЛЯ И ОПРЕДЕЛИТЕЛЬ СОДЕРЖАНИЯ.

Поле: Каждая библиографическая запись логически делится на поля. Имеется поле для автора, поле для информации о заглавии и т.д. Эти поля подразделяются на одно или несколько "подполей".

Метка: Каждое поле ассоциируется с трёхцифровым числом, которое называется меткой. Метка идентифицирует поле (тип данных), которое следует после неё.

Индикаторы: За каждой меткой поля следуют две позиции символов (за исключением полей 001-009) . Одна или обе эти позиции символов могут использоваться для индикаторов. В некоторых полях применяется только первая или вторая позиция; в других полях используются обе позиции; а в таких полях, как 020 или 300, позиции не используются совсем. Если позиция индикатора не используется, индикатор характеризуется как "неопределённый", позиция остаётся незаполненной. Значением каждого индикатора является цифра от 0 до 9. (Хотя правилами допускаются буквы, они используются редко). Даже, если два индикатора вместе могут казаться двухзначным числом, в действительности они являются двумя отдельными цифрами.

Подполе: Каждый тип данных в поле называется подполем, и каждому подполю предшествует код подполя . Поля от 001 до 009 не имеют подполей.

Код подполя: представляет собой одну букву нижнего регистра (в отдельных случаях цифру), которой предшествует разделитель подполя. Каждый код подполя указывает, какой тип данных следует после него.

Разделитель: Различные программы математического обеспечения для представления разделителя на экране или в распечатке используют различные символы. Примерами могут служить двойной кинжал (Ш) , знак "эт" (@) , знак доллара ($) , линия подчёркивания (_) и другие.

2.4 Коммуникативный формат USMARC

Коммуникативный формат USMARC состоит из маркера и справочника. В коммуникативном формате метки перед полями не проставляются. Однако, непосредственно за маркером следует блок данных, называемых справочником. Этот справочник показывает, какие метки имеются в записи и где они располагаются. Справочник формируется (компьютером) из библиографической записи.

Маркер: представляет собой первые 24 (от 0 до 23) символа записи.

Справочник: показывает, какие метки имеются в записи и где они располагаются. Это достигается с помощью подсчёта символов в направлении позиции, где начинается каждое поле. Первые 24 позиции являются маркером. Он заканчивается цифрами "4500". Непосредственно после маркера начинается справочник. В своих последних редакциях формат USMARC превратился в комплекс специализированных форматов (USMARC Concise Formats) для записи библиографических, авторитетных, классификационных данных, данных о фондах и общественной информации.

2.5 Цели создания формата UNIMARC

С начала 70-х годов семейство MARC увеличилось более чем на 20 форматов. Различия в содержании данных этих форматов вызывают необходимость редактирования записи до обмена ими.

Для преодоления несовместимости форматов было принято решение разработать международный формат MARC (UNIMARC) , который позволил бы принимать записи, составленные в любом формате MARC так, чтобы они могли конвертироваться в UNIMARC, а из него в любой другой формат MARC. Для этого каждой национальной службе достаточно будет составить только две программы (одну для конвертирования в UNIMARC, другую из формата UNIMARC) вместо специальных программ конвертирования в каждый из форматов MARC. Основной целью создания формата UNIMARC является содействие международному обмену данными в машиночитаемой форме между национальными библиографическими службами, а также более простое и удобное составление описания библиографических единиц, их поиск и контроль.

В 1980 г. вышло в свет второе издание UNIMARC, а в 1983 г. - UNIMARC Handbook, в которых основное внимание уделялось каталогизации монографий и сериальных изданий.

В 1987 г. издана новая версия формата UNIMARC, отраженная в Руководстве по применению UNIMARC - "UNIMARC Manual", которая расширила его действие на другие виды документов. Кроме того, в Руководстве предусмотрена возможность использования этого формата "как модели для разработки новых машиночитаемых библиографических форматов". Дальнейшее развитие формата было связано, в частности, с созданием его разновидности для ведения авторитетных записей, обеспечивающих технологию поддержки массивов имен персоналий и наименований (организаций, изданий и т.п.) для однозначного и удобного их использования при автоматизированной библиографической обработке документов, соответствующий формат - UNIMARC/AUTHORITIES - опубликован в 1991 г.

В том же году в рамках программы ИФЛА "Универсальный библиографический учет и международная программа MARC" (Universal Bibliographic Control and International MARC, UBCIM) создан Постоянный комитет по UNIMARC (PUC), на который возложены функции контроля за развитием формата, включая обеспечение совместимости вносимых изменений ранее разработанным его версиям. Необходимость указанных функций была вызвана продолжением развития национальных версий формата MARC.

В 1999 г. в результате согласования и последующего слияния библиографических форматов США и Канады (USMARC и CANMARC) объявлено об образовании на их основе нового формата - MARC21 ("Формата ХХ1 века"). С того времени организации, ориентировавшиеся на формат USMARC, должны перейти на формат MARC21 и отслеживать все его последующие изменения, включая новые дополнения к нему (ранее подобные требования отсутствовали).

MARC21 включает в себя форматы:

· библиографических данных,

· авторитетных данных,

· данных о фондах,

· классификационных данных,

· общественной информации.

В настоящее время формат MARC21 используется в США, Канаде, Австралии, Новой Зеландии, в университетских библиотеках Великобритании и Франции, Венгрии, Дании, Испании, Швеции, Финляндии а также в Национальной библиотеке Италии.

RUSMARC Российский коммуникативный формат представления библиографических записей - российская версия международного коммуникативного формата UNIMARC в трактовке и категориях, действующих в России государственных стандартов и правил каталогизации.

Формат разработан в 1997 г. по заказу Министерства культуры в рамках программы LIBNET под эгидой Российской библиотечной ассоциации.

В разработке использовались международные стандарты ISO, отечественные стандарты СИБИД, а также рабочие материалы Постоянного комитета по UNIMARC. Формат распространяется на книги и сериальные издания; предназначен для обмена библиографическими записями в машиночитаемой форме.

Особенность формата - широкое применение полей связи с использованием технологии встроенных полей. Для элементов данных национального значения, не нашедших отражения в формате UNIMARC, введены дополнительные поля и подполя в соответствующих блоках с цифрой 9, определяющей национальный статус.

Формат RUSMARC для библиографических записей дополняет взаимосвязанный с ним Российский коммуникативный формат представления авторитетных/нормативных записей, разработанный в 1997 г.

Формат позволяет структурировать библиографические данные в виде, пригодном для машиной обработки, т. е. дает возможность загружать библиографическую информацию в машиночитаемые базы данных, с целью организации автоматизированного поиска и получения необходимых форм вывода.

Формат предназначен быть посредником при осуществлении обмена библиографическими записями и способствовать решению следующих задач:

1. Улучшение доступности библиографической информации

формат является фундаментом любой автоматизированной системы, обеспечивающей поиск и управление данными.

2. Создание сводных каталогов

формат является незаменимым инструментом для создания сводных каталогов, давая возможность обмена структурированной информацией.

3. Сокращение затрат при каталогизации

формат делает возможным проведение кооперированной каталогизации, устраняя тем самым необходимость дублирования операций при обработке документов.

Российский коммуникативный формат представления авторитетных нормативных записей - это первая версия документа, разработанного в рамках программы LIBNET. Формат предназначен для обмена авторитетными/нормативными, а также ссылочными и справочными записями (имени лица, наименования организации, родового имени, географического названия, унифицированного заглавия, обобщающего унифицированного заглавия, тематической предметной рубрики).

3. Методическое обеспечение системы национальных авторитетных нормативных файлов

Развитие этого направления включает:

· совершенствование и развитие универсальной и отраслевых методик предметизации и индексирования;

· разработку методики создания системы многоязычных авторитетных/нормативных файлов;

· разработку методики и технологии корпоративного ведения системы авторитетных/нормативных файлов;

· подготовку методических пособий и инструкций по формированию авторитетных данных.

3.1 Национальная система авторитетных/нормативных файлов

каталогизация электронный библиографический

Для создания системы индексирования ресурсов предполагается дальнейшее развитие методического обеспечения формирования системы авторитетных/нормативных файлов (АФ), Библиотечно-библиографической и Универсальной десятичной классификаций, в том числе:

· совершенствование системы национальных авторитетных/нормативных файлов на основе корпоративной технологии (имен и унифицированных заглавий, наименований организаций, географических названий, предметных рубрик, краеведческой тематики и др.);

· обеспечение технико-технологического взаимодействия библиотек-участниц формирования национальных АФ и службы АФ СКБР;

· интегрирование национальных АФ в мировую распределенную систему авторитетных/нормативных файлов;

· отработка в экспериментальном режиме автоматического индексирования полных текстов документов с использованием АФ;

· формирование электронного эталона ББК, создание веб-сайта ББК. Машиночитаемый электронный эталон классификационных таблиц должен являться основным электронным ресурсом, обеспечивающим постоянное хранение, поддержку и эксплуатацию таблиц ББК;

· предоставление возможности использования классификационных таблиц ББК и УДК в режиме он-лайн при индексировании документов и в ходе тематического поиска в электронных каталогах библиотек России и ближнего зарубежья.

Конвертирование форматов - преобразование данных из одного формата в другой, воспринимаемый иной системой (как правило, при экспорте или импорте данных).

Конвертор - программное средство для перекодирования данных из одного машинного кода в другой или из одного формата в другой.

4. Вопросы конвертирования международных форматов

Международное информационное сотрудничество, библиотечно-информационная кооперация, а также переход к корпоративной каталогизации порождает необходимость обмена огромными информационными документопотоками.

Поскольку в отечественной практике каталогизации утвердились параллельно два международных формата USMARC и UNIMARC, причем с различными модификациями, возникла необходимость в разработке универсального конвертора из одного формата в другой с возможностью многовариантных дополнений.

Многие информационные автоматизированные системы ставили перед собой эту задачу и в большей или меньшей степени решали ее, но как правило, игнорируя такие важные элементы данных как индикаторы и контрольные подполя, так например, ИНФОРМСистема разработала автономный конвертор с учетом соответствия форматов только на уровне полей и подполей. Кроме того не была освоена конверсия форматов с полным репертуаром видов материалов.

В международной практике неоднократно проводились попытки конвертирования двух форматов. Остановимся на некоторых из них. Библиотека Конгресса США имеет автономный конвертор USMARC-UNIMARC, работающий однако через формат-посредник, которым является внутренний формат системы.

Система VTLS имеет подобный конвертор, но встроенный внутрь системы, также работающей на своем формате. Поэтому, при наличии внутренних форматов напрямую соответствия эквивалентов UNIMARC и USMARC не проводилось.

В 90-е годы на уровне ИФЛА для MARC-форматов был разработан проект универсального конвертирования USEMARCON, посредником в котором является формат UNIMARC. Но в данном проекте не учитывается специфика формата - встроенные поля, что не позволяет проводить подробного конвертирования.

Разработка конверторов довольно трудоемкий процесс, успех которого зависит от возможностей программного обеспечения, комплекса технических средств и интеллектуального потенциала разработчиков.

Сопоставление форматов проводилось по структурным и семантическим характеристикам. В ходе сопоставления элементов данных определялось их соответствие по содержанию и способу записи. Было выявлено несколько типов соответствия: элементы данных форматов полностью соответствуют; элементы данных отсутствуют в каком-либо формате; элемент одного формата является частью элемента другого формата; элемент одного формата соответствует множеству элементов другого формата. Было установлено несколько параметров эквивалентности данных. Безусловное соответствие, соответствие при условии, полное несоответствие элементов данных.

Анализ элементов данных показал, что степень совместимости форматов весьма высока на уровне содержания данных. Около 40% данных форматов аналогичны и конвертируются без каких-либо условий соответствия. Практически полностью конвертируются примечания, блоки описательной информации и взаимосвязанных заглавий для однотомных изданий. Остальные конвертируются в соответствующие элементы при наличии условий различной степени сложности. Блок интеллектуальной ответственности конвертируется в соответствии со значением индикаторов.

При конвертировании разработчики сталкиваются со следующими трудностями в сопрягаемости форматов:

1. Конвертирование кодированных элементов данных. Одним из самых трудоемких процессов является составление трансляторов для кодированной информации, которая в своем большинстве приводится в полях с позиционным значением. В основном, кодированная информация используется для непечатных категорий материалов: карт, звукозаписей, видеозаписей, проекционной графики и др., так как их основные характеристики содержатся в элементах данных фиксированной длины. Поскольку поля с позиционным расположением данных не определяются идентификаторами и их позиции следуют в числовом порядке, любое смещение в ту или другую сторону приводит к абсурдным ошибкам при конверсии.

В формате USMARC существует всего четыре поля для кодированной информации: обязательное поле 008, которое содержит 40 позиций символов для всех единиц описания и вспомогательные для дополнительных характеристик, в основном, непечатных категорий материала.

Так поле 007 в формате USMARC дает физические характеристики единицы описания для семи видов документов, причем все виды отличаются числом позиций и различным набором односимвольных кодов, которые формируются в зависимости от начальной позиции самого поля и маркера записи. В формате UNIMARC 20 полей фиксированной длины, каждое из которых относится к определенному виду материала.

Поэтому совмещать эквиваленты при таких неоднозначных системах кодирования крайне трудно, если к тому же учесть, что каждый аналогичный элемент закодирован, как правило, различными символами, требующими в свою очередь трансляции. Даже коды стран в форматах приводятся в разных стандартах. В UNIMARC это ISO 3166, в USMARC это Перечень кодов Библиотеки Конгресса.

В конверторе насчитывается свыше 200 таблиц-трансляторов кодов физических характеристик для всех видов материалов. Поля кодированной информации в форматах не являются обязательными, часто заполняются пробелами или символами-эаполнителями, поэтому определить правильную позицию с соответствующим кодом при конверсии можно только с помощью программ глобального контроля.

2. Индикаторы. Особое место при конвертировании отводится индикаторам. Семантическое несоответствие индикаторов в эквивалентных полях может привести к заведомой потере информации. Если поля соответствуют по содержанию, а их индикаторы противоположны по значению, информация конвертируется, игнорируя индикаторы на входе, а в выходном формате индикаторам придается условное наиболее распространенное значение.

Так например, в соответствующих полях основного заглавия в поле 200 индикатор обозначает значимость заглавия, а в 245 индикатор указывает на наличие добавочной записи. В результате такого несоответствия на выходе индикатору придается условное значение, при этом для результатов конвертирования необходима последующая визуальная доработка поля.

Как правило, индикаторы в эквивалентных полях форматов конвертируются с помощью отдельных таблиц соответствия для каждого поля.

При сравнении двух форматов обращает внимание повышенная семантическая нагрузка на индикаторы в формате USMARC. Часто значение индикаторов соответствует отдельным полям в формате UNIMARC, например, поле 246 USMARC конвертируется в соответствии со значением индикаторов в 510, 517, 512, 513, 514 поля UNIMARC, поле 780 USMARC конвертируется в поля связи 430-437, при обратном конвертировании наоборот несколько полей формата UNIMARC конвертируются в одно поле формата USMARC согласно индикаторам.

Наличие индикаторов в формате USMARC и отсутствие их в соответствующих полях UNIMARC не позволяет качественно осуществлять конверсию.

3. Условные разделительные знаки. Проблема при конвертировании возникает в результате использования в формате USMARC условных разделительных знаков в качестве идентификаторов элементов данных, которые при конвертировании должны быть преобразованы в подполя UNIMARC. При обратном конвертировании разделительные знаки должны расставляться в соответствующие подполя программными средствами.

Трудности возникали в преобразовании контрольных номеров, имеющих дефисы. Например, международный стандартный книжный номер-ISBN. В записи USMARC номер ISBN приводится без дефисов, а в UNIMARC записывается в определенной структуре с дефисами, поэтому конвертирование из UNIMARC с подавлением дефисов проходит нормально, а при обратном конвертировании для восстановления дефисов должна быть разработана очень сложная система алгоритмов с приведением таблиц порядка присвоения стандартных номеров, эта задача пока не решена.

4. Сборники без общего заглавия. Серьезную проблему представляло конвертирование сборников без общего заглавия. В формате UNIMARC в поле заглавия предусмотрено подполе для заглавия произведения второго автора, USMARC не идентифицирует заглавие второго автора, приводит его в структуре библиографического описания через точку, которая не может служить признаком для построения соответствующего алгоритма.

Поэтому при конвертировании UNIMARC в USMARC могут возникнуть затруднения с правильным форматированием заглавия на выходе, осложненном простановкой условных разделительных знаков, потери информации удалось избежать путем сложных условий программирования. Однако обратного конвертирования достичь не удалось. В связи с этим при конверсии подобных записей, в выходном формате USMARC необходима интеллектуальная доработка документов.

5. Поля связи. Следующей проблемой в процессе конвертирования является конвертирование из UNIMARC записей со сложной иерархической структурой связи. Причем в процессе конвертирования надо учитывать две схемы связи в формате UNIMARC: со встроенными полями и со стандартными подполями. Для этого необходимо раработать 4 таблицы соответствия со сложными алгоритмами зависимости элементов и уровнями связи и соответственно структурами эквивалентных полей в формате USMARC.

При этом необходимо иметь в виду, что каждый формат имеет несколько иерархических структур взаимосвязанных заглавий, когда поля того и другого формата могут иметь разные варианты соответствия, например, 463--505 или 463--774, 461--440 или 461--773. В результате конвертор должен иметь несколько программных настроек, чтобы иметь на выходе соответствующий вариант, который должен декларироваться.

6. Отсутствие элементов данных. Поскольку USMARC является в большей степени форматом каталогизации, он содержит большое количество полей, используемых для обозначения фондов, экземпляров и добавочных описаний. UNIMARC как обменный формат не должен поддерживать аналогичные элементы. Формат USMARC содержит около 190 полей, формат UNIMARC - 165 полей. В USMARC детально разработана система контрольных номеров Библиотеки Конгресса, Национальной сельскохозяйственной библиотеки, Национальной медицинской библиотеки, Национальной библиотеки Канады и др. номеров, которые не находят соответствия в формате UNIMARC. Поэтому некоторые данные, не имея эквивалентов, не участвуют в конвертировании и дополняют потерю информации.

Еще с одной трудностью сталкиваются разработчики конвертора, получая информацию из зарубежных источников каталогизации - это различные таблицы наборов кодирования графических символов в отечественных и иностранных автоматизированных системах.

В нашей компьютерной среде в зарубежных файлах появляются лишние кириллические символы, которые необходимо подавлять программными средствами.

В международной практике начали широко использоваться 16тиричные таблицы UNICOD, позволяющие избегать подобных издержек, но для нас они пока недоступны по экономическим причинам, т.к. требуют больших объемов памяти и, следовательно, высококлассной техники.

Помимо конвертирования одного формата в другой, конвертор может производить дополнительные функции:

· обрабатывает записи в соответствии с двумя вариантами форматирования полей связи UNIMARC: со встроенными полями, со стандартными подполями,

· конвертирует записи на все виды документов,

· имеет двуязычный интерфейс на русском и английском языках,

· может показывать исходную и обработанную запись в соответствующем формате, проводить поиск обработанных документов,

· пользователь может самостоятельно дополнять форматы новыми полями без сложных условий соответствия,

· пользователь может удалять ненужные ему поля из конвертора по своему усмотрению и перенастраивать конвертор.

В информационной среде России вливается еще один коммуникативный формат - RUSMARC, который необходимо учитывать при конверсии, если он займет ведущую роль при обмене информации в стране. Хотя формат RUSMARC является версией формата UNIMARC, он содержит такие исключения, что соответствовать UNIMARC может только через конвертор.

Возникает проблема - разрабатывать еще один конвертор RUSMARC-USMARC(MARC21) или проводить промежуточное конвертирование RUSMARC-UNIMARC.

5. Международные коммуникативные форматы издательско-книготорговой отрасли

Исторически сложилось так, что у книготорговли не существовало точного, своевременно выпускаемого и достаточно полного библиографического описания, которое пришлось бы ко двору и книготорговцам, и библиотекарям. В книготорговле никогда не было стандарта описания продукта, подобного, например, формату MARC, однако и этот стандарт не вполне подходит для целей книготорговли.

Сейчас ситуация меняется самым решительным образом. Движущей силой назревающих перемен являются книготорговцы, работающие через Интернет, им нужны более полные описания продукции и поэтому книжный мир в целом сдвигается в сторону расширения традиционного библиографического описания.

Такого рода расширенные данные будут включать в себя библиографическое описание, аннотацию, изображения обложки, рекламную информацию и др. Польза от такого рода данных будет ощущаться не только книготорговлей. В подобной информации нуждаются и библиотекари, занимающиеся комплектованием, и читатели. Предполагается, что электронный каталог библиотеки только выиграет, если читатели смогут увидеть то же, что и посетители сайтов книжных магазинов в Интернете.

5.1 ONIX - Обмен информацией при постоянном соединении

Формат разработан совместно Ассоциацией американских издательств (Association of American Publishers) и организацией EDItEUR (международной организацией, координирующей разработку стандартов, касающихся электронной коммерции в отрасли книг и сериальных изданий) в 2000 году.

И представлял собой первую попытку создания коммуникативного формата, позволяющего передавать электронные библиографические описания между заинтересованными организациями. В основе его лежал подход с точки зрения формата файла, а не модели предметной области.

ONIX включает:

· полное библиографическое описание;

· текстовый материал: описания, обзоры, биографии авторов, выдержки из основного текста документа;

· изображения: обложку, рисунки, фотографии авторов;

· аудио- и видеоматериалы, ссылки на Интернет-адреса;

· территориальные права собственности;

· цены и доступность продукта на различных рынках;

· информацию рекламного характера.

В результате в стандарте есть целый ряд проблем, которые были успешно решены в версии 2.0 (принята в 2001 году) и далее в 2.1 (принята в июне 2003 года).

С тех пор никаких принципиальных изменений в стандарт не вносилось, что говорит о его качестве и стабильности. ONIX 2.1, наряду с множественной идентификацией, обеспечивает возможность множественных описаний, таких как аннотация для читателя, рекомендации для продавца, рекламные материалы и прочее, тогда как версия 1.0 ограничена исключительно обычной аннотацией.

Также, в версии 2.1 можно передавать несколько названий книг, в т.ч. наряду с полным официальным названием можно указать сокращенное для представления на экране компьютера с заданной максимальной длиной, или название на языке оригинала, если это необходимо.

В целом версия 2.1 обеспечивает более структурированную и четкую модель, легко расширяемую за счет вынесения в отдельный модуль справочников с возможностью их пополнения вне зависимости от структуры документа ONIX.

Российская версия ONIX предполагает передачу библиографической информации, как минимум в объеме краткого библиографического описания. Также российская версия поддерживает такие электронные документы, как: заказ, накладная/счет-фактура, отчет о продажах, отчет о возврате товара, акт приема товара, отпуск товара.

Тип описываемого ресурса: любая издательская (в том числе электронная и мультимедийная) продукция.

Область описания: библиографическая и издательская информация, возможно приложение мультимедиа-файлов, описывающих продукт.

Распространённость: массово распространён в мире, применяется в организациях, деятельность которых касается распространения издательской продукции. ? Интернациональность: ONIX поддерживается через локальные (региональные) группы, которые регулярно встречаются и вносят предложения по развитию формата. Такие группы есть в США, Великобритании, Германии, Франции, Италии, Канаде, Австралии, Корее, других странах.

Практика работы в данном формате показала, что ONIX является форматом нового поколения, удовлетворяющим требованиям современного книжного рынка.

Использование ONIX позволяет:

· повысить эффективность работы за счет передачи большого объема библиографической информации в файле электронного прайс-листа,

· повысить надежность идентификации получаемых от поставщиков данных,

· передавать данные, необходимые для самостоятельного проведения поставщиками предпродажной подготовки.

Результатом перехода на работу в ONIX, является сокращение издержек на информационное обеспечение, при увеличении потоков информации, расширении рынков сбыта и возможности увеличения числа поставщиков.

Уже сейчас стандарт ONIX широко применяется в книготорговле США и Великобритании; к его использованию готовятся в Латинской Америке, Франции и Германии и в книготорговых организациях многих других стран. Международные агентства ISBN также планируют принять исходный набор стандарта ONIX в качестве ключевого для метаданных в рамках ответственности ISBN. Международный фонд ДОИ (DOI) формулирует исходные требования к метаданным, также базируясь на стандарте ОНИКС.

Заметен интерес к стандарту ONIX со стороны библиотечного сообщества. Специалисты Британской библиотеки составили список соответствий между ONIX и UNIMARC, а специалисты Библиотеки Конгресса США - между ONIX и MARC 21 (MARC 21).

Исследовательский фонд Британской национальной библиографии финансирует исследования о возможности применения ONIX в качестве стандарта обмена библиографическими данными между книготорговлей и библиотеками.

Изучается целесообразность применения ONIX в качестве формата передачи данных электронным способом из системы «Каталогизация в процессе публикации» ( Cataloguing in Print, CIP), имеющейся у издателей, в систему национальных библиотек. В группах, разрабатывающих ONIX, библиотеки представлены солидно. Лелеются надежды на перспективы создания потока непрерывной библиографической информации в стандартных форматах по всей цепочке поставки документа.

Особое значение имеет стандарт ONIX для периодических изданий. Он позволит создавать структурированную многоуровневую библиографическую информацию, которая может быть использована и в качестве полного каталожного описания, и для контроля за регистрацией, процессом передачи документа, и службой оповещения о задержке - т.е. для совершенствования технологии работы с библиотечными фондами.

Работа в этом направлении неплохо продвинулась, пилотные испытания ONIX для периодических изданий проведены в 2001 г.

В целом можно сказать, что стандарт ONIX будет способствовать увеличению потока библиографической информации о продукте по всей цепочке создания и поставки произведения. Это также отличный шанс для организации сотрудничества между книготорговлей и библиотеками.

Теперь рассмотрим, как форматы соотносятся между собой. Форматы можно классифицировать, во-первых, по охвату и подробности типов описываемых ресурсов, что отражено в рекомендованном словаре типов описываемых ресурсов. Во-вторых, по ширине и подробности области описания ресурсов и мощности структуры элементов метаданных. Кроме этого, можно классифицировать по предметным областям, или целям разработки и использования формата метаданных.

Литература

1. Воройский Ф.С. Информатика: Новый систематизированный толковый словарь-справочник (Вводный курс по информатике и вычислительной технике в терминах). - М.: Либерея, 2001. - 536 с.

2. Стандарты по библиотечно-информационной деятельности. - СПб.: Профессия, 2003, С. 11-38.

3. Информатика: Учебник / Под ред. проф. Н.В. Макаровой. - М.: Финансы и статистика, 2004. - 768 с.

4. Федеральный Закон «Об информации, информатизации и защите информации» // НТИ. Сер. 1. - 1995. - № 2. - С. 2-8.

5.UNIMARC: Вводный курс / Под ред. Я.Л. Шрайберга. - М., 1995. - 28 с.

Дополнительная

1. Воройский Ф.С. Информатика: Новый систематизированный толковый словарь-справочник (Вводный курс по информатике и вычислительной технике в терминах). - М.: Либерея, 2001. - 536 с.

2. ГОСТ 7.0-99.СИБИД. Информационно-библиотечная деятельность, библиография. Термины и определения // Стандарты по библиотечно-информационной деятельности. - СПб.: Профессия, 2003. - С. 11-38.

3. ГОСТ 34.003--90. Информационная технология. Комплекс стандартов на автоматизированные системы. Автоматизированные системы. Термины и определения // Стандарты по библиотечно-информационной деятельности. - СПб.: Профессия, 2003. - С. 484-502.

4. ГОСТ 15971--90. Системы обработки информации. Термины и определения // Стандарты по библиотечно-информационной деятельности. - СПб.: Профессия, 2003. - С. 475-483.

5. ГОСТ Р 51141--98. Делопроизводство и архивное дело. Термины и определения // Стандарты по библиотечно-информационной деятельности. - СПб.: Профессия, 2003. - С. 531-541.

6. Информатика: Учебник / Под ред. проф. Н.В. Макаровой. - М.: Финансы и статистика, 2004. - 768 с.

7. Федеральный Закон «Об информации, информатизации и защите информации» // НТИ. Сер. 1. - 1995. - № 2. - С. 2-8.

Размещено на Allbest.ru

...

Подобные документы

  • Понятия компьютерной графики, история развития. Краткая характеристика программных пакетов, элементы публикации. Виды текстуры, моделирование энергетических преобразований в системах. Стандарты обмена данными. Векторные форматы графических файлов.

    дипломная работа [1,1 M], добавлен 14.12.2013

  • Общая характеристика дисковых приводов и оптических носителей информации, история их появления и развития. Особенности их конструкции. Приводы CD и DVD. Интерфейсы, форматы и стандарты, устройство и принцип работы. Форматы BLU-RAY и HD-DVD. Образы дисков.

    курсовая работа [990,2 K], добавлен 12.11.2013

  • Векторный способ записи графических данных. Tехнология сжатия файлов изображений Djvu. Скорость кодирования и размеры сжатых файлов. Сетевые графические форматы. Особенности работы в программе Djvu Solo в упрощенном виде. Разновидности стандарта jpeg.

    реферат [23,5 K], добавлен 01.04.2010

  • Изучение процесса обмена данными между приложениями в среде MS Office, используя при этом разные форматы хранения и представления информации. Создание файла исходных данных формата CSV по шаблону. Выполнение тестов, расчетов с исходным набором данных.

    курсовая работа [3,4 M], добавлен 27.01.2015

  • Растровые, векторные и комплексные графические форматы. Классификация графических форматов по допустимому объему данных, параметрам изображения, хранению палитры и методике сжатия. Разновидности метода Фурье. Метод преобразования Karhunen-Loeve.

    курсовая работа [46,0 K], добавлен 22.12.2014

  • История появления "флешек". Устройство и технические характеристики USB-флеш-памяти, принцип ее действия, дополнительные опции и программное обеспечение, типы разъемов. Карты памяти, их виды и форматы. Способы организации записи информации в ячейку.

    реферат [439,2 K], добавлен 21.12.2010

  • Компьютерная растровая и векторная графика. Графические редакторы. Форматы файлов для хранения растровых графических изображений. Особенности защиты информации в современных условиях. Идентификация и подлинность доступа в систему. Механизмы защиты.

    реферат [31,4 K], добавлен 26.01.2009

  • Характеристика цифровых изображений, применяющиеся в издательской деятельности. Отличительные особенности растровых и векторных изображений, понятие цветового охвата, изучение моделей для описания отраженных цветов. Форматы и виды графических файлов.

    контрольная работа [22,9 K], добавлен 16.09.2010

  • Характеристика работы архиватора - компьютерной программы, которая осуществляет сжатие данных в один файл архива для более легкой передачи, компактного их хранения. Особенности процесса архивирования - записи файлов и разархивирования - открытия файлов.

    реферат [216,5 K], добавлен 26.03.2010

  • Виды графических редакторов. Форматы файлов для хранения растровых графических изображений. Среда графического редактора. Панели инструментов и режимы работы графических редакторов. Инструменты редактирования рисунка. Изменение шрифта текста на рисунке.

    контрольная работа [246,6 K], добавлен 16.12.2010

  • Преобразование графической информации из аналоговой формы в цифровую. Количество цветов, отображаемых на экране монитора. Расчет объема видеопамяти для одного из графических режимов. Способы хранения информации в файле. Формирование векторной графики.

    презентация [2,1 M], добавлен 22.05.2012

  • Особенности и преимущества цифровой записи, история создания цифровых аппаратов. Характеристика цифрового фотоаппарата и видеокамеры, роль качества оптики, объем памяти, форматы видеозаписи, технологии DVD. Настройка и управление съемочным процессом.

    контрольная работа [47,3 K], добавлен 24.11.2010

  • Общее понятие о компакт-дисках, их техническая характеристика, устройство, назначение и правила эксплуатации. Структура записывающих оптических дисков, технология их изготовления и требования к качеству. Отличительные особенности DVD и форматы записи.

    реферат [713,0 K], добавлен 06.08.2013

  • Алгоритм написания программы для поиска музыкальных файлов по электронному каталогу магазина на языке программирования С++. Проектирование консольного меню для обеспечения взаимодействия пользователя с компьютером. Тестирование программы на компиляторе.

    курсовая работа [548,9 K], добавлен 25.11.2015

  • Основные понятия и преимущества электронного документооборота над бумажным. Проблемы внедрения системы, реализация электронного документооборота. Обеспечение подготовки, автоматизация, форматы и стандарты обмена. Обеспечение гарантированной доставки.

    реферат [1,0 M], добавлен 23.02.2011

  • Сущность и виды компакт-привода (оптического привода), история его появления. Формат хранения данных на диске. Считывание информации с диска. Скорость чтения/записи CD. Суть технологии записи высокой плотности. Технические особенности CD и DVD дисков.

    контрольная работа [26,1 K], добавлен 04.10.2011

  • Определение буфера обмена, его расположение, правила работы, форматы хранимых данных. WIN API функции, используемые в данном проекте. Модульная структура программы, краткое описание подпрограмм и их назначение, причины использования многопоточности.

    курсовая работа [872,5 K], добавлен 24.06.2011

  • Характеристика буфера обмена как области памяти, резервируемой системой Windows для организации обмена данными между приложениями. Копирование и перемещение файлов как функции буфера обмена. Изучение абсолютной и относительной адресации ячеек MS Excel.

    контрольная работа [13,9 K], добавлен 11.09.2011

  • Digital Versatile Disk - цифровой многофункциональный диск. Основы устройства DVD. Возможности использования DVD. Новые форматы дисков. Отличие CD от DVD. Емкость хранимых данных. Новейшие стандарты Blu-Ray и HD DVD.

    реферат [136,6 K], добавлен 17.02.2007

  • Растровые и векторные графические редакторы. Формирование изображений, форматы графических файлов. Особенности векторной графики, ее достоинства. Построение треугольника и гиперболы по алгоритму Бразенхема. Математические модели поверхностей и объектов.

    курсовая работа [769,5 K], добавлен 21.12.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.