Основы архивного дела

Этапы становления архивного дела в различных странах с момента появления архивов в конце IV тысячелетия до нашей эры до их окончательного оформления в особые учреждения в начале ХХ века нашей эры. Их роль, организация в разных странах и управление.

Рубрика История и исторические личности
Вид курс лекций
Язык русский
Дата добавления 13.09.2019
Размер файла 128,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Исходя из представления о том, что БД соответствуют традиционным видам справочников, можно сказать, что библиографическая БД идеально соответствует указателю, путеводитель можно расценивать уже как полнотекстовую БД. Указатель - это система, в которой текстовая структура может быть использована для сортировки точек доступа в согласованном порядке, то есть указатель - это фиксированные поля.

Библиографическая БД - это, как раз и есть, БД с фиксированными полями и, как правило, одним экраном. Если речь идет об иерархической БД то, такая БД имеет поля и субполя. Но всегда есть альтернатива оставить основной текст неструктурированным и довериться компьютерной системе в поиске по ключевым словам, то есть искать как в web (Интернет). Но точность поиска в этом случае уменьшается, поэтому при выборе дизайна следует решить вопрос: ускорить поиск и уменьшить трудозатраты создавая неструктурированный текст, но снизить точность поиска, или же многократно увеличить точность поиска, но увеличить трудозатраты на создание БД.

Элементы БД в зарубежной практике, как правило, делятся на два основных сектора: сектор, доступный пользователям, и сектор с конфиденциальной информацией, доступный только архивисту. Классическим примером библиографической иерархической БД является MARC-AMC. БД, созданные на основе SGML (Standard General Make-up Language), также являются иерархическими по структуре, но полнотекстовыми по содержанию, поскольку содержат три уровня описания содержания документов (исторический обзор, каталог, перечень единиц хранения).

MARC-AMC содержит все элементы БД, которые нужны пользователю для поиска информации по типу библиографического каталога. Поиск можно вести по названию, персоналиям, тематике, переименованиям и т.д., выход дается на фонд и опись, а также местонахождения документов - архив и местонахождение дублетного или схожего по тематике материала.

Например, описание, а, следовательно, и поиск картографических материалов предполагает масштаб, проекцию, размеры, заглавие, но не указывается способ воспроизведения изображения, что важно для «старых» карт.

AMC - управляющий сектор БД, или сектор управления информацией, содержит элементы, которые нужны для внутренних управленческих целей, закрыт для доступа пользователя.

MARC-AMC как раз сочетает в себе фиксированные поля и возможность использовать поиск по системе on line.

SGML вытесняет MARC формат из архивной среды, потому что позволяет расширить информацию БД за счет информации о содержании документов. Наиболее подходящий справочник для среды SGML - это опись (inventory).

Вопрос о том, какая форма представления информации лучше, спорен. Библиографическая БД - более объективный способ описания информации, поскольку указывает «что» и «где» находится. Как только предпринимается попытка оценить информацию, то есть описать содержание фонда, как сразу повышается уровень субъективности описания. Идеальным способом, с точки зрения пользователя, является представление полных текстов документов, но этот путь - утопичен, поскольку архивисты никогда не смогут внести все архивные документы в ЭВМ (причем с сохранением статуса документа). Поиск в такой системе невозможен. Библиографические БД как раз очень мобильны, так как малообъемны.

Структура БД, количество и соподчиненность ее полей зависит как от технических возможностей, так и от задач, поставленных архивистом.

В этом сочетании для архивиста очень важно выбрать не только информацию, но и форму описания и представления этой информации. Архивный подход ориентируется на уровень фондового описания, выбор эффективных систем сохранения предполагает не только очень чуткие взаимоотношения организации и ее системы, но и ясность целей и объектов системы сохранности. Кроме того, всегда надо помнить, что описание связано с поиском.

Фиксированные поля с одной стороны облегчают задачу, поскольку ограничивают информацию и упрощают поиск технически. Но ограничение информации требует очень высокого уровня ее формализации, свертывания, что подчас весьма сложно. Поэтому для описания БД требуется стандарты для описания. Библиографические БД дают возможность высокого уровня стандартизации, отработки системы ключевых слов и создания эталонных файлов.

Эталонные файлы - это сложное понятие, которое в нашей (российской) практике отсутствует полностью. Смысл эталонных файлов сводится к тому, чтобы ключевые слова, используемые пользователем, соответствовали как можно более точно ключевым словам, заложенным в БД. Иногда пользователям необходимо предварительное знакомство с материалами, чтобы выбрать нужные ключевые слова.

Сегодня понятия «ключевые слова» и «эталонные файлы» размываются развитием гипертекстов в Интернет. В WEB описание информации не требует четких единых правил, и информация о содержании архива может быть представлена в разном виде: в виде файла (описания), БД, иерархической структуры (дерева). Но уже отмечалось, что большинство документов большинства архивов не может быть оцифровано физически. Вопрос о выходе в web - это финансовый и технический вопрос, поэтому многие архивы предполагают создание внутренних программ в виде системы БД. При создании внутриархивных БД предпочтительнее, как указывалось, именно библиографические БД, поскольку они дают очень высокую точность и оперативность поиска местонахождения информации, полные же тексты документов можно «отсмотреть» в читальном зале.

Проблема создания единой системы НСА явно переросла национальные рамки и требует решения в глобальном масштабе. Информация, в целом, не подвластна границам, а формирование единого информационного пространства требует информационной интеграции различных поисковых систем в мировые информационные сети, а, следовательно, появляется настоятельная необходимость в стандартизации описания документной информации. Первой попыткой был MARC-формат, в настоящее время сделаны и другие предложения.

Стандарты описания архивных документов. Действительно глобальная интеграция информационных ресурсов возможна только после приведения стандартов описания информации к всеобщей «гармонии». Архивисты создавали стандарты описания архивных материалов в течение столетия, но попытка стандартизировать архивные описания для автоматизированных систем относится к концу 1960-х годов и связана с SPINDEXII. Десятилетием позже в США разработки были продолжены в виде National Information Systems Task (NISTF) и завершились созданием «Data Elements Dictionary» (Data Elements Used in Archives, Manuscripts, and Records Repository Information Systems: A Dictionary of Standard Terminology), послужившей для формирования основы MARC-AMC формат.

В 1978 году Библиотекой Конгресса был предложен альтернативный код для архивов (AACR 2). В 1983 году вышло первое издание Archives, Personal Papers, and Manuscripts (APPM). Второе издание АРРМ в 1989 году полностью объединило структуру данных с содержанием данных, используя для правил каталогизации примеры MARC.

В течение двух десятилетий архивисты сомневались в возможности стандартизации структуры поисковых систем, поскольку происхождение массивов архивных документов и запросы исследователей диктуют базисные различия в подходах к поиску информации. В архивах хранение информации организовано по фондам, то есть по принципу происхождения документов, а пользователь изучает (и ищет) информацию по темам. К началу 1980-х годов архивисты использовали программы текстовых редакторов и БД местного уровня, то есть локальные БД, в попытке контролировать структуру поисковых систем. В 1985 году опубликованы результаты работы группы архивистов по разработке стандартов описания в Канаде - «Toward Descriptive Standards: Report and Recommendations of the Canadian Working Group on Archival Descriptive Standards». В начале 1990-х годов, как результат работы группы, были изданы Правила Архивного описания (Rules for Archival Description (RAD), которые были сконцентрированы на создании архивных поисковых систем, а не каталогов.

В конце 1980-х годов для разработки средств и процедур оценки, адоптации и поддержания стандартов описания была сформирована the Working Group on Standards for Archival Description (WGSAD). Группа рекомендовала установление стандартов в SAA, публикации пособий и пр.

В настоящее время существует несколько национальных стандартов структуры и описания документов, претендующих на роль общемирового стандарта, в частности EAD - Encoded Archival Description (кодированное архивное описание).

EAD - стандарт не только для структуры поисковых систем, но и для их содержания, и может включать данные, составленные с помощью The International Standard Archival Description General (ISAD (G) - (Международного стандарта архивного описания) с обозначением всех специфических элементов ISAD. При общей характеристики EAD следует отметить три основных момента:

EAD создана архивистами и для архивистов. Фактически, общество американских архивистов контролирует необходимость в дополнительных элементах, уничтожение элементов, модификацию атрибутов, то есть все изменения, хотя официально группа наблюдения за внедрением EAD создана при Группе библиотечных исследований (the RLG Advisory Group).

EAD позволяет конвертировать информацию из существующих поисковых систем (без прямого ввода в систему) и затем осуществлять «электронную доставку» поисковых систем пользователю через Web или на CD-ROM.

EAD позволяет каждому архиву индивидуально решить вопрос о конвертировании имеющихся поисковых систем в EAD. Средства конвертации могут быть созданы в любой организации самостоятельно. Но именно эта ситуация заставляет признать необходимость решения проблемы внедрения EAD как решения общественно обоснованного: чем больше участников - тем лучше (пользователи, исследователи, хранители, специалисты по техническому обеспечению).

Разработка EAD начата в 1993 году, вторая версия завершена в 1997 году, хотя и считается экспериментальной.

EAD «составляют» два основных компонента:

SGML (Standard General Makeup Language) - метаязык для конструирования разметочных систем для определенных классов документов, независимо от системы (язык разметки). Стандарт ISO (ISO 8879), использованный впервые в полиграфии, для определения спецификации и создания цифровых документов, которые могут быть доставлены, показаны, соединены и обработаны, независимо от системы.

DTD (Document Type Definitions) - свод правил для создания или кодирования (шифровки) разновидностей (типов) документов с целью обеспечения их поиска. вывода на экран и обмена в предсказуемой, независимой от hardware и software манере.

Для прочтения документов в SGML разработано несколько коммерческих приложений:

Panorama Pro - коммерческое приложение для просмотра SGML документов;

Dyna Web - коммерческий программый пакет для создания, индексации, поиска и вывода на экран SGML документов;

Open Text - коммерческий программный пакет для индексации, поиска и вывода на экран SGML документов;

EAD DTD (Document Type Definitions) использовала:

The International Standards Organization (ISO) 8879 Standard Generalized Markup Language (SGML),

Graphic notations such as TIFF and GIE,

The International Standard Archival Description General (ISAD(G),

XML (Extensible Markup Language) and HTML for Web.

Главное заключается в том, что EAD является механизмом для долговременного электронного хранения поисковых систем (т.е. не зависит от программных и технических изменений) и представления их в Интернет.

EAD - стандарт не только для структуры поисковых систем, но и для их содержания, и может включать данные, составленные с помощью ISAD-G (Международного стандарта архивного описания) с обозначением всех специфических элементов ISAD. В тоже время, являясь прототипом поисковых систем, EAD не может быть в одночасье внедрена и использована в каждом отдельном хранилище. Именно организация внедрения в практику общенационального стандарта может быть наиболее интересна и полезна для российских архивистов сегодня, поскольку эта часть североамериканского опыта реально применима в России.

Для характеристики процесса внедрения EAD в практику работы архивов можно выделить три основные момента. Во-первых, возможность архивистов контролировать необходимость в дополнительных элементах, уничтожение элементов, модификацию атрибутов, то есть все изменения, вносимые в стандарт.

Во-вторых, возможность конвертировать информацию из существующих поисковых систем и осуществлять «электронную доставку» поисковых систем пользователю позволяет избежать коренных изменений в организации работы архивистов, то есть с введением EAD удар по «спокойно текущей работе» минимален, а значит нужно меньше времени на выполнение работы.

В-третьих, признание решения проблемы внедрения EAD как решения общественно обоснованного позволяет организовать широкое обсуждение проблемы, что весьма актуально для архивов, не обладающих значительными финансовыми средствами и многочисленным штатом. Признано необходимым проводить подробные обсуждения на страницах архивных журналов, т.е. производить многочисленные публикации, опыт внедрения системы в каждом архивохранилище с указанием всех нюансов, просчетов, успехов.

Конечно, общая стандартизация поисковых систем далека еще от всеобщей практики, необходимо осознание местных потребностей пользователя в электронных поисковых системах, а также хорошие программные решения для конкретных архивов. Среди проблем ближайших лет и в США, и в России можно выделить:

«преодоление» разобщенности хранения документов посредством создания языка описания;

завершение технической инфраструктуры, которая предоставит возможность легкого поиска разрозненных материалов;

обучение пользователей всем видам «средств движения» в электронной среде;

понимание знаний нового типа, необходимых для работы в новой среде.

Мощным средством обмена информацией и дополнительным способом расширения доступа к архивной информации предстает Интернет. Включение архивной информации во всемирную глобальную сеть - Интенет позволило, пожалуй, впервые за много лет поставить вопрос о публичных архивах как реальной возможности.

10. Архивы и Интернет

Вопрос о публичности архивов, безусловно, должен рассматриваться в контексте вопроса доступа к архивной информации. С точки зрения открытости архивов для пользователя В.П. Козлов выделил 4 категории:

публичные (то есть доступные всем),

ограниченно-публичные,

доверительные,

закрытые (оперативные) архивы.

Предложенная типология связана, в первую очередь, с наличием в архивах секретных или конфиденциальных документов и формой собственности. Но проблема публичности документа не может быть сведена только к проблеме равного для всех пользователей доступа к архивной информации, хотя обеспечение равного доступа остается ключевым условием открытости, а, значит, и публичности архивов.

Публичность предполагает соблюдение некоторых условий:

равный доступ всех категорий пользователей к информационным массивам;

свободный доступ (физический и интеллектуальный) к любой информации, то есть к любому архивному документу, за исключением случаев, определенных действующим законодательством;

возможность тиражирования документной информации, то есть свободное копирование архивных документов.

Первое условие гарантируется законодательно и, в целом соблюдается всеми архивами в зависимости от их статуса.

Второе условие более сложно для выполнения, поскольку требует создания качественных систем поиска архивной информации. Сложность решения данной проблемы заключается в том, что архивы изначально не рассматривались как публичные заведения. Во-первых, архивы, при создании, ориентировались, в первую очередь, на сохранение документов, а уже затем на их использование. Во-вторых, архивы были призваны сохранять доказательность, то есть документы имеющие юридическую силу, а не информацию. Следовательно, архивы хранят подлинники, физический доступ к которым был ограничен всегда.

Выполнение архивами условий свободного доступа к информационным ресурсам и свободного тиражирования документов затруднено именно по причине сложности, а подчас и невозможности, установления и сохранения равновесия между двумя основными функциями архивов - хранить и информировать.

Решить проблемы свободного доступа к информации архивы стремятся различными способами - созданием научно-справочного аппарата, формированием фонда пользования, публикацией отдельных документов.

Для российских архивов наиболее актуальной является задача создания фонда пользования, то есть фонда копий документов, доступных для пользователей. Надо признать, что медленное формирование архивами фондов пользования зависит не только от недостаточного технического оснащения архивов, но и от использования устаревших форм копирования документов. Самым распространенным способом создания копий архивных документов для пользования остается микрофильмирование. Качество микрофильма зависит от качества пленки, средств для чтения микрофильмов и оборудованности рабочих мест пользователей. То же самое можно сказать и об аналоговых средствах записи устной (звуковой) информации, то есть аудиокассетах. Создание фондов пользования из ксерокопий мало приемлемо для архивов, поскольку опасность разрушения материального носителя информации в данном случае очень высока.

Совершенно ясно, что в перспективе фонды пользования будут создаваться преимущественно путем оцифрования имеющихся документов и архивирования полученных записей. В отличие от ксерокопирования оцифрование (сканирование) документов наносит меньший урон материальной основе документа, а в отличие от микрокопий оцифрованные документы (электронные образы документов) удобнее в использовании, занимают меньше места и легко копируются на любой носитель. Наконец, с помощью оцифрованных документов (электронных образов документов) намного проще решается проблема приближения информации к пользователю: электронный образ легко передается с помощью информационных сетей в любую точку страны или мира. Уже сегодня пользователь может получить архивную информацию «на дому» через глобальные информационные сети.

Интернет выступает мощным способом достижения архивами статуса публичных учреждений. Глобальные сети позволяют разместить базы данных и полнотекстовые документы, а, следовательно, решить проблемы удаленного доступа к информации и копирования документов.

Архивная информация в Интернет представлена в виде корпоративных систем (например, RLIN - the Research Library Information Network) и сайтов.

Создание корпоративных сетей достаточно трудоемкий процесс, требующий привлечения значительных финансовых средств, разработки особых технологий и создания единой методики действий участников корпоративных сетей.

Создание сайтов менее затратный путь представления архивной информации в мировой информационной сети. Создание интернет-сайта доступно каждому архиву и даже архиву, который не располагает собственной компьютерной техникой. Количество архивных сайтов заметно увеличилось в последние 2-3 года, особенно в России, и продолжает неуклонно возрастать.

Архивы размещают на интернет-сайтах, как правило, три блока информации:

справочные сведения об архиве (о фондах, тематике документов, правилах работы в архиве и пр.),

информационно-поисковые системы (БД, путеводители, указатели, перечни документов),

тексты документов.

В настоящее время большинство российских архивов ограничивается представлением на сайтах первой группы документов. В целом, архивы предпочитают размещать на сайтах первые два блока информации, представление текстов документов в Интернет весьма ограничено. Причина заключается в том, что оцифрование архивных документов затрудняется их значительными объемами, а также необходимостью воспроизведения во многих случаях рукописных текстов и текстов на древних языках, что требует подготовки специальных программ.

Представление полных текстов архивных документов на интернет-сайтах, несомненно, проблема будущего. В настоящее время Интернет может оказать неоценимую услугу в обеспечении доступа к поисковым системам архивов. Поисковые базы данных, размещенные на архивных сайтах, позволяют ускорить поиск нужной информации. Фактически, можно выделить два перспективных направления работы архивов: оцифрование вновь поступивших документов и создание информационно-поисковых систем к архивным документам на базе Интернет.

Российские архивы активно включились в создание интернет-сайтов и количество их продолжает возрастать. Создан общероссийский архивный сайт «Архивы России», представляющий информацию о российской архивной службе в целом. Кроме того, на сайте публикуется информация о конкретных архивах - федеральных, региональных (государственных), муниципальных. Информационно-поисковые системы на сайте представлены ограничено. Такое положение свидетельствуют о том, что архивы ограничиваются в основном рекламированием своих документных комплексов, эффективная же помощь исследователям в поиске необходимой информации остается делом будущего.

Определяя перспективу работы архивистов по представлению архивной информации в Интернет, можно предположить, что со временем электронный НСА будет полностью представлен в сети Интернет. Вопрос о представлении в Интернет полных текстов документов предполагает решение юридических и технических задач: архивные документы не только представляют значительный объем, но могут содержать коммерческую тайну, конфиденциальную информацию и пр.

Подготовка и создание интернет-сайтов. Работа по созданию сайта во многом сходна с работой по подготовке оригинал-макета, принципиальным различием можно считать тот факт, что производство сайта - это безбумажное производство. При организации работы над сайтом можно выделить те же этапы, что и при создании оригинал-макета:

разработка дизайна сайта (структура и содержание), составление программы работы над сайтом;

отбор информации и ее редактирование;

отбор иллюстраций;

«верстка» текста и иллюстраций;

«вывод» информации (перевод информации в формат Интернета - HTML).

При разработке дизайна сайта нужно четко определить цели сайта: рекламный проспект, информационно-поисковые системы, тексты документов и т.д. Выбор типа справочника, представленного на сайте, зависит, в конечном результате, от запросов пользователей. В любом случае, архивист должен определить цели сайта с позиций пользователя: какая форма представления материала предпочтительнее, какой объем оптимален, какие гиперссылки лучше применить и прочее. Кроме того, следует помнить, что сайт может пополняться и изменяться, хотя он и не может быть безграничным. Поэтому желательно изначально определить в какую сторону будет «развиваться» сайт.

Лучше если группа, работающая над сайтом, будет немногочисленной. Это позволит более четко распределить обязанности и установить сроки исполнения работы. Желательно включение в группу специалиста по компьютерным технологиям, который сможет выполнять обязанности web-мастера, что избавит от многих проблем чисто технического характера при создании сайта и позволит больше внимания уделить вопросам подготовки информации.

Отбор информации для включения в сайт - наиболее сложный и ответственный этап в его подготовке. Недостаточная или избыточная информация появляются тогда, когда создатель забывает о том, что сайт готовится для пользователя, а, следовательно, главная цель - информация о содержании архивных документов. Ни дизайн, ни реклама, ни история архива не должны превалировать над основной идей. Даже оформление, т.е. иллюстративный материал, должно быть подчинено тексту.

При определении структуры и объема текста необходимо учитывать, что расширение информации сайта производится за счет использования нелинейного текста, т.е. за счет ссылок. Но чем больше ссылок, тем сложнее структура текста, а, следовательно, происходит замедление поиска нужной информации или происходят частые сбои. Иллюстративный материал требует большого объема памяти и приводит к такому же результату. Поэтому должен проводится очень тщательный отбор информации для включения в сайт и очень тщательно продумываться соотношение текстового и иллюстративного материалов.

Сайт может включать следующие «группы» информации:

«Главная» страница сайта (оглавление). Желательно, чтобы любая страница сайта была связана с «главной» страницей посредством ссылки, т.е. на каждой странице сайта должна размещаться ссылка на «главную» страницу.

Историческая справка об архиве (архивах). В данную группу сведений могут быть включены сведения и о регионе в целом, особенно если сайт рассчитан и на зарубежного пользователя.

Информация о составе и содержании фондов архива (аннотация документов). Данная часть может состоять из нескольких блоков информации, отличающихся по объему и степени детализации информации и взаимосвязанных друг с другом с помощью ссылок и точек доступа. Например, общая характеристика документов архива (архивов) по нескольким тематическим группам, краткий справочник по фондам, обзоры наиболее ценных или значимых фондов или коллекций, описи отдельных фондов, отдельные документы и пр. Эта часть сайта является «сменной», т.е. она может изменяться, дополняться, обновляться, поэтому требует постоянного внимания с целью своевременного внесения изменений.

Информация о реферативных системах архива, порядке и условиях доступа к архивным документам, режиме работы читального зала, возможности копирования документов, проезде к архиву, платных и бесплатных услугах, контактная информация (адрес, электронная почта, факс, телефоны).

Информация о руководителях архивных учреждений и ответственных сотрудниках архива (архивов).

Библиография об архиве и его изданиях, в том числе ссылки на родственные сайты.

Английская версия сайта, если архив заинтересован в широком привлечении зарубежных пользователей. Данная версия бывает короче основной за счет сокращения блока информации о содержании и составе документов архива. В данном случае, как правило, ограничиваются общей аннотацией (обзором) документов.

Иллюстрации, как правило, не составляют отдельного блока, а интегрируются в текст сайта. Но это не означает, что иллюстрации не несут смысловой нагрузки, а используются только как «картинки». Отбор иллюстраций - очень ответственный этап в подготовке сайта. Здесь должна быть соблюдена определенная пропорция между текстом и иллюстративным материалом, поскольку перенасыщение сайта иллюстрациями ведет к чисто техническим трудностям. В то же время иллюстрация должна подчеркивать основную идею окружающего ее текста и, по возможности, нести дополнительную информацию.

При подготовке сайта текст может набираться в текстовом процессоре в виде отдельных файлов, а затем импортироваться в структуру сайта. Как правило, современное программное обеспечение (например, Windows) позволяют «перебрасывать» текст в формат HTML через спецификации в меню «Файл». Текст может быть также сканирован и затем переведен в формат HTML.

Иллюстрации, как правило, сканируются в самостоятельный файл, ретушируются, а затем импортируются в структуру сайта.

Важно, чтобы после создания сайта, была налажена связь между пользователями информации и создателями сайта. Лучше всего если сайт будет предусматривать возможность автоматической связи через e-mail с архивом. Это позволит пользователю сделать запрос без дополнительных усилий. Архив же должен разработать порядок получения, регистрации и исполнения запросов, поступивших через Интернет.

Сайт должен иметь возможность изменяться вместе с интернет-средой. Это важный аспект в процессе поддержания сайта в рабочем состоянии. Вторым условием нормального функционирования сайта является постоянное и своевременное обновление информации на сайте.

Таким образом, глобальные информационные сети становятся важным звеном в процессе создания информационных поисковых систем к архивным документам, а, следовательно, и в процессе расширения и упрощения доступа к архивной информации.

«Определяя» место архивов в современном мире можно утверждать, что архивы - не только память о прошлом, это - социальная память, память общества о самом себе. Без такой памяти не может существовать ни государство, ни нация, поэтому архивы всегда рассматривались как часть культурного наследия любой нации. Более того, архивы и архивные системы представляются своеобразным отражением систем государственного и политического устройства общества. Изучение архивов - это возможность понять ход и закономерности развития государств и наций, что необходимо для гармонизации развития межгосударственных и межнациональных отношений в современных условиях.

11. Технотронные архивы

Лекция подготовлена на основе научных докладов, статей и сообщений американских архивистов, проводивших исследования в области обеспечения сохранности электронных документов в конце 1990-х годов. В лекции изложены основные направления исследований архивов в области сохранения электронных документов и создания полноценных архивов для долговременного хранения электронных документов и обеспечения к ним свободного доступа пользователей. Более широко вопрос о создании технотронных архивов, например, архивов микроформ, аудиовизуальных документов, в лекции не затрагивается.

Электронные документы

Понятие «технотронные архивы» появилось сравнительно недавно и не получило еще широкого распространения. Сегодня под технотронными архивами подразумеваются скорее не специализированные архивохранилища, а способы организации хранения и использования документов, созданных на нетрадиционных носителях, и, в первую очередь, вновь созданных электронных документов и документов, полученных при оцифровании уже имеющихся архивных документов.

Очень часто понятие «технотронные архивы» отождествляется с понятием «электронные архивы», хотя к технотронным архивам можно отнести и архивы аудиовизуальных документов.

Технотронные (электронные архивы) реально существуют сегодня только в виде архивированной электронной информации, то есть процесс архивирования рассматривается как создание электронного архива.

Наиболее интересные разработки в области архивирования электронных документов сделаны в Соединенных Штатах, Канаде и Австралии. Особого внимания заслуживают работы профессора Вашингтонского университета (США) Чарльза Доллара и, в частности, его монография «Доказательность электронных документов: стратегия долговременного доступа» (Authentic Electronic Records: Long-Term Access Strategies, 1999), в которой определяются основные принципы электронного архивирования как способа сохранения электронных документов (ЭД) и обеспечения доступа к ним на протяжении значительного временного периода.

Первая и основная сложность, которую привносят в деятельность архивов электронные документы, состоит в удостоверении подлинности электронных документов (ЭД). Архивы собирают доказательность, а не сведения или информацию, другими словами, каждый архивный документ должен обладать юридической силой. Для документов на бумажном носителе за столетия создана четкая и стройная система удостоверения подлинности документа, то есть в данном случае документ обладает доказательностью. С документами на иных носителях дело обстоит сложнее, особенно с ЭД, которые «не видны, не слышны и не осязаемы» для человека. Электронные документы располагаются на «жестком» диске (винчестере), дискете, оптическом диске в виде сочетания определенных символов, недоступных органам восприятия человека, и появляющиеся на мониторе компьютера в преобразованном виде. Естественно, что такая ситуация с документами - «невидимками» заставляет архивистов, юристов, пользователей задавать вопрос о подтверждении достоверности документа и сохранении этой достоверности во времени и пространстве.

Дэвид Бирман, один из крупнейших специалистов в области ЭД, считает доказательность документа той чертой, которая отличает ЭД от электронной информации. Например, с точки зрения Д. Бирмана, вся информация «вращающаяся» в Интернет не является ЭД, поскольку не обладает юридической силой и доказательностью. Доказательность ЭД, по мнению Д. Бирмана, является неким соединением сведений (т.е. записи слов, чисел, образов, звуков), структуры (то есть взаимоотношений между этими сведениями) и контекста (то есть взаимосвязи между документом и функцией или деятельностью, в результате которой документ был создан). Таким образом, документ - это всегда продукт деловой деятельности.

К такому же выводу, по существу, пришла и Лючана Дуранти, преподаватель университета Британской Колумбии (Канада), которая ввела в научный оборот понятие «архивная связь» или «архивное звено» (archival bond). В определении ЭД, данного Л. Дуранти, помимо компонента «контекст» существует еще компонент «архивные связи», который обозначает «историю действия документа». Таким образом, по мнению Л. Дуранти, может иметь любой контекст, например, контекст происхождения (где и как создан документ), но он имеет и некую историю «своей жизни» (кто и как использовал документ, когда копировался, как часто использовался).

Таким образом, электронный документ - не только сведения о чем-либо, но и сведения о самом документе (когда был создан, когда копировался, когда представлялся для пользования), без такого «окружения» первоначальных сведений не существует электронного документа. Электронный документ состоит из данных и метаданных, которые и являются средством удостоверения документа, то есть его доказательностью.

Метаданные - это структурированные данные о данных. Метаданные появляются «автоматически» при создании документа: время и место создания документа, код и прочее. При перезаписи документа с одного носителя на другой появляются новые метаданные. Они также отличают один вариант документа от другого, если в документ вносятся изменения. Таким образом, метаданные всегда сопровождают документ. «Ответственность» за метаданные «несет» программное обеспечение ЭВМ и вмешательство человека, практически, невозможно. Именно это обстоятельство вызывает недоверие архивистов, поскольку, с их точки зрения, ЭВМ проконтролировать нельзя.

Метаданные, как и данные, должны сохраняться во времени и пространстве при перемещении ЭД из одной программы в другую (т.е. при смене программного обеспечения и типа ЭВМ), при перезаписи ЭД, при переносе его на другой носитель и т.д. При этом метаданные должны определяться новым программным обеспечением и быть доступными для новых технических средств. Именно для определения («улавливания») метаданных и сохранения их во времени должны существовать особые системы хранения ЭД, «документосберегающие системы» (recordkeeping systems).

Ни «жесткий» диск компьютера, ни оптический диск сами по себе не имеют таких систем определения и хранения, а, следовательно, не пригодны для хранения электронных документов, а могут хранить лишь информацию. Именно о хранении электронных документов в особых «документосберегающих» системах и ведет речь Ч. Доллар в своих работах. На сегодняшний день такие системы существую в теории или действуют в рамках отдельных исследовательских проектов, то есть на практике их действие ограничено. В практике работы с документами встречается понятие «архивирование» (или «электронное архивирование» как говорит Ч. Доллар). Именно с помощью функции «архивирование» делаются первые попытки сохранить сведения и информацию об этих сведениях (метаданные). В процессе «архивирования» документа программа фиксирует время; «разархивирование» документа также отмечается программой, то есть «улавливается» доступ к ЭД. Но данная программа на практике еще не «отработана», так как она не гарантирует от изменений документа при передаче информации во времени и пространстве, утраты информации при новом воспроизведении электронных документов в новом программном обеспечении, а также намеренного уничтожения ЭД.

Ч. Доллар рассматривает возможность создания таких программ или систем электронного архивирования, которые позволяют гарантировать сохранение ЭД в первоначальном виде и обеспечение доступа к ним на протяжении длительного времени. Для электронных документов речь не может идти о вечном хранении, поскольку при любой миграции (то есть передаче документа во времени и пространстве) часть информации объективно утрачивается из-за применения новых технологических средств и оборудования.

Принципы электронного архивирования

Последние исследования в области обеспечения долговременного хранения электронных документов выдвинули множество требований к электронному архивированию, но при обобщении этих требований можно выделить восемь принципов электронного архивирования:

технологическая обработка документов («processing»)

ясность (понятность) ЭД, т.е. совместимость

возможность поиска ЭД

реконструкция («восстановимость») ЭД

«понимаемость» ЭД (средствами ЭВТ), то есть «читабельность» ЭД

неизменяемость ЭД

возможность проверки (контроля) ЭД

«упаковка» (капсулирование) ЭД

Система хранения ЭД будет признана действующей, если она «работает» на основе перечисленных принципов.

Технологическая обработка ЭД указывает на то, что только обработанные ЭВТ электронные документы (т.е. описанные по определенным правилам, имеющие, в том числе метаданные) могут быть прочитаны, правильно интерпретированы и управляемы современным компьютерным hardware и software (оболочка и программное обеспечение) и могут быть легко трансформированы (перемещены) на новую технологическую платформу (новое программное оборудование), использующую функцию импорт / экспорт в software.

Электронные документы, которые могут быть только просмотрены и отпечатаны, являются необработанными в том смысле, что изначальная функциональность программного обеспечения, ассоциирующаяся с документами, не может быть выполнена, то есть документы нельзя редактировать, копировать, частями и т.д. В документ нельзя войти без несанкционированных изменений его содержания, т.е. система не может фиксировать «вхождение» в документ, его использование и пр.

Отработанные документы можно трансформировать (транспортировать) на новую технологическую платформу, т.е. в новую модель компьютера или в новое программное обеспечение. Есть два пути выполнения такого «перевода». Первый - обратная совместимость, которая выстраивается в продуктивную линию. Второй - использование технологически независимого формата обмена данными, поддержанного несколькими производителями программного обеспечения.

Обратная совместимость является эффективным кратковременным решением, и она становиться проблематичной, когда производитель прекращает поддержку продукта или когда потребитель «перешагивает» (перескакивает) ревизующую генерацию (поколение) технических средств и желает двигаться к абсолютно иной технологической платформе.

Использование технологически независимого (или нейтрального) формата обмена данными позволяет пережить кризис даже тогда, когда устанавливается совершенно новая технологическая платформа.

Вторым принципом электронного архивирования является понимание ЭД компьютерами, то есть распознание ЭД. Сегодня любой компьютер может распознать поток бинарных битов из единиц и нулей, генерируемый любым другим компьютером. Однако единицы и нули потока бинарных битов не несут присущей (изначальной) ясности, которую компьютер может распознать и интерпретировать для целей обработки.

Можно использовать и хромотографический анализ потока битов (единицы и нули). Любой компьютер может распознать поток бинарных битов, включающий «сырые» сведения, находящиеся в естественном формате системы хромотографических данных. Однако этот поток бинарных битов понятен только такому программному обеспечению, которое может переводить естественный формат и «передавать» его для просмотра, печатания и переработки, нового анализа.

Возможность поиска ЭД. Электронные документы, как доказательства для будущего, должны быть доступны в течение всего времени их хранения, а, следовательно, должны обладать способностью «быть найденными». Текстовые ЭД могут храниться в директории файлов, в то время как цифровые данные хранятся в БД. Электронные документы в БД могут быть легко «найдены» по взаимосвязям, потому что функция индексирования осуществляется автоматически. Идентификация (определение) текстовых документов, особенно тех, которые были созданы текстовыми редакторами, требуют выделения терминов индексирования (т.е. терминов для создания указателей). Термины, которые учитывают документные особенности в системах документационного обеспечения управления, могут включать даты, время, автора, получателя, форму материала (текст, образ), действие, которое ведет к созданию документа, взаимосвязанные документы и период сохранения информации. Фактически, под «терминами» понимаются «точки доступа», которые должны создаваться при создании ЭД.

Возможность реконструкции ЭД. Реконструкция означает, что ЭД могут быть переданы на монитор или принтер с сохранением всех физических и логических связей, которые они имели на момент записи их на «долговечный» носители. Другими словами, возможность реконструкции ЭД ясно видна, когда они перешли от создателя к получателю. «Восстановимость» ЭД должна сохранять любые внутренние или внешние качества, которые требовались им, чтобы быть полными и эффективными во время их создания. Это означает, например, то, что если аутентичность письма или «мемо» доказывается с помощью цифровой подписи, то эта подпись должна быть сохранена, причем так долго как это потребуется.

Возможность прочтения (читабельность) ЭД определяет факты или обстоятельства, окружающие создание, использование и поддержание ЭД, которые доступны для понимания человеку. «Понимание» ЭД не ограничивается только словами или цифрами, но включает и контекст создания и использования. Специалист по информационным технологиям Давид Блэр определил это следующим образом: «понимание» документа может быть только в его взаимосвязи с другими документами, которые вместе влияют на деятельность учреждения». Одним из ключевых моментов «читабельности» ЭД является их взаимосвязь с другими ЭД, которые частично создают контекст появления, использования, или сохранения ЭД. Архивный шифр (код), заголовок дела или его «обложка» могут определять эти взаимоотношения. Другими словами, информация, определяющая взаимоотношения является метаданными, которым должен быть обеспечен такой же уровень защиты, как и самим ЭД (это то, что Лючана Дуранти назвала архивными связями).

Вся информация о контексте создания и использования ЭД должна быть определена, идентифицирована компьютерными системами. Идентифицированная информация содержится в фактических метаданных, без которых ЭД не могут быть полностью «поняты».

Неизменность ЭД означает, что они не подвергаются изменению, переделке, утрате или порче, как по умыслу, так и случайно после их первоначальной идентификации на долговременных носителях. Неизменяемость ЭД может рассматриваться как доказательная представительность фактов, идей и событий, которые содержатся в документах. Защищенность ЭД от изменений является вновь возникшей проблемой, потому что это связано с возможностью «легкого» внесения изменений в ЭД без разрешения и видимого доказательства таких изменений. Больше того, перевод ЭД на новые сохраняющие носители и конвертирование на новые технологические платформы приводит к порче и потере информации, как при создании дизайна, так и случайно.

Хотя сегодня неизвестен способ поддержания стопроцентной защиты от порчи, изменения или уничтожения электронных документов, есть несколько способов уменьшить риск и выявить любые произошедшие изменения. Первая линия защиты против изменения и уничтожения ЭД - это перевод их хранения из-под контроля тех, кто создавал электронные документы, в хранилища, являющиеся «третьим доверенным лицом», обязанностями которых является следование лучшей практике и защита ЭД от уничтожения, изменения или порчи (то есть перевод ЭД с временного ведомственного хранения на постоянное хранение). Такие хранилища ЭД могли бы поддерживать доступ к ЭД только в режиме прочтения (read only) после того, как ЭД переводятся (и идентифицируются) на долговременный носитель. Если последующий анализ выявит ошибку или будет использована новая техника, то будет определена копия ЭД, которая существует как новая версия.

Другой путь защиты электронных документов от изменений - это использование цифровых технологий, которые могут определить произошедшие изменения. Одним из таких способов является «цикличный избыточный контроль» - CRC (Cyclical Redundancy Checksum), который обычно используется в телекоммуникациях для гарантии свободной от ошибок передачи ЭД. Используя CRC во время обновления, конверсии или миграции ЭД можно быть уверенным, что ошибки не произойдет. С подходящим программным обеспечением результативная ценность CRC для каждого документа или массива документов может быть усилена и закреплена в образе документа или массива документов как часть исторического образа, который документирует свободную от ошибок обработку электронных документов.

Другая цифровая технология - «хэширование», то есть наложение кода (хэш-кода), который как бы закрепляет («замораживает») документ со всеми реквизитами и текстовым содержанием, гарантируя его аутентичность при воспроизведении на компьютере, поскольку все внесенные в документ изменения после хэш-кодирования будут зафиксированы, показаны и воспроизведены.

Односторонняя хэш-функция служит алгоритмом, который сжимает объект в очень маленькую запись фиксированной длины. Эта функция называется односторонней, потому что само изложение хэш-функции является необратимым: невозможно восстановить документ из хэш-дайжеста. Безразлично как много раз документ «хэширован», определяющий хэш-дайжест основного документа (оригинала) будет производиться, несмотря на отсутствие изменений. Таким образом, «второе хэширование» электронных документов (и все последующие) будут сравнивать его с первоначальным «хэшированием», что обнаружит любое изменение в ЭД.

Хотя цель состоит в гарантировании того, что электронные документы не будут изменены, фактически, это - невозможно. Как указывалось выше, существует объективная причина этому: при любой передаче ЭД с носителя на носитель происходит утрата информации, особенно если трансформация происходит через значительные промежутки времени.

«Проверяемость» ЭД (контроль за электронными документами) означает возможность определения и сохранения информации о том кто, когда, что, почему и как использовал, хранил, поддерживал. Таким образом, «проверяемость» электронных документов - это документирование всех действий, производимых с документами. Этот путь проверки (ревизии) важен для документирования процесса создания ЭД, включая цифровой временной штамп и соответствующие действия, расширяющие пригодность ЭД через обновление носителя, конверсию или миграцию. Эта информация является метаданными и должна бы сохраняться, как и электронные документы, в первую очередь это относится к той части метаданных, которые капсулированы (упакованы) в ЭД.

Упаковка (капсулирование) ЭД. В «упакованных» (капсулированных) ЭД вся информация ассоциируется с особым документом или многочисленными документами, которые включают папку электронных файлов, таких как метаданные и содержание, существующую в виде отдельной логической или физической сущности (т.е. «упакованные» документы - это ЭД, в которых содержание и метаданные прочно увязаны в одно целое).

Различие между логической и физической сущностью важно, потому что такие технические средства как связанный объект и гипертекст, по-существу, создают динамичные документы, которые могут существовать на разнообразных носителях и серверах и которые могут использоваться только при специальном программном обеспечении.

Логическая «упаковка», то есть объект связанный и закрепленный (MSWord) может поддерживаться и сохраняться на протяжении одного технологического поколения, но становится труднодостижимым через поколения.

Физическая «упаковка» интегрирует все логические компоненты ЭД в единую систему (общность). Физическая упаковка может помочь уменьшить сложность мультимедийных электронных документов. Однако она не лишена своих собственных проблем. Например, задача конвертации, скажем, графических материалов или новое программное оборудование для графики может потребовать временного интенсивного компьютерного поиска всех ЭД в «хранилище» для такого материала. Одним из путей упрощения этой проблемы является создание заменителя основной совокупности (общности), которое включает описательную информацию о различных типах информационного представления, которое может быть найдено по определению особых документов или массива.

Одна из частных форм физической «упаковки» может расширить возможности поиска и сохранность электронных документов, например, с помощью XML (Extensile Markup Language), который является наиболее технологически независимым решением, доступным сегодня для описания массива документов и любых взаимосвязанных процессов документирования или метаданных. Такое описание происходит через DTD (Document Type Definition).

Эти восемь принципов являются множественно зависимыми так, что каждый может быть взят в расчет при дизайне стратегии электронного архивирования.

Стратегия электронного архивирования

Гарантия доступности электронных документов, как доказательности, со временем сталкивается с двумя фундаментальными препятствиями: ограниченной «полезной» жизнью носителей и постоянно изменяющимися технологиями, которые приводят к неизбежному устареванию существующих технологий. Сочетание этих препятствий приводит к утрате гарантии долговременного доступа к ЭД.

В настоящее время имеется три различных подхода к вопросу о том, как преодолеть эти последствия. Сэму эль Росс (университет Глазго) отстаивает один из проектов, называемый «цифровая археология». При этом подходе внимание сосредоточено на конвертации электронных документов в новые технологии только тогда, когда требует этого последующий доступ к ним. «Цифровая археология» трансформирует издержки передвижения ЭД из сферы зависимости от программного обеспечения в некую определенную точку в будущем. Стратегия этого подхода заключается в периодическом перемещении ЭД на все новые носители с целью поддержания продолжительной читабельности. В дополнение к этому данная методология требует собирания и хранения («документирования») операционных систем и прикладного программного обеспечения, которые могут быть использованы в будущем для восстановления технологической платформы, на которой электронные документы первоначально создавались.

...

Подобные документы

  • Положение архивов в России во второй половине XIX века. Археологические съезды: основатели и цели. Место архивного вопроса на съездах. Значение деятельности Н.В. Калачова для развития архивного дела. Проекты централизации и реформа в целом архивного дела.

    реферат [34,7 K], добавлен 24.12.2009

  • История развития архивного дела в Киевской Руси. Его развитие в эпоху Российского централизованного государства. Архивная деятельность в XIX-XX веках. Теория и методика архивоведения. Особенности становления архивного дела в независимой Украине.

    реферат [24,4 K], добавлен 27.11.2009

  • Этапы развития архивного дела в России и их характеристики. Приказы, приказные дьяки и подьячие и их делопроизводство. Архивы приказов и постановка в них архивного дела. Архивы в приказах дворцовых, Посольском, Разрядном, Поместном и Тайных делах.

    контрольная работа [41,9 K], добавлен 25.06.2010

  • Становление архивного дела в Киевской и Московской Руси. Особенности архивоведения в Российской империи (XVIII в.- 1917 г.). Развитие архивного дела в довоенный, военный и послевоенный периоды. Современное состояние архивного дела в Российской Федерации.

    реферат [45,8 K], добавлен 14.05.2011

  • Архивоведческая деятельность Д.Я. Самоквасова, повлиявшая на организацию и развитие архивного дела в России. Характерные черты методологии архивного дела у Д.Я. Самоквасова, реформа системы хранения документов позволившая ускорить делопроизводство.

    реферат [45,3 K], добавлен 18.12.2016

  • Калачов Н.В. как ученый историк-юрист, академик и сенатор. Его служба в Археографической комиссии. Благоустройство архивов как важное условие для процветания исторической науки и права. Направления реорганизация архивного дела после реформ Петра I.

    реферат [22,5 K], добавлен 06.01.2010

  • Этапы зарождения и развития архивного дела на Руси, значение данного процесса в становлении письменности. Документы того времени и их функциональные особенности. Археография как научная дисциплина, периоды ее развития в России и современное состояние.

    шпаргалка [91,9 K], добавлен 10.05.2010

  • Изменения в области архивного дела. Законодательство XVIII века в области архивного дела. Использование и хранение архивных документов. Обзор состояния дел в отдельных архивах XVIII века. Архивы высших, местных учреждений. Исторические архивы.

    реферат [43,0 K], добавлен 27.09.2008

  • Исследование биографии и деятельности Дмитрия Яковлевича Самоквасова. Анализ его влияния на положение архивного дела в России конца XIX - начала XX века. Работа историка в Московском Архиве Министерства Юстиции. Изучение его проекта архивной реформы.

    курсовая работа [46,7 K], добавлен 18.02.2014

  • Характеристика деятельности Д.Я. Самоквасова как видного российского историка, автора архивной реформы. Вклад Д.Я. Самоквасова в развитии архивного дела в России. Основная цель реформы в области архивного дела. Проекты идей предложенных Д.Я. Самоквасовым.

    курсовая работа [66,3 K], добавлен 16.12.2016

  • Биография Дмитрия Яковлевича Самоквасова, его реформаторские взгляды на организацию, хранение и использование исторических документов. Особенности законодательства в области архивного дела в России в конце XIX – начале XX вв., проекты его изменения.

    реферат [26,1 K], добавлен 16.12.2009

  • Становление Государственного архива. Исследование научной организации Архивного фонда РФ, его структура. Классификация, порядок комплектования и использования документов Архивного фонда. Проблемы организации архивного хранения электронных документов.

    курсовая работа [113,8 K], добавлен 22.11.2015

  • Понятие документального фонда и архивного фонда. Создание Московского сенатского архива как первого архива ведомства. Структура Государственного архива РСФСР, история его создания и реорганизаций со времен Октябрьской революции и по нынешнее время.

    реферат [17,4 K], добавлен 09.06.2010

  • Храмовые архивы государств Древнего Востока. Особенности хранения хозяйственных документов в древнем мире. Производственные архивы стран Западной Европы в средние века. Национальная архивная реформа и развитие архивной профессии в США в 20 века.

    шпаргалка [44,5 K], добавлен 16.05.2010

  • Общая характеристика социально-экономического развития Аргентины в XIX - начале ХХ века, а также его особенности после создания самостоятельного государства. Анализ и специфика анархизма и идентичноста аргентинских рабочих в конце XIX – начале ХХ века.

    реферат [34,0 K], добавлен 26.07.2010

  • Развитие системы высшего образования в царской России. Правовое регулирование высшего образования после октябрьского переворота. Образ русского студента в конце XIX - начале XX века. Реакционные студенческие организации и кооперативы, их деятельность.

    курсовая работа [39,5 K], добавлен 18.10.2010

  • История просветительной деятельности в России второй половины XIX - начала XX вв.: этапы становления и общие тенденции в развитии. Правовая политика государства в сфере регулирования деятельности просветительных обществ в конце XIX - начале XX вв.

    реферат [94,7 K], добавлен 27.03.2012

  • Правовая база архивного дела в России. Критерии определения особо ценных (уникальных), исторически значимых документов, порядок их учета. Организация хранения и использования данного вида документов, базы обеспечения их физико-химической сохранности.

    курсовая работа [36,6 K], добавлен 20.04.2014

  • Особенности использования источников при изучении раннего периода нашей истории. Монах Нестор и его рукопись "Повесть временных лет". Варяги и их роль в нашей истории. Норманнская теория происхождения древнерусского государства. Начало формирования Руси.

    презентация [389,5 K], добавлен 18.01.2012

  • Письмо и письменность в древности. Книжное и печатное дело в Средние века. Начало книгопечатания и печатного дела в Европе (XV-XVI века). Начало славянского книгопечатания и печатного дела в русском государстве. Современное полиграфическое производство.

    реферат [5,7 M], добавлен 31.05.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.