НЕКОТОРЫЕ ПРОБЛЕМЫ ПУБЛИКАЦИИ АРХИВНЫХ ДОКУМЕНТОВ В ЭЛЕКТРОННЫХ ИЗДАНИЯХ

Печать PDF

Развитие и совершенствование мультимедийных компьютерных технологий открыло дорогу к созданию новой формы публикации архивных документов — электронной. Сегодня уже ясно, что использование архивных документов в электронных изданиях идет иным путем, чем их использование в традиционных печатных изданиях. В данной статье рассматривается ряд принципиальных, по нашему мнению, проблем, которые связаны прежде всего с практическим созданием подобных электронных публикаций архивных документов.

Согласно определениям ГОСТ Р 51141-98 под публикацией архивного документа понимается подготовка его к изданию в соответствии с установленными правилами. С одной стороны, эти правила касаются выявления и отбора документов для публикации и их археографической обработки, с другой - представления документа и связанной с ним информации в форме, адекватной форме предстоящего издания, в нашем случае - электронной. Если в первом случае как для традиционной печатной публикации, так для электронной применимы одни и те же методы подготовки, то во втором случае мы можем говорить об информационной технологии публикации архивного документа в электронном издании. Формирование данной информационной технологии и ее методологическое осмысление сегодня представляет важную практическую задачу использования архивного фонда в электронных формах.

В основе подготовки электронного издания с использованием архивных материалов лежит создание электронной копии архивного документа. Согласно ГОСТ 7.48-2002 «Консервация документов. Основные термины и определения» электронная копия - это копия, изготовленная в цифровой форме, а изготовление копии - это воспроизведение на другом носителе в том же или ином формате с помощью различных технологий. Но электронная копия в то же время - электронный документ, который согласно ГОСТ 7.83-2001 «Электронные издания. Основные виды и выходные сведения» является документом на машиночитаемом носителе, для использования которого необходимы средства вычислительной техники. В том же стандарте приводится определение электронного издания как электронного документа (или группы электронных документов), прошедшего редакционно-издательскую обработку, предназначенного для распространения в неизменном виде, имеющего выходные сведения.

Опираясь на данные определения, под электронной публикацией архивного документа можно понимать электронное издание, содержащее электронную копию (или группу электронных копий) архивных документов, прошедших археографическую и редакционно-издательскую обработку, предназначенное для распространения в неизменном виде на машиночитаемом носителе и имеющее выходные сведения. Следует различать:

• электронные аналоги печатных публикаций архивных документов, воспроизводящие в основном соответствующее печатное издание (текст и его расположение на страницах, иллюстрации, ссылки, примечания, научно-справочный аппарат и т.д.);

• самостоятельные электронные публикации архивных документов, не имеющие печатных аналогов.

По природе воспроизводимой информации ГОСТ 7.83-2001 предлагает различать текстовые, изобразительные, звуковые и мультимедийные электронные издания. Применительно к электронным публикациям архивных документов возможно выделение изданий по видовому составу документов архивного фонда (публикации фонодокументов, фотодокументов и т.п.), соотносясь с классификацией, сложившейся в архивной практике. В то же время надо четко понимать, что электронная форма представления в значительной мере стирает видовые границы, сводя их к различным цифровым форматам представления данных. И с позиций информационной технологии публикации архивного документа возникает вопрос о выборе соответствующего ему цифрового формата, который во многом определяется целями использования документа в конкретном электронном издании.

Электронная публикация архивных документов может осуществляться в изданиях научного, научно-популярного, учебного, справочного, художественного и иного характера, ориентированных на локальное, сетевое или комбинированное распространение. Для нас важно отметить, что любая научная публикация архивных документов должна иметь детерминированный характер, т.е. параметры, содержание и способ взаимодействия с электронным изданием должны быть предопределены его целями, издателем и не могут быть изменяемы пользователем. Только в этом случае мы можем говорить о достоверности приводимой архивной информации и рассматривать электронную публикацию архивных документов как инструмент для научной работы и форму обеспечения сохранности архивного фонда. При несоблюдении данного условия электронная публикация архивного документа будет иметь только справочное, иллюстративное, ознакомительное значение. Поэтому предлагается специально помечать научные электронные издания грифом «Научное издание» на титульном экране и в библиографическом описании и выработать для этого вида изданий особую систему правил их подготовки при использовании архивных материалов. При этом мы предлагаем отнести к разряду научных публикаций фондовые публикации архивов. На наш взгляд, недостаточно решать вопрос об оцифровании тех или иных архивных фондов только с позиций фонда пользования и нужно сразу ставить вопрос о страховом оцифровании, а фонд пользования формировать на основе страхового фонда.

Согласно ГОСТ 6.10.4.-84 для документов на машинных носителях устанавливаются категории подлинника, дубликата и копии только при условии аутентичности содержания и сохранения присутствия обязательных реквизитов. При этом подлинником считается первая по времени запись документа и содержащая соответствующее указание, дубликатом - более поздняя по времени перезапись документа на аналогичном носителе, а копией - перезапись документа на иной вид машинного носителя. Отметим, что разница между подлинником и дубликатом для машиночитаемых документов в отличие от печатных или рукописных, носит больше формальный характер, что дает основание дублировать при соблюдении определенных стандартом условий электронные документы для задач проведения электронной реставрации, для передачи по сети, для тиражирования и иных целей. Для этого используются специальные программы дубляжа (FDD, CloneCD и др.) и устройства-дубликаторы, работающие на уровне физического переноса информации и гарантирующие ее аутентичность. В то же время устанавливаемые стандартом признаки копии вызывают большое сомнение. По нашему мнению, аутентичный перенос информации на иной по виду машинный носитель также относится к ее дублированию со всеми вытекающими последствиями и положение стандарта в этом плане требует пересмотра. Другое дело - конвертирование электронного документа из формата в формат, когда мы имеем дело с электронным копированием и реальной возможностью потери аутентичности копии.

Для электронного воспроизведения архивных документов крайне важен научно обоснованный вариант воспроизведения - графический или символьный. В традиционных публикациях факсимильное воспроизведение документа используется больше с иллюстративной целью, и перед публикатором стоит задача корректного воспроизведения текста документа со всеми имеющимися пометами в современном написании и с использованием современного печатного шрифта. При символьном воспроизведении текста документа задача полностью аналогична, с той разницей, что для воспроизведения текста и помет используются машинные или экранные шрифты. Но без наличия параллельного графического варианта электронную публикацию архивного документа, на наш взгляд, нельзя считать полной. Более того, можно полагать, что в электронной публикации символьное воспроизведение играет вспомогательную роль, и главная научная и практическая задача электронной публикации - доведение до исследователей полноценного графического образа документа с необходимым археографическим и источниковедческим описанием.

Теперь мы вплотную подошли к вопросу: какой электронный формат для архивного документа можно считать полноценным? В архивной практике работы с электронными документами выделяют две группы цифровых форматов записи данных - страховые и пользовательские. К страховым форматам относят такие, которые имеют лучшие характеристики для страхового архивного хранения, к пользовательским -оптимальные для решения задач использования. С точки зрения научной публикации архивного документа, вопрос о форматах можно рассматривать следующим образом. В любой научной электронной публикации архивных документов целесообразно предусмотреть возможность доступа исследователя как к копиям «страхового», так и «пользовательского» уровней. Оцифрование архивного документа ввиду того, что оно не совсем безопасно для физического состояния подлинника, целесообразно сразу производить в страховом формате с качеством, установленным для страхового фонда. Публикация страхового формата дает исследователю доступ к копии такого же качества, какое бы он получил бы и при обращении к электронному фонду архива. Перевод из страхового формата в пользовательский сегодня не представляет технической проблемы*, и на уровне разработки электронных фондов пользования архивы будут руководствоваться доступными им информационными системами и средствами. Но страховое оцифрование должно стать предметом общеотраслевой регламентации. Научные электронные издания архивов могут стать серьезным средством развития межархивного и межбиблиотечного обмена, но они вряд ли будут носить массовый характер, и нужна соответствующая государственная поддержка их выпуска.

Для научного электронного издания, использующего архивные документы, можно выделить несколько основных задач: а) создание электронного цифрового страхового фонда архивных документов и его локальное воспроизведение в рамках издания; б) создание электронного фонда пользования для данного издания, навигационных и поисковых средств; в) электронное восстановление документов для фонда пользования.

Проводя оцифрование традиционного архивного фонда, мы должны получить не просто набор электронных копий составляющих его архивных документов, а его электронную модель -полноценный образ фонда, включающий его установленные атрибуты (карточку фонда и т.д.), архивные ссылки, т.е. в составе электронного фонда должен существовать некоторый служебный электронный документ, несущий необходимую метаин-формацию о нем. Поэтому, например, электронный фонд архивных документов можно определить как массив электронных копий архивных документов и служебной информации, обеспечивающей точную идентификацию фонда, как в традиционном архиве, так и в обслуживающей его информационной системе.

В последнее время архивистами и документоведами активно обсуждается концепция и тематика электронного архива. При этом в составе его фонда рассматриваются не только электронные копии бумажных архивных документов, но и электронные документы, созданные в сфере электронного документооборота, сетевые электронные документы, в том числе и те, которые не имеют «бумажных» вариантов. Все это говорит о том, что электронная культура медленно, но верно формирует свой вариант организации архивного дела и сфера информационных технологий вторгается в область комплектования, обеспечения сохранности и использования архивного фонда. Сегодня электронный архив - это не только название программного продукта и известной своими успехами в данной области фирмы, это вполне определенный институт архивной деятельности.

Практика оцифрования библиотечных фондов и коллекций породила два термина: «электронная библиотека» и «электронная коллекция». По мнению ряда специалистов, основное отличие электронной библиотеки от электронного издания в том, что библиотека является открытой системой, допускающей при соблюдении условий неизменности электронных документов ввод новых документов, реструктуризацию документальных комплексов и массивов и т.д. Электронная библиотека понимается как информационная система, позволяющая надежно сохранять и эффективно использовать разнообразные коллекции электронных документов (текстовых, изобразительных, звуковых, видео и др.), локализованных в самой системе, а также доступных ей через телекоммуникационные сети. Но ведь именно такие задачи и стоят перед электронным архивом! В чем тут может быть разница?

Изучение накопленного практического опыта показывает, что электронные библиотеки и электронные архивы - это одни и те же по сути и структуре информационные системы, которые получают различные названия скорее из-за традиций разделения библиотечного и архивного дела. По нашему мнению, будет правильнее говорить об электронном архиве-библиотеке, подчеркивая сближение архивных и библиотечных задач. В широком смысле слова в качестве электронной публикации может рассматриваться сам факт создания электронного архива-библиотеки. Электронный архив-библиотеку можно рассматривать как нетиражируемое электронное издание архивных документов, он обладает всеми атрибутами, которые мы выделили для электронных изданий выше.

В подобной трактовке электронное издание может рассматриваться как вариант формы организации фонда пользования для архива-библиотеки и доведения электронных копий архивных материалов до пользователей. Тогда в электронной публикации архивных документов должны воспроизводиться материалы конкретного электронного архивного фонда, т.е. выполненные для публикации новые электронные копии архивных документов должны его пополнить или вновь образовать, а это значит, что они должны быть выполнены в соответствии с определенными качественными критериями как для страхового хранения, так и для фонда пользования архива-библиотеки. Возникает вопрос о необходимости национального сводного реестра страхового архивного оцифрования, т.е. прослеживается аналогия с проблемами страхового микрофильмирования библиотечных и архивных фондов.

Законодательное закрепление за ФГУП НТЦ «Информ-регистр» функций федерального депозитария электронных изданий4 означает, что дубликаты всех, в том числе и архивных, электронных публикаций должны передаваться на государственное депозитарное хранение. При решении вопроса о передаче дубликатов страхового фонда электронных архивов-библиотек фактически формируется достаточно четкая и стройная система организации электронного архивного дела.

Базовым уровнем данной системы являются локальные архивы-библиотеки, создаваемые как при действующих архивных, библиотечных и музейных учреждениях, так и на корпоративных началах

в рамках национальных и международных проектов оцифрования архивных фондов.

В рамках архива-библиотеки должны быть решены следующие базовые задачи:

• выявление источников комплектования и организация экспертизы ценнности электронных копий архивного хранения для формирования страхового фонда;

• формирование электронного каталога как формы реализации научно-справочного и поискового аппарата;

• фондирование и составление описей фондов в электронном виде как форма реализации учетных функций архива-библиотеки;

• участие в межархивном обмене дубликатами страхового фонда электронных копий, взаимодействие с федеральным депозитарием.

• формирование фонда пользования, как в локальных, так и сетевых формах доведения до потребителей (исследователей), представление материалов фонда пользования в электронных публикациях;

• обеспечение сохранности информационных массивов и реализация автоматизированного поиска и доведения информации до конечного потребителя, организация учета работы с информационными массивами.

В рамках федерального депозитария электронных изданий необходимо решить задачи приема и государственного хранения электронных цифровых копий документов страховых фондов, электронных копий фонда пользования и иных архивных электронных публикаций. При этом целесообразно применительно к этим поступлениям ограничиться исключительно задачами хранения и восстановления целостности утраченных фондов, оставляя информационные функции исключительно в ведении архивов-библиотек. С другой стороны, централизованное государственное хранение способно решить проблему ведения единого сводного реестра, о которой говорилось выше. В целом подобная постановка вопроса представляется экономически целесообразной и интересной.

В заключение рассмотрим некоторые практические моменты электронной публикации архивных материалов. К сожалению, при всем многообразии использования исторических документов как в сетевом доступе, так и в выпускаемых сегодня массовых мультимедийных энциклопедиях, справочниках, электронных книгах на CD-ROM порой не только нарушаются авторские и издательские права, но и дискредитируется сама идея электронной публикации архивных документов.

Электронная публикация, особенно мультимедийная, создаваемая с образовательными целями, как правило, имеет свою уникальную программную структуру, построенную по специально созданному сценарию навигации, увязанную с формами представления документов, и т.п. Создание такой публикации - результат творческого процесса составителя, редактора, программиста, художника-дизайнера, сканировщика, верстальщика и других участников выпускающего творческого коллектива. Но при всем многообразии творческих подходов целесообразно говорить о необходимости соблюдения элементарных правил ссылок на используемые архивные документы в соответствии с установленными нормами, о наличии в публикации общей описи использованных электронных копий архивных документов, представляющей собой локализацию описи фондов конкретного архива-библиотеки. Именно этот момент является своего рода актом сертификации достоверности приведенной в издании информации. Научное значение электронное издание может иметь только при условии соблюдения данного требования, в противном случае оно будет носить справочный, ознакомительный характер.

Ощущается настоятельная необходимость в разработке комплекса нормативных требований к научной электронной публикации архивных материалов.

Примеры лучших электронных документальных публикаций демонстрируют следующие концептуальные подходы:

• предоставление полной информации о документах без какого-либо вмешательства в их содержание;

• включение в электронную публикацию оцифрованных образов источников;

• обеспечение возможностей поиска информации в этих документах;

• организация гипертекстовых ссылок между документами одной публикации, а также между разными публикациями;

• значительное увеличение объема дополнительной и справочной информации, включаемой в электронную публикацию исторических источников. Примерами удачных публикаций могут служить: CD-ROM «Torre е Tasso» (составитель - Carmelo Bianco, координатор - Pierpaolo Dorsi), изданный государственным архивом Триеста в 1998 г. Публикация содержит печатные тексты стихов P.M. Рильке на немецком языке, оригинальные автографы в виде сканированных копий и переводы стихов на итальянский язык, сканированные фотографии и рисунки из фондов архива, экслибрисы, автограф элегии «Дуанесса». Документы приведены в оцифрованной форме. Публикация документов сопровождается кратким археографическим предисловием, содержащим историю происхождения документа, места и времени его создания, места хранения, а также данные о физическом состоянии документа. Приведена биография Рильке с портретом поэта, снабженная отсылкой на издание, откуда был взят этот материал.

На CD-ROMe использована разветвленная система гиперссылок, позволяющая переходить от оригинала документа (сканированной его копии) к печатному варианту на языке оригинала (немецкий) или переводу на итальянский язык, а так же к каталогу, содержащему сведения о месте нахождения документа (номер фонда). Публикация снабжена комментариями и рекомендациями по просмотру диска в Windows 95/98 и Macintosh.

Другим примером удачной электронной публикации архивных документов является CD-ROM «Сталинские расстрель-ные списки», подготовленный совместно Международным обществом «Мемориал» и архивом Президента (АП) РФ. Помещенные на диске списки, воспроизводятся на основе оригиналов, находящихся на хранении АП РФ (Ф. 3. Оп. 24. Д. 409-419). Электронная версия включает все документы, находящиеся в данных делах. Публикация состоит из трех разделов: введения, «сталинских списков», справочно-поисковой системы. Археографическое введение содержит необходимую информацию об архивном документе, месте его настоящего хранения, предыстории создания и хранения, археографического описания. Основной раздел - «сталинские списки» - позволяет просматривать любой из списков последовательно. В окне выбора источника пользователь может указать любой из томов или любой из позднейших списков. Списки снабжены информационно справочной системой, которая позволяет осуществлять разнообразные виды поиска как в пределах всех списков вообще, так и в пределах основного корпуса или его отдельного тома. Поиск может осуществляться как по индивидуальным данным, так и по таким атрибутам списков (или групп, в них выделенных), как регион, название выделенной в первоисточнике группы, наличие тех или иных подписей, дата, категория, наличие в списках около данной фамилии помет (зачеркиваний/подчеркиваний).

Круг актуальных вопросов, связанных с качеством электронных публикаций не только в Интернете, но и на CD-ROM, легко определим: принципы отбора документов, полнота издания, проблемная компановка серии, ценность и полнота комментариев, справочных материалов. К этому можно добавить требования не вырывать отдельные интересные документы, а мобилизовать материалы определенных фондов, для публикации отбирать оригиналы документов, максимально сохранять особенности и характерные черты документов, снабжать публикации достаточно подробными примечаниями и указателями (именным, географическим).

Однако публикации архивных документов пока крайне редки. Подавляющее большинство исторических источников на CD - оцифрованные версии уже опубликованных памятников, иногда откомментированные тем или иным образом. Показателем достаточно высокого уровня такого издания можно считать:

• точно обозначенный «бумажный» первоисточник (и обоснование выбора именно этого издания при наличии нескольких);

• неизъятые из него комментарии публикаторов (и соблюдение их авторских прав);

• четкое изложение принципов и объемов купюр в тексте (если таковые делались).

Эти минимальные требования необходимы для адекватной оценки всего изложенного в тексте, для определения его достоверности и информативности. Можно сказать, что простор для работы профессиональных археографов и источнико-ведов в области электронных публикаций огромен. Необходимы публикации, не только освещающие те или иные проблемы, но и дающие образцы высокопрофессиональных изданий, использующие при этом все преимущества электронных публикаций. В то же время появление публикаций исторических документов, сделанных с нарушением элементарных норм авторского и имущественного права, фактически дискредитирует идею электронной публикации и настоятельно требует совершенствования методической и нормативно-правовой базы этого вида архивной работы.