КОМПЬЮТЕРИЗАЦИЯ - ОПЫТ РГАКФД

Печать PDF

С момента своего образования в 1926 г. основным инструментом для оперативного поиска информации в нынешнем Российском государственном архиве кинофотодокументов являются каталоги. Это, прежде всего, систематические и именные каталоги, а также различные указатели, позволяющие осуществлять многоаспектный поиск информации на уровне сюжета внутри отдельно взятой единицы хранения кинодокумента и на уровне каждой хранящейся в архиве единицы хранения фотодокументов. На сегодняшний день эти каталоги насчитывают 620.000 карточек в кинокаталогах и около 970.000 карточек в фотокаталогах. Этот массив ежегодно пополняется, в среднем 18.000 новыми карточками, которые надо составить, проиндексировать, напечатать на пишущей машинке, проверить правильность их составления, при необходимости внести исправления, для карточек на фотодокументы изготовить в лаборатории контрольные фотоотпечатки и наклеить их на каталожные карточки. И только потом включить эти карточки в соответствующие каталоги. Из всего этого видно, что каталогизация - дело трудное и затратное во всех отношениях.

Следует при этом отметить, что за приблизительно 75 лет формирования каталогов этой работой занимались сотрудники разной, порой недостаточной квалификации, требования и методика неоднократно менялись. Трижды за эти годы менялись схемы индексации, в соответствии с которыми осуществляется организация каталожного массива внутри каталогов.

К тому же существующая «Схема единой классификации документной информации в систематических каталогах государственных архивов СССР» (М.,1978) прежде всего ориентирована на традиционную «бумажную» документацию и не всегда может помочь архивисту в правильной организации кинофотодокументов в каталогах (разработка в РГАКФД своей усовершенствованной Схемы единой классификации полностью не решает этой проблемы). Это приводило к большим сложностям в индексации каталожных карточек, наличию при этом определенного субъективизма, и, вследствие этого, даже к «потере» каталожных карточек среди разных отделов и подотделов каталогов (дублирование карточек для различных отделов и подотделов каталога не всегда приводило к желаемым результатам, а также существенно «раздувало» каталоги).

Ничего нет удивительного в том, что мечтой архивистов было стремление каким-либо образом автоматизировать этот процесс.

Следует также отметить, что стали меняться запросы работающих в архиве заказчиков в сторону большей детализации. Заказчиков стали интересовать вопросы, на которые каталоги в силу заложенных в них принципов организации ответить уже не могли. Выход из сложившейся ситуации напрашивался сам собой - внедрение автоматизированных архивных технологий, способных поднять на качественно иной уровень предоставление любым возможным пользователям информации о составе и содержании архивных кинофотодокументов.

Поэтому, как только появились относительно дешевые (в сравнении с большими электронно-вычислительными машинами) персональные компьютеры, архив предпринял попытку внедрения компьютерного описания фотодокументов (работа велась параллельно с ведением традиционных каталогов).

Следует при этом отметить, что начало 90-х гг., несмотря на очень нелегкие условия в деятельности архива, ознаменовалось активным внедрением автоматизированных архивных технологий, но качество их программного обеспечения порой создавало впечатление, что программы написаны, если можно так выразиться, «на коленке». Например, в бывшем архиве кино-фотофонодокументов Российской Федерации в г. Владимире база данных (БД) была создана на основе текстового редактора! Последствия подобной «технологии» РГАКФД, в фонды которого поступили документы из ликвидированного в 1995 г. архива во Владимире, ощущает до сих пор.

РГАКФД в качестве основы БД фотодокументов принял программу 4 th Dimension Runtime 2.1., предназначенную для работы на персональных компьютерах класса Apple Macintoch. Выбор компьютеров Apple Macintoch был обусловлен тем, что они на тот период лучше были приспособлены для работы с изображениями, чем IBM-совместимые компьютеры.

Программа с самого начала предполагала включать в себя и изображения, но так как в то время не было удобных и дешевых емких накопителей информации (существовавшие тогда стримеры не решали этой проблемы), первоначально БД пополнялась описаниями фотодокументов без их изображений. Только в 1995 г., с приобретением магнитно-оптических дисков емкостью по 120 Мб, начались работы и по сканированию фотоизображений (с разрешением 75 точек на дюйм) и по привязке их с описанием фотодокументов в БД.

Эта БД к началу 2004 г. насчитывала порядка 55.000 ед. хр. описаний и более 12.000 изображений (общим объемом 2.020 Мб).

Но так как архив помимо фотодокументов хранит и кино-и видеодокументы, в 1997 г. при финансовой поддержке Института «Открытое общество» (фонд Сороса) РГАКФД и американская компания «Абамедиа» приступили к созданию электронной версии кинокаталога.

Оригинальное программное обеспечение было разработано российской компанией «Киком».

Описание каждой единицы хранения кинодокумента для этой БД осуществляется на основе монтажного листа. При этом почти в самом начале проекта пришлось отказаться от идеи снабжения каждой аннотации кинодокументов 3-4 «стоп-кадрами». Это произошло из-за технической сложности в организации осуществления этой работы (такими стоп-кадрами была снабжена только «пилотная» версия БД, объединяющая кинодокументы выпуска 1937 г.), так как слишком велики оказались затраты машинного времени при переводе кинодокументов на видеопленку, да и такого количества стоп-кадров явно недостаточно для того, чтобы иметь представление о содержании даже 10-минутной кинопленки.

Составляемая аннотация на кинодокументы пока носит обобщенный характер и уступает в целом информативности традиционных каталожных каталогов, но этот временный недостаток компенсируется удобством поиска необходимой информации и оперативностью этого поиска, так как в настоящее время эта БД, составленная на более, чем 40.000 ед. учета кинодокументов, доступна пользователям архивной информации как в читальном зале архива, так и в Интернете (существует также неполная версия на английском языке). Эта же программа применяется и для описания хранящихся в архиве видеодокументов.

При разработке этой программы впервые в практике архива была предусмотрена, помимо информационных возможностей, и возможность параллельного распечатывания учетных данных в виде книг учета и описания, тем самым была решена важная проблема создания вторых (страховых) экземпляров учетных архивных документов.

Следующим этапом будет включение, помимо аннотации, в описание каждой единицы учета и монтажного листа целиком, с возможностью также осуществлять по нему контекстный поиск. А в перспективе с использованием мультимедийных средств, дающих возможность просмотра на мониторе компьютера кинодокументов в совокупности с поисковыми возможностями БД, уже можно будет говорить о качественно иных, более высоких возможностях использования архивных кинодокументов и о БД как полноценной замене традиционных кинокаталогов. С учетом особенностей носителя подобная перспектива реальна, в первую очередь для видеодокументов. Но прежде чем приступить к реализации этой программы, необходимо определиться с выбором формата, в котором изображения кинодокументов должны быть записаны и быть доступными с помощью Интернета.

Но в этой БД заложены и серьезные недостатки, которые не всегда, к сожалению, возможно исправить. Когда был получен грант на проведение работ по созданию электронной версии кинокаталога, то, естественно, были определены сроки, в течение которых необходимо было выполнить оговоренные грантом объемы описаний кинодокументов. Естественное желание быстрее воплотить в жизнь долгожданный проект, а также желание быстрее «освоить» выделенные деньги привели к тому, что к выполнению работ по описанию съемок кинодокументов были привлечены не только архивисты, но и сторонние люди, в большинстве своем студенты.

Это было ошибкой, которая привела к тому, что большое количество описаний вызывает сейчас законную критику со стороны всех, кто обращается к БД. Конечно, редактирование описаний проводилось как в период работ по гранту, так осуществляется и сейчас, уже в плановом порядке, но БД велика, постоянно пополняется новыми описаниями, и работа по редактированию ранее введенных описаний займет еще немало времени и сил. Это желание быстрее описать весь массив хранящихся в архиве кинодокументов послужило причиной принятия, наперекор возражениям архивных специалистов, волевого решения, определяющего методику, по которой на кинодокумент составлялась обобщенная аннотация, в независимости от количества частей (коробок) в каждой единице учета кинодокумента.

Не сразу удалось добиться отмены подобной методики, хоть и значительно ускоряющей описание кинодокументов, но приводящей к тому, что исследователи, найдя необходимую информацию в БД, вынуждены заказывать из архивного хранилища все части (коробки) кинодокумента или же предварительно просматривать монтажные листы с описями съемок этого кинодокумента. В любом случае - это или дополнительная работа для сотрудников архивохранилищ по подбору и доставке кинодокументов, или непроизводительная трата времени заказчика. Естественно, такие описания вызывают справедливые нарекания со стороны заказчиков, поэтому перед специалистами архива стоит теперь задача повторного описания этого, к сожалению, немалого массива ранее уже описанных кинодокументов. В перспективе необходимо будет снабжать эти описания оцифрованными изображениями кинодокументов, но это пока слишком дорого для нас. Хотя с учетом особенностей носителя подобная перспектива вполне реальна для видеодокументов.

Опыт эксплуатации в течение уже нескольких лет электронной версии кинокаталога дает основание сделать следующие выводы о достоинствах и недостатках этой оригинальной программы, разработанной российской фирмой «Киком». К достоинствам ее можно отнести небольшие размеры (около 12 Мб программного обеспечения), «дружественный» интерфейс, простоту работы с ней как для архивистов, работающих по описанию кинодокументов, так и для пользователей архивной информации. В то же время, эта простота осложняет работу по поиску необходимой информации в том случае, если запрос изначально не может быть конкретизирован и требуется предварительная тематическая выборка описаний.

Такая возможность в БД есть: при описании кинодокумента в соответствующей графе делается запись (при необходимости - не одна) о тематической принадлежности киносъемок. Терминология тем разработана на основе «Схемы единой классификации документной информации в систематических каталогах государственных архивов СССР» (М., 1978), но представляет собой значительно более сжатый, обобщенный перечень тем без индексов. Тематическая принадлежность съемок (в независимости от их количества) заполняется архивистом в одной графе. Разные темы разделяются точками. В ту же графу при необходимости заносятся ключевые слова, характеризующие понятия, не нашедшие отражения в тексте аннотации. Поиск возможен как отдельно по графам «Название», «Ключевые слова», «Аннотация», так и по запросу в графе редактора поиска, объединяющей эти три графы. Это достаточно удобно и эффективно, но предполагает, в случае необходимости тематической выборки, знания формулировок тем. В читальном зале сотрудник архива может подсказать заказчику, как сформулировать необходимый тематический запрос. У пользователя архивной информации, работающего по ее поиску в Интернете, такой возможности нет. Поэтому нет ничего удивительного в том, что, как показывает практика, большинство работающих с этой БД не могут правильно сформулировать тематический запрос и предпочитают осуществлять простой контекстный поиск.

Архитектура БД не предполагает жестко организованных справочников тем, персоналий, географических названий, ключевых слов, которые можно было бы самостоятельно пополнять и редактировать. Возможность только поединичного редактирования текста описаний не является оптимальным решением проблемы - и при редактуре можно пропустить ошибки в написании фамилий, терминов и географических названий, что может сказаться на результатах поиска необходимой информации.

Что касается фотодокументов, то программа, с помощью которой велась с 1991 г. работа по их описанию, и на соответствующих тому времени компьютерах, конечно, физически и морально устарела к настоящему времени и уже не отвечала сегодняшним требованиям. Поэтому, когда была внедрена БД кинодокументов, перед архивом встала дилемма: или обновить парк купленных в начале 90-х гг. компьютеров Apple Macintoch, купить новую, современную версию программы 4 th Dimension Runtime (она существует и сейчас) и продолжить ведение этой БД, или же с учетом того, что в настоящее время подавляющее большинство в архиве компьютеров были уже IBM-совместимые, на них разместить новую программу, но при этом попытаться сконвертировать «макинтошевскую» БД под нее. Нами был выбран второй путь, хотя более рискованный, но более оправданный в смысле унификации компьютерного парка в рамках всего архива.

В 2003 г. при финансовой поддержке фонда Форда РГАКФД и С.-Петербургская фирма «Альт-Информ» заключили договор о разработке и внедрении новой БД фотодокументов. Помимо разработки программно-информационного комплекса ИКАР (на основе СУБД Oracle), «Альт-Информ» бралась осуществить конвертацию текстовых описаний и изображений каталога фотодокументов из существующей БД Macintosh в ИКАР, при этом должна была осуществиться привязка к тематическому рубрикатору, справочнику персоналий, другим информационно-справочным ресурсам. ИКАР является сетевой программой, поэтому был осуществлен монтаж локальной вычислительной сети, приобретен WEB-сервер, и архивом было куплено право использования комплекса ИКАР на 12 рабочих местах. Было также оборудовано рабочее место с цифровой фотокамерой для оцифровывания фотоснимков в альбомах.

В 2004 г. началась работа по описанию фотодокументов для БД ИКАР с одновременным снабжением этих описаний отсканированными изображениями фотодокументов. Параллельно, компанией «Альт-Информ» была проведена успешная конвертация «макинтошевской» БД фотодокументов под программу ИКАР. К настоящему времени БД фотодокументов уже содержит почти 96.000 описаний с изображениями (в их числе - конвертированные 55.000 описаний и 12.000 изображений).

Уже сейчас можно сказать, что достаточно рискованное решение о конвертации «макинтошевской» БД фотодокументов себя оправдало, и архив располагает теперь современной, удобной в эксплуатации БД.

Программа с самого начала разрабатывалась с таким расчетом, чтобы исключить дублирующие операции в описании фотодокументов на протяжении всего пути прохождения их в архиве с момента отбора на хранение в процессе комплектования, присвоения им учетных данных, описания в учетных книгах, каталогизации и ведения БД технического состояния в целях их технического контроля и сроков проведения реставрацион-но-профилактических мероприятий.

Программно-информационный комплекс ИКАР позволил по-новому организовать работу с фотодокументами: в отделе комплектования описываются в БД содержание фотодокументов, место и даты их съемок, источник комплектования и авторство, на основе этих описаний программа формирует и распечатывает акты приема-передачи, протоколы Экспертно-проверочной комиссии. Далее в отделе обеспечения сохранности эти описания редактируются, им присваиваются архивные учетные номера и распечатываются (в двух экземплярах) книги учета и описания. На заключительном этапе в отделе научно-справочного аппарата (НСА) описания фотодокументов пополняются данными тематического свойства (рубриками и подрубриками), а также данными для именного справочника. После этого на принтере распечатываются каталожные карточки для систематического и именного каталогов. Параллельно отдел технического контроля пополняет базу данными технического состояния, позволяющими контролировать порядок и сроки проведения рестав-рационно-профилактических мероприятий. Такова теперь схема прохождения фотодокументов от момента приема их на государственное хранение до их размещения в архивохранилище и их описания не только в БД, но и в каталогах. Наличие локальной сети позволяет все эти операции осуществлять оперативно, с возможной информативной полнотой и надлежащим качеством.

Хотелось бы остановиться на некоторых характеристиках программно-информационного комплекса ИКАР в рамках, касающихся компетенции отдела НСА, который, как отмечалось выше, теперь только пополняет описания фотодокументов данными тематического свойства (рубриками и подрубриками), а также данными для именного справочника и распечатывает формируемые программой каталожные карточки для систематического и именного каталогов. Но это не значит, что у отдела стало меньше работы - она стала несколько другой. Если отпала необходимость в составлении аннотации на фотодокумент, заполнении его учетных данных, то сохранилась обязанность его индексации в соответствии со «Схемой единой классификации документной информации в систематических каталогах государственных архивов СССР» (М., 1978) и добавилась необходимость формирования в БД справочника персоналий. Отдел также осуществляет редактирование данных во всех справочниках БД.

Выше уже говорилось о методике ведения БД о составе и содержании кинодокументов: помимо учетных данных в этой БД заполняется графа «Аннотация», содержащая описание содержания киносъемок, и графа «Ключевые слова», в которой печатаются термины тематической принадлежности съемок, а также ключевые слова, дополняющие возможности контекстного поиска по тексту»Аннотации».

В БД ИКАР информация о содержании фотодокументов пополняется с помощью системы справочников, которые дают возможность в процессе работы выбирать необходимую информацию из ранее сформированных списков и при необходимости пополнять и редактировать их.

Прежде всего речь идет о графах «Рубрики, индексы» и «Темы», которые дают возможность на основе «Схемы единой классификации документной информации в систематических каталогах государственных архивов СССР» осуществлять тематическую принадлежность содержания фотодокументов (количество рубрик и тем не ограничено). По «умолчанию» в этих справочниках уже занесены индексы, наименование рубрик и подрубрик, поэтому при описании фотодокумента необходимо только грамотно выбрать из предлагаемого списка нужные. При распечатке каталожных карточек эти данные будут напечатаны в виде привычных архивистам буквенно-цифровых индексов и с наименованиями рубрик и подрубрик в соответствии со «Схемой единой классификации...».

В настоящее время в архивной отрасли готовится новый «Единый классификатор документной информации Архивного фонда России (Отделы. Подотделы. Разделы. Подразделы)» -(ЕКДИ), в котором уже нет буквенно-цифровых индексов, а только цифровые, и который ориентирован для «эффективного поиска и использования документов АФ РФ, внедрения автоматизированных архивных технологий, информатизации архивной отрасли, формирования единого архивного информационного пространства». В случае его принятия не составит большого труда заменить в справочнике нашей БД фотодокументов термины одного классификатора на новые. При этом, видимо, придется применять ЕКДИ в обобщенном (из-за его размеров - несколько сот страниц) варианте. Но если справочник «Рубрики, индексы» четко структурирован и только изредка, при необходимости, пополняется новыми индексами и понятиями, то справочник «Персоны» уже на сегодняшний день содержит около 16.000 фамилий и имен (на почти 96.000 описаний фотодокументов).

В архиве ранее существовал перечень признаков, в соответствии с которыми на те или иные персоналии составлялись или нет каталожные карточки для именных каталогов (как для кинокаталога, так и для фотокаталога). Опыт показывает, что это приводит к потере информации, так как не всегда есть возможность объективно оценить на данный момент историческую значимость того или иного лица. Поэтому было принято решение, в соответствии с которым все имеющиеся в распоряжении архивиста фамилии заносятся в именной справочник. При этом в справочник «Персоны» заносятся следующие данные: фамилия, имя, отчество, годы жизни, биография, псевдоним (при необходимости), страна (для иностранных граждан). Имя и отчество желательно писать полностью, так как существует большое количество однофамильцев - например, в РГАКФД есть описания полных однофамильцев - Героев Советского Союза!
Биографическими данными не следует «увлекаться», так как именная каталожная карточка, формируемая программой для распечатки, включает данные этой графы справочника в текст (т.е. чем больше текст биографических данных, тем меньше остается места для иной информации на бланке каталожной карточки) - достаточно основных понятий, характеризующих статут персоны, а конкретные данные биографии на момент съемки лучше включать в текст аннотации. Но заполнять данные биографии следует в любом случае, чтобы потом в справочнике отличить «Иванова - рабочего» от «Иванова -колхозника».

Программа БД организована так, что в соответствии с архивными требованиями распечатываются именные карточки на иностранных граждан, где в «шапке» представлено наименование государства, гражданами которого они являются. Подобная методика описания персоналий конечно требует в отличие от традиционных технологий больших трудовых затрат, но зато значительно повышает информативные возможности БД.

Схожая методика пополнения, впрочем более простая, характерна для ведения и других справочников БД: источник поступления, авторы съемки, страна съемки, место съемки, персоны съемки. Некоторыми отличиями обладает справочник «Место съемки», в котором географические понятия структурируются по принципу от «крупного к мелкому» и где группами являются наименования областей, национальных объединений в рамках страны, а внутри групп - географические понятия в последовательности: «район», «город», «село» или «деревня» (или иное). Важным достоинством справочников в программно-информационном комплексе ИКАР является возможность их самостоятельного, вне описаний фотодокументов, просмотра и редактирования, с целью исключения ошибок, повторов и т.п. Особенно это важно в отношении справочников «Персоны» и «Место съемки». Подобная работа должна изначально планироваться и регулярно осуществляться по всему комплексу справочников.

Удобным также представляется и возможность поиска необходимой информации с помощью не только «Редактора поиска» БД, но и самостоятельных «Редакторов поиска» в каждом из справочников. Особенно это удобно при поиске необходимой персоны, так как справочник персон дает возможность просмотра списка фамилий целиком на предмет поиска подобия или отличия в написании тех или иных фамилий.

Подводя итог 15-летнего опыта эксплуатации различных БД, можно сделать следующие выводы:

1)    важна роль заказчика программного обеспечения в процессе разработки технического задания и в начальный период опытной эксплуатации - желателен опыт работы с БД, чтобы предметно обосновывать требования к программистам; программы должны быть не только надежными и быстрыми, но и функционально удобными для сотрудников, работающих с ними;

2)    необходим комплексный подход к решению проблем: программное обеспечение должно разрабатываться не только для облегчения текущей работы, но и с прицелом «на перспективу», а также в процессе эксплуатации должно иметь возможность корректироваться;

3)    информация БД должна регулярно редактироваться, технологичности этой работы следует уделять при разработке технического задания программы не меньше внимания, чем технологии ввода информации. В нашем случае представляется, что система справочников в программно-информационном комплексе ИКАР и их форма оптимальна на обозримую перспективу;

4)    с внедрением компьютерных технологий значительно повысились информационные возможности архива (в том числе с помощью размещения в Интернете). В то же время, с учетом того, что продолжается ведение традиционных карточных каталогов, не произошло существенного снижения трудовых и материальных затрат (в нашем случае - при описании фото- документов), или же они даже существенно повысились при описании кинодокументов. С учетом малых людских и финансовых средств архива подобная ситуация только усугубляет ситуацию с темпами обработки поступающих на хранение в архив документов. Выход из этой ситуации - отказ от практики параллельного ведения компьютерных БД и традиционных карточных каталогов;

5)    с учетом того, что размещение документов в Интернете считается публикацией и подпадает под закон «Об авторском и других смежных правах» (в нашем случае это в первую очередь касается фотодокументов), следует предусмотреть или возможность программными средствами ограничить доступ к определенным документам, или же не размещать их в Интернете до истечения ограничительного срока, при этом качество изображений в размещенной в Интернете БД не должно быть высоким, чтобы исключить несанкционированное использование изображений фотодокументов в полиграфических целях;

6)    представляется желательным иметь в архиве цифровые копии фотодокументов с высоким разрешением, которые несли бы функцию страховых копий фотодокументов, а также позволяли бы, например, изготавливать по заказу на специализированных принтерах фотоотпечатки на фотобумаге или же предоставлять заказчикам копии на цифровых носителях для полиграфических нужд. Это может быть особенно удобно при предоставлении копий цветных фотодокументов, так как процесс изготовления их традиционным фотохимическим способом трудоемок и дорог, и, например, в РГАКФД не осуществляется. Но это предполагает узаконивание самого понятия страховой цифровой копии документа. Следует также иметь в виду, что уже появились аудиовизуальные документы, изначально изготовленные на цифровых носителях, и все большее количество издательств, газет и журналов работают с фотографиями, снятыми цифровыми камерами. Соответственно и архивы уже ими комплектуются. При наличии у архива денег (и, к сожалению, немалых) можно, конечно, приобрести соответствующую технику и осуществлять вывод цифровых документов на 35-мм пленку и хранить эти пленки как страховые копии, но мне представляется это лишь данью традиции материальности, в физическом смысле, документов. Правда, в РГАКФД подобная технология применяется, но только для осуществления компьютерной реставрации изображений фотодокументов;

7) при разработке программного обеспечения БД также желательно предусматривать возможность и пути их адаптации в будущем к новому программному обеспечению и новому компьютерному «железу» - с подобной проблемой мы впервые столкнулись после того, как был ликвидирован бывший кинофото-фоноархив Российской Федерации в г. Владимире и нам были переданы как кинофотодокументы, так и НСА к ним, который включал и БД на кинофотодокументы, предназначенные для эксплуатации на 286-х моделях компьютеров - ни на чем ином эти БД работать не желали.

Безусловно, внедрение компьютерных технологий повышает привлекательность архивного труда, но одновременно увеличивает опасность того, что такой подготовленный специалист с большей легкостью найдет себе применение в смежных отраслях, где ему могут предложить совсем другую оплату за свой труд.

Повышение требований к качеству и уровню программного обеспечения и компьютерного оборудования также требует и значительно более квалифицированного обслуживания соответствующими специалистами, для оплаты труда которых требуются совершенно другие средства, чем те, которыми сейчас располагают архивы. Решение этих кадровых проблем все больше будет выходить на передний план в деятельности архивов, и решение их невозможно без соответствующего участия государства.