| 06 Января 2017
Е.А. ВОЛКОВ, г. Москва, Российская Федерация
ОПЫТ И ПРАКТИКА УСПЕШНОГО СОЗДАНИЯ ЦИФРОВЫХ АРХИВОВ ДЛЯ ХРАНЕНИЯ АУДИОВИЗУАЛЬНОГО КОНТЕНТА
Аннотация
В статье рассматривается опыт создания и развития цифровых архивов и библиотек. Традиционно многие архивы учитывают только носители, то есть исходные материалы и их копии. При переходе в цифровую форму, кажется, что мы получаем ещё одну копию. Но свойства файлов уже по сути отличаются от традиционных носителей. Грубо говоря, файл становится менее «материальным». Разумеется, можно придать ему форму традиционных носителей (скопировать на диск и сложить на полку, например), но в этом варианте попросту теряются почти все те достоинства, которые несёт в себе перевод в цифровую форму. При создании электронного архива появляются средства работы с медиафайлами и избежать появления еще одной базы данных – оцифрованных материалов, в большинстве случаев невозможно. При этом, как говорилось ранее, первичной становится единица медиаконтента (произведение в том или ином виде) и создаваемая база данных также становится основной по мере проведения оцифровки.
Ключевые слова
Цифровой архив, цифровая библиотека, процесс оцифровки, медиафайл, медиаконтент.
Компания «Умный архив» – это команда специалистов с уникальным опытом по созданию и развитию цифровых архивов и библиотек. Сотрудники компании занимали ключевые позиции при создании крупнейших проектов федерального масштаба (суммарно более двух миллионов единиц контента), на всех стадиях: проектирования, реализации, развития и поддержки.
По нашему опыту, любой отдельно взятый архив, несмотря на то, что существует единый для всех Федеральный закон от 22.10.2004 г. № 125-ФЗ «Об архивном деле в Российской Федерации», имеет свою уникальную специфику. Можно с уверенностью сказать о том, что нет универсальных программных продуктов, типовых рабочих процессов, которые можно использовать массово и везде. Тем не менее, при обширном опыте можно выделить некоторые общие проблемы и рецепты их решения. В данном докладе мы хотели бы затронуть небольшую часть из них.
Итак, организация (или архивное подразделение внутри неё) приняла некоторые реальные шаги по переходу в «цифру». В этот момент оказывается, что в самом начале процесса требуется разрешить множество неочевидных проблем и принять множество сложных решений, которые будут определять жизнь цифрового архива в дальнейшем.
Традиционно многие архивы учитывают только носители, то есть исходные материалы и их копии. При переходе в цифровую форму, кажется, что мы получаем ещё одну копию. Но свойства файлов уже по сути отличаются от традиционных носителей. Грубо говоря, файл становится менее «материальным». Разумеется, можно придать ему форму традиционных носителей (скопировать на диск и сложить на полку, например), но в этом варианте попросту теряются почти все те достоинства, которые несёт в себе перевод в цифровую форму.
С того момента, как файл оказывается в цифровом хранилище, понятие носителя нивелируется. Полностью идентичная копия может быть сделана в течении нескольких минут, перенесена в другую систему хранения данных, передана по сети в виде файла или потока, причём всё это может быть сделано одновременно и в автоматическом режиме, без участия человека и даже без носителей в их традиционном понимании. Принимая это свойство, можно сказать, что первичной в цифровом архиве становится единица медиаконтента. Однако же и работа с носителями никуда не уходит. Речь идёт об оригиналах, об исходниках. С ними также по-прежнему должна проводиться работа, у файлов остаётся привязка к исходным носителям. С точки зрения работы с контентом на первый план выходят цифровые копии (файлы), в то время как основная работа по учёту и сохранности архивных фондов проводится с оригинальными носителями.
И в этот момент возникает дилемма. Существует программное обеспечение, которое хорошо решает задачи учёта, поддерживает регламенты и рабочие процессы по работе с физическими объектами. Существует программное обеспечение, которое отлично работает с медиаактивами, как с файлами (MAM – media asset management). Существует программное обеспечение, которое прекрасно поддерживает описательную часть (метаданные). Есть огромное количество систем документооборота.
В целом, можно отметить, что ещё несколько лет назад ниша систем, рассчитанных на архивы, а тем более, на архивы, находящиеся в процессе оцифровки, пустовала.
Прогресс не отменить и во всех без исключения архивах уже установлены компьютеры и используются электронные базы данных, которые используются для учёта или описания. Средства их реализации самые разнообразные, от текстовых файлов, до программных платформ с СУБД корпоративного уровня. Выбор инструментов, как правило, является стохастическим. У кого-то инициативный сотрудник, использующий знакомую технологию, где-то уже присутствует система для других целей и база данных выстраивается на её основе.
При создании электронного архива, появляются средства работы с медиафайлами и избежать появления ещё одной базы данных – оцифрованных материалов, в большинстве случаев невозможно. При этом, как говорилось ранее, первичной становится единица медиаконтента (произведение в том или ином виде) и создаваемая база данных, также становится основной по мере проведения оцифровки. В дальнейшем, конечно, можно оставить несколько баз данных, организовав обмен между ними. Обмен же возможен либо в ручном режиме, либо с использованием некоторой общей шины данных. Если говорить о ручной работе, то здесь всё более или менее понятно – это неудобно, долго, с ошибками. Что же касается, общей шины, то для её организации необходимо стандартизовать обмен данными, упорядочить их, привести в соответствие между собой. Но при этом, всё равно остаётся задачи поддержки нескольких разнородных систем.
Также, если говорить об объединении данных, то здесь появляется ещё один огромный плюс – это своего рода инвентаризация, которая наряду с оцифровкой позволяет получить объективную картину по состоянию фондовых материалов.
Наш опыт показывает, что при создании электронного архива, наилучшим вариантом является создание единой базы данных, в которую включены, как носители, так и произведения, образующие связи между собой.
С электронной системой работают люди. Очень редкие сотрудники сразу и безоговорочно приветствуют нововведения. И если говорить об оцифровке, консолидации данных и т.п., то это задачи технологические и решаются инженерами и программистами. Также, существует распространённое и небезосновательное мнение, что технарей мало заботит удобство пользователей. Из нашей практики мы можем заявить, что наибольшие требования с точки зрения пользователей, предъявляются именно к интерфейсу. Цвет, расположение элементов, группировка их, отображение, шрифты. На разных мониторах, в разных средах, на разных типах устройств. Кроме того, не стоит забывать о том, что этой системой будут пользоваться не только сотрудники архивов, но и посетители, как в читальном зале, так и через интернет.
Хорошо спроектированный интерфейс является необходимым условием успешного внедрения новых систем.
Всё вышеуказанное составляет лишь малую часть сложностей, возникающих в процессе перевода архивов и библиотек в цифровую форму. Но при этом хотелось бы отметить следующее. Когда говорят «цифровой архив», то прежде всего подразумевают файлы, системы хранения, серверы, инфраструктуру. Однако, никогда не стоит ставить технологические вопросы во главу. Например, оцифровка, по сути, самое простое. Да, это дорого, долго, но это рутинная и простая операция, которая может быть отдана на аутсорс специализированным компаниям.
При переходе в цифру, прежде всего необходимо понимание, что сущность архива меняется, а точнее говоря, он приобретает значение именно «архива». Хранение исходных носителей, конечно, не теряет своей важности, но их утрата уже не является однозначной и полной утратой информации.
При этом у архива появляется другой важный, пожалуй, даже важнейший функционал – обработка информации и доступ к ней. Разумеется, эти функции в том или ином виде присутствуют в любых архивах (выдача документов историкам и населению, работа архивариусов, как исследователей).
Таким образом, при переходе в цифровую форму, важно понимать, что это не переход на другие носители (в данном случае, системы хранения и ленточные библиотеки), а переход в новую концепцию, смена парадигмы.
Сведения об авторе
Волков Евгений Александрович, технический директор компании «Умный архив», Российская Федерация, г. Москва, evolkov@archive.systems, 8 (910) 467-49-65