ВНЕДРЕНИЕ КОМПЛЕКСА ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В ЦЕНТРАЛЬНОМ ГОСУДАРСТВЕННОМ АРХИВЕ КИНОФОТОДОКУМЕНТОВ РЕСПУБЛИКИ КАЗАХСТАН
| 29 Января 2017
А.Ф. СЕИТОВА, г. Алматы, Республика Казахстан
ВНЕДРЕНИЕ КОМПЛЕКСА ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В ЦЕНТРАЛЬНОМ ГОСУДАРСТВЕННОМ АРХИВЕ КИНОФОТОДОКУМЕНТОВ РЕСПУБЛИКИ КАЗАХСТАН
Аннотация
Статья освещает опыт работы Центрального государственного архива кинофотодокументов Республики Казахстан по подготовке аудиовизуальных документов к переводу на современные носители, их оцифровке путем сканирования (кинофотодокументов) и перезаписи (фонодокументов), созданию программного комплекса, позволяющего производить поисковую работу по любому из видов документов по основным метаданным, имея возможность получения текстовой информации искомого документа и его непосредственного просмотра и/или прослушивания.
Ключевые слова
Центральный государственный архив кинофотодокументов Республики Казахстан, аудиовизуальные документы, обеспечение сохранности документов, оцифровка документов
Архив кинофотодокументов Казахстана осознает важность разрешения проблемы представления аудиовизуальных документов в глобальном масштабе. Известно, что аудиовизуальный документ содержащие изобразительную и (или) звуковую информацию, воспроизведение которой требует применения соответствующего оборудования. Развитие высоких технологий диктует необходимость совершенствования форм использования аудиовизуальных документов. Узнаваемой приметой времени стало – представление ретроспективной аудиовизуальной информации в Интернете, социальных сетях, даже в инстаграм, на популярных в республике веб-порталах «History», «Voxpopuli.kz», «Tengrinews», «NUR.KZ», «Zakon.kz», «bmtv.kz» (портал «Бiлiм және мәдениет» – «Знание и культура»), информационном агентстве «KazakhstanToday», на многочисленных сайтах и страницах электронных газет (напр., «OurLife» и журналов типа «Vласть». Но прежде, чем представить аудиовизуальный документ в формате широкого доступа, первоочередной задачей архива является решение вопроса о физической сохранности оригиналов. Необходимо проведение комплекса традиционных видов работ, в составе которых: консервационно-профилактическая обработка всех видов документов, включающая периодическую проверку состояния кинофотофонодокументов архивного фонда (контроль физико-химического состояния оригиналов, обеспыливание, реставрация, ручная чистка спиртом, чистка с помощью ультразвуковой установки с использованием сольвента 3 М Novac 8200для кинодокументов). Все вышеперечисленные виды работ обеспечивают подготовку аудиовизуальных документов к переводу на современные носители, в нашем случае – оцифровку путем сканирования (кинофотодокументов) и перезаписи (фонодокументов). Достижения архива в деле обеспечения сохранности аудиовизуальных документов напрямую связаны с возможностью оперативного предоставления исследователям аудиовизуальной ретроспективной информации.
Аудиовизуальные архивы, по определению, технические архивы, на каждом участке от стадии приема документов на государственное хранение до предоставления информации исследователям, архиву необходимо специальное оборудование, отвечающее современным требованиям.
Фонодокументы на магнитной пленке и граммофонные пластинки – тот вид аудиовизуальных документов, которые архиву в первую очередь необходимо было сохранить и перевести на современные носители. Это связано с техническим состоянием девятимиллиметровой магнитной пленки (жизненный цикл такой пленки – 15-25 лет, а в фондах архива хранится масса фонодокументов 60-летней давности). Эти документы подвержены серьезным временным изменениям (физическим и химическим), зачастую на грани исчезновения. Часть их была не востребована по причине невозможности прослушать звукозапись на оборудовании, которого уже нет (граммофоны, проигрыватели, магнитофоны для катушечных кассет 4, 9 скорости записи). Таким образом, 20 лет назад мы впервые столкнулись с проблемой обратной совместимости: сохранив оригиналы на пленочных и иных традиционных носителях, архив со временем лишился бы возможности предоставить документы пользователям, если бы своевременно не начал работу по переводу этих документов на современные носители. Итог: в настоящее время оцифровано и сохранено на современных носителях 90 % фонодокументов архивного фонда.
Что же касается фотофонда, самого многочисленного по составу и богатого по содержанию, то работу по оцифровке богатейшего собрания фотодокументов по истории Казахстана архив осуществляет уже около 20 лет. Оборудование, которым располагает архив, позволило оцифровать все негативы на стеклянных пластинах (в фондах архива их более 15 тыс. единиц хранения) и значительную часть особо ценных фотодокументов.
Оснащенность оборудованием для перевода кинодокументов на современные носители долгое время не соответствовала потребностям архива. Тем не менее, мы стремились делать все от нас зависящее, чтобы обеспечить сохранность оригиналов кинодокументов на 35-мм пленке, О сохранении и переводе на современные носители кинодокументов на 16 мм и 8 мм пленке в связи с отсутствием соответствующего оборудования не было и речи. Еще 15 лет назад единственной возможностью оцифровки кинодокументов была прямая перезапись с киноэкрана видеокамерами стандарта BetacamSP и miniDV и простой нелинейный монтаж. Долгое время архив настойчиво добивался возможности приобретения оборудования для профессиональной оцифровки кинодокументов, последующей их реставрации, обработки и монтажа цифровых копий. В 2012 г. архив приобрел не только комплекс оборудования по оцифровке кинодокументов (пленка, 35 мм, 16 мм), но и ультразвуковую установку для чистки машинным способом оригиналов кинодокументов для подготовки к оцифровке и консервации (для последующего долгосрочного хранения). Оцифрованные копии кино- и видеодокументов сохраняются в формате FullHD с размером изображения 1920 на 1080 пикселей и помещаются в серверы долгосрочного хранения. Таким образом, исключается последующее использование оригинала кинодокументов. В дальнейшей работе используются только цифровые копии. Оборудование позволяет выполнять следующие виды работ:
– на фильмопроверочных и звукомонтажных столах производится проверка технического состояния, мелкая реставрация, замена ракордов кинодокументов, подготавливаемых к чистке. Новое оборудование позволяет работать с кинодокументами как на 35мм пленке, так и на 16мм, тогда как до сего времени кинодокументы на 16 мм пленке лежали на архивных полках «мертвым грузом» из-за отсутствия соответствующего оборудования. А ведь зачастую содержание этих документов просто уникально;
– подготовленные кинодокументы проходят процесс очистки на установке «UltraClean» (с использование безопасного реагента 3 М Novac 8200, который в отличии от стандартного перхлорэтилена не причиняет вреда ни человеку, ни окружающей среде);
– только прошедшая очистку пленка может быть допущена к сканированию (оцифровке). Теперь архив может оцифровывать широкоформатные фильмы, несинхронные кинодокументы, кинодокументы, не имеющие позитивной копии при наличии негатива изображения и негатива фонограммы (и все это относится как к 35мм, так и 16мм пленке);
– в процессе сканирования на станции оцифровки оператором производится коррекция цвета, света, яркости и контрастности изображения; поступающий со сканера цифровой видеопоток автоматически очищается корректором видеошума от таких дефектов, как пылинки, царапины и мелкие тактильные повреждения;
– сканируемые кинодокументы сохраняются на сервере временного хранения и затем переносятся в роботизированное хранилище на долгосрочное хранение (срок хранения – до 30 лет);
– сохраненные цифровые копии документов могут быть использованы архивом в любой форме, затребованной потребителем ретроспективной аудиовизуальной информации (предоставление копий, монтаж, конвертация в любой затребованный видеоформат и кодировку (mpg 2, DVD, JPEG 2000 и др.).
В результате проведения вышеописанного комплекса работ архив хранит цифровые копии аудиовизуальных документов со следующими параметрами: фото: разрешение – 4 тыс. точек на квадратный дюйм, формат TIF; фоно: частота дискретизации от 48 тыс.герц, глубина 8 бит, формат wav (без компрессии); видео: разрешение 1920 на 1080 (FULLHD) - АVI (кодек JPEG2000 или MPEG2). Следует подчеркнуть, что при современном уровне оснащения, архив имеет технические возможности, соответствующие уровню мировых стандартов.
В настоящее время в оборот архивной терминологии активно внедряется понятие «аудиовизуальный электронный документ», под которым понимаются электронные документы, содержащие аудиовизуальную информацию. В связи с этим, надо обратить внимание на то, что во время оцифровки нами создается вторая уменьшенная цифровая копия документа. Для чего? Отвечаем: учитывая огромные объемы хранимой архивом информации, ни один, самый информативный аудиовизуальный документ, не может быть найден без подробной сопроводительной текстовой информации. Именно поэтому архивом был разработан информационно-поисковый программный комплекс по каждому виду хранимых документов (кино-, фото-, фонодокументы архивного фонда). К каждому документу привязывается вышеназванная вторая уменьшенная цифровая копия.
За годы поисков мы испробовали многие технологии по созданию СУБД (системы управления базами данных (СУБД). Это были и локальные программы, работающие только на одном компьютере, и программы, использующие базу данных локальной сети, размещенную на удаленном компьютере. Но в итоге остановились на технологии, использующей все преимущества глобальной сетевой работы – WEB-технологии. Ее преимущества: 1) возможность работы в любой как локальной, так и глобальной сети (операторы имеют возможность заполнения, введения информации, размещения, наполненияе информационно-поискового программного комплекса); 2) глобальный доступ к поиску документов как со стороны операторов (расширенный доступ), так и со стороны исследователей; 3) глобальная популяризация содержания аудиовизуальных документов архивного фонда по всему миру. В этой технологии есть, на наш взгляд, только один недостаток: это потенциальная возможность хакерской атаки, взлома и извлечения информации. Но, во-первых, мы следуем здесь принципу «Открытому обществу – открытые архивы», информация о содержании документов архивного фонда и так является общедоступной; во-вторых, мы используем основные общепринятые методы для защиты интеллектуальной собственности государства, к которой относится информация, содержащаяся в архивных документах (п. 1, ст.15, гл. 4 «Закона о Национальном архивном фонде и архивах»).
Данный программный комплекс размещен на сайте архива www.kfdz.kz. На данном этапе задачи, стоявшие перед архивом, выполняются. Вот уже 11 лет архив занимается наполнением базы данных программного комплекса метаданными по всем видам аудиовизуальных документов архивного фонда. За это время было размещено: фонодокументов – 18300 ед. учета, что составляет 95% от общего объема фонда; фотодокументов – 17082 ед. учета, что составляет 10% от общего объема фонда; кинодокументов – 4536 ед.учета, что составляет 80% от общего объема архивного фонда (без учета видеодокументов).
На сегодняшний день оцифровано и привязано к метаданным программного комплекса: - фонодокументов – 6 600 ед, хр. фотодокументов – 40 664 ед. учета; кинодокументов – 3 364 ед. хр.
Программный комплекс позволяет производить поисковую работу по любому из видов документов по основным метаданным. В результате мы получаем не только текстовую информацию по искомому документу, но и возможность просмотра и/или прослушивания самого документа.
К сожалению, кинодокументы для глобального доступа не предоставляются из-за ограничений нашего Интернет-канала, но такая возможность существует: зайдя на сайт по локальной сети архива, пользователь имеет возможность просмотра любого размещенного на сайте кинодокумента. Немаловажно, что тайм-код искомого (найденного) документа на 100% соответствует цифровой копии документа, пользователь прямо на сайте может производить необходимую ему «раскадровку».
Размещенные на сайте цифровые копии документов защищены следующим образом: фотодокументы – при размещении на сайте формат уменьшается до 800 на 600 пикселей, на изображение накладывается водяной знак с названием архива, в тело файла встраивается название архива и архивный номер документа; фонодокументы – при размещении на сайте документ кодируется в формат MP3 (битрейт сокращается до 32 клбт в секунду), время звучания сокращается до 20 сек.; кинодокументы – перед размещением на сайте цифровой оригинал перекодируется в формат MPEG4, размер изображения уменьшается до 320 на 240 пикселей, качество звука сокращается до 41 тыс. герц. Предпринятые меры предотвращают «пиратское» (незаконное) использование документов архива.
Предполагая большие объемы размещенния на сайте мультимедийных данных и учитывая, что для их размещения в программном комплексе нужны большие скорости передачи данных, сайт архива изначально размещен внутри и на серверах архива. Это условие всегда будет оставаться однозначным и исключительно приемлемым для данной разработки.
Мы сознаем, что для 100% заполнения информационно-поискового программного комплекса нам необходимо время и человеческие ресурсы, но даже в представленном виде – это прорыв в деле создания единого информационного пространства, к чему все архивисты стремятся в идеале.
Следует отметить, что в рейтинге категории «Государство» сайт архива занимает 18-е место. Виртуальные фотовыставки, созданные на основе мультимедийных данных программного комплекса, пользуются популярностью, вызывают интерес к документам архивного фонда и истории государства. Сайт Центрального государственного архива кинофотодокументов (www.kfdz.kz) – это престиж архива, а всё вышеперечисленное, в особенности – присутствие электронного архива на сайте, дает право называть его полноценным Информационно-поисковым порталом.
Недавно мы пошли дальше: архив начал разработку API – интерфейс прикладного программирования – (удаленных) запросов к сайту. Эта система позволяет осуществлять запросы к метаданным информационно-поискового программного комплекса архива с любого интернет-ресурса. То есть, при наличии у вас сайта вы можете разместить на нем полноценную форму для поиска документов нашего архива, и ваши пользователи даже не будут догадываться, что работают с данными сайта казахстанского архива (ЦГА КФДЗ РК). Эта система позволяет также внедряться в любую глобальную информационно-поисковую интернет-систему. На сайте архива есть раздел «ВЕБ мастеру», там легко получить информацию. Присоединяйтесь к нам! Во всяком случае, нам всем необходимо задуматься о разработке единых стандартов обмена данными наших информационно-поисковых систем.
Не могу не отметить еще одну большую проблему «общемирового масштаба». Оцифровывая документы, мы накапливаем все более огромные объемы данных. Задача состоит в том, чтобы обеспечить их надежное долгосрочное хранение с прямым доступом к оцифрованным копиям аудиовизуальных документов. Однако, решение проблемы долгосрочного хранения больших объемов данных стоит очень дорого, поэтому необходимы совместные поиски путей решения данного вопроса. На сегодняшний день, по нашим сведениям, существуют серверы долгосрочного хранения, позволяющие хранить информацию до 100 лет.
Информационные технологии играют исключительно важную роль в обеспечении информационного взаимодействия между людьми, в системах подготовки и распространения массовой информации, в том числе – ретроспективной аудиовизуальной информации. Эти средства быстро ассимилируются в культуре, снимая многие производственные, социальные и бытовые проблемы, вызываемые процессами глобализации и интеграции мирового сообщества, расширением внутренних и международных экономических и культурных связей, миграцией населения и его все более динамичным перемещением по планете.
Сведения об авторах
Сеитова Алла Федоровна, заслуженный деятель Республики Казахстан, директор Центрального государственного архива кинофотодокументов и звукозаписей, г. Алматы, Республика Казахстан, +7 727 267 14-54