Специальные архивные форматы – это полезный инструмент для обеспечения долговременной сохранности и пригодности к использованию электронных документов, а также для снижения расходов на содержание электронных архивов. Вы узнаете не только о современных проблемах в этой области, но, что особенно ценно, об уже реализованных решениях и наметившихся тенденциях. Перечислены форматы, оптимальные для архивного хранения разных видов информации (текстовой, табличной, графической и т.п.). Рассказывается о применении контейнерных форматов.
Вы сможете взять себе на вооружение программу DROID, способную автоматически идентифицировать форматы передаваемых на хранение документов либо уже хранимых архивом файлов, что позволит выявлять файлы старых форматов, уже требующих обработки. Этой программой пользуются архивы многих стран, вы тоже можете присоединиться к их числу, скачав ее бесплатно.
Все более широкое использование электронных документов и электронных носителей информации в государственном управлении, деловой деятельности и в быту делают неизбежным создание специализированных электронных архивов. В ближайшие годы припозднившаяся с решением этого вопроса Россия начнет в пожарном порядке создавать государственные электронные архивы, а передовые ведомства и организации уже начали заниматься электронной архивацией.
Чтобы обеспечить долговременную сохранность электронных документов и информации, «электронным архивистам» приходится решать разнообразные правовые, организационные и технологических проблемы. При этом приходится учитывать кардинальное изменение ситуации: у электронных архивов нет возможности, как раньше, выждать, пока практика выявит наиболее надежные технологии, им приходится действовать «на опережение», активно взаимодействуя с источниками комплектования и пытаясь повлиять на используемые ими технологии создания и хранения документов.
Электронные документы создаются и существуют в динамичной среде, для которой характерна непрерывная смена технологий. Достаточно типичной является ситуация, когда оставленная «без присмотра» информация уже через 5–10 лет полностью или частично не читается вследствие физического или морального устаревания оборудования, программного обеспечения, носителей информации и/или форматов. Практика показала, что, если не принимать специальных мер, поддержание целостности, аутентичности1 и пригодности к использованию электронных материалов становится чрезмерно трудоемкой и затратной задачей. Одним из широко используемых способов решения проблемы является разработка, регламентация и применение архивных форматов (в том числе и в отсутствие электронных архивов), а для электронного архива выбор политики в отношении форматов является ключевым решением, во многом определяющим его дальнейшую судьбу.
В настоящее время в мире существуют сотни электронных файловых форматов, состав которых постоянно обновляется. Всякий раз, когда появляются новые виды электронных объектов или новые функциональные возможности программного обеспечения, неизбежно приходится создавать новые форматы или их варианты. Длительное время применять стабильные форматы удается лишь в «устоявшихся» областях, таких, например, как подготовка офисных документов.
«Изобилие» форматов осложняет взаимодействие между организациями и между системами внутри одной организации, а также затрудняет обеспечение долговременной сохранности электронных документов. Практика показывает, что если не ограничивать и не контролировать форматы принимаемых на хранение электронных документов, то архивы сталкиваются с рядом серьезных технических, экономических и правовых проблем, в числе которых:
- необходимость регулярного проведения трудоемких и затратных действий по конверсии / миграции, в ходе которых приходится также решать проблему сохранения юридической и доказательной силы документов;
- увеличение расходов на квалифицированный персонал, оборудование, программное обеспечение;
- проблема обеспечения доступности и пригодности к использованию электронных документов.
В настоящее время профильный комитет Международной организации по стандартизации (ИСО) использует следующую терминологию, закрепленную в международном стандарте ISO 30300:2011 (она несколько отличается от ранее применявшейся терминологии стандарта ISO 15489-1:2001, адаптированного у нас как ГОСТ Р ИСО 15489-1-2007 «Управление документами. Общие требования»):
Конверсия – процесс преобразования документов из одного формата в другой. Примеры: сканирование бумажных документов с целью создания электронных графических образов (в форматах TIFF, JPEG и т.п.); преобразование подготовленных в текстовом редакторе материалов в формат PDF; преобразование текстового файла в операционной системе UNIX в текстовой файл операционной системы Microsoft Windows; обновление файлов MS Word версии 1 до версии 2.
Миграция – процесс перемещения документов из одной аппаратной или программной конфигурации в другую без изменения их формата. Примеры: перемещение данных с магнитного диска на магнитную ленту; перенос файлов базы данных из Oracle на SQL Server.
Выбирая форматы, необходимо помнить о проблемах, с которыми может столкнуться организация как в оперативной работе, так и при долговременном хранении электронных документов, и иметь представления о требованиях, которым должны удовлетворять «хорошие» архивные форматы.
Проблемы, возникающие при долговременном хранении электронных документов
При организации хранения электронных документов архивы сталкиваются с рядом проблем. В первую очередь необходимо программное обеспечение, способное работать с соответствующим форматом (в т.ч. с различными его версиями). Однако уже сейчас существует множество устаревших и редких форматов, с которыми современное массовое программное обеспечение корректно работать не умеет. В таких случаях приходится отыскивать и порой приобретать за большие деньги необходимое программное обеспечение и / или оборудование, прибегать к таким методам, как эмуляция2, либо, в наиболее трудных случаях, заказывать разработку нового программного обеспечения, способного читать специфический формат.
Могут возникнуть и правовые проблемы,...