Формат файлов для долгосрочного хранения электронных документов

Опубликовано: 
VI-я Международная научно-практическая конференция "Наука и социальные проблемы общества: информатизация и информационные технологии". Сборник научных трудов. - Харьков: ХНУРЭ. 2011. - 421.с.,сс. 211-212.

Формат файлов для долгосрочного хранения

электронных документов

Мелащенко А.О., Перевозчикова О.Л., Скарлат Е.С.

Институт Кибернетики им. В.М. Глушкова Национальной академии наук Украины

Проспект Академика Глушкова, 40, Киев, 03680 МСП, Украина,  (044) 526-36-03 

E-mail: [email protected]

The implementation details of the file formats are described for the long-term preservation. Considering the analysis of the existing file formats and the main reasonable arguments of expediency of the exertion of PDF/A format for archive preservation of the electronic documents, the basic course of activities are proposed providing the last stage of the documents lifecycle – archival storage.

 

Введение.Традиционные архивные методы (бумага, микрофильмы, микрофиши) гарантируют долгосрочное воспроизведение, но являются устаревшими. Мир информационных технологий пришел к мысли о том, что в документообороте пора перейти к новым, основанным на XML, форматам, доступным мировой общественности, рис.1. Однако внедрение электронного документооборота имеет свои нюансы, связанные с обеспечением жизненного цикла документов, а именно отсутствие инструментария и методологии обеспечения архивного хранения электронных документов. 

Преимущества PDF. Будущее должно видеть заархивированные документы такими, какими видел их автор. Поэтому, мировое архивное сообщество обратилось к Adobe касательно использования PDF [1] для долгосрочного архивного хранения контента, содержащего текст, изображения, векторные и растровые данные.  В основе создания формата файлов PDF лежит концепция «безбумажного офиса». Мобильность и кроссплатформенность формата позволяет организовывать электронный документооборот. Основополагающим аспектом PDF для целей электронного документооборота есть включение механизма электронных подписей для защиты и проверки подлинности документов. Стандарт PDF/A ISO19005 [2] был специально разработан для долгосрочного хранения,  рис.2.

PDF/A для долгосрочного хранения MoReq, MoReq2, MoReq2010.Спецификация MoReqпокрывает вопросы делопроизводства и ведомственного хранения документов. MoReq не рассматривает вопросы управления бизнес-процессами. В Украине дискуссии об электронном документообороте неизбежно перетекают в разговор о ключах, методах шифрования, удостоверяющих центрах. На Западе пошли по иному пути – обеспечивается надежное хранение всего массива документов в сертифицированной системе [4] вместе с их метаданными. Пункт 6.1.5 спецификации MoReq2 говорит о том, что при хранении электронных записей, которые состоят из более чем одного компонента (архивное дело), допускается модификация таких записей системой управления электронными записями (ERMS– Electronicrecordsmanagementsystem) с целью обеспечения будущего доступа к ним, что противоречит принципу ERMSсистем о неизменности записей, но является неизбежным в том случае, когда записи должны храниться в первозданном виде, без потери своей функциональности и качества воспроизведения. Альтернативный подход – преобразование записей в другой формат файлов, который сохраняет их статический вид, т.е. PDF/A. Другими словами, в системе электронного документооборота в Украине, на последней стадии жизненного цикла документов – архивного хранения – целесообразно использовать PDF/Aпри любом варианте развития событий на украинском рынке информационных технологий.

Таблица 2 – Состояние принятия правительственными ведомствами разных стран согласно [5] документов формата PDFи PDF/Aдля долгосрочного хранения

Выводы.Следует ожидать, что в ближайшие годы архивы электронных документов превратятся в серьезные источники информации для принятия важнейших решений на всех уровнях управления. В связи с этим проблемы хранения электронных информационных ресурсов и пути преодоления этих проблем приобретают ключевое значение в методологии организации такого рода архивов. Работы по обеспечению сохранности электронных документов можно разделить на три вида: 1) обеспечение физической сохранности и целостности файлов с электронными документами; 2) обеспечение условий для считывания информации в долговременной перспективе; 3) обеспечение условий для воспроизведения электронных документов в так называемом человекочитаемом виде. Первое условие зависит от создаваемой системы электронного документооборота, будь она основана на спецификации MoReq2, MoReq2010 или любой другой. Последние два условия может обеспечить формат PDF/A.

Список источников

1.    ISO32000-1:2008 Documentmanagement- Portabledocumentformat-- Part1: PDF1.7

2.    ISO19005-1:2005 Documentmanagement - Electronic document file format for long-term preservation - Part 1: Use of PDF 1.4 (PDF/A-1); ISO/DIS 19005-2.2 Document management -- Electronic document file format for long-term preservation - Part 2: Use of ISO 32000-1 (PDF/A)

3.    ETSI TS 102 778:2009 Electronic Signatures and Infrastructures (ESI); PDF Advanced Electronic Signature Profiles

4.    Model Requirements for the management of electronic records. MoReq2 specification. http://ec.europa.eu/transparency/archival_policy/

5.    PDF/A archiving standard http://www.adobe.com/enterprise/standards/pdfa/