31 марта 2010 г.

Неподвластно времени

Как и обещал, делаю перепост, посвященный проблеме долговременной сохранности документов (в английской ECM-терминологии для этого понятия существует термин preservation, часто употребляемый с дополнительным определением – long-term preservation). Авторство текста принадлежит Джереми Эллисону (Jeremy Allison), ведущему разработчику проекта Samba и одному из лидеров свободного сообщества. Текст 2007 года, где находится оригинал, не знаю, русский перевод взят отсюда. Никаких лицензий своим перепостом я вроде бы не нарушил. Я не буду сейчас ничего комментировать по тексту, он вполне самодостаточен. Я только не удержался и выделил жирным шрифтом самые важные, с моей точки зрения, фразы. Вернусь к этой проблеме в своих последующих постах.



Джереми Эллисон. Неподвластно времени.
Недавно в Тулсе, Оклахома, была извлечена из земли памятная капсула 1957 года. Ее основным содержимым был автомобиль — Плимут Бельведер 1957 года. При закладке капсулы его предусмотрительно снабдили канистрой бензина, сочтя, что летающие автомобили 2007 года уже не будут нуждаться в столь ископаемом топливе. В сопроводительных бумагах к автомобилю, последний именовался «бесценным для 2007 года антиквариатом»!

Безусловно, это антиквариат, но не очень-то бесценный. В капсулу просочились грунтовые воды, и бедняге подпортило ржавчиной корпус, крылья, да и все в целом. Нам, умудренным людям 2007 года, легко смеяться над наивностью создателей капсулы, однако разве мы сами лучше, когда оставляем историкам будущего свои письменные свидетельства? Все наши письменные свидетельства быстро переходят на электронные носители. Хорошим примером тому служит закат популярности фотопленки – почти никто в наши дни не покупает пленочных фотоаппаратов; фотографии теперь хранятся на картах памяти или загружаются на крайне хрупкие жесткие диски компьютеров, обычно без всяких резервных копий. Даже будучи профессиональным компьютерщиком, я проявляю не меньшую лень по части резервного копирования фото, чем все прочие. Одна несчастная случайность – и все мои драгоценные воспоминания будут безвозвратно утрачены.

Недавно в NASA обнаружили, что оригинальные пленки медленной развертки с первой высадки человека на Луну с Аполлона-1 пропали. Те кадры, что видели все, на самом деле лишь копия тех пленок, снятая с видеозаписи с высоким разрешением телекамерой 1969 года. Согласно сообщениям NASA, у них имеется 2 612 коробок с пленками, однако не хватает еще 13 000 дополнительных пленок. Это мне напоминает склад, который показывают в конце «Поисков утраченного ковчега» [Raiders of the Lost Ark – один из фильмов об Индиана Джонсе, – прим. пер.].
Даже если эти пленки найдутся – интересно, много ли сохранилось киноаппаратов образца 1969 года в рабочем состоянии, чтобы можно было воспроизвести эти данные? Насколько обветшает к тому моменту пленка? И это всего лишь за 40 лет – или около того. А что будет через 100 лет, или через 500, или 1000? Пленки со съемками высадки на Луну – историческая ценность, и если мы о них не можем позаботиться, то что уж говорить о менее важных записях? Письменные записи, по крайней мере, можно расшифровать и через много тысяч лет.

Я вовсе не луддит: преимущества перевода наших данных и записей в цифровой формат серьезно перевешивают все возможные недостатки. К примеру, оцифровка всех книг и данных музеев сделает их доступными для тех ученых, у кого есть доступ в Интернет, но нет шансов соприкоснуться с этими данными в реальности. Да и вообще, возможность в информационных массивах весьма привлекательна. Сейчас, при свободном доступе к спутниковым снимкам через Интернет, стали неожиданно делаться важные открытия – например, метеоритных кратеров. Кто знает, что еще откроется благодаря переводу человеческих знаний в общий доступ? Однако было бы неплохо задуматься о сохранении возможности доступа к важным историческим записям нашего времени.

Полагаю, проприетарные форматы записи станут проблемой для историков. Возможно, не в ближайшем будущем – но уж совершенно точно, через некоторое время (я говорю о сотнях, если не о тысячах лет). Представьте себе, как лет через 500 некий историк обнаруживает «засекреченный бункер» вице-президента Чейни, где спрятан его личный ноутбук. «Ура, – думает этот историк, – наконец-то мы узнаем, кто же давал советы этой администрации по поводу нефтяной политики!» – и вновь погружается в океан, поглотивший бывший Вашингтон. И тут оказывается, что данные записаны в формате «Word-Кривой для Windows 2002», который специально создавался так, чтобы конкуренты не могли его прочесть.

Кроме шуток, проприетарные форматы усложняют задачу сохранения нашей культуры почище устаревших аппаратных интерфейсов и подверженности носителей данных разрушению, хотя мы привыкли считать их вечными и незыблемыми. Использовать форматы данных, не являющиеся опубликованными стандартами, означает просто напрашиваться на неприятности при долгосрочном хранении данных. Я отдаю предпочтение формату ODF, формат Microsoft Office Open XML (OO-XML) тоже документирован, так что он не вызовет проблем при долгосрочном хранении данных. Однако большинство документов мира – как на правительственном уровне, так и на корпоративном – попрежнему сохраняются в проприетарных форматах, а ведь порой документы, считавшиеся недостойными сохранения, оказываются самыми желанными для историков.
Меня не слишком волнуют «сценарии судного дня», рисующие постиндустриальную, лишенную электричества цивилизацию, утратившую все научные знания по причине неспособности прочитать документы, созданные на компьютере: когда общество в таком положении, у него есть более серьезные поводы для беспокойства, чем невозможность получить доступ к древним финансовым документам предприятий. Нет, меня беспокоит другое: вдруг кто-то захочет увидеть старую пленку с записью падения Берлинской Стены, и обнаружит, что есть только копии с копий с других копий, а оригинальная «правда» этого события утрачена сотни лет назад. Или, что еще хуже, не сможет определить, которая из версий этого видео показывает настоящее событие.

Мой любимый мультипликатор Тед Ролл [Ted Rall] (http://www.rall.com) использует 2024 как римейк оруэлловской антиутопии «1984». Герой от нечего делать редактирует список лауреатов Нобелевской премии Мира и подсовывает в него имя местного рок-музыканта. Средства массовой информации получают и распространяют этот список, а герой уже позабыл о своей шалости и принимает подаваемую информацию на веру, как и все остальные. Когда живые очевидцы события исчезнут, и сохранятся только электронные свидетельства, с присущей им подверженностью изменениям, узнают ли люди правду о нашем прошлом? Возможно, DVD или запись на ином физическом носителе, точно привязанном к хронологии исторических событий, может стать ценнее, чем любые данные в электронном виде, и даже послужит арбитром для имеющихся цифровых версий. Возможно, мы оставляем грядущим поколениям проклятие в виде такого неимоверного количества версий одних и тех же данных, что невозможно будет отличить, где же среди них оригинальная правдивая версия, если она вообще есть.

И, напоследок, не могу удержаться от комментария в адрес NASA – они ответственны за сохранение единственного долгосрочного носителя данных, когда-либо созданного человечеством. Космические корабли Пионер и Вояджер несут на борту плакетки с указанием расположения нашей солнечной системы; на Вояджере также находится диск с аудио- и видеозаписями с Земли. Есть надежда, что миллионы лет спустя далеко за пределами Солнечной системы эти послания достигнут внеземного разума, который сможет прочесть их. Вот памятная капсула, достойная восхищения!

13 комментариев:

  1. Статья в целом неплохая, но есть кое-какие "но".

    ...в английской ECM-терминологии для этого понятия существует термин preservation, часто употребляемый с дополнительным определением – long-term preservation

    А ничего, что это добрый старый термин из области делопроизводства и архивного дела? :)

    Джереми Эллисон>> Я отдаю предпочтение формату ODF...

    Типичный айтишник... Не знает, что ни ODF, ни OOXML не предназначены для долговременного архивного хранения, и ни одна страна пока что не числит их среди рекомендуемых "архивных" форматов.

    Джереми Эллисон>> Возможно, DVD или запись на ином физическом носителе, точно привязанном к хронологии исторических событий, может стать ценнее, чем любые данные в электронном виде

    Я сначала не поверила, что маститый специалист может так "ляпнуть". Проверила первоисточник - перевод точный! Он и вправду не знает, что на DVD информация записана в электронно-цифровой форме!!

    ОтветитьУдалить
  2. Наташа, рад Вас видеть - давненько не заглядывали ко мне с комментами :)

    >> А ничего, что это добрый старый термин из области делопроизводства и архивного дела? :)

    А формулировку из первоисточника, плиз :)

    ОтветитьУдалить
  3. А формулировку из первоисточника, плиз :)

    Какого первоисточника?! Я-то возражаю против того, чтобы широко используемый термин записывали в ECM-терминологию!

    Впрочем, вот некоторые определения/первоисточники:

    Long Term Preservation: The act of maintaining information, in a correct and Independently Understandable form, over the Long Term. [Ключевой стандарт по электронной архивации ISO 14721:2003 aka OAIS]

    3.14 preservation: processes and operations involved in ensuring the technical and intellectual survival of authentic records through time [ключевой стандарт по управлению документами ISO 15489-1:2001]

    3.7 long-term preservation: period of time that electronic document-based information is maintained as accessible and authentic evidence. (NOTE: This period of time can range between a few years to hundreds of years, depending upon the needs and requirements of the organization. For some organizations, this period of time would be determined by regulatory compliance, legal requirements and business needs. For other oranizations, such as archival repositories holding public records, the period of time required to retain electronic document-based information is usually thought to be hundreds of years.) [ISO/TR 18492:2005 "Long-term preservation of electronic document-based information"]

    ОтветитьУдалить
  4. Ну, во-первых, я-то просил формулировку именно из делопроизводства - исконно и исключительно российской сущности, которой нет аналога на Западе. Разве не так?

    А что касается управления записями :), то это общепризнанная часть ECM, и не вижу причин, по которым термин из RM не может быть засчитан как термин более широкого глоссария.

    ОтветитьУдалить
  5. ...из делопроизводства - исконно и исключительно российской сущности, которой нет аналога на Западе

    Рада бы погордиться отечественной уникальностью, но, увы - повода в данном случае нет... Есть делопроизводству аналог - "recordkeeping" называется (любопытно, как его "записефилы" на русский бы перевели?)

    ...управления записями :), то это общепризнанная часть ECM,

    Управление записями IMHO есть только в СУБД :) Ну и в ЗАГСах, разумеется...

    ОтветитьУдалить
  6. Добавлю, для коллекции:

    6.1.01 preservation: all measures taken, including financial and strategic decisions, to maintain the integrity and extend the life of documents (1.2.02) or collections (1) (2.2.1.05) [ISO 5127:2001 Information and documentation — Vocabulary]

    3.3.9 preservation: processes and operations involved in ensuring the maintenance of records over time [ISO/CD 30300 Information and documentation — Management system for records — Fundamentals and vocabulary]

    ОтветитьУдалить
  7. Пытался вставить картинку в коммент, но, увы, ничего не вышло. А на картинке было как "записефилы" переводят "recordkeeping". В общем, переводят без затей - "хранение записей". Так что, ни разу "recordkeeping" на "делопроизводство" не похоже :). Ни одной совпадающей буквы. "Дело" так и вообще по-импортному "case" или "file" будет.

    И что это Вы мне все импортные формулировки приводите? А где же исконно наши ГОСТы? Не те, которые ИСО ГОСТ, а которые совсем наши?

    ОтветитьУдалить
  8. Можно найти и отечественные формулировки :)

    Вот, скажем, ГОСТ Р 51141-98 "Делопроизводство и архивное дело. Термины и определения"

    99 обеспечение сохранности документов: Обеспечение физико-химической сохранности документов и их учет

    100 обеспечение физико-химической сохранности документов: Разработка, создание и практическое применение научно-технических средств и методов хранения, реставрации, консервации, биохимической защиты и воспроизведения документов

    ОтветитьУдалить
  9. Не-не-не...
    ГОСТ 51141-98 я сегодня еще раньше Вас проверил. Все ждал, когда же Вы его мне процитируете :).
    Но Вы же не будете отрицать, что этот ГОСТ совсем не про электронное нечто, а совсем даже про бумажное

    ОтветитьУдалить
  10. Но Вы же не будете отрицать, что этот ГОСТ совсем не про электронное нечто, а совсем даже про бумажное

    Ещё как буду! Большинство принципов и методов управления документами и архивного дела одинаковы или очень похожи для документов на самых различных носителях. Определенный "бумажный" оттенок, конечно, есть - ну и что?

    И где в ГОСТе написано, что он относится только к бумажным документам? :))

    ОтветитьУдалить
  11. >> И где в ГОСТе написано, что он относится только к бумажным документам? :))

    Так в ГОСТе и не написано, что он к электронным документам относится. А некоторые ведущие эксперты по управлению документацией :) так и вовсе считают, что ГОСТ 51141-98 "... не претендовал ни на регламентацию электронного документооборота, ни на регламентацию всех видов документации… " ( вот здесь считают :) )

    ОтветитьУдалить
  12. ...некоторые ведущие эксперты по управлению документацией :) так и вовсе считают, что ГОСТ 51141-98 "... не претендовал ни на регламентацию электронного документооборота, ни на регламентацию всех видов документации…"

    И я не буду с ними спорить - действительно не претендовал. Ну и что? Ключевые принципы делопроизводста и архивного дела с появлением электронных документов не изменились. Если думаете иначе, попробуйте это доказать :)

    ОтветитьУдалить
  13. >> Ключевые принципы делопроизводста и архивного дела с появлением электронных документов не изменились.

    Я бы в эту фразу добавил бы всего одно слово после слова "принципы" - "российского"...
    Помните, была такая ключевая фраза в михалковском "Сибирском цирюльнике" - "Он русский - это многое объясняет"? Чем больше я погружаюсь в тему российского "электронного правительства" (Вы это, наверняка, заметили по моим постам), тем сильнее мне хочется еще в одной классической фразе ("Не дай бог увидеть русский бунт, бессмысленный и беспощадный...") заменить "бунт" на "электронный документооборот".

    А вообще, начали, как всегда, с терминологии, а заканчиваем новой концептуальной проблемой - я как раз "ключевые принципы..." имею в виду. Не обещаю, что быстро свое доказательство представлю, но - представлю.
    Я помню, что за мной пара обещаний еще с осени числится, теперь их на одно больше станет :)

    ОтветитьУдалить