11 февраля 2010 г.

«Война форматов» продолжается: Европейские страны выбирают ODF

Я достаточно подробно писал о «войне форматов» в серии постов «Как OOXML становился стандартом ISO» (часть I, часть II, часть III) в первой половине декабря прошлого года. Потом эта тема в моем блоге немного ушла в тень, хотя я и не собирался забывать о ней насовсем. Более того, в моем творческом плане стоят несколько постов, в которых я собираюсь рассмотреть сегодняшнюю ситуацию в противостоянии ODF и OOXML.

Жизнь сама заставила вернуться к теме «войны форматов», причем в приятном для меня аспекте: позиции ODF укрепляются, о чем свидетельствуют новости из двух европейских стран – Норвегии и Дании.
Перевод новости из Норвегии впервые опубликовала в своем блоге Наталья Храмцовская. Я думаю, она не очень обидится на меня за использование коротких фрагментов ее текста (тем более, что я честно на нее ссылаюсь). Кстати, новость из Дании я нашел и перевел самостоятельно :).

Норвегия
С 1 января 2010 года в Норвегии вступило в силу требование, согласно которому содержание государственных веб-сайтов должно быть доступно в открытых форматах. Согласно новым правилам, все государственные веб-сайты должны использовать HTML в качестве основного формата для публикации материалов. Если нужно сохранить оригинальный вид документа, то следует использовать формат PDF версии 1.4 и выше, или же PDF/A, соответствующий стандарту ISO 19005-1. Для публикации заполняемых форм предписывается использовать формат ODF (стандарт ISO/IEC 26300). Материалы также могут дополнительно размещены и в других форматах.

С 1 января 2009 года все государственные органы обязаны исполнять требования «Базового каталога ИТ-стандартов для государственного сектора» версии 1.0. Согласно новым нормативам, теперь эти же требования распространяются и на муниципальные органы власти. «Базовый каталог» регулярно пополняется новыми ИТ-стандартами. «Базовый каталог» версии 2.0 уже утвержден правительством, и в нём установлены новые обязательные ИТ-стандарты для видео-, аудиоматериалов, для графических изображений и графического контента, размещаемого на государственных веб-сайтах.
В будущем, по итогам ежегодно проводимого аудита, в нормативные требования будут включаться новые стандарты, одобренные правительством.

С моей точки зрения, очень логичное решение. PDF/A на сегодняшний день – пока единственный формат, пригодный для обеспечения долговременной сохранности документов. И, кстати, немаловажно (об этом не все знают), что Adobe отказалась от проприетарных прав на этот формат и перевела его в статус общественного достояния (public domain).

Выбор же ODF тем более знаменателен, что еще не забыт крупнейший скандал, случившийся в пору ISO-стандартизации Microsoft’овского OOXML (я об этом подробно писал). Норвежские специалисты тогда проголосовали «Против» DIS 29500, но политики, «подогреваемые» Microsoft, сумели все вывернуть наизнанку и протащить в финальное голосование формальное «За». Так что сейчас происходит восстановление справедливости.

И совсем свежая новость, появившаяся, пока я готовил этот пост.
Одно из правительственных агентств Норвегии – Норвежское Агентство Общественного Управления и Электронного Правительства (Norwegian Agency for Public Management and eGovernment, DIFI) – подготовило отчет, в котором утверждается, что формат Microsoft OOXML не удовлетворяет требованиям, предъявляемым к форматам, предназначенным для правительственного использования.

В отчете, в ряду других аргументов против OOXML, утверждается, что очень немногие программы в состоянии редактировать файлы формата DOCX (ECMA-376) удовлетворительным способом. Кроме того, в отчете подчеркивается «нестабильность» формата, т.к. в настоящее время имеется более 100 предложений по изменениям в стандарте, суммарно исчисляемым более чем 1000 страниц текста.


Дания
В конце января 2010 года датский парламент принял решение, в соответствии с которым через год с небольшим (точнее – с 1 апреля 2011 года) обязательным для хранения правительственных документов форматом становится ODF. Правда, это решение пока не распространяется на региональные и муниципальные власти, которые и после наступления контрольного срока в «День дурака» (интересно, не специально ли выбиралась именно эта дата?) будут вольны в выборе форматов для хранения своих документов; однако, предполагается, что в будущем и для них будет введена обязательность формата ODF.

Лейф Лодал (Leif Lodahl), координатор проекта OpenOffice.Org в Дании, написал в своем блоге достаточно прямо и жестко:
«Датский парламент решил сформировать список допустимых стандартов. Эти стандарты ДОЛЖНЫ БЫТЬ внедрены до конца 2011 года. Решение включает два существенных аспекта:
a)       ODF находится в списке, а OOXML – НЕТ!
b)       Новые стандарты ДОЛЖНЫ удовлетворять определенным критериям, среди которых – полная интероперабельность с существующими форматами (форматами, уже включенными в список). Так что, теперь Microsoft отвечает за интероперабельность с ODF».

Следует напомнить, что и в Дании голосование по DIS 29500 сопровождалось серьезными нарушениями процедур, спровоцированными Microsoft. В ходе первого голосования (сентябрь 2007) в датский комитет по стандартизации поступили многочисленные письма в поддержку OOXML, содержавшие практически идентичный текст (аналогичная история была и в Швеции).
При финальном голосовании в 2008 году (после BRM) не были учтены голоса некоммерческих организаций (которые ВСЕ высказались «Против»), а были засчитаны только голоса «За» коммерческих организаций – партнеров Microsoft.


Решения властей Норвегии и Дании стали очередными ощутимыми ударами по позициям Microsoft в Европе. Такие страны, как Бельгия, Франция, Швеция и Литва уже сейчас требуют использовать ODF для правительственных документов.

В качестве первоисточника приведенной выше информации рекомендую почитать очень интересный блог «Boycott Novell». Каждая тема в нем преподносится в актуальном и историческом аспектах, с многочисленными цитатами из других ресурсов и перекрестными ссылками.
По последним «фронтовым новостям» пост, с которого целесообразно начать чтение – «ODF is Winning in Europe…»

15 комментариев:

  1. Норвежское Агентство Общественного Управления и Электронного Правительства ... подготовило отчет, в котором утверждается, что формат Microsoft OOXML не удовлетворяет требованиям...

    Если не верить на слово дилетантам из новостийных агентств, и прочитать сам отчёт (см. http://standard.difi.no/filearchive/utredning-egnethetsvurdering-redigerbare-dokumentformater.pdf, выводы - в разделе 4.1), то выясняется, что не так всё плохо для OOXML, и (что полностью замолчали в новостях) - не так всё "в шоколаде" для ODF.

    Я поняла выводы отчета так:

    Формат ECMA-376 1-й редакции допускается для публикации документов и для обмена с госорганами и гражданами, при условии, что дальнейшей работы над этими документами не ведётся. Форматы ECMA-376 2-й редакции и ISO/IEC 29500:2008 пока считаются неподходящими - просто потому, что "не отстоялись", и нет ещё программных средств для создания документов в этих форматах.

    ODF - да, считается возможным применять его и для публикации, и при коллективной работе с документами, но при условии, что большинство офисных программных пакетов смогут читать этот формат.

    ОтветитьУдалить
  2. ...пост, с которого целесообразно начать чтение – «ODF is Winning in Europe…»

    На сегодняшний день Google находит:
    файлов формата ODT - 331 тысяча
    файлов формата DOCX - 873 тысячи
    файлов формата PDF - 626 МИЛЛИОНОВ

    Так кто там побеждает во второй лиге? :))

    ОтветитьУдалить
  3. Вау! Наташа, спасибо за такой шикарный повод для дискуссии.
    А то как-то немного подустал я с «ветряными мельницами госуслуг» воевать :).
    И да – Вау-2! Вы и по-норвежски умеете? :) Кстати, спасибо за ссылку на отчет. Надеюсь, когда-нибудь я его смогу прочесть.
    Ну, или Google качество своего переводчика повысит :)

    А теперь, собственно, к предмету обсуждения перехожу.

    Наташа Храмцовская >> Если не верить на слово дилетантам из новостийных агентств…

    Ну вообще-то, Computerworld – достаточно серьезное издание, и думаю, что дилетантов там не держат. А то, что не все 63 страницы отчета в газете пересказали, - так это, извините, специфика прессы – печатные знаки, дедлайны…

    Наташа Храмцовская >> Формат ECMA-376 1-й редакции допускается для публикации документов и для обмена с госорганами и гражданами, при условии, что дальнейшей работы над этими документами не ведётся.

    Вы же понимаете, что ECMA-376 v1 и ISO 29500 – это, как говорят в Одессе, две большие разницы. ECMA-376 v1 (он же DOCX, генерируемый MS Office 2007) – достаточно стабильный формат. А вот ISO 29500 (OOXML, который под тем же расширением DOCX будет генерить MS Office 2010) – нестабилен, и на это прямо указывает приведенный Вами вывод отчета.
    DOCX 1-ой редакции допускается de facto, поскольку явочным порядком в госорганах уже стоят (пока, надеюсь!) тысячи копий MS Office 2007, которые генерят DOCX как формат по умолчанию (а госслужащие, думаю, не сильно заморачиваются – какой у них там формат документа получился).

    Наташа Храмцовская >> Форматы ECMA-376 2-й редакции и ISO/IEC 29500:2008 пока считаются неподходящими - просто потому, что "не отстоялись", и нет ещё программных средств для создания документов в этих форматах.

    Положа руку на сердце :), Вам не кажется несколько странной ситуация, когда формат, утвержденный как стандарт ISO два (!) года назад, все еще считается «не отстоявшимся»? Да и упоминание об отсутствии программных средств для генерации этих форматов – косвенное признание серьезных нарушений, допущенных в ISO при стандартизации OOXML по процедуре Fast Track. Ведь по этой процедуре должны проводиться стандарты, только имеющие несколько промышленных реализаций!

    Наташа Храмцовская >> ODF … но при условии, что большинство офисных программных пакетов смогут читать этот формат.

    На Википедии в статье «OpenDocument software» (http://en.wikipedia.org/wiki/OpenDocument_software) перечислено, по крайней мере, 20 (!) – это я считал только по буллетам первого уровня – текстовых процессоров, работающих с ODF. Этого достаточно, чтобы считать, что большинство, понимающее ODF, существует? Или под «большинством» имелось в виду количество установленных копий MS Office? Так и MS Office может читать этот формат – вот только лучше это делать через Sun’овский (теперь, наверное, уже нужно говорить Oracle’овский…) плагин, а не через собственный код программеров Microsoft, встроенный в MS Office 2007 SP2.

    ОтветитьУдалить
  4. Наташа Храмцовская >> На сегодняшний день Google находит: …

    «Есть три вида лжи – ложь, наглая ложь и статистика». :) Кстати, обнаружил замечательную статью об этом афоризме на Википедии (http://ru.wikipedia.org/wiki/Ложь,_наглая_ложь_и_статистика).
    Угадайте, в какую категорию попадают приведенные Вами цифры? :)

    Если я не ошибаюсь (проверять лениво), в блоге «ECM Club», когда Вы опубликовали пост про статистическое (!) распределение форматов на веб-сайтах, был весьма здравый комментарий, что форматы файлов в интернете и форматы в повседневном деловом общении – две большие разницы (ах, Одесса, жемчужина у моря…).

    Так что, вроде бы и нечего в этих цифрах комментировать – преимущество PDF вполне обоснованно. Но тем не менее…
    1. Я считаю неправильным сравнение PDF с DOCX и ODF (ODT). PDF (точнее, PDF/A) предназначен для обеспечения долговременной сохранности – и в этой роли пока конкурентов не имеет. Роль же DOCX и ODF – обеспечение интероперабельности. Пока предпочтительным кандидатом на эту роль мне представляется именно ODF (сейчас аргументы приводить не буду – я это делал уже много раз).
    2. Если все же сравнивать все три формата именно с позиции долговременной сохранности, то правильнее было бы запрашивать у Гугла статистику строго по PDF/A. Но, насколько я понимаю, Гугл сейчас не в состоянии отличить обычный PDF от PDF/A.
    3. Если сравнивать DOCX и ODF, то правильнее было бы «прочесывать» не весь Интернет, а только правительственные сайты. Там, я думаю, соотношение сил в скором времени (скажем, к концу этого года) начнет меняться именно в пользу ODF. Готов заключить пари :)

    ОтветитьУдалить
  5. На Википедии ... перечислено, по крайней мере, 20 (!) ... текстовых процессоров, работающих с ODF. Этого достаточно, чтобы считать, что большинство, понимающее ODF, существует?

    Нет. Если интересы граждан и т.д. воспринимать всерьёз, а не на словах, то государство должно выкладывать документы в нескольких форматах, так, чтобы 99% населения могли их читать без совершения каких-либо дополнительных действий. Делая ODF монополистом в условиях, когда его способно читать 5% граждан, Вы принуждаете людей ставить ненужный им софт.

    Поэтому большинство IMHO должно определяться по доле среди установленных у граждан и организаций пакетов, а не по числу разномастных "софтин", некоторые из которых широко известны только в очень узких кругах.

    Какова же доля всего перечисленного Википедией "зоопарка" (можете к ней добавить и продукты Майкрософт, без примочек читающие ODF)? Не думаю, что она составляет более половины.

    ОтветитьУдалить
  6. ...по процедуре Fast Track. Ведь по этой процедуре должны проводиться стандарты, только имеющие несколько промышленных реализаций

    А ребятам из ИСО об этом кто-нибуль сказал? :)) Я вот сейчас анализирую проект ISO DIS 16175 требований к СЭД, тоже идущий по fast track'у. А это документ Международного Совета Архивов, который не то что никто не применяет, - его не читают и о нем не пишут. ИСО тоже нужно планы разработки стандартов выполнять, а быстренько провести что-нибудь готовенькое проще, чем разрабатывать стандарт "с нуля".

    Теперь цитата из ISO/IEC Directives, Part 1, 2009, Annex F, F.2.1.1

    F.2 “Fast-track procedure”

    F.2.1 Proposals to apply the fast-track procedure may be made as follows.

    F.2.1.1 Any P-member or category A liaison organization of a concerned technical committee may propose that an existing standard from any source be submitted for vote as an enquiry draft. The proposer shall obtain the agreement of the originating organization before making a proposal. The criteria for proposing an existing standard for the fast-track procedure are a matter for each proposer to decide.

    F.2.1.2 An international standardizing body recognized by the ISO or IEC council board may propose that a standard developed by that body be submitted for vote as a final draft International Standard.

    ОтветитьУдалить
  7. «Есть три вида лжи – ложь, наглая ложь и статистика». ... Угадайте, в какую категорию попадают приведенные Вами цифры? :)

    В категорию проверяемых фактов, неприятных для сторонников ODF.

    ОтветитьУдалить
  8. Не могу удержаться от того, чтобы не подбросить ещё немножко статистики (данные Google) :)

    На сайтах Дании (домен dk)
    ODT : 4780
    DOCX: 14000
    DOC : 1,440,000
    PDF : 13,200,000

    На сайтах Норвегии (домен no)
    ODT : 15600
    DOCX: 15400
    DOC : 1,890,000
    PDF : 15,800,000

    ОтветитьУдалить
  9. Наташа Храмцовская >> Если интересы граждан и т.д. воспринимать всерьёз, а не на словах, то государство должно выкладывать документы в нескольких форматах, так, чтобы 99% населения могли их читать без совершения каких-либо дополнительных действий. Делая ODF монополистом в условиях, когда его способно читать 5% граждан, Вы принуждаете людей ставить ненужный им софт.

    Ни Норвегия, ни Дания не делают ODF монополистом. Базовые каталоги стандартов – открытые перечни. Предусмотрен ежегодный аудит с возможностью (как я понимаю) не только добавления новых стандартов в каталог, но и исключения из него «не оправдавших высокого доверия».

    Для того, чтобы «99% населения могли …», у этих 99%-ов, как минимум, должен быть компьютер с доступом в интернет. Это куда как более социально-ориентированная цель, чем отстаивание «в интересах народа» конкретного формата. И «без совершения каких-либо дополнительных действий», увы, не обойтись. Даже MS Office не может появиться на компе в результате современного аналога непорочного зачатия - нерукотворной инсталляции :).

    Почему Вы считаете, что ODF «способно читать 5% граждан»?? Не нужно ставить полный OpenOffice.Org – достаточно скачать плагин для MS Office.
    И кто сказал, что ODF-софт – «ненужный народу софт»? Народ Вам это сказал? А народ не сказал, почему ему нужнее проприетарный лицензионный MS Office, который он без всякого принуждения покупает за свои кровные, чтобы не пользоваться чуждым, принудительным и совершенно бесплатным ODF-софтом.
    Наташа, я уже Вам писал в Вашем блоге при обсуждении той же темы – Ваши высказывания есть чистой воды популизм. При всем искреннем уважении к Вам…

    Наташа Храмцовская >> Поэтому большинство IMHO должно определяться по доле среди установленных у граждан и организаций пакетов, а не по числу разномастных "софтин", некоторые из которых широко известны только в очень узких кругах.

    И снова – здравствуйте… КАК Вы предполагаете определить «долю установленных у граждан пакетов»? Всенародной переписью?
    Что касается «широко известных только в очень узких кругах», то могу на это ответить только цифрами (ссылки на источники дам в отдельном посте, который опубликую вслед за этими комментариями):
    - OpenOffice.Org 3.x (3.0 и 3.1) за полтора года – с октября 2008 - скачали более 120 миллионов человек
    - В Германии у более чем 21% пользователей домашних ПК установлен пакет OpenOffice.Org или производные от него (StarOffice или IBM Lotus Symphony)

    Наташа Храмцовская >> Какова же доля всего перечисленного Википедией "зоопарка" (можете к ней добавить и продукты Майкрософт, без примочек читающие ODF)? Не думаю, что она составляет более половины.

    Не понял – а почему MS Office «без примочек» Вы к «зоопарку» отнесли?
    Насчет «больше-меньше половины» - мы же не президента выбираем. Есть требования к форматам публикуемых правительственных документов – бесплатность софта и открытость формата. DOCX этим требованиям удовлетворяет?

    ОтветитьУдалить
  10. В Германии у более чем 21% пользователей домашних ПК установлен пакет OpenOffice.Org или производные от него (StarOffice или IBM Lotus Symphony)

    Цифры - "честный человек": 21% - далеко не большинство (хотя IMHO это достаточно много, чтобы использовать ODF как один из форматов)

    Ваши высказывания есть чистой воды популизм

    "Юпитер, Вы сердитесь..." :))

    ОтветитьУдалить
  11. Наташа Храмцовская >> ИСО тоже нужно планы разработки стандартов выполнять, а быстренько провести что-нибудь готовенькое проще, чем разрабатывать стандарт "с нуля".

    У ISO помимо процедуры Fast Track (к разработке которой приложила руку небезысвестная Ecma International – но ведь мы ничего не хотим этим сказать… :) ) есть еще ускоренная процедура одобрения PAS (Publicly Available Specification), которая, кстати, применяется в том же JTC1. У Роба Вейра, которого я достаточно часто цитирую в своих постах о «войне форматов», есть очень подробный пост, разбирающий разницу между процедурами Fast Track и PAS. Поскольку пост очень большой, я не буду его сейчас цитировать, просто дам ссылку на него - http://www.robweir.com/blog/2008/02/fast-track-versus-pas.html. Думаю, Вы прочитаете его с интересом и сохраняя объективность. Кстати (об этом упоминается в посте Роба), ODF проходил утверждение как стандарт ISO 26300 именно по процедуре PAS. Как говорится, почувствуйте разницу… :)

    Наташа Храмцовская >> В категорию проверяемых фактов, неприятных для сторонников ODF.

    Я уже где-то у себя писал, когда начинал серию постов про «войну форматов», что до недавнего времени я не был сторонником ODF, и вообще не использовал этот формат – равно как и софт, с ним работающий. Когда же мне понадобилось прочесть файл, который был доступен только в формате ODT, то я за 5 минут скачал и установил плагин – и не чувствовал себя «принуждаемым» к чему-то. Случилось это уже, кстати, во времена существования этого блога – у меня даже пост-картинка, посвященный этому событию есть :). Вот здесь - http://ecm-discovery.blogspot.com/2009/12/alea-iacta-est-caesar-citra-rubiconem.html
    Вообще-то, все в жизни когда-то случается в первый раз :). Ведь для чтения самого первого PDF-файла Вам все-таки пришлось скачивать Acrobat Reader… Или он у Вас «непорочно» установился сам?

    Я и противником Microsoft тоже не являюсь. Я – противник методов, которые применялись при стандартизации OOXML. При этом я не отрицаю священного права Microsoft на стандартизацию собственных форматов (ну, конечно, с оговоркой, что они их реально сделают открытыми для народа).

    Наташа Храмцовская >> Не могу удержаться от того, чтобы не подбросить ещё немножко статистики (данные Google) :)

    Наташа, статистика нерелевантная. Вы приводите данные по всем сайтам стран, а я уже говорил, что нужно выделить подгруппу правительственных сайтов и смотреть на нее.

    ОтветитьУдалить
  12. Наташа Храмцовская >> "Юпитер, Вы сердитесь..." :))

    Я искренне удивляюсь, а не сержусь :)

    ОтветитьУдалить
  13. Насчет "сердитесь" - вспомнил "широко известную в узких кругах блоггирующих" Анюту :).
    Вон она к Вам опять приходила, оживляжик привносила...
    Надо бы, наверное, и мне чего-нибудь про MoReq2 написать - может, и ко мне в журнал придет? :)

    ОтветитьУдалить
  14. ... статистика нерелевантная. Вы приводите данные по всем сайтам стран, а я уже говорил, что нужно выделить подгруппу правительственных сайтов и смотреть на нее.

    Знаю, знаю: "Это неправильные пчёлы, и они делают неправильный мед".

    Берем правительственный портал Норвегии: www.regjeringen.no
    Запрос: site:www.regjeringen.no filetype:xxx
    ODT: 12
    DOCX: 29
    DOC: 5680
    PDF: 160,000

    Сайт парламента Норвегии: www.stortinget.no
    ODT: 0
    DOCX: 0
    DOC: 2
    PDF: 22,300

    Сайт датского парламента: http://www.ft.dk
    ODT: 0
    DOCX: 0
    DOC: 1
    PDF: 93,100

    Сайт столичного региона Дании: http://www.regionh.dk
    ODT: 0
    DOCX: 0
    DOC: 212
    PDF: 5690

    Ещё один сайт датского парламента: http://www.direkte.folketinget.dk
    ODT: 0
    DOCX: 0
    DOC: 0
    PDF: 5,550

    ОтветитьУдалить
  15. Ну вот - можете же, когда захотите... :)

    Спасибо за эти цифры, Наташа. Интересно будет повторить запросы через некоторое время - или вообще делать это с какой-нибудь не слишком обременяющей регулярностью. И пока (в этом году) имеет смысл смотреть только на Норвегию - ну, может, еще на Бельгию, Францию, Швецию и Литву :). Т.е на страны, где ODF уже "навязан народу".

    И еще раз повторюсь - я не рассматриваю PDF как оппонента ODF. У каждого из этих форматов свое предназначение. Поэтому большие количественные показатели PDF меня нисколько не расстраивают.

    ОтветитьУдалить