воскресенье, 29 апреля 2012 г.

Про офисы и документы

Решил я провести маленький эксперимент и сравнить разные офисные пакеты на предмет размера выходного файла. Я прекрасно помню каких чудовищных размеров получался HTML файл у Microsoft Office. А тут такое время что у микрософта появились конкуренты в лице Libre Office, IBM Lotus, Kingsoft Office.
Итак эксперимент, я взял одну классическую книгу Мэри Шэлли, да-да, тот самый франкенштейн. Формат просто текст (txt), причем текст, как в древности водилось, разбит на строки по 80 символов. А такой вид документа будет воспринят любым офисом как одна строка это один абзац. Т.е. документ вышел из 5526 абзацев. Итак посмотрим размер файла при сохранении в родном формате каждого офиса


Microsoft Office 20031162 кБ
Microsoft Office 2007312 кБ
Microsoft Office 2010315 кБ
Libre Office 3.3.2249 кБ
IBM Lotus 3.0.1249 кБ
Kingsoft Office 8.1.0983 кБ


Итак самый прожорливый это формат doc 2003-го офиса. Причем я пробовал сохранять в этот формат из других офисов и в результате размер раздувался раза в три-четыре. Так что в данном случае большой размер это проблема данного формата. Зато как мы можем увидеть формат 2007 и 2010 офиса от microsoft без дураков оптимизировали и размер конечного файла стал минимум в три раза меньше. Kingsoft Office меня конечно подвел, я очень надеялся что размер его файла не будет большим, однако он сравним с 2003-м офисом.
А вот два победителя Libre (отдельная ветвь Open Office) и IBM Lotus. Одиноковый выходной размер файла объясняется одинаковым выходным форматом ODT (open document text).
Вот такие пироги, единственное что меня напрягает в Libre и Lotus, это то что они написаны на java. А Kingsoft мне хочется пожелать чтобы у них случился качественный скачок в формате документа как у Microsoft, а лучше просто появилась поддержка ODT.

1 комментарий:

Анонимный комментирует...

Форматированный текст, если без табличек, круче всего сохранять в rtf при помощи Atlantis Word Processor
http://www.atlantiswordprocessor.com/en/
Он клепает реально малюсенькие rtf. Очень показательно сравнить doc 2003 и rtf созданный этой прогой с таким же текстом.
Есть бесплатная версия http://www.atlantiswordprocessor.com/en/nova.htm