[devel] rpm: LZMA payload compression

Alexander Bokovoy =?iso-8859-1?q?ab_=CE=C1_altlinux=2Eorg?=
Сб Май 24 21:55:23 MSD 2008


24 мая 2008 г. 20:37 пользователь Alexey Tourbin <at на altlinux.ru> написал:
>> Было бы интересно увидеть конкретные цифры установок в хэшере.
>
> Цифры чисто по скорости сжатия/разжатия есть здесь:
> http://tukaani.org/lzma/benchmarks
>
> В хешере что-либо измерить трудно.  Во-первых, hasher создаёт
> cache/chroot/chroot.cpio, то есть скорость можно измерять только
> для дополнительных пактов из BuildRequires (а для базовой системы
> при последовательных сборках скорость оказывается "бесплатной").
> Во-вторых, собственно, сложно удержать то, что мы хотим измерить.
> На tmpfs мы измеряем одно, на ext3 мы измеряем другое; в обоих случаях
> буферный кеш и kswapd спутывают все карты.
Это так. В таком случае может вообще не стоит рассматривать LZMA?

>> Дело в том, что gzip имеет код, который позволяет создавать архивы,
>> построенные на фиксированных блоках (опция --rsyncable в утилите
>> gzip), наверняка такую же настройку можно активировать и в библиотеке.
>> С этими фиксированными блоками rsync очень хорошо справляется.
>
> Увы, gzip не использует zlib (а gzdio использует zlib).  Это в
> нескольких местах надо править.  И, собственно, rsync использует свою
> собственную модифицированную копию zlib.  И ещё zlib есть в ядре...
Основной gzip 1.3.12 содержит в TODO план включения --rsyncable.
Аналогичный патч для zlib существует, ровно как и патчи для всех
остальных необходимых компонент, в конце концов, этот патч нужен
только для компрессии, а распаковка выполняется стандартной
процедурой. Как я уже говорил, в Debian поддержка rsyncable уже есть с
2003 или около того, в том числе благодаря работам ALT Linux Team. :-)

> К тому же на практике rsync мало используют (если я не ошибаюсь,
> у нас нет ни одного rsync зеркала, зато есть несколько ftp зеркал).
Это вопрос приоритезации. Если мы сумеем добиться внятных результатов,
то можно будет поставить rsync:// в качестве метода по умолчанию в
дистрибутивах (с возможностью перевыбора пользователями). Это позволит
сэкономить дорогой трафик в регионах и постепенно перевести
пользователей на более эффективные методы работы.

-- 
/ Alexander Bokovoy


Подробная информация о списке рассылки Devel