[devel] ускорение lzma декомпрессии (XZ Utils)
Ilya Kurdyukov
ilyakurdyukov на basealt.ru
Вт Дек 14 06:16:31 MSK 2021
Для понимания что делает патч:
В LZMA используется адаптивное арифметическое кодирование каждого бита.
А именно: ru.wikipedia.org/wiki/Интервальное_кодирование
После того как бит раскодирован из потока данных - обновляется несколько
переменных, причём в зависимости от того какой бит прочитали (0 или 1)
делается это по разному. То есть в конце чтения бита стоит конструкция
вида if-else, а это условные прыжки в бинарном коде. Ветвление в
программе тормозит её выполнение, потому что процессору нужно очистить
конвейер с заранее декодированными инструкциями и заполнить его
инструкциями по новому адресу, короче говоря прыжок это дорогая инструкция.
Патч убирает это ветвление за счёт того, что оба пути исполнения if-else
вычисляются одновременно, но код получается без ветвления.
Это усложняет код, так что процессор исполняет чуть больше инструкций.
Но время уменьшается. Всё зависит от цены прыжков для конкретного
процессора.
Тут хорошей аналогией будет сравнить процессор в автомобилем, а
программу с трассой. На прямой дороге можно разогнаться и приехать к
финишу быстрее, чем проехать более короткую трассу, но с большим
количеством резких поворотов, потому что на поворотах нужно снижать
скорость. Но это также будет зависеть от конкретной машины, если машина
не может сильно разогнаться (например это трактор) - то прямая и более
длинная дорога не даст заметного ускорения.
Поэтому на более простых процессорах (мобильных или просто старых)
ускорение от патча будет ниже. Как Intel Atom на котором проверил Андрей.
On 14.12.2021 01:59, Andrey Savchenko wrote:
>
>> Я проверю на x86 (Intel Atom N270). Займёт некоторое время, т.к.
>> машина старенькая и слабенькая. Проверю распаковку имеющихся под
>> рукой исходников ядра и бинарного пакета firefox (там zstd,
>> перепакую в xz -9e --x86).
> old,s new,s delta,%
> kernel src 33.522±0.077 32.515±0.087 3.01±0.34
> firefox pkg 14.645±0.030 14.256±0.023 2.66±0.25
>
> Погрешности приведены для одного стандартного отклонения.
> Тесты делались на tmpfs для уменьшения эффекта i/o.
>
> Результат небольшой, но значимый и статистически достоверный.
>
> Best regards,
> Andrew Savchenko
Подробная информация о списке рассылки Devel