[devel] Оптимизированные для i686 и выше библиотеки.

Led ledest на gmail.com
Пт Сен 3 17:20:53 UTC 2010


On Friday 03 September 2010 20:03:29 Alexey Tourbin wrote:
> On Fri, Sep 03, 2010 at 03:49:30PM +0300, Led wrote:
> > > С такими величинами возникют вопросы по части статистики, типа
> > > действительно там набежало один процент.  Потому что но вот понимаешь,
> > > у тебя сейчас например выдает +1%.  Но это не значит, что оно
> > > действительно работает быстрее.  Просто цифры немного отличаются.
> > > В определенном интервале нельзя сделать вывод, что это действительно
> > > быстрее.  На других данных и на другом CPU у тебя уже покажет -1%.
> > >
> > > Потом ещё обычно оптимизация "для бедных" тестируется на богатых
> > > процессорах.  Но смысл тестировать cmov на c2d?  Замерять?
> > > Там уже всё другое, микроархиектура другая.
> >
> > Потестируйте на атомах (практически, единственная "живая" на сегодня
> > не-x86_64 x86 архитектура), которые НЕ-out-of-order, а самые что ни на
> > есть тупые in-order, в которых даже добавление -mtune-i686 к -march=core2
> > даёт существенный прирост, ощётимый даже "на глаз" к производительности
>
> Существенный прирост.  Это сколько примерно? )
> Кстати на атомах cmov дает меньше всего.
> http://www.altlinux.org/FFmpeg

Я говорил о том, что Atom - in-order, поэтому древнее письмо Линуса про 
ненужность CMOV на out-of-order процессоре к атому отношения не имеет. А 
также про то, что прирост даёт "-march=core2 -mtune=i686" по сравнению с 
просто "-march=core2" - как следствие in-order

>
> > P.S. Давайте сначала похваем устриц (а не вспоминать ощущение тех, кто
> > хавал их несколько лет назад), прежде чем что-то утверждать, ок?
>
> Я и говорю, давайте покажем, чего мы добиваемся.  А то понимаешь развели
> тут тред, оптимизированные для i686 библиотеки.  Можно подумать за это
> на премию можно выдвинуть.  Пробуешь разобраться, спрашиваешь людей,
> сколько у вас процентов вышло?  Люди подозрительно молчат, mike спрашивает
> "тебе жалко что ли"?  thresh хотя бы честно замерил и написал, что там
> выходит около одного процента в лучше случае (а на атомах - меньше).

По указанной ссылке вообще трудно делать оценку: не указаны флаги компиляции - 
не понятно что значит "скомпилировано с CMOV - скомпилировано без CMOV". Да и 
FFmpeg очень сильно оптимизирован "вручную", асм-кодом и SIMD'ами, чтоб это 
было показателем. Если бы я проверял, то, наверное, ипользовал бы разные 
сборки xvid (с --disable-assembly).

> Мне не жалко, но просто страдать по этому поводу я не собираюсь - нет
> смысла. 

-- 
Led


Подробная информация о списке рассылки Devel