[devel] Оптимизированные для i686 и выше библиотеки.
Led
ledest на gmail.com
Пт Сен 3 17:20:53 UTC 2010
On Friday 03 September 2010 20:03:29 Alexey Tourbin wrote:
> On Fri, Sep 03, 2010 at 03:49:30PM +0300, Led wrote:
> > > С такими величинами возникют вопросы по части статистики, типа
> > > действительно там набежало один процент. Потому что но вот понимаешь,
> > > у тебя сейчас например выдает +1%. Но это не значит, что оно
> > > действительно работает быстрее. Просто цифры немного отличаются.
> > > В определенном интервале нельзя сделать вывод, что это действительно
> > > быстрее. На других данных и на другом CPU у тебя уже покажет -1%.
> > >
> > > Потом ещё обычно оптимизация "для бедных" тестируется на богатых
> > > процессорах. Но смысл тестировать cmov на c2d? Замерять?
> > > Там уже всё другое, микроархиектура другая.
> >
> > Потестируйте на атомах (практически, единственная "живая" на сегодня
> > не-x86_64 x86 архитектура), которые НЕ-out-of-order, а самые что ни на
> > есть тупые in-order, в которых даже добавление -mtune-i686 к -march=core2
> > даёт существенный прирост, ощётимый даже "на глаз" к производительности
>
> Существенный прирост. Это сколько примерно? )
> Кстати на атомах cmov дает меньше всего.
> http://www.altlinux.org/FFmpeg
Я говорил о том, что Atom - in-order, поэтому древнее письмо Линуса про
ненужность CMOV на out-of-order процессоре к атому отношения не имеет. А
также про то, что прирост даёт "-march=core2 -mtune=i686" по сравнению с
просто "-march=core2" - как следствие in-order
>
> > P.S. Давайте сначала похваем устриц (а не вспоминать ощущение тех, кто
> > хавал их несколько лет назад), прежде чем что-то утверждать, ок?
>
> Я и говорю, давайте покажем, чего мы добиваемся. А то понимаешь развели
> тут тред, оптимизированные для i686 библиотеки. Можно подумать за это
> на премию можно выдвинуть. Пробуешь разобраться, спрашиваешь людей,
> сколько у вас процентов вышло? Люди подозрительно молчат, mike спрашивает
> "тебе жалко что ли"? thresh хотя бы честно замерил и написал, что там
> выходит около одного процента в лучше случае (а на атомах - меньше).
По указанной ссылке вообще трудно делать оценку: не указаны флаги компиляции -
не понятно что значит "скомпилировано с CMOV - скомпилировано без CMOV". Да и
FFmpeg очень сильно оптимизирован "вручную", асм-кодом и SIMD'ами, чтоб это
было показателем. Если бы я проверял, то, наверное, ипользовал бы разные
сборки xvid (с --disable-assembly).
> Мне не жалко, но просто страдать по этому поводу я не собираюсь - нет
> смысла.
--
Led
Подробная информация о списке рассылки Devel