[sisyphus] ATLAS vs BLAS performance
Andrey Khavryuchenko
=?iso-8859-1?q?akhavr_=CE=C1_kds=2Ecom=2Eua?=
Пн Июн 5 10:19:46 MSD 2006
Alexey,
"AT" == Alexey Tourbin wrote:
AT> On Sun, Jun 04, 2006 at 06:04:54PM -0400, Ivan Adzhubey wrote:
>> On Sunday 04 June 2006 17:05, Alexey Tourbin wrote:
>> > Я разобрался, как надо собирать ATLAS.
>> > Вот предварительный benchmark.
>> >
>> > Fortran BLAS:
>> > > mm <- matrix(rnorm(10^6), ncol = 10^3)
>> > > system.time(crossprod(mm))
>> >
>> > [1] 1.572 0.004 1.580 0.000 0.000
>> >
>> > ATLAS w/ SSE2:
>> > > mm <- matrix(rnorm(10^6), ncol = 10^3)
>> > > system.time(crossprod(mm))
>> >
>> > [1] 0.344 0.020 0.369 0.000 0.000
Когда можно ждать пакеты?
>> А вот с GotoBLAS 1.2 (P4 2.8GHz, R 2.3.0):
>>
>> > mm <- matrix(rnorm(10^6), ncol = 10^3)
>> > system.time(crossprod(mm))
>> [1] 0.232 0.012 0.270 0.000 0.000
AT> Похоже, что процессор у Вас помощнее. Суть в том, что разница будет
AT> если и заментной, то не значительной. Учитывая то, что ATLAS -- это
AT> free software, а GotoBLAS -- проприетарный софт, то агитирую за ATLAS. :)
Я бы хотел/просил для GotoBLAS тоже сделать nosrc.rpm. И для ATLAS
наверное тоже.
[...]
AT> В общем, если это будет работать из коробки как надо и если по сравнению
AT> с GotoBLAS разница будет не хуже, чем в полтора раза, тогда я буду
AT> доволелен. Потому что основной разрыв по сравнению с фортраном всё
AT> равно ликвидирован, а 10-20% на практике редко что решают.
Если бы... :( Когда расчёты идут месяцами, то 10-20% - весьма существенное
время.
Понятное дело, что при подобной постановке задачи надо оптимизировать пакет
под конкретную хост-систему. Но хотелось бы всё же иметь максимум
возможного "из коробки".
--
Andrey V Khavryuchenko
Software Development Company http://www.kds.com.ua/
Подробная информация о списке рассылки Sisyphus