[sisyphus] ATLAS vs BLAS performance

Andrey Khavryuchenko =?iso-8859-1?q?akhavr_=CE=C1_kds=2Ecom=2Eua?=
Пн Июн 5 10:19:46 MSD 2006


Alexey,

"AT" == Alexey Tourbin wrote:

 AT> On Sun, Jun 04, 2006 at 06:04:54PM -0400, Ivan Adzhubey wrote:
 >> On Sunday 04 June 2006 17:05, Alexey Tourbin wrote:
 >> > Я разобрался, как надо собирать ATLAS.
 >> > Вот предварительный benchmark.
 >> >
 >> > Fortran BLAS:
 >> > > mm <- matrix(rnorm(10^6), ncol = 10^3)
 >> > > system.time(crossprod(mm))
 >> >
 >> > [1] 1.572 0.004 1.580 0.000 0.000
 >> >
 >> > ATLAS w/ SSE2:
 >> > > mm <- matrix(rnorm(10^6), ncol = 10^3)
 >> > > system.time(crossprod(mm))
 >> >
 >> > [1] 0.344 0.020 0.369 0.000 0.000

Когда можно ждать пакеты?

 >> А вот с GotoBLAS 1.2 (P4 2.8GHz, R 2.3.0):
 >> 
 >> > mm <- matrix(rnorm(10^6), ncol = 10^3)
 >> > system.time(crossprod(mm))
 >> [1] 0.232 0.012 0.270 0.000 0.000

 AT> Похоже, что процессор у Вас помощнее.  Суть в том, что разница будет
 AT> если и заментной, то не значительной.  Учитывая то, что ATLAS -- это
 AT> free software, а GotoBLAS -- проприетарный софт, то агитирую за ATLAS. :)

Я бы хотел/просил для GotoBLAS тоже сделать nosrc.rpm.  И для ATLAS
наверное тоже.

[...]

 AT> В общем, если это будет работать из коробки как надо и если по сравнению
 AT> с GotoBLAS разница будет не хуже, чем в полтора раза, тогда я буду
 AT> доволелен.  Потому что основной разрыв по сравнению с фортраном всё
 AT> равно ликвидирован, а 10-20% на практике редко что решают.

Если бы... :(  Когда расчёты идут месяцами, то 10-20% - весьма существенное
время. 

Понятное дело, что при подобной постановке задачи надо оптимизировать пакет
под конкретную хост-систему.  Но хотелось бы всё же иметь максимум
возможного "из коробки".

-- 
Andrey V Khavryuchenko            
Software Development Company http://www.kds.com.ua/



Подробная информация о списке рассылки Sisyphus