[sisyphus] ATLAS vs BLAS performance

Alexey Tourbin =?iso-8859-1?q?at_=CE=C1_altlinux=2Eru?=
Пн Июн 5 05:17:09 MSD 2006


On Mon, Jun 05, 2006 at 02:26:30AM +0400, Alexey Tourbin wrote:
> On Sun, Jun 04, 2006 at 06:04:54PM -0400, Ivan Adzhubey wrote:
> > On Sunday 04 June 2006 17:05, Alexey Tourbin wrote:
> > > Я разобрался, как надо собирать ATLAS.
> > > Вот предварительный benchmark.
> > >
> > > Fortran BLAS:
> > > > mm <- matrix(rnorm(10^6), ncol = 10^3)
> > > > system.time(crossprod(mm))
> > >
> > > [1] 1.572 0.004 1.580 0.000 0.000
> > >
> > > ATLAS w/ SSE2:
> > > > mm <- matrix(rnorm(10^6), ncol = 10^3)
> > > > system.time(crossprod(mm))
> > >
> > > [1] 0.344 0.020 0.369 0.000 0.000
> > 
> > А вот с GotoBLAS 1.2 (P4 2.8GHz, R 2.3.0):
> > 
> > > mm <- matrix(rnorm(10^6), ncol = 10^3)
> > > system.time(crossprod(mm))
> > [1] 0.232 0.012 0.270 0.000 0.000
> 
> model name      : AMD Athlon(tm) 64 Processor 3200+
> cpu MHz         : 2050.186
> cache size      : 512 KB

> В общем, если это будет работать из коробки как надо и если по сравнению
> с GotoBLAS разница будет не хуже, чем в полтора раза, тогда я буду
> доволелен.  Потому что основной разрыв по сравнению с фортраном всё
> равно ликвидирован, а 10-20% на практике редко что решают.

А вот ATLAS без оптимизации под P4SSE2:

> mm <- matrix(rnorm(10^6), ncol = 10^3)
> system.time(crossprod(mm))
[1] 0.584 0.012 0.624 0.000 0.000

Почти в два раза хуже, чем с SSE2 (но почти в три раза лучше, чем
фортран).  Значит стоит делать /usr/lib/sse2.
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Тип     : application/pgp-signature
Размер  : 191 байтов
Описание: =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Url     : <http://lists.altlinux.org/pipermail/sisyphus/attachments/20060605/4dff8d2c/attachment-0003.bin>


Подробная информация о списке рассылки Sisyphus