[hpc-devel] Q: беспарольные пользователи на множественных узлах

Alexander A. Naumov =?iso-8859-1?q?alexander=2Enaumov_=CE=C1_t-platforms=2Eru?=
Ср Авг 29 01:11:06 MSD 2007


Сереж, спасибо большое.
Но lustre ведь будет нагружать ib, так?
То есть счетные задачи могут замедляться? 



-- 
С уважением,
Александр Наумов
ООО "Т-Платформы"
Тел.: (495)744-0995
http://www.t-platforms.ru
On Tue, Aug 28, 2007 at 11:23:48PM +0300, Serge Ryabchun wrote:
> 28.08.07, Alexander A. Naumov<alexander.naumov на t-platforms.ru> написал(а):
> > Не уверен.
> > На больших кластерах имеет смысл использовать специальные системы хранения,
> > узел пусть считает, на не занимается файловой системой.
> 
> top - 23:18:33 up 14 days, 10:12,  1 user,  load average: 4.90, 4.90, 4.89
> Tasks: 122 total,   6 running, 116 sleeping,   0 stopped,   0 zombie
> Cpu(s): 99.3% us,  0.7% sy,  0.0% ni,  0.0% id,  0.0% wa,  0.0% hi,  0.0% si
> Mem:   8162020k total,  5735356k used,  2426664k free,        0k buffers
> Swap: 80405284k total,      116k used, 80405168k free,  1948472k cached
> 
>   PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
> 27043 ru        25   0 1453m 873m 3944 R  100 11.0 115:36.54 war
> 27042 ru        25   0 1454m 872m 3944 R   99 10.9 115:35.98 war
> 27041 ru        25   0 1483m 872m 3948 R  100 10.9 115:33.79 war
> 27040 ru        25   0 1438m 553m 3848 R  100  6.9 115:32.76 war
>   185 root      15   0     0    0    0 S    0  0.0  30:09.69 pdflush
>  2879 ntp       15   0 22228 8084 6744 S    0  0.1  29:04.41 ntpd
>   285 root      34  19     0    0    0 R    0  0.0  10:26.42 kipmi0
>  3053 root      15   0     0    0    0 S    0  0.0   6:04.36
> socknal_reaper
>  3030 root      15   0     0    0    0 S    0  0.0   6:00.80
> kiblnd_connd
>  2537 root      10  -5     0    0    0 S    0  0.0   5:00.20 ipoib
>    13 root      10  -5     0    0    0 S    0  0.0   3:14.32 events/3
>     1 root      15   0  4820  576  484 S    0  0.0   1:38.64 init
>    12 root      10  -5     0    0    0 S    0  0.0   1:29.37 events/2
>  3055 root      15   0     0    0    0 S    0  0.0   0:48.85 ptlrpcd
>    11 root      10  -5     0    0    0 S    0  0.0   0:47.34 events/1
>  3057 root      15   0     0    0    0 S    0  0.0   0:22.71 ll_ping
>  4248 root      18   0 66720 4336 2044 S    0  0.1   0:18.43 slurmd
>  3027 root      15   0     0    0    0 S    0  0.0   0:17.21
> kiblnd_sd_01
>  3026 root      15   0     0    0    0 S    0  0.0   0:17.13
> kiblnd_sd_00
>  3028 root      15   0     0    0    0 S    0  0.0   0:17.12
> kiblnd_sd_02
>  3029 root      15   0     0    0    0 S    0  0.0   0:16.58
> kiblnd_sd_03
>  4147 root      15   0     0    0    0 S    0  0.0   0:12.80
> ldlm_bl_02
>  4150 root      15   0     0    0    0 S    0  0.0   0:12.36
> ldlm_bl_05
>  4152 root      15   0     0    0    0 S    0  0.0   0:12.12
> ldlm_bl_07
>  4145 root      15   0     0    0    0 S    0  0.0   0:12.10
> ldlm_bl_00
>  4148 root      15   0     0    0    0 S    0  0.0   0:12.03
> ldlm_bl_03
>  4151 root      15   0     0    0    0 S    0  0.0   0:12.03
> ldlm_bl_06
>  4146 root      15   0     0    0    0 S    0  0.0   0:11.93
> ldlm_bl_01
>  4149 root      15   0     0    0    0 S    0  0.0   0:11.67
> ldlm_bl_04
>  2322 root      15   0  5852  728  588 S    0  0.0   0:08.34 syslogd
> 27010 ru        15   0 43244 4808 2012 S    0  0.1   0:05.44 mpirun
>   186 root      10  -5     0    0    0 S    0  0.0   0:01.78 kswapd0
> 
> Я не думаю, что это много. Lustre для узла через IB - это
> примерно тоже, что и ext3, чуть больше. Вот через GigE,
> таки да, сильно больше
> 
> # mount
> n000.c03.icyb:/.cluster/03 on / type nfs
> (rw,vers=3,rsize=32768,wsize=32768,hard,nolock,proto=udp,timeo=7,retrans=3,sec=sys,addr=n000.c03.icyb)
> proc on /proc type proc (rw)
> sysfs on /sys type sysfs (rw)
> none on /dev type tmpfs (rw)
> devpts on /dev/pts type devpts (rw)
> tmpfs on /dev/shm type tmpfs (rw)
> 11.0.0.171 на o2ib:/work on /mnt/work type lustre (rw)
> 11.0.0.171 на o2ib:/adm on /mnt/adm type lustre (rw)
> 11.0.0.171 на o2ib:/work on /home/users type lustre (rw)
> _______________________________________________
> Hpc-devel mailing list
> Hpc-devel на lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/hpc-devel



Подробная информация о списке рассылки HPC-devel