[hpc-devel] Q: беспарольные пользователи на множественных узлах
Alexander A. Naumov
=?iso-8859-1?q?alexander=2Enaumov_=CE=C1_t-platforms=2Eru?=
Ср Авг 29 01:11:06 MSD 2007
Сереж, спасибо большое.
Но lustre ведь будет нагружать ib, так?
То есть счетные задачи могут замедляться?
--
С уважением,
Александр Наумов
ООО "Т-Платформы"
Тел.: (495)744-0995
http://www.t-platforms.ru
On Tue, Aug 28, 2007 at 11:23:48PM +0300, Serge Ryabchun wrote:
> 28.08.07, Alexander A. Naumov<alexander.naumov на t-platforms.ru> написал(а):
> > Не уверен.
> > На больших кластерах имеет смысл использовать специальные системы хранения,
> > узел пусть считает, на не занимается файловой системой.
>
> top - 23:18:33 up 14 days, 10:12, 1 user, load average: 4.90, 4.90, 4.89
> Tasks: 122 total, 6 running, 116 sleeping, 0 stopped, 0 zombie
> Cpu(s): 99.3% us, 0.7% sy, 0.0% ni, 0.0% id, 0.0% wa, 0.0% hi, 0.0% si
> Mem: 8162020k total, 5735356k used, 2426664k free, 0k buffers
> Swap: 80405284k total, 116k used, 80405168k free, 1948472k cached
>
> PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
> 27043 ru 25 0 1453m 873m 3944 R 100 11.0 115:36.54 war
> 27042 ru 25 0 1454m 872m 3944 R 99 10.9 115:35.98 war
> 27041 ru 25 0 1483m 872m 3948 R 100 10.9 115:33.79 war
> 27040 ru 25 0 1438m 553m 3848 R 100 6.9 115:32.76 war
> 185 root 15 0 0 0 0 S 0 0.0 30:09.69 pdflush
> 2879 ntp 15 0 22228 8084 6744 S 0 0.1 29:04.41 ntpd
> 285 root 34 19 0 0 0 R 0 0.0 10:26.42 kipmi0
> 3053 root 15 0 0 0 0 S 0 0.0 6:04.36
> socknal_reaper
> 3030 root 15 0 0 0 0 S 0 0.0 6:00.80
> kiblnd_connd
> 2537 root 10 -5 0 0 0 S 0 0.0 5:00.20 ipoib
> 13 root 10 -5 0 0 0 S 0 0.0 3:14.32 events/3
> 1 root 15 0 4820 576 484 S 0 0.0 1:38.64 init
> 12 root 10 -5 0 0 0 S 0 0.0 1:29.37 events/2
> 3055 root 15 0 0 0 0 S 0 0.0 0:48.85 ptlrpcd
> 11 root 10 -5 0 0 0 S 0 0.0 0:47.34 events/1
> 3057 root 15 0 0 0 0 S 0 0.0 0:22.71 ll_ping
> 4248 root 18 0 66720 4336 2044 S 0 0.1 0:18.43 slurmd
> 3027 root 15 0 0 0 0 S 0 0.0 0:17.21
> kiblnd_sd_01
> 3026 root 15 0 0 0 0 S 0 0.0 0:17.13
> kiblnd_sd_00
> 3028 root 15 0 0 0 0 S 0 0.0 0:17.12
> kiblnd_sd_02
> 3029 root 15 0 0 0 0 S 0 0.0 0:16.58
> kiblnd_sd_03
> 4147 root 15 0 0 0 0 S 0 0.0 0:12.80
> ldlm_bl_02
> 4150 root 15 0 0 0 0 S 0 0.0 0:12.36
> ldlm_bl_05
> 4152 root 15 0 0 0 0 S 0 0.0 0:12.12
> ldlm_bl_07
> 4145 root 15 0 0 0 0 S 0 0.0 0:12.10
> ldlm_bl_00
> 4148 root 15 0 0 0 0 S 0 0.0 0:12.03
> ldlm_bl_03
> 4151 root 15 0 0 0 0 S 0 0.0 0:12.03
> ldlm_bl_06
> 4146 root 15 0 0 0 0 S 0 0.0 0:11.93
> ldlm_bl_01
> 4149 root 15 0 0 0 0 S 0 0.0 0:11.67
> ldlm_bl_04
> 2322 root 15 0 5852 728 588 S 0 0.0 0:08.34 syslogd
> 27010 ru 15 0 43244 4808 2012 S 0 0.1 0:05.44 mpirun
> 186 root 10 -5 0 0 0 S 0 0.0 0:01.78 kswapd0
>
> Я не думаю, что это много. Lustre для узла через IB - это
> примерно тоже, что и ext3, чуть больше. Вот через GigE,
> таки да, сильно больше
>
> # mount
> n000.c03.icyb:/.cluster/03 on / type nfs
> (rw,vers=3,rsize=32768,wsize=32768,hard,nolock,proto=udp,timeo=7,retrans=3,sec=sys,addr=n000.c03.icyb)
> proc on /proc type proc (rw)
> sysfs on /sys type sysfs (rw)
> none on /dev type tmpfs (rw)
> devpts on /dev/pts type devpts (rw)
> tmpfs on /dev/shm type tmpfs (rw)
> 11.0.0.171 на o2ib:/work on /mnt/work type lustre (rw)
> 11.0.0.171 на o2ib:/adm on /mnt/adm type lustre (rw)
> 11.0.0.171 на o2ib:/work on /home/users type lustre (rw)
> _______________________________________________
> Hpc-devel mailing list
> Hpc-devel на lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/hpc-devel
Подробная информация о списке рассылки HPC-devel