[hpc-devel] Q: беспарольные пользователи на множественных узлах

Serge Ryabchun =?iso-8859-1?q?serge=2Eryabchun_=CE=C1_gmail=2Ecom?=
Ср Авг 29 00:23:48 MSD 2007


28.08.07, Alexander A. Naumov<alexander.naumov на t-platforms.ru> написал(а):
> Не уверен.
> На больших кластерах имеет смысл использовать специальные системы хранения,
> узел пусть считает, на не занимается файловой системой.

top - 23:18:33 up 14 days, 10:12,  1 user,  load average: 4.90, 4.90, 4.89
Tasks: 122 total,   6 running, 116 sleeping,   0 stopped,   0 zombie
Cpu(s): 99.3% us,  0.7% sy,  0.0% ni,  0.0% id,  0.0% wa,  0.0% hi,  0.0% si
Mem:   8162020k total,  5735356k used,  2426664k free,        0k buffers
Swap: 80405284k total,      116k used, 80405168k free,  1948472k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
27043 ru        25   0 1453m 873m 3944 R  100 11.0 115:36.54 war
27042 ru        25   0 1454m 872m 3944 R   99 10.9 115:35.98 war
27041 ru        25   0 1483m 872m 3948 R  100 10.9 115:33.79 war
27040 ru        25   0 1438m 553m 3848 R  100  6.9 115:32.76 war
  185 root      15   0     0    0    0 S    0  0.0  30:09.69 pdflush
 2879 ntp       15   0 22228 8084 6744 S    0  0.1  29:04.41 ntpd
  285 root      34  19     0    0    0 R    0  0.0  10:26.42 kipmi0
 3053 root      15   0     0    0    0 S    0  0.0   6:04.36
socknal_reaper
 3030 root      15   0     0    0    0 S    0  0.0   6:00.80
kiblnd_connd
 2537 root      10  -5     0    0    0 S    0  0.0   5:00.20 ipoib
   13 root      10  -5     0    0    0 S    0  0.0   3:14.32 events/3
    1 root      15   0  4820  576  484 S    0  0.0   1:38.64 init
   12 root      10  -5     0    0    0 S    0  0.0   1:29.37 events/2
 3055 root      15   0     0    0    0 S    0  0.0   0:48.85 ptlrpcd
   11 root      10  -5     0    0    0 S    0  0.0   0:47.34 events/1
 3057 root      15   0     0    0    0 S    0  0.0   0:22.71 ll_ping
 4248 root      18   0 66720 4336 2044 S    0  0.1   0:18.43 slurmd
 3027 root      15   0     0    0    0 S    0  0.0   0:17.21
kiblnd_sd_01
 3026 root      15   0     0    0    0 S    0  0.0   0:17.13
kiblnd_sd_00
 3028 root      15   0     0    0    0 S    0  0.0   0:17.12
kiblnd_sd_02
 3029 root      15   0     0    0    0 S    0  0.0   0:16.58
kiblnd_sd_03
 4147 root      15   0     0    0    0 S    0  0.0   0:12.80
ldlm_bl_02
 4150 root      15   0     0    0    0 S    0  0.0   0:12.36
ldlm_bl_05
 4152 root      15   0     0    0    0 S    0  0.0   0:12.12
ldlm_bl_07
 4145 root      15   0     0    0    0 S    0  0.0   0:12.10
ldlm_bl_00
 4148 root      15   0     0    0    0 S    0  0.0   0:12.03
ldlm_bl_03
 4151 root      15   0     0    0    0 S    0  0.0   0:12.03
ldlm_bl_06
 4146 root      15   0     0    0    0 S    0  0.0   0:11.93
ldlm_bl_01
 4149 root      15   0     0    0    0 S    0  0.0   0:11.67
ldlm_bl_04
 2322 root      15   0  5852  728  588 S    0  0.0   0:08.34 syslogd
27010 ru        15   0 43244 4808 2012 S    0  0.1   0:05.44 mpirun
  186 root      10  -5     0    0    0 S    0  0.0   0:01.78 kswapd0

Я не думаю, что это много. Lustre для узла через IB - это
примерно тоже, что и ext3, чуть больше. Вот через GigE,
таки да, сильно больше

# mount
n000.c03.icyb:/.cluster/03 on / type nfs
(rw,vers=3,rsize=32768,wsize=32768,hard,nolock,proto=udp,timeo=7,retrans=3,sec=sys,addr=n000.c03.icyb)
proc on /proc type proc (rw)
sysfs on /sys type sysfs (rw)
none on /dev type tmpfs (rw)
devpts on /dev/pts type devpts (rw)
tmpfs on /dev/shm type tmpfs (rw)
11.0.0.171 на o2ib:/work on /mnt/work type lustre (rw)
11.0.0.171 на o2ib:/adm on /mnt/adm type lustre (rw)
11.0.0.171 на o2ib:/work on /home/users type lustre (rw)


Подробная информация о списке рассылки HPC-devel