[hpc-devel] Need help: mpich2 setup

Sanislav Ievlev =?iso-8859-1?q?inger_=CE=C1_altlinux=2Eorg?=
Ср Авг 29 16:37:08 MSD 2007


Попробовал собрать mvapich2 (mpich2)
для начала в силу отсутствия кластера пробую вариант работы через tcp 
(сборке говорил просто configure с параметрами по-умолчанию).

1. Есть две машины: на одной работаю сам, вторая - тестовая.
На вторую машину можно беспарольно ходить по ssh.

С на обоих машинах ~/.mpd.conf с одним и тем же секретом.

2. Запуск локально на каждой машине работает отлично:
   $mpdboot
   $mpirun -n 3 hostname
   $mpdallexit

3. Делаю ~/mpd.hosts, где собственно перечисляю два хоста:
--
   host1.office.altlinux.ru
   host2.office.altlinux.ru
--

3. Однако запуск mpd на двух узлах не проходит:
   $ mpdboot --debug --verbose -n 2 
	debug: starting
	running mpdallexit on host1.office.altlinux.ru
	LAUNCHED mpd on host1.office.altlinux.ru  via  
	debug: launch cmd= /usr/bin/mpd.py   --ncpus=1 -e -d
	debug: mpd on host1.office.altlinux.ru  on port 41954
	RUNNING: mpd on host1.office.altlinux.ru
	debug: info for running mpd: {'ncpus': 1, 'list_port': 41954,
	'entry_port': '', 'host': 'host1.office.altlinux.ru', 'entry_host': '',
	'ifhn': ''}
	LAUNCHED mpd on host2.office.altlinux.ru  via  host1.office.altlinux.ru
	debug: launch cmd= ssh -x -n -q host2.office.altlinux.ru '/usr/bin/mpd.py
	-h host1.office.altlinux.ru -p 41954  --ncpus=1 -e -d' 
	debug: mpd on host2.office.altlinux.ru  on port 52081
	mpdboot_host1.office.altlinux.ru (handle_mpd_output 374): failed to ping
	mpd on host2.office.altlinux.ru; recvd output={}

4. Вопрос: Что я сделал не так?

P.S. Запуск вручную с расстановкой отладки в питоньем деемоне показал, что mpd.py который запускается на host2 одним
концом соединяется с host1, а вторым пытается соединиться с 127.0.0.1 и ес-но обламывается ибо никого там нет.
Может что не доконфигурил на стороне host2?


$ mpich2version 
Version:           1.0.5
Device:            ch3:sock
Configure Options: '--build=x86_64-alt-linux' '--host=x86_64-alt-linux'
'--prefix=/usr' '--exec-prefix=/usr' '--bindir=/usr/bin'
'--sbindir=/usr/sbin' '--sysconfdir=/etc' '--datadir=/usr/share'
'--includedir=/usr/include' '--libdir=/usr/lib64' '--libexecdir=/usr/lib'
'--localstatedir=/var/lib' '--sharedstatedir=/usr/com'
'--mandir=/usr/share/man' '--infodir=/usr/share/info'
'--disable-dependency-tracking' '--without-included-gettext'
'--with-pm=mpd' '--without-mpe' 'CFLAGS=-pipe -Wall -O2' 'CXXFLAGS=-pipe
-Wall -O2' 'FFLAGS=-pipe -Wall -O2' 'build_alias=x86_64-alt-linux'
'host_alias=x86_64-alt-linux'
CC:  x86_64-alt-linux-gcc -pipe -Wall -O2
CXX: c++ -pipe -Wall -O2
F77: x86_64-alt-linux-g77 -pipe -Wall -O2
F90: x86_64-alt-linux-f95 




Подробная информация о списке рассылки HPC-devel