[hpc-devel] Need help: mpich2 setup
Sanislav Ievlev
=?iso-8859-1?q?inger_=CE=C1_altlinux=2Eorg?=
Ср Авг 29 16:37:08 MSD 2007
Попробовал собрать mvapich2 (mpich2)
для начала в силу отсутствия кластера пробую вариант работы через tcp
(сборке говорил просто configure с параметрами по-умолчанию).
1. Есть две машины: на одной работаю сам, вторая - тестовая.
На вторую машину можно беспарольно ходить по ssh.
С на обоих машинах ~/.mpd.conf с одним и тем же секретом.
2. Запуск локально на каждой машине работает отлично:
$mpdboot
$mpirun -n 3 hostname
$mpdallexit
3. Делаю ~/mpd.hosts, где собственно перечисляю два хоста:
--
host1.office.altlinux.ru
host2.office.altlinux.ru
--
3. Однако запуск mpd на двух узлах не проходит:
$ mpdboot --debug --verbose -n 2
debug: starting
running mpdallexit on host1.office.altlinux.ru
LAUNCHED mpd on host1.office.altlinux.ru via
debug: launch cmd= /usr/bin/mpd.py --ncpus=1 -e -d
debug: mpd on host1.office.altlinux.ru on port 41954
RUNNING: mpd on host1.office.altlinux.ru
debug: info for running mpd: {'ncpus': 1, 'list_port': 41954,
'entry_port': '', 'host': 'host1.office.altlinux.ru', 'entry_host': '',
'ifhn': ''}
LAUNCHED mpd on host2.office.altlinux.ru via host1.office.altlinux.ru
debug: launch cmd= ssh -x -n -q host2.office.altlinux.ru '/usr/bin/mpd.py
-h host1.office.altlinux.ru -p 41954 --ncpus=1 -e -d'
debug: mpd on host2.office.altlinux.ru on port 52081
mpdboot_host1.office.altlinux.ru (handle_mpd_output 374): failed to ping
mpd on host2.office.altlinux.ru; recvd output={}
4. Вопрос: Что я сделал не так?
P.S. Запуск вручную с расстановкой отладки в питоньем деемоне показал, что mpd.py который запускается на host2 одним
концом соединяется с host1, а вторым пытается соединиться с 127.0.0.1 и ес-но обламывается ибо никого там нет.
Может что не доконфигурил на стороне host2?
$ mpich2version
Version: 1.0.5
Device: ch3:sock
Configure Options: '--build=x86_64-alt-linux' '--host=x86_64-alt-linux'
'--prefix=/usr' '--exec-prefix=/usr' '--bindir=/usr/bin'
'--sbindir=/usr/sbin' '--sysconfdir=/etc' '--datadir=/usr/share'
'--includedir=/usr/include' '--libdir=/usr/lib64' '--libexecdir=/usr/lib'
'--localstatedir=/var/lib' '--sharedstatedir=/usr/com'
'--mandir=/usr/share/man' '--infodir=/usr/share/info'
'--disable-dependency-tracking' '--without-included-gettext'
'--with-pm=mpd' '--without-mpe' 'CFLAGS=-pipe -Wall -O2' 'CXXFLAGS=-pipe
-Wall -O2' 'FFLAGS=-pipe -Wall -O2' 'build_alias=x86_64-alt-linux'
'host_alias=x86_64-alt-linux'
CC: x86_64-alt-linux-gcc -pipe -Wall -O2
CXX: c++ -pipe -Wall -O2
F77: x86_64-alt-linux-g77 -pipe -Wall -O2
F90: x86_64-alt-linux-f95
Подробная информация о списке рассылки HPC-devel