[hpc-devel] Need help: mpich2 setup - проблема найдена
Max Lapan
=?iso-8859-1?q?lapan_=CE=C1_yandex-team=2Eru?=
Ср Авг 29 17:24:04 MSD 2007
Всем привет,
а вот растолкуйте мне, в чем тайный смысл этого mpd? Mpirun нормально
пускает все через rsh/ssh, зачем еще одна программулина посередине?
Никогда mpd не конфигурил, а тут вдруг задумался "может я делаю что-то
не так"? :)
Или это один из способов обойти проблему предыдущего треда про
беспарольный доступ?
В Срд, 29/08/2007 в 17:13 +0400, Stanislav Ievlev пишет:
> Проблема оказалась на ровном месте.
>
> На моей машине был не совсем идеальный /etc/hosts
> В результате host1 резолвился в 127.0.0.1 из-за чего собственно и сносило
> внутренюю логику этой программулины ;)
>
> Выяснилось в результате установки lam, который уже заявил об этом прямым
> текстом ;))
>
> Вообще я был сильно удивлён:
> Зачем mpich решил повторить путь lam?
> Вроде как openmpi уже не требует запуска никаких демонов в отличие от
> своего предка.
> А тут не только их внедрили, но ещё и их на питоне написали (при том что mpdboot на C) ...
>
> Неужели демоны, написанные на скриптовых языках не замедляют работу?
>
> On Wed, Aug 29, 2007 at 04:03:09PM +0300, Serge Ryabchun wrote:
> > 2007/8/29, Sanislav Ievlev <inger на altlinux.org>:
> > > Попробовал собрать mvapich2 (mpich2)
> > > для начала в силу отсутствия кластера пробую вариант работы через tcp
> > > (сборке говорил просто configure с параметрами по-умолчанию).
> > >
> > > 1. Есть две машины: на одной работаю сам, вторая - тестовая.
> > > На вторую машину можно беспарольно ходить по ssh.
> > >
> > > С на обоих машинах ~/.mpd.conf с одним и тем же секретом.
> > >
> > > 2. Запуск локально на каждой машине работает отлично:
> > > $mpdboot
> > > $mpirun -n 3 hostname
> > > $mpdallexit
> > >
> > > 3. Делаю ~/mpd.hosts, где собственно перечисляю два хоста:
> > > --
> > > host1.office.altlinux.ru
> > > host2.office.altlinux.ru
> > > --
> > >
> > > 3. Однако запуск mpd на двух узлах не проходит:
> > > $ mpdboot --debug --verbose -n 2
> > > debug: starting
> > > running mpdallexit on host1.office.altlinux.ru
> > > LAUNCHED mpd on host1.office.altlinux.ru via
> > > debug: launch cmd= /usr/bin/mpd.py --ncpus=1 -e -d
> > > debug: mpd on host1.office.altlinux.ru on port 41954
> > > RUNNING: mpd on host1.office.altlinux.ru
> > > debug: info for running mpd: {'ncpus': 1, 'list_port': 41954,
> > > 'entry_port': '', 'host': 'host1.office.altlinux.ru', 'entry_host': '',
> > > 'ifhn': ''}
> > > LAUNCHED mpd on host2.office.altlinux.ru via host1.office.altlinux.ru
> > > debug: launch cmd= ssh -x -n -q host2.office.altlinux.ru '/usr/bin/mpd.py
> > > -h host1.office.altlinux.ru -p 41954 --ncpus=1 -e -d'
> > > debug: mpd on host2.office.altlinux.ru on port 52081
> > > mpdboot_host1.office.altlinux.ru (handle_mpd_output 374): failed to ping
> > > mpd on host2.office.altlinux.ru; recvd output={}
> >
> > ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
> > Вот это очень похоже на другую систему - scali
> > chkconfig xinetd on
> > chkconfig echo on
> > chkconfig echo-udp on
> > service xinetd restart
> >
> > я долго смеялся, но вот такое оно ;-), как здесь не знаю, но тоже может быть
> > также
> > _______________________________________________
> > Hpc-devel mailing list
> > Hpc-devel на lists.altlinux.org
> > https://lists.altlinux.org/mailman/listinfo/hpc-devel
> _______________________________________________
> Hpc-devel mailing list
> Hpc-devel на lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/hpc-devel
--
wbr, Max Lapan
Подробная информация о списке рассылки HPC-devel