[hpc-devel] Need help: mpich2 setup - проблема найдена

Serge Ryabchun =?iso-8859-1?q?serge=2Eryabchun_=CE=C1_gmail=2Ecom?=
Ср Авг 29 17:50:53 MSD 2007


29.08.07, Andrey Slepuhin<andrey.slepuhin на t-platforms.ru> написал(а):
> Max Lapan wrote:
> > Всем привет,
> >
> > а вот растолкуйте мне, в чем тайный смысл этого mpd? Mpirun нормально
> > пускает все через rsh/ssh, зачем еще одна программулина посередине?
> > Никогда mpd не конфигурил, а тут вдруг задумался "может я делаю что-то
> > не так"? :)
> >
> > Или это один из способов обойти проблему предыдущего треда про
> > беспарольный доступ?
> >
> Вообще-то mpd (или аналог) призван решать 3 проблемы:
> 1) Быстрый запуск заданий на большом количестве узлов (даже на 280 узлах
> запуск задачи через rsh/ssh довольно длительная процедура)
> 2) Содействие имплементации функций порождения процессов из стандарта MPI-2
> 3) Контроль за выполнением MPI-процессов и их аккуратное терминирование
> (в MVAPICH, например, при запуске через ssh регулярно висящие процессы
> остаются)
>
> Другой вопрос, в какой мере mpd эти проблемы действительно решает... :):)

пункт 3) решает частично, у нас за mpd в slurm стоит хук на окончание задачи
с последующим ssh на все узлы ресурса и зачисткой хвостов, изредка остаются.
кстати, в openmpi тоже самое ;-)

1) таки да, сильно помогает в openmpi и тратит меньше памяти, как в mpich2 не
знаю, у нас там только 32 узла по 2 процессора, разница не ощущается и на нее
никто специально не смотрел


Подробная информация о списке рассылки HPC-devel