[hpc-devel] Need help: mpich2 setup - проблема найдена

Serge Ryabchun =?iso-8859-1?q?serge=2Eryabchun_=CE=C1_gmail=2Ecom?=
Ср Авг 29 17:35:56 MSD 2007


29.08.07, Stanislav Ievlev<inger на altlinux.org> написал(а):
> Проблема оказалась на ровном месте.
>
> На моей машине был не совсем идеальный /etc/hosts
> В результате host1 резолвился в 127.0.0.1 из-за чего собственно и сносило
> внутренюю логику этой программулины ;)
>
> Выяснилось в результате установки lam, который уже заявил об этом прямым
> текстом ;))
>
> Вообще я был сильно удивлён:
> Зачем mpich решил повторить путь lam?
> Вроде как openmpi уже не требует запуска никаких демонов в отличие от
> своего предка.

требует - orted. Это гораздо более правильный вариант по сравнению с
sshd на каждый процесс на 8-ми ядерной машине

> А тут не только их внедрили, но ещё и их на питоне написали (при том что mpdboot на C) ...
>
> Неужели демоны, написанные на скриптовых языках не замедляют работу?

Ну, насчет замедляет, то нет, он просто в памяти болтается, а вот то что память
отъедает не по детски, так это да. У mpich2 другая засада, задача стартует не
с управляющего узла, а из одного из узлов ресурса, т.е. один из узлов становится
управляющим для задачи и вот у него этой памяти отъедается очень много на
большом количестве процессоров, в итоге плохо всем. одно из двух, или у
пацанов небольшой кластер для разработки и они не видят проблему, либо памяти
не меряно и они тоже проблему не видят.


Подробная информация о списке рассылки HPC-devel