[hpc-devel] I: результаты очередной проверки на кластере

Alexander A. Naumov =?iso-8859-1?q?alexander=2Enaumov_=CE=C1_t-platforms=2Eru?=
Пт Янв 25 09:13:39 MSK 2008


Коллеги, день добрый!

А чем плоха идея стартовать инфинибэнд как отдельный сервис 
из init-скрипта?

Мы запускали тесты osu_bw и osu_latency из OSU benchmarks.


-- 
С уважением,
Александр Наумов
ООО "Т-Платформы"
Тел.: (495)744-0995
http://www.t-platforms.ru
On Thu, Jan 24, 2008 at 05:11:56PM +0300, Stanislav Ievlev wrote:
> Всем привет!
> 
> Сегодня мы наконец-таки добрались до кластера и посмотрели как там
> живёт  ALT Linux (ходят слухи, что на следующей недели мы сможем
> наконец увидеть железку и тогда дела пойдут быстрее ;) ).
> 
> Из нового: поставили одну машину с CD, а вторую загрузили как
> бездисковую станцию( воспользовались mknfsroot, настроили dhcp,
> остальное из коробки), проверили сразу две реализации MPI: openmpi и
> mvapich2.
> 
> Вот подробное описание произошедшего:
> 
> система:
> * не хватает в системе установленных devel-частей от libibverbs и libibumad.
> * кажется dhcpd по умолчанию off, надо бы уточнить.
> 
> Итого: Добавим недостающее. Ещё говорят полезно иметь несколько
> реализаций одновременно посему надо собрать ещё mvapich, mpi-selector
> и повесить на него все эти реализации. Правильно ли я понимаю, что
> mpi-selector, позволяет каждому пользователю сделать индивидуальные
> настройки?
> 
> ядро:
>  * автоматом загрузилось mlx4_core.
>  * ручками загружали mlx4_ib ib_uverbs, ib_umad.
>  * имеющихся правил udev хватило чтобы автоматом создать необходимые
> файлы в /dev для infiniband.
> 
> Итого: надо понять почему не загрузилось автоматом mlx4_ib и что с
> этим делать (может быть зависимости в модулях подправить лучше).
> Оставшиеся два модуля видимо надо прописать в /etc/modutils.d. Не знаю
> точно как там это делается, но в идеале было бы здорово добавить их в
> зависимость к mlx4_ib, чтобы не делать "тупой" загрузки каждый раз.
> 
> mknfsroot
>   * надо добавить драйвер e1000. А вообще надо бы чтобы mkinitrd начал
> принимать список модулей, а не только серию --with-module ...
>  * была одна плюха ошибка в настройках mca для openmpi. В системе
> дисковой было blt = openib, а в nfsroot - blt = tcp. Ну это мелкий
> косяк по забывчивости.
>  * кажется схватился /etc/mtab из хост системы, надо бы его сделать
> как и для livecd, симлинком на /proc/mounts.
>  * для теста не пользовались bind, использовали только /etc/hosts.
> Надо бы копировать /etc/hosts из хост-системы в создаваемый nfsroot.
> 
> Итого: мелкие косяки в mknfsroot поправим.
> 
> Что ещё остаётся:
> 
> Антон, надо бы решить вопрос по получению исходного кода драйвера для Панасуса.
> 
> Дополнительные вопросы:
> 
> Вопрос ко всем: Использует ли кто bind на кластерах или предпочтение
> отдаётся /etc/hosts? Может быть вообще убрать bind из состава
> дистрибутива за ненадобностью?
> 
> Вопрос к Алесандру Наумову: Как называются тесты производительности,
> которые мы смотрели? Откуда их брать?
> 
> Вопросы к Александру Московскому:
> Какой коммерческий софт стоит проверить на совместимость с
> дистрибутивом? Наверное уже стоит потихоньку начинать переговоры с
> фирмами о проведении подобного тестирования.
> Стоит наверное потихоньку начинать тестировать и интегрировать в
> дистрибутив софт, входящий в программу СКИФ.
> 
> --
> Ну вот и всё ;)
> Станислав Иевлев.
> _______________________________________________
> HPC-devel mailing list
> HPC-devel на lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/hpc-devel



Подробная информация о списке рассылки HPC-devel