[hpc-devel] Q: openmpi - ещё запрос

Denis Pynkin =?iso-8859-1?q?d=2Epynkin_=CE=C1_sam-solutions=2Enet?=
Вт Авг 28 21:08:02 MSD 2007


On 27 August 2007, Stanislav Ievlev wrote:

прошу прощения за задержку - семейные проблемы :-(
до пятницы наверное не будет возможности в инет вылезти и почту почитать :-(

если что-то срочное - делайте NMU, только предупредить не забудьте плиз ;-)
новая версия ущла в инкаминг

> > хм... может проще вам этот пакет перехватить ? ;-)
> > если есть желание
>
> Ну если ещё что-то потребуется - возьму - пока вроде больше ничего не надо.

просто так добавить libdapl-devel не получается :-(

возникает проблема на хостах не оснащенных специальным оборудованием
при запуске выдает, что не может найти ¨/dev/infiniband/rdma_cm¨
также еще пытается определить наличие/отсутствие спецоборудования по 
¨/sys/class/misc/rdma_cm/abi_version¨ и 
¨/sys/class/infiniband_ucma/abi_version¨.

пока что добавил в пост-инсталл скрипт попытку найти директорию  
¨/dev/infiniband¨, а если не найдена - вставить в системный конфиг-файл 
параметр ¨btl tcp,self¨ - мне нравиться ;-)))

что лучше использовать в качестве индикатора наличия infiniband - не знаю :-( 
сейчас доступа к скифу нет - будет наверное только в конце этой недели, а 
может быть - только на следующей.

а вообще - может есть смысл выделить в отдельный пакет конфиг-файлы и сделать 
дополнительный с конфигами, оптимизированными для узлов, оснащенных 
Infiniband ? либо это можно делать инсталлятором, что имхо наиболее 
правильно. Ваше мнение ?

2-я проблема пока висит, если поможете - буду очень благодарен. Хотя наличие 
динамически подключаемых плагинов имхо не актуально. все можно очень хорошо 
настраивать с помощью глобальных/локальных конфигов. и опять-таки 
производительность.

> > > 3. Проблема с timer:linux - осталась. То есть когда я собираю в живой
> > > системе timer:linux выбирается для сборки, но потом отваливается на
> > > unresolved symbols.
> >
> > странно, у меня не наблюдается
> >
> > 1. живая система=рабочая машина ?
> > 2. собираете как ?
> > 3. как запускаете ?
> > 4. тестовый пример на котором валится. или на любом ?
>
> Собираю на рабочей машине, rpm -ba openmpi.spec,
> валится не на тестах, а на пол-пути сборки, заявляя что unresolved symbol
> *freq_timer* (точно имя символа не помню).

проверяю на 2-х машинах: i586 (P4) и  x86_64 (Athlon) - таких проблем не 
возникло :-/
пришлите лог мне на мыло - попробую посмотреть, но.... 

-- 
WBR, d4s
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Тип     : application/pgp-signature
Размер  : 189 байтов
Описание: This is a digitally signed message part.
Url     : <http://lists.altlinux.org/pipermail/hpc-devel/attachments/20070828/0f726a97/attachment-0003.bin>


Подробная информация о списке рассылки HPC-devel