[sisyphus] Зависания сервера HP DL380G4

astroiLL astroill на gmail.com
Чт Авг 25 07:56:47 UTC 2011


Подскажите, плиз, направления диагностики машины.
Симптомы такие. Работает, работает, потом бац и все сервисы зависли, на 
экране никаких изменений (не могу точно сказать, т.к. не вижу экран), 
пинг еще идет, а по ssh уже не зайти, в логах ничего.
Может несколько дней проработать, может несколько часов.
Осложняется тем, что машина сейчас далеко, доступ к ней только по ssh 
или через iLo (чтобы перезагрузить).
Вывод log/kernel во вложении.
Почти последний Сизиф.
# uname -a
Linux fs01-psh.psh.ru 3.0.1-std-def-alt1 #1 SMP Sat Aug 6 10:18:36 UTC 
2011 x86_64 GNU/Linux
С предыдущим ядром (2.6.39-std-def-alt3) было то же самое.

Само железо не новое, долго работало в вышестоящей организации под 
сервером баз данных. Прислали нам, я подвоха не ожидал поставил систему, 
все заработало, отвез, поставил, собрался настраивать/запускать, а она 
начала зависать.
Другие похожие машины, старше и новее работают и такого не проявляют.
Если что-то дохнет или валится, то в логах хоть видно и понятно 
направление лечения. А тут шайтан.

Через время поеду, заберу/заменю, но пока хотелось бы выяснить, что 
происходит.
Хочу помощи в направлении удаленной диагностики, т.к. в логах ничего.
Как повысить информативность логов?

ЗЫ."Политические" темы, что "надо сначала тестировать, а потом ставить 
стабильную систему, а не Сизиф" просьба не поднимать.
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : psh-kernel.log.bz2
Тип     : application/x-bzip
Размер  : 15787 байтов
Описание: отсутствует
Url     : <http://lists.altlinux.org/pipermail/sisyphus/attachments/20110825/77355fdd/attachment-0001.bin>


Подробная информация о списке рассылки Sisyphus