[sisyphus] Зависания сервера HP DL380G4
astroiLL
astroill на gmail.com
Чт Авг 25 07:56:47 UTC 2011
Подскажите, плиз, направления диагностики машины.
Симптомы такие. Работает, работает, потом бац и все сервисы зависли, на
экране никаких изменений (не могу точно сказать, т.к. не вижу экран),
пинг еще идет, а по ssh уже не зайти, в логах ничего.
Может несколько дней проработать, может несколько часов.
Осложняется тем, что машина сейчас далеко, доступ к ней только по ssh
или через iLo (чтобы перезагрузить).
Вывод log/kernel во вложении.
Почти последний Сизиф.
# uname -a
Linux fs01-psh.psh.ru 3.0.1-std-def-alt1 #1 SMP Sat Aug 6 10:18:36 UTC
2011 x86_64 GNU/Linux
С предыдущим ядром (2.6.39-std-def-alt3) было то же самое.
Само железо не новое, долго работало в вышестоящей организации под
сервером баз данных. Прислали нам, я подвоха не ожидал поставил систему,
все заработало, отвез, поставил, собрался настраивать/запускать, а она
начала зависать.
Другие похожие машины, старше и новее работают и такого не проявляют.
Если что-то дохнет или валится, то в логах хоть видно и понятно
направление лечения. А тут шайтан.
Через время поеду, заберу/заменю, но пока хотелось бы выяснить, что
происходит.
Хочу помощи в направлении удаленной диагностики, т.к. в логах ничего.
Как повысить информативность логов?
ЗЫ."Политические" темы, что "надо сначала тестировать, а потом ставить
стабильную систему, а не Сизиф" просьба не поднимать.
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя : psh-kernel.log.bz2
Тип : application/x-bzip
Размер : 15787 байтов
Описание: отсутствует
Url : <http://lists.altlinux.org/pipermail/sisyphus/attachments/20110825/77355fdd/attachment-0001.bin>
Подробная информация о списке рассылки Sisyphus