[sisyphus] Зависания сервера HP DL380G4

Denis Nazarov marsden на mail.ru
Чт Авг 25 16:38:57 UTC 2011


25.08.2011 14:42, astroiLL пишет:
> 25.08.2011 13:07, thecrux на gmail.com пишет:
>> On Thu, Aug 25, 2011 at 11:56:47AM +0400, astroiLL wrote:
>>> Подскажите, плиз, направления диагностики машины.
>>> Симптомы такие. Работает, работает, потом бац и все сервисы зависли, на
>>> экране никаких изменений (не могу точно сказать, т.к. не вижу экран),
>>> пинг еще идет, а по ssh уже не зайти, в логах ничего.
>> ...
>>> Само железо не новое, долго работало в вышестоящей организации под
>>> сервером баз данных. Прислали нам, я подвоха не ожидал поставил 
>>> систему,
>>> все заработало, отвез, поставил, собрался настраивать/запускать, а она
>>> начала зависать.
>>
>> Были схожие симптомы с таким же сервером, но более младшей модели (G3),
>> когда начал отказывать SCSI-контроллер (smart array 6i кажется).
>> При зависании системы на передней панели было видно, что якобы разом
>> отказали все диски (горели красные лампочки). Ребут какое-то время лечил
>> проблему, но затем  в определённый момент диски перестали быть видны и в
>> BIOS при загрузке.
>> Отправили в утиль.
> Спасибо, надо будет посмотреть.
> Но вроде через iLo в диагностике ничего криминального не пишет.
> Попробую как-то выловить сбой SCSI-контроллера записывая лог на 
> внешний диск, может получиться.
>
> ЗЫ. Кстати почему-то iLo не дает remote-console, пишет, что "The 
> single-cursor remote console feature requires JVM 1.4.2 or later." 
> Хотя java-1.6.0

если машинка старая то я бы просто тупо перебрал все железо, потом на 
диагностику,  вполне
возможен банальный неконтакт из-за окисления. За последние пару лет 
попадались
машины на 478 сокете, которые отказывались стартовать, элементарное 
"вынул-вставил проц" помогало :)



Подробная информация о списке рассылки Sisyphus