[Hardware] Q: Intel SRCU42X RAID card (LSI Logic MegaRAID SCSI 320-2X)

Dmitry Lebkov dima на sakhalin.ru
Ср Янв 18 15:24:11 MSK 2006


Доброго времени суток,

Имеется Intel SRCU42X (в "девичестве" - LSI Logic MegaRAID SCSI 320-2X) и
по два HDD на каждый канал. Всё это собрано в RAID-5 массив и одним разделом
отдано под базу PostgreSQL (208Gb, XFS filesystem).

Массив отстоял сутки под тестами bonnie++ без всяких нареканий. После заливки
данных в SQL-таблицу (порядка 5-6Gb) и попытки построить индексы в логи начинает
сыпаться вот такое:

Jan 18 19:22:10 nf kernel: megaraid: aborting-8937 cmd=2a <c=2 t=0 l=0>
Jan 18 19:22:10 nf kernel: megaraid abort: 8937:13[255:0], fw owner
Jan 18 19:22:10 nf kernel: megaraid: aborting-8931 cmd=2a <c=2 t=0 l=0>
Jan 18 19:22:10 nf kernel: megaraid abort: 8931:19[255:0], fw owner
Jan 18 19:22:10 nf kernel: megaraid: aborting-8932 cmd=2a <c=2 t=0 l=0>
...
Jan 18 19:22:10 nf kernel: megaraid abort: 8994:20[255:0], fw owner
Jan 18 19:22:10 nf kernel: megaraid: reseting the host...
Jan 18 19:22:10 nf kernel: megaraid mbox: Wait for 64 commands to complete:180
Jan 18 19:22:15 nf kernel: megaraid mbox: Wait for 64 commands to complete:175
Jan 18 19:22:20 nf kernel: megaraid mbox: Wait for 64 commands to complete:170
...
Jan 18 19:25:11 nf kernel: megaraid mbox: Wait for 64 commands to complete:0
Jan 18 19:25:11 nf kernel: megaraid mbox: critical hardware error!
Jan 18 19:25:11 nf kernel: megaraid: reseting the host...
Jan 18 19:25:11 nf kernel: megaraid: reseting the host...
Jan 18 19:25:11 nf kernel: end_request: I/O error, dev sda, sector 145063
Jan 18 19:25:11 nf kernel: lost page write due to I/O error on sda1

После чего машина либо зависает полностью, либо отваливается RAID. К жизнии
его можно вернуть только перезагрузкой.

Поиск в гугле к решению проблемы не привел. Смена ядра улучшения не принесла.

kernel-image-std-smp-2.4.32-alt1
kernel-image-vs26-smp-2.6.14-alt2.1

в этой ситуации ведут себя одинаково.

У кого-нить есть опыт успешной эксплуатации этой "железки"? Или "в морг"?

-- 
WBR, Dmitry Lebkov

PS. Firmware в карту залит самый последний, с интеловского сайта. Не помогло.


Подробная информация о списке рассылки Hardware