[sisyphus] Re: XFS filesystem crash

info =?iso-8859-1?q?5740_=CE=C1_mail=2Eru?=
Пт Дек 19 11:36:34 MSK 2003


18 Декабрь 2003 21:08, Денис Смирнов написал:
> On Thu, Dec 18, 2003 at 11:56:59AM +0300, info wrote:
>  > Поддерживаю. Именно так мы и работаем - с той только
>  > разницей, что на нашем сервере не RAID 5, а RAID 1, то
>  > бишь тупое зеркалирование. Причина проста. Дисковая память
>  > сейчас дешева, особо жмотиться смысла не имеет, а RAID 1
>  > очень легко восстанавливается таже после тяжелого сбоя. Я
>  > проверял: даже если один из дисков RAID накрывается
>  > целиком, то монтируешь оставшийся как обычный раздел, и
>  > все данные - на месте.
>
> Когда современный диск обнаруживает badblock, то он делает
> отображение на один из резервных, который оказывается
> _обнулённым_. Как на такое реагирует RAID 1? Не окажется ли,
> что он именно его и скопирует на другой? В случае RAID 5,
> насколько я понимаю, эта ситуация обработается вполне
> корректно. RAID 1, также насколько я понмаю, пригоден только
> для спасения от ситуаций вида "хард умер".

Когда я решал, какой вид RAID ставить, то прежде всего поискал в 
инете реальные истории тех людей, которые его восстанавливали 
после сбоев. Счас уже не помню где, но была пара леденящих душу 
историй, как RAID 5 после тяжелого сбоя восстановить так и не 
сумели. 

Насколько я понимаю, RAID 5 хорош для преодоления относительно 
легких сбоев - с которыми он справляется без вашего участия. 
Его идеология довольно старая, когда дисковая память была ну 
очень дорогой, и делать даже однократное (не говоря уже о 
двух-трехкратном) зеркалирование казалось верхом 
расточительства. Так что RAID 5 есть компромисс - некоторое 
повышение надежности за счет не сильного перерасхода дискового 
пространства. 

Что же касается RAID 1, то, насколько я понимаю, в описываемой 
Вами ситуации, когда один диск отражает badblock на один из 
своих резервных блоков, то ровно то же самое делает и второй 
диск - хотя у него этот блок и не bad. Может, я не прав. Но 
RAID 1 я тестировал полгода на в усмерть убитом SCSI 1997-го 
года выпуска c морем badblock-ов, забивал его под завязку 
большими, но не слишком ценными файлами (да простят меня 
ALT-овцы - это были RPM-ы сизифуса), и все работало нормально 
жо тех пор, пока сказя окончательно не сдохла. Причем была пара 
ситуаций, когда приходилось делать --rebuild-tree - и даже 
после этого ничего не пропадало, все восстанавливалось.

Ну, а если хотите совсем уж надежности - сделайте два RAID 5 
массива, а потом зазеркалируйте их как RAID 1.

Георгий


Подробная информация о списке рассылки Sisyphus