[sisyphus] Re: XFS filesystem crash

Денис Смирнов =?iso-8859-1?q?mithraen_=CE=C1_freesource=2Einfo?=
Пт Дек 19 19:30:59 MSK 2003


On Fri, Dec 19, 2003 at 11:36:34AM +0300, info wrote:

 > Когда я решал, какой вид RAID ставить, то прежде всего поискал в 
 > инете реальные истории тех людей, которые его восстанавливали 
 > после сбоев. Счас уже не помню где, но была пара леденящих душу 
 > историй, как RAID 5 после тяжелого сбоя восстановить так и не 
 > сумели. 

Вполне логично. RAID 5 очень зависим от программы, его реализующего.
 
 > Насколько я понимаю, RAID 5 хорош для преодоления относительно 
 > легких сбоев - с которыми он справляется без вашего участия. 

Он рассчитан на устранение любых сбоев без участия человека. Повреждение
любого сектора может быть обнаружено _автоматически_, и так же
автоматически исправлено. Точно так же как смерть диска может быть
обнаружена автоматически (как и для RAID 1), и новый диск подцеплен из hot
spare.
 
 > Его идеология довольно старая, когда дисковая память была ну 
 > очень дорогой, и делать даже однократное (не говоря уже о 
 > двух-трехкратном) зеркалирование казалось верхом 
 > расточительства. Так что RAID 5 есть компромисс - некоторое 
 > повышение надежности за счет не сильного перерасхода дискового 
 > пространства. 

Надёжность всё-таки у него выше, IMHO. По крайней мере в ситуации с
badblock'ами я просто не понимаю, каким образом RAID 0 её может обработать
корректно.
 
 > Что же касается RAID 1, то, насколько я понимаю, в описываемой 
 > Вами ситуации, когда один диск отражает badblock на один из 
 > своих резервных блоков, то ровно то же самое делает и второй 
 > диск - хотя у него этот блок и не bad. Может, я не прав.

Точно не так, ибо диск об этой замене никого не информирует. Просто в
какой-то момент сектор оказывается обнулённым. В результате RAID 1 просто
увидит два разных сектора -- какой из них он выберет?
 
 > Но RAID 1 я тестировал полгода на в усмерть убитом SCSI 1997-го 
 > года выпуска c морем badblock-ов, забивал его под завязку 
 > большими, но не слишком ценными файлами (да простят меня 
 > ALT-овцы - это были RPM-ы сизифуса), и все работало нормально 
 > жо тех пор, пока сказя окончательно не сдохла. Причем была пара 
 > ситуаций, когда приходилось делать --rebuild-tree - и даже 
 > после этого ничего не пропадало, все восстанавливалось.
 > Ну, а если хотите совсем уж надежности - сделайте два RAID 5 
 > массива, а потом зазеркалируйте их как RAID 1.

Для надёжности лучше, IMHO, вложить эти же деньги во внешний массив, с
отдельным источником питания и отдельным UPS, особенно если речь идёт о
больших объёмах и SCSI-дисках.

RAID 1 хорош в первую очередь _производительностью_, правильная реализация
может на чтении работать так же быстро, как и RAID 0. Поэтому связка RAID
0+1 видится мне оптимальной для массивов IDE-дисков. Для SCSI это слишком
дорого и неэффективно, IMHO. 

А, да, ещё одно применение -- когда на сервер ставится только 2 харда. По
финансовым соображениям. Тогда выбора нет -- только RAID 1.

-- 
С уважением, Денис

http://freesource.info




Подробная информация о списке рассылки Sisyphus