[Sysadmins] Ядро ovz-el, software RAID5, его синхронизация и высокий LA

Alex Moskalenko mav на elserv.msk.su
Вс Июн 3 22:56:46 MSK 2012


03.06.2012 18:06, Alex Moskalenko пишет:
> Здравствуйте!
>
> Столкнулся с непонятным мне поведением системы на ovz-el при
> синхронизации/создании/проверке программного массива RAID5.
>
> Исходные данные: Intel(R) Core(TM)2 CPU 6420 на 2.13GHz, чипсет G31, SATA
> ICH9R в режиме AHCI. 4 SATA жестких диска. На них собран программный
> RAID5 массив
> md5 : active raid5 sdc2[0] sdd2[4] sde2[2] sdf2[1]
>       1514703360 blocks super 1.2 level 5, 512k chunk, algorithm 2
> [4/4] [UUUU]
>       bitmap: 6/482 pages [24KB], 512KB chunk, file: /_bitmap_md5
>
> Работает все это на 2.6.32-ovz-el-alt63 (аналогичное поведение было на
> ovz-el ядрах и до alt63). При создании/ребилде/проверке этого массива
> получаю нехарактерно низкую для такой системы скорость синхронизации и
> нехарактерно высокий LA. Также высокий LA получается при интенсивной
> работе с массивом RAID5. С массивом RAID10, расположенным на тех же
> дисках, таких эффектов не наблюдается.
>
> Для примера - текущий снимок системы в момент проверки массива:
>
> cat /proc/mdstat
> Personalities : [raid1] [raid10] [raid6] [raid5] [raid4]
> md5 : active raid5 sdc2[0] sdd2[4] sde2[2] sdf2[1]
>       1514703360 blocks super 1.2 level 5, 512k chunk, algorithm 2
> [4/4] [UUUU]
>       [>....................]  check =  4.6% (23342252/504901120)
> finish=990.1min speed=8105K/sec
>       bitmap: 6/482 pages [24KB], 512KB chunk, file: /_bitmap_md5
> uptime
>  17:21:52 up 23 days,  4:53,  1 user,  load average: 50.28, 54.18, 49.92

Проблема, похоже, в CONFIG_MULTICORE_RAID456=y. Возможно, нет смысла 
включать по умолчанию эту опцию? Судя по ссылкам, оно работает мягко 
говоря "странно". В ближайшее время, если ничего не помешает, попробую 
пересобрать ядро с CONFIG_MULTICORE_RAID456=n, и если проблема исчезнет 
- повешу багу.


Подробная информация о списке рассылки Sysadmins