[sisyphus] RAID/LVM - как-то подтормаживает.

Sergey a_s_y на sama.ru
Вт Дек 16 23:05:26 MSK 2014


On Friday 30 November 2012, Sergey wrote:

> Даже попытка открыть один здоровенный набор графиков на 3К штук (так
> получилось :-) ) вызвала рост LA до 6 примерно. В общем, неплохой
> эффект. Ну и непонятно время жизни SSD в таком режиме.

В этом году проведён долговременный эксперимент.
 
Model Family:     SandForce Driven SSDs
Device Model:     KINGSTON SV300S37A60G

Время жизни - около пяти месяцев. Не Intel, конечно, но думалось, что года
полтора-два продержится. Правда пока непонятно, что с ним случилось, вроде
бы, должен быть жив. Кое-что из SMART:

  9 Power_On_Hours_and_Msec 0x0032  095  095  000  Old_age  Always -  4438h+49m+07.620s
172 Erase_Fail_Count        0x0032  000  000  000  Old_age  Always -  0
182 Erase_Fail_Count        0x0032  000  000  000  Old_age  Always -  0

Erase_Fail_Count два почему-то, но оба - ноль.

Симптомы - резко упала скорость записи. ФС ext4, trim включен. Да и без trim
упёрлось бы не через 5 месяцев. Вернулся к играм с RAID10 пока, смотрю цифры
в /proc/sys/vm/*... Вообще, некоторого эффекта добиться удалось увеличением
dirty_expire_centisecs. Чтобы мало не казалось, до 20 минут. И памяти добавил
больше, чем количество данных в /var/lib/collectd/rrd. Но остановка сервера
теперь, случись что, то ещё занятие:

# time sync
0.00user 0.01system 27:38.55elapsed 0%CPU (0avgtext+0avgdata 548maxresident)k
0inputs+0outputs (0major+182minor)pagefaults 0swaps

Объём кэша, примерно за неделю, достиг объёма rrd-файлов и стабилизировался:

# free
             total       used       free     shared    buffers     cached
Mem:      18498472   11123952    7374520          0     415948    9538404
-/+ buffers/cache:    1169600   17328872
Swap:      6094836          0    6094836

Немного статистики (с цифрами, для тех, кто картинку не увидит).

Картинка cpu6load.png содержит график загрузки для 6-ого ядра, где висит ahci.
До мая - сбор сокращённого набора данных на RAID10 (IO 25%), во второй половине
мая переход на SSD, добавление данных. С использованием SSD прошло практически
незаметно (IO 5-10%). Середина ноября - выход SSD из строя, примерно там же 
возврат на RAID10 (IO устойчиво 100% в обоих случаях; объём собираемых данных
не уменьшался). Начало декабря - начало проб с /proc/sys/vm/*. Пики до IO 100%
бывают всё равно, и достаточно продолжительные, но средняя загрузка в 100% уже
не упирается.

-- 
С уважением, Сергей
a_s_y at sama.ru
-------------- next part --------------
A non-text attachment was scrubbed...
Name: cpu6load.png
Type: image/png
Size: 20785 bytes
Desc: not available
URL: <http://lists.altlinux.org/pipermail/sisyphus/attachments/20141216/55e8e63a/attachment-0001.png>


Подробная информация о списке рассылки Sisyphus