[Sysadmins] Что это может быть (dmesg)?

Sergey Vlasov vsu на altlinux.ru
Пт Апр 5 19:45:56 MSK 2013


On Fri, 5 Apr 2013 12:57:31 +0400 Yuri Khachaturyan wrote:

> С недавнего времени в dmesg наблюдаю следующее (см. ниже).
> Кто подскажет что это может быть - железо? память?

Вечная проблема с фрагментацией памяти...

> [34302.846989] smtp: page allocation failure. order:1, mode:0x20

Запрашивается блок размером 2 страницы (order:1) с флагом GFP_ATOMIC
(необходимо найти свободный блок немедленно - нельзя ожидать
освобождения памяти).

> [34302.846996] Pid: 13462, comm: smtp Not tainted 2.6.39-std-def-alt3.2 #1
> [34302.846998] Call Trace:
> [34302.847001]  <IRQ>  [<ffffffff810fa29f>]
> __alloc_pages_nodemask+0x67f/0x8b0
> [34302.847019]  [<ffffffff81136786>] kmem_getpages+0x66/0x180
> [34302.847023]  [<ffffffff811376cf>] fallback_alloc+0x17f/0x240
> [34302.847026]  [<ffffffff81137490>] ____cache_alloc_node+0x90/0x150
> [34302.847030]  [<ffffffff81137da3>] kmem_cache_alloc+0xe3/0x170
> [34302.847035]  [<ffffffff813465d3>] sk_prot_alloc+0x43/0x180
> [34302.847038]  [<ffffffff8134681b>] sk_clone+0x1b/0x300
> [34302.847043]  [<ffffffff81393cd1>] inet_csk_clone+0x11/0xc0
> [34302.847047]  [<ffffffff813ad0f4>] tcp_create_openreq_child+0x24/0x4c0
> [34302.847051]  [<ffffffff813ab528>] tcp_v4_syn_recv_sock+0x48/0x270

Причина запроса - приём очередного TCP-соединения; параметры
соответствующего slab cache можно увидеть в /proc/slabinfo:

$ head -n2 /proc/slabinfo; grep -w TCP /proc/slabinfo
slabinfo - version: 2.1
# name            <active_objs> <num_objs> <objsize> <objperslab> <pagesperslab> : tunables <limit> <batchcount> <sharedfactor> : slabdata <active_slabs> <num_slabs> <sharedavail>
TCP                   19     32   1664    4    2 : tunables   24   12    8 : slabdata      8      8      0

(вообще на разных версиях ядра параметры могут несколько отличаться, но
в попавшихся под руку тоже pagesperslab=2).

> [34302.847245] Node 0 DMA: 0*4kB 1*8kB 0*16kB 1*32kB 2*64kB 1*128kB 1*256kB 0*512kB 1*1024kB 1*2048kB 3*4096kB = 15912kB
> [34302.847256] Node 0 DMA32: 26048*4kB 22*8kB 0*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 104368kB
> [34302.847267] Node 0 Normal: 11246*4kB 0*8kB 0*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 1*2048kB 0*4096kB = 47032kB

Свободная память вроде бы и есть, но в основном в виде одиночных
страниц, а найти непрерывный блок даже из 2 страниц существенно сложнее
(вообще-то такие блоки есть, но часть памяти резервируется для совсем
особых случаев, к которым не относится даже GFP_ATOMIC - например, для
использования в процессе работы OOM killer, если для завершения процесса
вдруг временно понадобится ещё немного памяти, или для процессов с
установленным флагом PF_MEMALLOC, успешная работа которых должна
привести к освобождению памяти).

Реально работающих методов борьбы с этим безобразием, кроме подъёма
/proc/sys/vm/min_free_kbytes, практически нет.  Хотя именно на выбор
параметров slab cache в данном случае можно было бы повлиять параметром
ядра slab_max_order=0 (ценой некоторого увеличения бесполезных потерь
памяти).  Однако этот параметр доступен только начиная с ядра 3.3.

Вообще calculate_slab_order() в данном случае ведёт себя не совсем
оптимальным образом - на 1 страницу может влезть 2*1664, на 2 страницы -
4*1664, поэтому никакого преимущества по использованию памяти при выборе
order=1 получить не удастся.


Подробная информация о списке рассылки Sysadmins