[devel] [partially solved] Q: exit_group slowness
Kirill A. Shutemov
kirill на shutemov.name
Вт Июн 5 17:10:35 MSK 2012
On Tue, Jun 05, 2012 at 04:46:03PM +0400, Dmitry V. Levin wrote:
> On Tue, Jun 05, 2012 at 03:37:19PM +0300, Kirill A. Shutemov wrote:
> > On Tue, Jun 05, 2012 at 01:08:28PM +0400, Dmitry V. Levin wrote:
> > > On Tue, Jun 05, 2012 at 09:06:22AM +0300, Kirill A. Shutemov wrote:
> > > > Похоже вот на это:
> > > >
> > > > http://lkml.org/lkml/2012/6/3/34
> > > >
> > > > Ниже по трэду Пол предлагает возможное решение.
> > >
> > > Спасибо, откат на 3.2.14-std-def-alt1 радикально улучшил картинку:
> > > # env -i strace -r -eprocess /usr/bin/unshare -i /bin/true
> > > 0.000000 execve("/usr/bin/unshare", ["/usr/bin/unshare", "-i", "/bin/true"], [/* 0 vars */]) = 0
> > > 0.001357 arch_prctl(ARCH_SET_FS, 0x7f49add73700) = 0
> > > 0.000457 unshare(CLONE_NEWIPC) = 0
> > > 0.000200 execve("/bin/true", ["/bin/true"], [/* 0 vars */]) = 0
> > > 0.000350 exit_group(0) = ?
> > > 0.156461 +++ exited with 0 +++
> > >
> > > Хотя до идеала еще далеко:
> > > # env -i strace -r /bin/true
> > > 0.000000 execve("/bin/true", ["/bin/true"], [/* 0 vars */]) = 0
> > > 0.000628 exit_group(0) = ?
> > > 0.000329 +++ exited with 0 +++
> >
> > exit_group() дорогой только для последнего процесса в namespace, так?
>
> Да, конечно.
>
> > Думаю, это цена которую можно заплатить.
>
> 0.15 секунды это очень долго, то же самое ядро на более простых серверах
> завершает последний процесс в namespace на 1-2 порядка быстрее. Так что
> вопрос, что не так и как с этим бороться, пока остается.
RCU_FAST_NO_HZ не предназначена для больших машин. О чём в явном виде
написано в описании опции. Так что CONFIG_RCU_FAST_NO_HZ=y было ошибкой
для дистрибутивного ядра.
Когда моя большая машинка (40 ядер + ht) освободится я попробую
поэксперементировать с этим немного. Есть подозрение, что отмонирование
файловой системы (внутриядерной, в случае CLONE_NEWIPC) плохо
масштабируется на большое количество процессоров даже без RCU_FAST_NO_HZ.
--
Kirill A. Shutemov
Подробная информация о списке рассылки Devel