[sisyphus] Huge regression in "grep -i" performance
Ivan Adzhubey
iadzhubey на rics.bwh.harvard.edu
Вт Авг 16 01:09:28 UTC 2011
On Monday, August 15, 2011 04:52:21 PM Dmitry V. Levin wrote:
> On Mon, Aug 15, 2011 at 11:25:31PM +0400, Dmitry V. Levin wrote:
> > On Sun, Aug 14, 2011 at 11:36:54PM -0400, Ivan Adzhubey wrote:
> > > Доброго времени суток всем!
> > >
> > > Похоже, у нас в Сизифе регрессия:
> > >
> > > https://bugzilla.redhat.com/show_bug.cgi?id=194471
> > >
> > > Причем, в отличие от описанного в федоровской багзилле, у нас и fgrep
> > > точно так же тормозит под UTF. Так что я не уверен, что это именно
> > > этот баг, просто точнее ничего не нашел.
> >
> > Это, конечно, какая-то другая регрессия с -i, но она, тем не менее,
> > воспроизводится на текущей версии grep. Спасибо за информацию.
>
> Это http://savannah.gnu.org/bugs/?29391 и она еще не исправлена.
Да, эта регрессия похоже у всех присутствует, см ниже. Даже на Mac OS X,
правда говорят, там ее починили в 10.6, но у меня 10.6 нету чтобы проверить.
Вообще феерический баг, мне сейчас приходится шерстить сотни скриптов и
дописывать всюду LANG=C.
Прощу прощения за невольную попытку дискредитации Сизифа ;-)
Kubuntu 11.04:
$ time grep -i ^1ko9 pdb.fragm
1ko9 A 1 312 12 323
real 0m0.734s
user 0m0.730s
sys 0m0.000s
$ time fgrep -i 1ko9 pdb.fragm
1ko9 A 1 312 12 323
real 0m0.766s
user 0m0.740s
sys 0m0.010s
$ LANG=C time grep -i ^1ko9 pdb.fragm
1ko9 A 1 312 12 323
0.07user 0.00system 0:00.07elapsed 95%CPU (0avgtext+0avgdata 3296maxresident)k
0inputs+0outputs (0major+259minor)pagefaults 0swaps
$ echo $LANG
en_US.UTF-8
$ grep --version
GNU grep 2.6.3
Copyright (C) 2009 Free Software Foundation, Inc.
Подробная информация о списке рассылки Sisyphus