[sisyphus] Huge regression in "grep -i" performance

Ivan Adzhubey iadzhubey на rics.bwh.harvard.edu
Вт Авг 16 01:09:28 UTC 2011


On Monday, August 15, 2011 04:52:21 PM Dmitry V. Levin wrote:
> On Mon, Aug 15, 2011 at 11:25:31PM +0400, Dmitry V. Levin wrote:
> > On Sun, Aug 14, 2011 at 11:36:54PM -0400, Ivan Adzhubey wrote:
> > > Доброго времени суток всем!
> > > 
> > > Похоже, у нас в Сизифе регрессия:
> > > 
> > > https://bugzilla.redhat.com/show_bug.cgi?id=194471
> > > 
> > > Причем, в отличие от описанного в федоровской багзилле, у нас и fgrep
> > > точно так же тормозит под UTF. Так что я не уверен, что это именно
> > > этот баг, просто точнее ничего не нашел.
> > 
> > Это, конечно, какая-то другая регрессия с -i, но она, тем не менее,
> > воспроизводится на текущей версии grep.  Спасибо за информацию.
> 
> Это http://savannah.gnu.org/bugs/?29391 и она еще не исправлена.

Да, эта регрессия похоже у всех присутствует, см ниже. Даже на Mac OS X, 
правда говорят, там ее починили в 10.6, но у меня 10.6 нету чтобы проверить. 
Вообще феерический баг, мне сейчас приходится шерстить сотни скриптов и 
дописывать всюду LANG=C.

Прощу прощения за невольную попытку дискредитации Сизифа ;-)

Kubuntu 11.04:

$ time grep -i ^1ko9 pdb.fragm
1ko9   A      1   312     12   323

real    0m0.734s
user    0m0.730s
sys     0m0.000s

$ time fgrep -i 1ko9 pdb.fragm
1ko9   A      1   312     12   323

real    0m0.766s
user    0m0.740s
sys     0m0.010s

$ LANG=C time grep -i ^1ko9 pdb.fragm
1ko9   A      1   312     12   323
0.07user 0.00system 0:00.07elapsed 95%CPU (0avgtext+0avgdata 3296maxresident)k
0inputs+0outputs (0major+259minor)pagefaults 0swaps

$ echo $LANG
en_US.UTF-8

$ grep --version
GNU grep 2.6.3

Copyright (C) 2009 Free Software Foundation, Inc.


Подробная информация о списке рассылки Sisyphus