[devel] Re: gcc -O2 vs gcc -Os performance

Alexey Tourbin =?iso-8859-1?q?at_=CE=C1_altlinux=2Eru?=
Пт Май 9 13:29:01 MSD 2003


On Thu, Mar 13, 2003 at 01:57:09AM +0300, Mikhail Zabaluev wrote:
> Мне неинтересно, у меня Pentium 4 :)
> По мне, наоборот, лучше -O3 (с inlining'ом и пр.),
> каковой я уже давно практикую.

Цифры?  Здесь только цифры имеют значение.  Вы можете запустить
прилагаемый тест на вашем P4?  Только честно. :)

В тесте используются:

- компилятор gcc-3.2.1-alt2
- bzip2-1.0.2-alt7 как пает для тестирования (*в spec-файле нужно
  предварительно закомментировать _optlevel*)
- openoffice-1.0.2-alt2.src.rpm, как пакет, содержащий очень большой
  bz2 файл
- машинка Cel333/128RAM; конечно, это не P4/1G, но, по моим ощущениям,
  таких машинок сейчас много; кроме того, базовая платформа у нас вообще
  i586

Результаты теста:

TEST FOR -O0
243.95user 1.10system 4:05.70elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (111major+912minor)pagefaults 0swaps
243.75user 1.12system 4:05.45elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (111major+912minor)pagefaults 0swaps
243.57user 1.34system 4:05.48elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (111major+912minor)pagefaults 0swaps
TEST FOR -O1
163.39user 1.31system 2:45.19elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (104major+912minor)pagefaults 0swaps
163.44user 1.40system 2:45.45elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (104major+912minor)pagefaults 0swaps
163.82user 1.13system 2:45.45elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (104major+912minor)pagefaults 0swaps
TEST FOR -O2
170.76user 1.29system 2:52.77elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (105major+912minor)pagefaults 0swaps
171.07user 1.08system 2:52.64elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (105major+912minor)pagefaults 0swaps
171.04user 1.14system 2:52.73elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (105major+912minor)pagefaults 0swaps
TEST FOR -Os
152.55user 1.25system 2:34.23elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (106major+912minor)pagefaults 0swaps
152.54user 1.20system 2:34.26elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (106major+912minor)pagefaults 0swaps
152.76user 1.13system 2:34.35elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (106major+912minor)pagefaults 0swaps
TEST FOR -O3
169.54user 1.39system 2:51.54elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (106major+912minor)pagefaults 0swaps
170.00user 1.03system 2:51.62elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (106major+912minor)pagefaults 0swaps
169.74user 1.20system 2:51.51elapsed 99%CPU (0avgtext+0avgdata 0maxresident)k
0inputs+0outputs (106major+912minor)pagefaults 0swaps

Похоже, что -Os является наиболее удачным набором оптимизаций.
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : bztest.sh
Тип     : application/x-sh
Размер  : 325 байтов
Описание: =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Url     : <http://lists.altlinux.org/pipermail/devel/attachments/20030509/82efa4ae/attachment-0001.sh>
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Тип     : application/pgp-signature
Размер  : 189 байтов
Описание: =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Url     : <http://lists.altlinux.org/pipermail/devel/attachments/20030509/82efa4ae/attachment-0001.bin>


Подробная информация о списке рассылки Devel