[devel] story time: LTO vs weird configure.ac

Dmitry V. Levin ldv на altlinux.org
Ср Сен 14 15:20:32 MSK 2022


On Wed, Sep 14, 2022 at 03:17:52PM +0400, Ivan A. Melnikov wrote:
> Привет.
> 
> Хочу поделиться ещё одной любопытной историей.
> 
> Для обновления boost мне понадобилось пересобрать пакет taler,
> однако он отказался пересобираться на aarch64 и ppc64le
> c интересной диагностикой:
> 
>   secp256k1/src/scalar_4x64_impl.h:748:5: error: unknown register name 'rdx' in 'asm'
>   secp256k1/src/scalar_4x64_impl.h:748:5: error: unknown register name 'rax' in 'asm'
> 
> и дальше в таком духе.
> 
> Оказалось, что configure этого чуда в вопросах включения
> ассемблерных вставок не ориентируется на текущую платформу,
> а просто проверяет, что ассембелрные вставки, совместимые
> с x86_64, работают, для чего компилирует ($CC -c ...)
> такую вот бесхитростную программу:
> 
> $ cat conftest.c
> 
>   #include <stdint.h>
> int
> main ()
> {
> 
>   uint64_t a = 11, tmp;
>   __asm__ __volatile__("movq \$0x100000000,%1; mulq %%rsi" : "+a"(a) : "S"(tmp) : "cc", "%rdx");
> 
>   ;
>   return 0;
> }
> 
> 
> Естественно, это чудо не компилируется, например, на aarch64:
> 
> $ aarch64-linux-gnu-gcc -c conftest.c
> conftest.c: In function 'main':
> conftest.c:8:60: warning: unknown escape sequence: '\$'
>     8 |   __asm__ __volatile__("movq \$0x100000000,%1; mulq %%rsi" : "+a"(a) : "S"(tmp) : "cc", "%rdx");
>       |                                                            ^
> conftest.c:8:3: error: unknown register name '%rdx' in 'asm'
>     8 |   __asm__ __volatile__("movq \$0x100000000,%1; mulq %%rsi" : "+a"(a) : "S"(tmp) : "cc", "%rdx");
>       |   ^~~~~~~
> 
> 
> Однако с -flto=auto, прилетающего из %optfags, компилируется:
> 
> $ aarch64-linux-gnu-gcc -c -flto=auto  conftest.c
> conftest.c: In function 'main':
> conftest.c:8:60: warning: unknown escape sequence: '\$'
>     8 |   __asm__ __volatile__("movq \$0x100000000,%1; mulq %%rsi" : "+a"(a) : "S"(tmp) : "cc", "%rdx");
>       |                                                            ^
> $ echo $?
> 0
> 
> Что, опять же, понятно: при таком LTO содержимое такой
> ассемблерной вставки будет разбирать только ассемблер
> и только на этапе компоновки, внутри lto-шащего плагина ld.
> 
> Замена AC_COMPILE_IFELSE на AC_LINK_IFELSE помогла.

Мне кажется, это уже где-то всплывало, но сейчас не помню, где именно.


-- 
ldv


Подробная информация о списке рассылки Devel