[Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38

Alex Moskalenko mav на elserv.msk.su
Пн Май 16 07:38:02 UTC 2011


On Friday 13 May 2011 15:52:06 Vitaly Kuznetsov wrote:
> Alex Moskalenko <mav на elserv.msk.su> writes:
> > За 20 минут работы - 15 Мб лога. Сообщения появляются не с постоянной
> > периодичностью, а при какой-либо активности в dom0, то есть работа в
> > domU сообщений не вызывает. С 2.6.32-alt36.2 этих сообщений нет.
>
> В попавшем сегодня в сизиф -alt39 проблема должна быть исправлена.
Спасибо, с alt39 сообщения не беспокоят. :)

Один раз поймал следующее:

May 15 12:17:05 mainsrv-dom0 kernel: [69672.415333] BUG: soft lockup - CPU#1 
stuck for 65s! [swapper:0]
May 15 12:17:05 mainsrv-dom0 kernel: [69672.415349] Modules linked in: 
xen_gntdev xt_physdev iptable_filter ip_tables x_tables coretemp ipmi_si 
ipmi_msghandler bridge stp dm_mod joydev usbhid hid ide_cd_mod cdrom 
ata_generic ide_pci_generic pata_acpi ata_piix ahci rtc_cmos rtc_core libata 
8250_pnp i2c_i801 i2c_core ehci_hcd uhci_hcd psmouse i5000_edac edac_core 
usbcore serio_raw piix i5k_amb ide_core hwmon pcspkr evdev ppdev parport_pc 
parport 8250 serial_core rtc_lib container sg tg3 nls_base button thermal 
processor ses enclosure ext3 jbd mbcache sd_mod crc_t10dif aacraid scsi_mod
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416113] CPU 1:
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416137] Modules linked in: 
xen_gntdev xt_physdev iptable_filter ip_tables x_tables coretemp ipmi_si 
ipmi_msghandler bridge stp dm_mod joydev usbhid hid ide_cd_mod cdrom 
ata_generic ide_pci_generic pata_acpi ata_piix ahci rtc_cmos rtc_core libata 
8250_pnp i2c_i801 i2c_core ehci_hcd uhci_hcd psmouse i5000_edac edac_core 
usbcore serio_raw piix i5k_amb ide_core hwmon pcspkr evdev ppdev parport_pc 
parport 8250 serial_core rtc_lib container sg tg3 nls_base button thermal 
processor ses enclosure ext3 jbd mbcache sd_mod crc_t10dif aacraid scsi_mod
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416898] Pid: 0, comm: swapper Not 
tainted 2.6.32-xen-dom0-alt39 #1 IBM eServer x3400-[7976L2G]-
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416912] RIP: e030:
[<ffffffff810093aa>]  [<ffffffff810093aa>] hypercall_page+0x3aa/0x1010
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416944] RSP: e02b:ffff88003fcadee8  
EFLAGS: 00000246
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416959] RAX: 0000000000000000 RBX: 
ffff88003fcadfd8 RCX: ffffffff810093aa
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416975] RDX: 0000000000000000 RSI: 
0000000000000000 RDI: 0000000000000001
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416989] RBP: ffff88003fcadf00 R08: 
0000000000000000 R09: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417004] R10: 0000000000000000 R11: 
0000000000000246 R12: ffffffff815a1a20
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417017] R13: 0000000000000000 R14: 
0000000000000000 R15: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417035] FS:  00007f676217e700
(0000) GS:ffff880028054000(0000) knlGS:0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417049] CS:  e033 DS: 002b ES: 
002b CR0: 000000008005003b
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417063] CR2: 00007f020ba76008 CR3: 
000000003eb75000 CR4: 0000000000002660
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417079] DR0: 0000000000000000 DR1: 
0000000000000000 DR2: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417093] DR3: 0000000000000000 DR6: 
00000000ffff0ff0 DR7: 0000000000000400
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417108] Call Trace:
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417134]  [<ffffffff81010cc0>] ? 
xen_safe_halt+0x10/0x30
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417162]  [<ffffffff8101db20>] 
default_idle+0x40/0xb0
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417188]  [<ffffffff81014349>] 
cpu_idle+0x79/0xc0
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417215]  [<ffffffff8138c65d>] 
cpu_bringup_and_idle+0xe/0x10

И то же самое сообщение для каждого из ядер в это же время. Как это отразилось 
на работе сервера (было ни "подвисание" на 65 сек) - сказать не могу, не 
следил за ним в это время.


-- 
WBR, Alex Moskalenko


Подробная информация о списке рассылки Sysadmins