[Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
Alex Moskalenko
mav на elserv.msk.su
Пн Май 16 07:38:02 UTC 2011
On Friday 13 May 2011 15:52:06 Vitaly Kuznetsov wrote:
> Alex Moskalenko <mav на elserv.msk.su> writes:
> > За 20 минут работы - 15 Мб лога. Сообщения появляются не с постоянной
> > периодичностью, а при какой-либо активности в dom0, то есть работа в
> > domU сообщений не вызывает. С 2.6.32-alt36.2 этих сообщений нет.
>
> В попавшем сегодня в сизиф -alt39 проблема должна быть исправлена.
Спасибо, с alt39 сообщения не беспокоят. :)
Один раз поймал следующее:
May 15 12:17:05 mainsrv-dom0 kernel: [69672.415333] BUG: soft lockup - CPU#1
stuck for 65s! [swapper:0]
May 15 12:17:05 mainsrv-dom0 kernel: [69672.415349] Modules linked in:
xen_gntdev xt_physdev iptable_filter ip_tables x_tables coretemp ipmi_si
ipmi_msghandler bridge stp dm_mod joydev usbhid hid ide_cd_mod cdrom
ata_generic ide_pci_generic pata_acpi ata_piix ahci rtc_cmos rtc_core libata
8250_pnp i2c_i801 i2c_core ehci_hcd uhci_hcd psmouse i5000_edac edac_core
usbcore serio_raw piix i5k_amb ide_core hwmon pcspkr evdev ppdev parport_pc
parport 8250 serial_core rtc_lib container sg tg3 nls_base button thermal
processor ses enclosure ext3 jbd mbcache sd_mod crc_t10dif aacraid scsi_mod
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416113] CPU 1:
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416137] Modules linked in:
xen_gntdev xt_physdev iptable_filter ip_tables x_tables coretemp ipmi_si
ipmi_msghandler bridge stp dm_mod joydev usbhid hid ide_cd_mod cdrom
ata_generic ide_pci_generic pata_acpi ata_piix ahci rtc_cmos rtc_core libata
8250_pnp i2c_i801 i2c_core ehci_hcd uhci_hcd psmouse i5000_edac edac_core
usbcore serio_raw piix i5k_amb ide_core hwmon pcspkr evdev ppdev parport_pc
parport 8250 serial_core rtc_lib container sg tg3 nls_base button thermal
processor ses enclosure ext3 jbd mbcache sd_mod crc_t10dif aacraid scsi_mod
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416898] Pid: 0, comm: swapper Not
tainted 2.6.32-xen-dom0-alt39 #1 IBM eServer x3400-[7976L2G]-
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416912] RIP: e030:
[<ffffffff810093aa>] [<ffffffff810093aa>] hypercall_page+0x3aa/0x1010
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416944] RSP: e02b:ffff88003fcadee8
EFLAGS: 00000246
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416959] RAX: 0000000000000000 RBX:
ffff88003fcadfd8 RCX: ffffffff810093aa
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416975] RDX: 0000000000000000 RSI:
0000000000000000 RDI: 0000000000000001
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416989] RBP: ffff88003fcadf00 R08:
0000000000000000 R09: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417004] R10: 0000000000000000 R11:
0000000000000246 R12: ffffffff815a1a20
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417017] R13: 0000000000000000 R14:
0000000000000000 R15: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417035] FS: 00007f676217e700
(0000) GS:ffff880028054000(0000) knlGS:0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417049] CS: e033 DS: 002b ES:
002b CR0: 000000008005003b
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417063] CR2: 00007f020ba76008 CR3:
000000003eb75000 CR4: 0000000000002660
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417079] DR0: 0000000000000000 DR1:
0000000000000000 DR2: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417093] DR3: 0000000000000000 DR6:
00000000ffff0ff0 DR7: 0000000000000400
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417108] Call Trace:
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417134] [<ffffffff81010cc0>] ?
xen_safe_halt+0x10/0x30
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417162] [<ffffffff8101db20>]
default_idle+0x40/0xb0
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417188] [<ffffffff81014349>]
cpu_idle+0x79/0xc0
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417215] [<ffffffff8138c65d>]
cpu_bringup_and_idle+0xe/0x10
И то же самое сообщение для каждого из ядер в это же время. Как это отразилось
на работе сервера (было ни "подвисание" на 65 сек) - сказать не могу, не
следил за ним в это время.
--
WBR, Alex Moskalenko
Подробная информация о списке рассылки Sysadmins