[Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash

Michail Yakushin silicium на altlinux.ru
Пт Апр 15 08:15:17 UTC 2011


14.04.2011 12:16, Alex Moskalenko пишет:
> On Wednesday 13 April 2011 20:01:07 you wrote:
>> В http://git.altlinux.org/tasks/42643/ собирается ядро, которое должно у
>> вас заработать. Как соберётся - можете начинать тестировать.
> Спасибо, 2.6.32.2 загрузилось. Устройства вроде бы тоже работают. klogd также
> запускается в чруте от пользователя.
>
> Есть несколько настораживающих сообщений в протоколах загрузки ядра и
> гипервизора, привожу их далее:
>
> гипервизор
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
>
> ядро
> [    0.067405] ACPI: No dock devices found.
> [    0.067667] HYPERVISOR_update_va_mapping at 0xffffc90000028000 return -22
> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
> [    0.067872] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003fc87140
> to 80000000fec80473
> [    0.068000] set_pte_at 0xffff88003fc87140 failed 1
> [    0.068008] ACPI Error: Could not map memory at 00000000FEC80000, size 100
> (20090903/exregion-180)
> [    0.068269] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
> [SystemMemory] (20090903/evregion-424)
> [    0.068533] ACPI Error (psparse-0537): Method parse/execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [    0.068850] ACPI Error (uteval-0250): Method execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [    0.069160] ACPI: PCI Root Bridge [PCI0] (0000:00)
>
> [    0.196719] ACPI: bus type pnp registered
> [    0.197082] HYPERVISOR_update_va_mapping at 0xffffc90000028000 return -22
> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
> [    0.197299] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003fc87140
> to 80000000fec80473
> [    0.197491] set_pte_at 0xffff88003fc87140 failed 1
> [    0.197616] ACPI Error: Could not map memory at 00000000FEC80000, size 100
> (20090903/exregion-180)
> [    0.197893] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
> [SystemMemory] (20090903/evregion-424)
> [    0.198173] ACPI Error (psparse-0537): Method parse/execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [    0.198523] ACPI Error (uteval-0250): Method execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [    0.198845] pnp 00:00: can't evaluate _CRS: 4
>
> [    0.215212] PM-Timer failed consistency check  (0x0xffffff) - aborting.
>
> [    0.422136] Freeing unused kernel memory: 548k freed
> [    0.423725] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003d6030f0
> to 80000004c0564145
> [    0.438260] input: AT Translated Set 2 keyboard
> as /devices/platform/i8042/serio0/input/input1
>
> [    5.593467] scsi 0:1:0:0: Attached scsi generic sg3 type 0
> [    5.593548] HYPERVISOR_update_va_mapping at 0xffffe8fffff1f000 return -22
> (ptep=0xffff88003d1d38f8 pteval=0x8000000432fd7063)
> [    5.593560] HYPERVISOR_update_va_mapping at 0xffffe8fffff3b000 return -22
> (ptep=0xffff88003d1d39d8 pteval=0x8000000435c88063)
> [    5.593570] HYPERVISOR_update_va_mapping at 0xffffe8fffff57000 return -22
> (ptep=0xffff88003d1d3ab8 pteval=0x8000000435dfa063)
> [    5.593581] HYPERVISOR_update_va_mapping at 0xffffe8fffff73000 return -22
> (ptep=0xffff88003d1d3b98 pteval=0x8000000435df9063)
> [    5.593591] HYPERVISOR_update_va_mapping at 0xffffe8fffff8f000 return -22
> (ptep=0xffff88003d1d3c78 pteval=0x80000004356ef063)
> [    5.593602] HYPERVISOR_update_va_mapping at 0xffffe8fffffab000 return -22
> (ptep=0xffff88003d1d3d58 pteval=0x80000004356ea063)
> [    5.593612] HYPERVISOR_update_va_mapping at 0xffffe8fffffc7000 return -22
> (ptep=0xffff88003d1d3e38 pteval=0x80000004356eb063)
> [    5.593627] HYPERVISOR_update_va_mapping at 0xffffe8fffffe3000 return -22
> (ptep=0xffff88003d1d3f18 pteval=0x80000004356ec063)
> [    5.593725] scsi 0:1:1:0: Attached scsi generic sg4 type 0
Суть этих сообщений warningи из за того что xen и dom0 подрались за 
область памяти, которая нужна ACPI и APIC. Но оно должно работать, да 
ядро не смогло кое-что сделать, но это делаетет сам xen.
Падения были вызваны тем, что ядро не правильно обрабатывало эту ошибку 
и наобум лезло туда куда xen его не пускал. П
Просбсьа понаблюдать, видимо этот пач будем отправлять в апстрим, 
подобная ситуация может быть и на другом железе.


Подробная информация о списке рассылки Sysadmins