[Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash

Alex Moskalenko mav на elserv.msk.su
Вт Фев 21 07:07:13 MSK 2012


15.04.2011 12:15, Michail Yakushin пишет:
> 14.04.2011 12:16, Alex Moskalenko пишет:
>> On Wednesday 13 April 2011 20:01:07 you wrote:
>>> В http://git.altlinux.org/tasks/42643/ собирается ядро, которое 
>>> должно у
>>> вас заработать. Как соберётся - можете начинать тестировать.
>> Спасибо, 2.6.32.2 загрузилось. Устройства вроде бы тоже работают. 
>> klogd также
>> запускается в чруте от пользователя.
>> Есть несколько настораживающих сообщений в протоколах загрузки ядра и
>> гипервизора, привожу их далее:
>>
>> гипервизор
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
>>
>> ядро
>> [    0.067405] ACPI: No dock devices found.
>> [    0.067667] HYPERVISOR_update_va_mapping at 0xffffc90000028000 
>> return -22
>> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
>> [    0.067872] arch/x86/xen/mmu.c:xen_set_pte:Error setting 
>> ffff88003fc87140
>> to 80000000fec80473
>> [    0.068000] set_pte_at 0xffff88003fc87140 failed 1
>> [    0.068008] ACPI Error: Could not map memory at 00000000FEC80000, 
>> size 100
>> (20090903/exregion-180)
>> [    0.068269] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
>> [SystemMemory] (20090903/evregion-424)
>> [    0.068533] ACPI Error (psparse-0537): Method parse/execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [    0.068850] ACPI Error (uteval-0250): Method execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [    0.069160] ACPI: PCI Root Bridge [PCI0] (0000:00)
>>
>> [    0.196719] ACPI: bus type pnp registered
>> [    0.197082] HYPERVISOR_update_va_mapping at 0xffffc90000028000 
>> return -22
>> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
>> [    0.197299] arch/x86/xen/mmu.c:xen_set_pte:Error setting 
>> ffff88003fc87140
>> to 80000000fec80473
>> [    0.197491] set_pte_at 0xffff88003fc87140 failed 1
>> [    0.197616] ACPI Error: Could not map memory at 00000000FEC80000, 
>> size 100
>> (20090903/exregion-180)
>> [    0.197893] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
>> [SystemMemory] (20090903/evregion-424)
>> [    0.198173] ACPI Error (psparse-0537): Method parse/execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [    0.198523] ACPI Error (uteval-0250): Method execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [    0.198845] pnp 00:00: can't evaluate _CRS: 4
>>
>> [    0.215212] PM-Timer failed consistency check  (0x0xffffff) - 
>> aborting.
>>
>> [    0.422136] Freeing unused kernel memory: 548k freed
>> [    0.423725] arch/x86/xen/mmu.c:xen_set_pte:Error setting 
>> ffff88003d6030f0
>> to 80000004c0564145
>> [    0.438260] input: AT Translated Set 2 keyboard
>> as /devices/platform/i8042/serio0/input/input1
>>
>> [    5.593467] scsi 0:1:0:0: Attached scsi generic sg3 type 0
>> [    5.593548] HYPERVISOR_update_va_mapping at 0xffffe8fffff1f000 
>> return -22
>> (ptep=0xffff88003d1d38f8 pteval=0x8000000432fd7063)
>> [    5.593560] HYPERVISOR_update_va_mapping at 0xffffe8fffff3b000 
>> return -22
>> (ptep=0xffff88003d1d39d8 pteval=0x8000000435c88063)
>> [    5.593570] HYPERVISOR_update_va_mapping at 0xffffe8fffff57000 
>> return -22
>> (ptep=0xffff88003d1d3ab8 pteval=0x8000000435dfa063)
>> [    5.593581] HYPERVISOR_update_va_mapping at 0xffffe8fffff73000 
>> return -22
>> (ptep=0xffff88003d1d3b98 pteval=0x8000000435df9063)
>> [    5.593591] HYPERVISOR_update_va_mapping at 0xffffe8fffff8f000 
>> return -22
>> (ptep=0xffff88003d1d3c78 pteval=0x80000004356ef063)
>> [    5.593602] HYPERVISOR_update_va_mapping at 0xffffe8fffffab000 
>> return -22
>> (ptep=0xffff88003d1d3d58 pteval=0x80000004356ea063)
>> [    5.593612] HYPERVISOR_update_va_mapping at 0xffffe8fffffc7000 
>> return -22
>> (ptep=0xffff88003d1d3e38 pteval=0x80000004356eb063)
>> [    5.593627] HYPERVISOR_update_va_mapping at 0xffffe8fffffe3000 
>> return -22
>> (ptep=0xffff88003d1d3f18 pteval=0x80000004356ec063)
>> [    5.593725] scsi 0:1:1:0: Attached scsi generic sg4 type 0
> Суть этих сообщений warningи из за того что xen и dom0 подрались за 
> область памяти, которая нужна ACPI и APIC. Но оно должно работать, да 
> ядро не смогло кое-что сделать, но это делаетет сам xen.
> Падения были вызваны тем, что ядро не правильно обрабатывало эту 
> ошибку и наобум лезло туда куда xen его не пускал. П
> Просбсьа понаблюдать, видимо этот пач будем отправлять в апстрим, 
> подобная ситуация может быть и на другом железе.
> _______________________________________________

Здравствуйте!

Подскажите пожалуйста, пытались ли контактировать с апстримом на предмет 
этого патча? Я до сих пор заинтересован в запуске xen на x3400, а ядра 
3.1.х и 3.2.х продолжают падать в dom0. Наше патченое xen-dom0 при этом 
работает. Поэтому, если с апстримом не контактировали, хочу сам 
попробовать пообщаться в рассылках/повесить баг на эту тему.

PS Неужели больше никто не пытался запускать pvops ядра в dom0 на x3400? 
Я единственный из всех пользователей xen, кто поймал эту проблему? Или у 
меня какой-то неправильный сервер?...


Подробная информация о списке рассылки Sysadmins