[devel] segfaults? oops'es?

Peter V. Saveliev =?iso-8859-1?q?peet_=CE=C1_altlinux=2Eru?=
Пт Апр 1 19:27:29 MSD 2005


...

прошу прощения, что пишу сюда -- но мне просто негде больше спросить.

В логах и на консоли вижу такое:

Apr  1 19:13:53 (none) user.warn kernel:                          free                        sibling
Apr  1 19:13:53 (none) user.warn kernel:   task             PC    stack   pid father child younger older
Apr  1 19:13:53 (none) user.warn kernel: swapper       S C0275280   204     1      0   271               (L-TLB)
Apr  1 19:13:53 (none) user.warn kernel: Call Trace:    [<c0121b1b>] [<c0121b66>] [<c0108bb3>] [<c0105000>] [<c0105360>]
Apr  1 19:13:53 (none) user.warn kernel:   [<c01050bb>] [<c0107286>] [<c0105090>]
<skip />
Apr  1 19:13:53 (none) user.warn kernel: ipcad         S C0275280    12   308    288                 307 (NOTLB)
Apr  1 19:13:53 (none) user.warn kernel: Call Trace:    [<c0154bd3>] [<c011a68e>] [<c011a5b0>] [<c01cf93f>] [<c0154f0e>]
Apr  1 19:13:53 (none) user.warn kernel:   [<c01552b9>] [<c01cf8fa>] [<c0108bb3>]
Apr  1 19:13:53 (none) user.warn kernel: getty         S C0275280     0  2883      7          2884       (NOTLB)
Apr  1 19:13:53 (none) user.warn kernel: Call Trace:    [<c011a627>] [<c010aa5b>] [<c0181b2f>] [<c01820de>] [<c017d2fd>]
Apr  1 19:13:53 (none) user.warn kernel:   [<c0143b76>] [<c0143555>] [<c0131173>] [<c0108bb3>]
Apr  1 19:13:53 (none) user.warn kernel: linuxrc       S C0275280  3956  2884      7                2883 (NOTLB)
Apr  1 19:13:53 (none) user.warn kernel: Call Trace:    [<c011a627>] [<c01c5f62>] [<c0181b2f>] [<c01820de>] [<c017d2fd>]
Apr  1 19:13:53 (none) user.warn kernel:   [<c0143b76>] [<c0153447>] [<c0108bb3>]

Что это за напасть? Причём на первый взгляд, всё работает нормально, доступ
есть со всех консолей, включая локальную, serial и telnet, работает упомянутый
в логах ipcad, в памяти 200Кбайт NetFlow -- не критично. Загрузка системы нулевая,
свободно 220 метров памяти (из 256). Единственно, траффик на 8Мбит всё время,
но тоже смешная цифра.

Ядро -- 2.4.29-rad-smp, это vs-smp из Сизифа с новым патчем для 2.4. Ещё на трёх
машинах с тем же набором, включая ядро, в логах нет ничего подобного. Очередей
не установлено, никаких активных сервисов нет. Единственное, что собирает
NetFlow, маскарадит пару сетей и немного рутит статиками.

По логам, такое выпадало уже раз пять с разными интервалами в течение 2х дней,
без каких-либо заметных глазу проблем. Это ведь не сегфолт? Паники не было, у
меня стоит ребут на панику. Не упс. Беда какая-то неопознанная, а потому
особенно тревожная.

Кстати, в ту же тему. Есть ребут на панику, а есть ли ребут на oops? От них машина
тоже встаёт, в 90% случаев -- намертво, как это ловить, кроме хардварного
watchdog?

-- 
Peter V. Saveliev


Подробная информация о списке рассылки Devel