[Sysadmins] зависание сервера (логи, сбор информации)

master altlinux =?iso-8859-1?q?master=2Ealtlinux_=CE=C1_gmail=2Ecom?=
Вс Авг 31 09:48:03 MSD 2008


 Здравствуйте!

На серверах (7 Штук) работает altlinux master 2.4. Естественно от самого
мастера там мало что осталось (большинство пакетов обновлено, ядро собрано
2.4.36).
Несколько недель все работало нормально. Теперь каждую ночь в 4:02 идет
зависание двух серверов.
И вот такие чудные логи:

Aug 31 04:02:05 vkufs1_11 pam_tcb[9829]: su: Session opened for cacheman by
(uid=0)
Aug 31 04:02:02 vkufs1_11 syslogd: syslogd shutdown succeeded
Aug 31 04:02:03 vkufs1_11 last message repeated 3 times
Aug 31 04:02:05 vkufs1_11 pam_tcb[9829]: su: Session closed for cacheman
Aug 31 04:02:03 vkufs1_11 syslogd: syslogd shutdown succeeded
Aug 31 06:02:22 vkufs1_11 syslogd 1.4.1: restart.
Aug 31 06:02:22 vkufs1_11 syslogd: syslogd startup succeeded
Aug 31 06:02:22 vkufs1_11 kernel: klogd 1.4.1, log source = /proc/kmsg
started.
Aug 31 06:02:22 vkufs1_11 klogd: klogd startup succeeded
Aug 31 06:02:22 vkufs1_11 kernel: Inspecting
/boot/System.map-2.4.36.arkhangel
Aug 31 06:02:22 vkufs1_11 kernel: Loaded 19891 symbols from


Причем зависание идет на обоих серверах ровно ровно в одно и тоже время.
Начал анализировать проблему. Оказалось в это время выполняются задания
anacron (лежат в /etc/cron.daily)
logrotate
cyrus-imapd
makewhatis
stmpclean
sysstat
000anacron
osec
updatedb

Так вот этот пользователь "cacheman" служит для выполнение скрипта
makewhatis (индексация man страниц).
Запускал данные задачи самостоятельно - ничего не виснит. Запускал через
anacron - все нормально.
Подскажите - может что-нибудь настроить - поставить, чтобы информация о
записании стала немного подробнее.
Сомнений в качестве аппаратной части нет. По температуре (процессор, мат.
плата) все норма.
Причем стоит заметить,что это происходит только на двух серверах (они
отличаются от остальных наличием райд массива 5-ого уровня).

Буду признателен за любую помощь и советы. Как лучше и что настроить, чтобы
информация стала более полной (и чтобы лишннего в тоже время не было).
Сейчас на одном из серверов убрал эти задачи и выйду сегодня в ночь - буду
ловить зависание. Но сам факт очень странный и непонятный.
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.altlinux.org/pipermail/sysadmins/attachments/20080831/6da11947/attachment-0002.html>


Подробная информация о списке рассылки Sysadmins