[Sysadmins] nagios HA

Dmitriy L. Kruglikov dmitriy.kruglikov на gmail.com
Пн Ноя 10 16:59:29 MSK 2014


On Mon, 10 Nov 2014 15:45:38 +0300
Anton Gorlov wrote:

AG> Задача такая -что бы если в 1 из дц какая либо проблема что
AG> бы работал 2 нагиос и в том же анаге не нужно было менять
AG> хост на котором крутится нагиос.
AG> То есть если в 1 дц какие-то проблемы - включая проблемы с
AG> сететвой частью что бы хосты в основном дц замониторил 2
AG> нагиос. То есть грубо говоря - ест ь3 датацентра. основнйо с
AG> кучей серверов и 2 дополнительных, которые должны
AG> мониторить  сервера в основном ДЦ. И если в  из
AG> "мониторящих" дц какие-то проблемы что бы его прозрачно
AG> заменил 2.

Если в ДЦ проблемы, включая сетевую часть, то внешние Nagios до него (всего ДЦ)
не доберутся и мониторить не смогут. Максимально - сам факт (не)доступности.
А если так, то пусть этим и ограничиваются.
Все остальные параметры логично мониторить в пределах основного ДЦ.
В этом случае получим любые уведомления один раз, а в если пропала сеть,
уведомлений не будет, и об этом отрапортуют, пусть и оба, внешних инстанса.
Если во время пропадания сети не будут шалит ьостальные параметры, то и очереди уведомлений не будет.

Мне такая схема кажется разумной.

Можно, конечно, на внешнем Nagios настроить зависимость сервисов и хостов от "шлюзового",
но это не снимет проблему отчетов от каждого из внешних.

Я не знаю встроенных механизмов определения в Nagios, послал ли отчет соседний сервер.
А городить обвязку для этого...
Можно, конечно, в скриптах, по SSH, дергать соседний сервер,
но я бы не морочил себе голову.

-- 
Best regards,
 Dmitriy Kruglikov


Подробная информация о списке рассылки Sysadmins