[Sysadmins] Мониторинг нагрузки на сервер

Maksym Tiurin mrkooll на bungarus.info
Чт Июл 17 23:59:17 MSK 2014


Сори за некропост, но может будет кому интересно.

Michael Shigorin writes:

> On Tue, Jun 24, 2014 at 11:40:47AM +0900, alexei/taf.ru wrote:
>> Смотрите в сторону zabbix'а. Через агента и внешние скрипты
>> можно собирать все, что только можно.
>
> Этот вариант более осмыслен тогда, когда машин много и надо
> их как-то обобщать, а тонкие детали происходящего на каждой
> отдельной не особо важны (т.к. период обновления сенсоров
> довольно велик, а для скриптов заметны накладные расходы).

Если машин много то лучше уж Cacti - одна нода точно обслуживает 6k
машин. Zabbix тупит, да и использование обычной реляционной СУБД для
статистики ИМХО хреновое решение.
Можно еще на graphite посмотреть, но он уродлив (сами графики уродливы и
неудобны - того кто придумал диапазон в текстовых полях набирать надо
книгой по юзабилити бить по голове).

>
> On Tue, Jun 24, 2014 at 10:13:49AM +0300, Dmitriy L. Kruglikov wrote:
>> Если только собирать картинки, то Collectd + rrd, 
>> а смотрелка для графиков из rrd - вообще не проблема.
>
> Для нескольких хостов либо необходимости отмечать кратковременные
> выбросы значений лучше collectd я пока ничего не видел -- лёгкий,
> нежручий, почти всё делает сам (хотя умеет дёргать и perl/java),
> умеет интервалы порядка 5..10 секунд, не отмечаясь особо в top,
> сливает данные по сети (при надобности через свой прокси) на
> collectd-сервер, где их можно агрегировать.  В качестве GUI брал
> комплектный пример collection3 и так и использовал.

collectd очень хорош, но еще лучше collectd-pw + perfwatcher.

>
> Вообще за последние лет десять на своих задачах пришёл к варианту
> "пассивный удалённый мониторинг + активный локальный", когда нет
> возможности отдачи команд рутом через какого-либо агента (и нет
> лишних открытых портов); реализовывал связкой collectd + monit.
>
> В любом случае запросы к абстрактному серверу можно фиксировать
> разве что на уровне соединений, а если это был веб-сервер, то
> стоит уточнить, на чём именно (apache1/2, nginx?): для разных
> httpd в разных системах мониторинга бывают свои модули, например,
> https://collectd.org/wiki/index.php/Plugin:Apache
> https://collectd.org/wiki/index.php/Plugin:nginx

collectd еще умеет парсить логи, запускать скрипты и получать значения
через unixsocket.
В общем колектом можно собирать что угодно, а куда собранное складывать
и чем анализировать это уже от задачи и нагрузки зависит.

-- 

With Best Regards, Maksym Tiurin
JID:	MrKooll на jabber.pibhe.com


Подробная информация о списке рассылки Sysadmins