[Sysadmins] linux cluster GATEWAY #part 1 - Heartbeat

Anton Kvashin foo на junior.esoo.ru
Вт Май 29 07:36:53 MSK 2012


28.05.2012 18:17, Alexandr ANDREEV написал:
> Вы писали 28 мая 2012 г., 13:03:13:
>> > Кластерные IP следует делать альясами на основных ethX.
>
> а разве это не происходит автоматически?
>
> небольшой эксперимент показал, что 10.0.0.240/24/eth0:1 в моем случае ни
> на что не влияет...
>
> т.е. я указываю как у вас алиас .../eth0:1 или .../eth0, но в результате
> получаю интерфейс .../eth0:0

Судя по вашим экспериментам - да, heartbeat сам все делает. Будем знать.

> и 2 вопрос:
>
> у вас хост назван node5 или это имя кластера?

Хост.

> у меня просто проблема, нужно чтобы, если падает любой IP или служба на
> одном сервере, это сервер "отключался" полностью. т.е. чтобы второй
> начинал выполнять все его функции...

Для служб можно использовать monit (на этом же сервере).

> но с примером из двух IP это работает с проблемами... переключение на
> работающий хост
>
> при живом сервере происходит очень очень долго(ну допустим одна из
> сетевух со вторым IP сгорела) ...
>
> быстро работает, только, если падает любой из интерфейсов на основной
> (eth0) на любом из кластеров. тогда происходит быстрое переключение
> кластерного IP на другой хост кластера.
>
> я это связываю с тем, что там у меня еще и бродкасты бегают - ну небыло
> у меня еще 2х сетевух на отдельное подключение между серверами.

Возможно следует разделить сервера, т.е. сделать два кластера. Либо 
читать доки по heartbeat (умеет ли он такое).

Можно посмотреть Pacemaker (надстройка над heartbeat), 
http://habrahabr.ru/post/107837/

> уменьшил значения
>
> keepalive 1
>
> deadtime 3
>
> warntime 4
>
> initdead 3
>
>
> не помогло
>
> добавил
>
> ping 10.0.0.241 # IP второго сервера в кластере
>
> ping 192.168.211.2
>
> без пингов переключения при сбое на второй паре адресов не было.
>
> если не извращаться с сетевыми картами, а допустить, что реально
> сломался один из серверов (неожиданно отключили питание).
>
> То опять-же запасной сервер поднимает замечательно и быстро только
> первый вертуальный интерфейс (eth0:0),
>
> второй мучает аж 15 минут после первого...

Попробуйте руками все сделать (heartbeat выключен на обеих нодах). Т.е. 
выключить первый сервер, а на втором поднять все нужные IP и сервисы. 
Убедиться что это работает.

-- 
Anton Kvashin


Подробная информация о списке рассылки Sysadmins