[Sysadmins] veth packet loss

Michael A. Kangin mak на complife.ru
Вс Апр 14 20:48:59 MSK 2013


Добрый день.

Случилась со мной намедни преудивительная история - начала временами
пропадать связь с филиалом - куча потерь пакетов. Причем, связь с самим
рутером в этом филиале через интернет не пропадает, и в логах OpenVPN
всё чисто.
После стандартных шаманств по уменьшениям размеров пакетов и пингов в
различных комбинациях выяснилось, что потеря пакетов происходит между
VZ-контейнером, где живёт OpenVPN, и хостнодой. Сеть там типа veth.
Потери пакетов на пингах mtr'ом составляют где-то 15%.

В логах на хостноде всё чисто, в dmesg всё хорошо. При потерях пакетов
загрузки системы мизерная. Всякие там user_beancounters без превышения
лимитов. Пакеты теряются так: вроде всё хорошо-хорошо, потом бац! -
пропадает десяток пингов один за другим, потом опять всё хорошо.

Наверное, злобные pps какие-то, подумал я, включил помониторить.
Нагрузка в среднем 300-400 pps, никак при потерях не меняется. Причем
доведение видеонаблюдением до 10-11 kpps в спокойный период никаких
проблем не создаёт.

Включив ради очередного тесту arping на проблемный адрес заметил, что
все потери тут же исчезли. А остановив его, тут же получил новую порцию
их. Ага, сказал я. Помониторил запись в arp-кеше для этого адреса, и
точно - в период потерь вместо адреса MAC появляется <incomplete>, а
потом MAC снова появляется и цикл потерь прекращается.
Прописывание статического MACа проблему на_сейчас решило.

Вот ведь!!! налицо всёже глюк. Почему пропадает MAC-адрес? он пропадает
явно быстрей, чем стандартное время жизни в 60 секунд. И порой не
стремится быстро отрезолвится назад, период пропажи пакетов может
длиться секунд 15.

Проблема такая набигает эпидемией, я вижу уже второй такой случай за
последний месяц. (до этого 6 месяцев полёт нормальный).

Ядро: 2.6.32-ovz-el-alt40.M60P.2

Ну и собственно вопрос - как правильно инициализировать статические
arp-записи при старте системы? про rc.local догадываюсь, конечно, но
может как-то etcnet'ом?



-- 
wbr, Michael A. Kangin


Подробная информация о списке рассылки Sysadmins