[sisyphus] vzctl stop висит
Anton Farygin
=?iso-8859-1?q?rider_=CE=C1_altlinux=2Ecom?=
Чт Сен 6 09:28:41 MSD 2007
Dmitry V. Levin пишет:
> On Wed, Sep 05, 2007 at 12:11:18PM +0400, Anton Farygin wrote:
>> lebedev.v.sergey wrote:
>>> В сообщении от Wednesday 05 September 2007 11:11:05 Anton Farygin написал(а):
>>>> Всем привет!
>>>>
>>>> начал миграцию с vserver на ovz и столкнулся со странной проблемой -
>>>> висит vzctl stop <id>
>>> [skip]
>>>> То как видно всё работает
>>>>
>>>> Что бы это могло быть ? есть идеи ?
>>>>
>>>> хост система - текущий 4.0/branch x86_64, контейнер - Sisyphus (как i586
>>>> так и x86_64 - одинаково)
>>>>
>>>> Ядро: 2.6.18-ovz-smp-alt15
>>> А vzctl enter 103 что выдает при работающем контейнере? У меня это наблюдалось
>>> на машине с alt6, alt7. Причем после подвисания эдак минут на пять, vzctl
>>> stop говорил о невозможности остановки и отваливался. Повторное выполнение
>>> vzctl stop нормально останавливало контейнер. Но обычно у таких контейнеров
>>> была проблема с невозможностью входа в него через vzctl enter. Ругань на
>>> отсутствие pty. Хотя allow... в hasher внесен. Создание контейнеров идет по
>>> похожим шаблонам и почему для одного все впорядке, а для другого не создается
>>> pty -- это осталось загадкой. Зависимости не нашел.
>> enter заходит без проблем. pty я исправил (в vserver почему-то он был не
>> нужен).
>>
>> Но это не помогло - висит зараза.
>
> Попробуй vzctl-3.0.18-alt1 из Сизифа, там есть коммит vzctl-3.0.16-44-g4766d1f,
> который может улучшить ситуацию.
>> strace показывает что vzctl stop запускает shutdown -h now внутри
>> контейнера. После этого ждёт пока контейнер исчезнет. Контейнер не
>> исчезает, таймауты не работают (или не прописаны, где смотреть ?)
>
> Логика работы vzctl stop простая:
> - pзапускает halt в контейнере
Действительно запускает. Кстати, shutdown -h now в контейнере должен
привести к его полной остановке ?
> - ждёт не более 2 минут, пока контейнер сам не завершится
Действительно ждёт .. на глаз - минут 10.
> - принудительно завершает работу процессов в контейнере (коммит
> vzctl-3.0.16-44-g4766d1f меняет способ этого завершения)
Посмотрим. сейчас вылезает как раз последнее сообщение - контейнер не
завершился.
> - ждёт не более 1 минуты, пока контейнер не завершится
> - если контейнер не завершился, жалуется на таймаут
Вот - когда я уже совсем долго подождал - заметил это сообщение про то,
что он не смог завершить контейнер.
Сейчас буду пробовать новую версию.
Подробная информация о списке рассылки Sisyphus