[sisyphus] vzctl stop висит

Anton Farygin =?iso-8859-1?q?rider_=CE=C1_altlinux=2Ecom?=
Чт Сен 6 09:28:41 MSD 2007


Dmitry V. Levin пишет:
> On Wed, Sep 05, 2007 at 12:11:18PM +0400, Anton Farygin wrote:
>> lebedev.v.sergey wrote:
>>> В сообщении от Wednesday 05 September 2007 11:11:05 Anton Farygin написал(а):
>>>> Всем привет!
>>>>
>>>> начал миграцию с vserver на ovz и столкнулся со странной проблемой -
>>>> висит vzctl stop <id>
>>> [skip]
>>>> То как видно всё работает
>>>>
>>>> Что бы это могло быть ? есть идеи ?
>>>>
>>>> хост система - текущий 4.0/branch x86_64, контейнер - Sisyphus (как i586
>>>> так и x86_64 - одинаково)
>>>>
>>>> Ядро:  2.6.18-ovz-smp-alt15
>>> А vzctl enter 103 что выдает при работающем контейнере? У меня это наблюдалось 
>>> на машине с alt6, alt7. Причем после подвисания эдак минут на пять, vzctl 
>>> stop говорил о невозможности остановки и отваливался. Повторное выполнение 
>>> vzctl stop нормально останавливало контейнер.  Но обычно у таких контейнеров 
>>> была проблема с невозможностью входа в него через vzctl enter. Ругань на 
>>> отсутствие pty. Хотя allow... в hasher внесен. Создание контейнеров идет по 
>>> похожим шаблонам и почему для одного все впорядке, а для другого не создается 
>>> pty -- это осталось загадкой. Зависимости не нашел.
>> enter заходит без проблем. pty я исправил (в vserver почему-то он был не 
>> нужен).
>>
>> Но это не помогло - висит зараза.
> 
> Попробуй vzctl-3.0.18-alt1 из Сизифа, там есть коммит vzctl-3.0.16-44-g4766d1f,
> который может улучшить ситуацию.
>> strace показывает что vzctl stop запускает shutdown -h now внутри 
>> контейнера. После этого ждёт пока контейнер исчезнет. Контейнер не 
>> исчезает, таймауты не работают (или не прописаны, где смотреть ?)
> 
> Логика работы vzctl stop простая:
> - pзапускает halt в контейнере
Действительно запускает. Кстати, shutdown -h now в контейнере должен 
привести к его полной остановке ?

> - ждёт не более 2 минут, пока контейнер сам не завершится
Действительно ждёт .. на глаз - минут 10.
> - принудительно завершает работу процессов в контейнере (коммит
>   vzctl-3.0.16-44-g4766d1f меняет способ этого завершения)
Посмотрим. сейчас вылезает как раз последнее сообщение - контейнер не 
завершился.
> - ждёт не более 1 минуты, пока контейнер не завершится
> - если контейнер не завершился, жалуется на таймаут


Вот - когда я уже совсем долго подождал - заметил это сообщение про то, 
что он не смог завершить контейнер.

Сейчас буду пробовать новую версию.




Подробная информация о списке рассылки Sisyphus