[sisyphus] Непонятное поведение LVM2

Ildar Mulyukov ildar на altlinux.ru
Пт Май 6 08:48:17 UTC 2011


On 28.04.2011 23:38:24, Yuri Khachaturyan wrote:
> Добрый вечер!
> Подскажите, в чем моя ошибка?
> 
> Есть машина со SCSI контроллером Adaptec 29320. К ней подключен
> массив, на котором созданы 3 RAID-5.
> 
> Система - последний сизиф. В системе 3 раздела объединены в LVM.
> 
> Наблюдаю непонятное поведение LVM после перезагрузки машины:
> 
> Setting up LVM2: Couldn't find device with uuid xxxx-xxx......xxxx.
> Refusing activation of patrial LV home. Use --partial to override.
> 0 logical volumes in volume group "home" now active       [FAILED]
> 
> Далее предлагает single-user или CTRL-D для перезагрузки.
> 
> Нажимаем CTRL-D, система перезагружается и работает нормально.
> 
> По результатам тестов на ядрах 2.6.38-std-def-alt2 и alt3 показало,
> что такое происходит только тогда, когда на указанный LVM шла записб
> данных и после этого машина была перезагружена. То есть просто
> перезагрузка машины несколько раз подряд такого эффекта не дает. А вот
> если поработать хотя-бы минут 10-15, то автоматически уже не
> перезагрузится.
> 
> Проявилось все это после вчерашнего dist-upgrade (до этого все
> работало нормально). Первым делом грешил на новое ядро
> 2.6.38-std-def-alt3, откатился на alt2 и увидел ту же проблему.
> 
> В чем моя ошибка или на что вешать багу?

на первый взгляд, похоже на "races". Чтобы их избежать, скорее всего  
где-то надо поставить небольшие таймауты. (например, перед vgscan)
Для отладки я бы посоветовал вывести необходимую информацию перед  
vgscan и посмотреть, чего ему не хватает. Потом поискать, в чём причина  
этого.

В общем, классический troubleshooting.
-- 
Ildar Mulyukov,
   free SW designer/programmer/packager
=========================================
email: ildar на altlinux.ru
Jabber: ildar.mulyukov на gmail.com
ICQ: 4334029
ALT Linux Sisyphus http://www.sisyphus.ru
=========================================


Подробная информация о списке рассылки Sisyphus