[sisyphus] apcupsd (Re: 2.6.38-std-def-alt7.2, 2.6.32-el-smp-alt22 & shutdown -h now = =?koi8-r?q?=CB=CF=CD=C1?=)

john на sakh.com john на sakh.com
Вт Июн 7 05:58:56 UTC 2011


В сообщении от 7 июня 2011 15:54:47 автор Sergey написал:
> On Tuesday 07 June 2011, john на sakh.com wrote:
> > Всё это почти разом стихает, UPSы дохнут. Разряд батарей полный. Они не
> > успевают даже немного зарядиться.  Тишина минуты 2-3. Щелчок, в пилоте
> > отработала  защита. Он включился. Все сервера заработали, альтовский не
> > хочет. Проверил в биосе альтовского сервера стоит Power On. Но он не
> > заводится.
> 
> В смысле не включается сам компьютер ?
Да, не включился, хотя должен был. Показывало что питание есть, но сервер
как будто спал. Хотя в биосе стоит Power On на случай появления питания.
Может конечно крыша поехала у сервера, от такой котовасии...
И к слову, есть два совершенно одинаковых сервера. Совершенно одинаково
настроены в плане BIOS. Firmware один и тот же.
Один заводится при появлении в эл. сети напряжения, другой
напрочь отказывается это делать. Отличаются только установленной на них ОС.
Управляются по сети тем же apcupsd. 
Который поднимается, там CentOS. Тот, что только по пинку по кнопке Power, альт.
Опять ерунда и как говорила моя учительница математики: один раз - это случайность,
два раза - это уже закономерность.
А хочеться думать что это, всё же только случайность, не более.
Кто виноват apcupsd или shutdown -h now, не знаю.
Рассуждать о кошерности применения poweroff или shutdown -h now
не могу. Но знаю одно, что shutdown -h now в центос ведёт к однозначному выключению
питания на сервере. И он однозначно поднимается, что не могу сказать про альт.
> 
> > При первом полном разряде батарей, когда только началась проблема с
> > сработкой защиты на пилоте, UPS как и положено послал команду на
> > shutdown серверов. Сервера потухли как и положенно. Разряд батарей
> > был не таким критическим, что бы не успеть выдать команду на завершение
> > работы. Альтовский сервер в режим halt. Центосовский выключился
> > полностью.
> 
> Через время "apcaccess|grep DSHUTD" должен был отключиться UPS и показать
> соотвующую индикацию: перемигивающиеся вверх-вниз индикаторы.
> 
> > Потом начинается свистопляска что описал выше. Включается, выключается,
> > всё орёт, пищит. Сервера заводятся, потом всё это падает. И опять
> > заводятся, и опять всё тухнет.
> 
> Нехорошая ситуация сама по себе. Думаю, надо выставить у UPS параметр
> RETPCT больше нуля (это по-умолчанию). Первое значение 15%. Минус -
> включаться всё не будет сразу, но, зато, этого "туда-сюда" не будет.
> Железо целее останется.
> 
> DSHUTD и RETPCT можно задать через apctest.
> 
> 5) Program EEPROM
> 
>    8) Change shutdown delay
>    11) Change battery return threshold percent
> 
> Кстати, неплохо бы ещё
> 
>    4) Change sensitivity
> 
> в Low выставить. Импульсным б/п в компьютерах по барабану, а UPS от лишних
> переходов на батарею может уберечь. Да и диапазоны переходов поправить тоже
> можно, в смысле пошире сделать.
в Low и стоит, это уже по умолчанию, с нашим мерзким напряжением.

> 
> > До управления UPSами серверами думаю даже в дальнейщем и не доходило.
> > Разряд батарей на UPSах стал  до такой степени критический, что они
> > просто напросто выключались при сработке защиты на пилоте. Вот собственно
> > что происходило.
> 
> В этой ситуации, как я понимаю, сервер с ALT никак не мог остаться
> включенным после shutdown, даже если что-то не так прошло с UPS.
Конечно не мог. Но при появлении питания, он вернулся в состояние halt
Как будто ему наплевать что в BIOS стоит Power On
Вообще такое поведение вижу в первый раз и очень надеюсь, последний.

-- 
С уважением, Серов Евгений

E-mail: john на sakh.com
UIN: 17777140


Подробная информация о списке рассылки Sisyphus