[Comm] Непонятное поведение p9

Yuri Khachaturyan yukh на yukh.ru
Вт Дек 3 11:29:06 MSK 2019


вт, 3 дек. 2019 г. в 00:40, Павел Исопенко <master на pauli.ru>:

>
>
> 02.12.2019 19:13, Yuri Khachaturyan пишет:
> > Диагностика показала, что у контроллера умерла Backup Battery. Заказал
> > новую, пока ее доставляют - продолжаю эксперименты.
> >
> > Пересобрал массив на RAID5 из 6 дисков по 1ТБ с полностью отключенным
> > write-cache.
> > Установил ALT Server 8.2 с ядром un-def. С пятницы все работает без
> > сбоев, правда подтормаживает файловая система.
>
> Вопрос насколько подтормаживает.
>
>
Под нагрузкой в 200Мбит/сек (сеть) и записи (качает торренты для теста) -
довольно заметно.


> > arcconf говорит, что батарейка живая, но визуально видно, что она
> вздулась.
>
> Врёт? А вольтметром? Li-Ion c маркировкой 3,7В это 3,6 в номинале, и
> если меньше 2.8 - в мусор. Хотя, если вздулась, наверное и прибор  уже
> не нужен.
>
>
Скорее всего врет. Батарейка вздулась, потому не вижу смысла пытаться ее
реанимировать. Вчера уже новая приехала, осталось добраться до сервера...


> >
> > Вопрос - может ли мертвая батарейка таким образом влиять на контроллер,
>
> Только инженер, делавший контроллер, может ответить. По опыту для начала
> просто отключить, дабы ничего не шунтировала. Если есть шлейф с разъёмом
> - снять с колодки, если контакты жёсткие - снять АКБ совсем. А перед
> этим сфотографировать, чтобы поставить как было когда придёт запчасть.
>
>
Тут дело такое, что контроллер выдает kernel panic, если его пытаешься
загрузить с отключенной батарейкой. В биосе контроллера нигде не нашел как
ее отключить. То есть этот контроллер априори без батарейки работать не
должен судя по всему.



> > что он просто теряет массив на какое-то время?
> >
> Непонятно. Это как? Что в логах? Потерять накопитель это же сколько
> визгу должно быть?
>

Никаких визгов. Просто отвалился "жесткий диск". В логах пусто (не успевает
записать ничего). Система мертвая - то, что есть в данный момент в ОЗУ -
работает, все остальное - нет, ни залогиниться локально и удаленно. reboot
только по питанию. После перезагрузки какое-то время все работает. Пока что
с пятницы такого больше не повторялось.



> Есть у меня один такой сервер, четыре года уже со снятой BBU АКБ - и
> ничего. Пока живая было совсем хорошо, когда сдохла пошли сбои.
> Догадался АКБ отключить и выбросить, живём без проблем дальше.
> write-cache разумеется отключен.
>

Пока что тоже без write-cache. До того, как поставить батарейку и
пересобирать заново массив, хочу все же обновиться до p9 и посмотреть как
будет вести себя система. Потому как все эти приключения начались ровно с
обновления из древнего Сизифа до p9.

-- 
С уважением,
Хачатурян Юрий (yukh на yukh.ru)
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.altlinux.org/pipermail/community/attachments/20191203/0349d3c6/attachment.html>


Подробная информация о списке рассылки community