[Comm] Непонятное поведение p9
Yuri Khachaturyan
yukh на yukh.ru
Чт Ноя 21 11:11:23 MSK 2019
Дима, массив на аппаратном уровне живее всех живых. Биос контроллера
говорит, что все живо и работает. Мало того, после перезагрузки все
работает как надо какое-то время. Возможно, это зависит от нагрузки на
дисковую систему. С минимальной нагрузкой сервер прожил 1.5 суток, с
максимальной - и часа не выдерживает.
чт, 21 нояб. 2019 г. в 00:18, Дмитрий Табунов <dickie на mail.ru>:
> Юра, привет.
>
> Скажи, сам рейд не рассыпается? Том жив при падении системы?
>
> --
> Отправлено из Mail.ru для Android
> среда, 20 ноября 2019г., 20:07 +01:00 от Yuri Khachaturyan yukh на yukh.ru:
>
> В продолжение этой темы.
> Заменил диски на новые и 100% рабочие (тестировал каждый диск перед
> установкой посекторно).
> Сервер проработал 1.5 суток и опять та же история - просто отвалился
> /dev/sda и система не дает ни залогиниться локально, ни
> естесственно удаленно.
> Есть мысль в неисправности контроллера (Intel ServerRAID 8K) или же
> все-таки проблема в драйвере aacraid? Как это можно диагностировать?
>
> В логах ни слова о проблеме нет.
>
> Мои мысли следующие на этот счет:
>
> 1. продуть разъемы SATA от пыли сжатым воздухом.
> 2. попробовать собрать mdraid вместо аппаратного (а вдруг)
> 3. заменить ОС на FreeBSD и посмотреть что будет.
>
> Ваше мнение?
>
> чт, 12 сент. 2019 г. в 16:29, Yuri Khachaturyan <yukh на yukh.ru>:
>
> В продолжение темы....
>
> После перезагрузки вижу в логах:
>
> сен 12 16:26:40 lax.yukh.ru systemd[1]:
> dev-disk-by\x2duuid-EA245C80245C51A5.device: Job
> dev-disk-by\x2duuid-EA245C80245C51A5.device/start timed out.
> сен 12 16:26:40 lax.yukh.ru systemd[1]: Timed out waiting for device
> /dev/disk/by-uuid/EA245C80245C51A5.
> сен 12 16:26:40 lax.yukh.ru systemd[1]: Dependency failed for /mnt/sdb1.
> сен 12 16:26:40 lax.yukh.ru systemd[1]: mnt-sdb1.mount: Job
> mnt-sdb1.mount/start failed with result 'dependency'.
> сен 12 16:26:40 lax.yukh.ru systemd[1]: Startup finished in 6.197s
> (kernel) + 1min 31.313s (userspace) = 1min 37.511s.
> сен 12 16:26:40 lax.yukh.ru systemd[1]:
> dev-disk-by\x2duuid-EA245C80245C51A5.device: Job
> dev-disk-by\x2duuid-EA245C80245C51A5.device/start failed with result
> 'timeout'.
>
> На деле:
>
> [root @ lax.yukh.ru ~]# ll /dev/disk/by-uuid/EA245C80245C51A5.
> ls: невозможно получить доступ к '/dev/disk/by-uuid/EA245C80245C51A5.':
> Нет такого файла или каталога
> [root @ lax.yukh.ru ~]# ll /dev/disk/by-uuid/
> итого 0
> lrwxrwxrwx 1 root root 10 сен 12 16:25
> f052100f-3f42-4100-97f3-8563fe976d7c -> ../../sda1
> lrwxrwxrwx 1 root root 10 сен 12 16:25
> 7a1a0cf7-af0c-46e9-a308-352e24c7126d -> ../../sda3
> lrwxrwxrwx 1 root root 10 сен 12 16:25
> f12d62c8-ea1d-4c95-9cc6-fa1c9aab60b4 -> ../../sda5
> lrwxrwxrwx 1 root root 10 сен 12 16:25
> 17e5aa57-e4bd-438d-a623-512f95c8d457 -> ../../sda4
> lrwxrwxrwx 1 root root 10 сен 12 16:25
> d56aff86-6f2b-4e59-ac0a-ff674a0d7bf0 -> ../../sda2
> drwxr-xr-x 2 root root 140 сен 12 16:25 ./
> drwxr-xr-x 6 root root 120 сен 12 16:25 ../
>
> Где посмотреть откуда взялась ссылка на /dev/disk/by-uuid/EA245C80245C51A5.
> ls: невозможно получить доступ к '/dev/disk/by-uuid/EA245C8
>
>
> Отключил write-cache как на самом массиве, так и на дисках - пока 4 часа
> полет нормальный. По смарт-тестам, которые умеет контроллер через arcconf
> никаких ошибок не вижу вообще. Куда еще посмотреть, кроме как снимать
> диски и тестировать их по-одному (в системе собран аппаратный RAID-5 на 6
> дисках по 1ТБ).
>
> пн, 9 сент. 2019 г. в 11:13, Sergey <a_s_y на sama.ru>:
>
> On Monday 09 September 2019, Yuri Khachaturyan wrote:
>
> > А есть ли вообще где-нибудь принятые нормы создания ФС?
>
> Всё весьма условно: https://www.altlinux.org/РазбиениеДиска
>
> --
> С уважением, Сергей.
> _______________________________________________
> community mailing list
> community на lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/community
>
>
>
> --
> С уважением,
> Хачатурян Юрий (yukh на yukh.ru)
>
>
>
> --
> С уважением,
> Хачатурян Юрий (yukh на yukh.ru)
> _______________________________________________
> community mailing list
> community на lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/community
>
> _______________________________________________
> community mailing list
> community на lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/community
--
С уважением,
Хачатурян Юрий (yukh на yukh.ru)
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.altlinux.org/pipermail/community/attachments/20191121/d35aef4e/attachment.html>
Подробная информация о списке рассылки community