[Comm] Непонятное поведение p9

Yuri Khachaturyan yukh на yukh.ru
Ср Ноя 20 22:07:24 MSK 2019


В продолжение этой темы.
Заменил диски на новые и 100% рабочие (тестировал каждый диск перед
установкой посекторно).
Сервер проработал 1.5 суток и опять та же история - просто отвалился
/dev/sda и система не дает ни залогиниться локально, ни
естесственно удаленно.
Есть мысль в неисправности контроллера (Intel ServerRAID 8K) или же
все-таки проблема в драйвере aacraid? Как это можно диагностировать?

В логах ни слова о проблеме нет.

Мои мысли следующие на этот счет:

1. продуть разъемы SATA от пыли сжатым воздухом.
2. попробовать собрать mdraid вместо аппаратного (а вдруг)
3. заменить ОС на FreeBSD и посмотреть что будет.

Ваше мнение?

чт, 12 сент. 2019 г. в 16:29, Yuri Khachaturyan <yukh на yukh.ru>:

> В продолжение темы....
>
> После перезагрузки вижу в логах:
>
> сен 12 16:26:40 lax.yukh.ru systemd[1]:
> dev-disk-by\x2duuid-EA245C80245C51A5.device: Job
> dev-disk-by\x2duuid-EA245C80245C51A5.device/start timed out.
> сен 12 16:26:40 lax.yukh.ru systemd[1]: Timed out waiting for device
> /dev/disk/by-uuid/EA245C80245C51A5.
> сен 12 16:26:40 lax.yukh.ru systemd[1]: Dependency failed for /mnt/sdb1.
> сен 12 16:26:40 lax.yukh.ru systemd[1]: mnt-sdb1.mount: Job
> mnt-sdb1.mount/start failed with result 'dependency'.
> сен 12 16:26:40 lax.yukh.ru systemd[1]: Startup finished in 6.197s
> (kernel) + 1min 31.313s (userspace) = 1min 37.511s.
> сен 12 16:26:40 lax.yukh.ru systemd[1]:
> dev-disk-by\x2duuid-EA245C80245C51A5.device: Job
> dev-disk-by\x2duuid-EA245C80245C51A5.device/start failed with result
> 'timeout'.
>
> На деле:
>
> [root @ lax.yukh.ru ~]# ll /dev/disk/by-uuid/EA245C80245C51A5.
> ls: невозможно получить доступ к '/dev/disk/by-uuid/EA245C80245C51A5.':
> Нет такого файла или каталога
> [root @ lax.yukh.ru ~]# ll /dev/disk/by-uuid/
> итого 0
> lrwxrwxrwx 1 root root  10 сен 12 16:25
> f052100f-3f42-4100-97f3-8563fe976d7c -> ../../sda1
> lrwxrwxrwx 1 root root  10 сен 12 16:25
> 7a1a0cf7-af0c-46e9-a308-352e24c7126d -> ../../sda3
> lrwxrwxrwx 1 root root  10 сен 12 16:25
> f12d62c8-ea1d-4c95-9cc6-fa1c9aab60b4 -> ../../sda5
> lrwxrwxrwx 1 root root  10 сен 12 16:25
> 17e5aa57-e4bd-438d-a623-512f95c8d457 -> ../../sda4
> lrwxrwxrwx 1 root root  10 сен 12 16:25
> d56aff86-6f2b-4e59-ac0a-ff674a0d7bf0 -> ../../sda2
> drwxr-xr-x 2 root root 140 сен 12 16:25 ./
> drwxr-xr-x 6 root root 120 сен 12 16:25 ../
>
> Где посмотреть откуда взялась ссылка на /dev/disk/by-uuid/EA245C80245C51A5.
> ls: невозможно получить доступ к '/dev/disk/by-uuid/EA245C8
>
>
> Отключил write-cache как на самом массиве, так и на дисках - пока 4 часа
> полет нормальный. По смарт-тестам, которые умеет контроллер через arcconf
> никаких ошибок не вижу вообще.  Куда еще посмотреть, кроме как снимать
> диски и тестировать их по-одному (в системе собран аппаратный RAID-5 на 6
> дисках по 1ТБ).
>
> пн, 9 сент. 2019 г. в 11:13, Sergey <a_s_y на sama.ru>:
>
>> On Monday 09 September 2019, Yuri Khachaturyan wrote:
>>
>> > А есть ли вообще где-нибудь принятые нормы создания ФС?
>>
>> Всё весьма условно: https://www.altlinux.org/РазбиениеДиска
>>
>> --
>> С уважением, Сергей.
>> _______________________________________________
>> community mailing list
>> community на lists.altlinux.org
>> https://lists.altlinux.org/mailman/listinfo/community
>
>
>
> --
> С уважением,
> Хачатурян Юрий (yukh на yukh.ru)
>


-- 
С уважением,
Хачатурян Юрий (yukh на yukh.ru)
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.altlinux.org/pipermail/community/attachments/20191120/8aa40380/attachment.html>


Подробная информация о списке рассылки community