[Comm] Непонятное поведение p9

Дмитрий Табунов dickie на mail.ru
Чт Ноя 21 00:17:53 MSK 2019


Юра, привет.
Скажи, сам рейд не рассыпается? Том жив при падении системы?
--
Отправлено из Mail.ru для Android среда, 20 ноября 2019г., 20:07 +01:00 от Yuri Khachaturyan  yukh на yukh.ru :

>В продолжение этой темы.
>Заменил диски на новые и 100% рабочие (тестировал каждый диск перед установкой посекторно).
>Сервер проработал 1.5 суток и опять та же история - просто отвалился /dev/sda и система не дает ни залогиниться локально, ни естесственно удаленно. 
>Есть мысль в неисправности контроллера (Intel ServerRAID 8K) или же все-таки проблема в драйвере aacraid? Как это можно диагностировать?
>
>В логах ни слова о проблеме нет.
>
>Мои мысли следующие на этот счет:
>
>1. продуть разъемы SATA от пыли сжатым воздухом.
>2. попробовать собрать mdraid вместо аппаратного (а вдруг)
>3. заменить ОС на FreeBSD и посмотреть что будет.
>
>Ваше мнение?
>чт, 12 сент. 2019 г. в 16:29, Yuri Khachaturyan < yukh на yukh.ru> :
>>В продолжение темы....
>>
>>После перезагрузки вижу в логах:
>>
>>сен 12 16:26:40  lax.yukh.ru systemd[1]: dev-disk-by\x2duuid-EA245C80245C51A5.device: Job dev-disk-by\x2duuid-EA245C80245C51A5.device/start timed out.
>>сен 12 16:26:40  lax.yukh.ru systemd[1]: Timed out waiting for device /dev/disk/by-uuid/EA245C80245C51A5.
>>сен 12 16:26:40  lax.yukh.ru systemd[1]: Dependency failed for /mnt/sdb1.
>>сен 12 16:26:40  lax.yukh.ru systemd[1]: mnt-sdb1.mount: Job mnt-sdb1.mount/start failed with result 'dependency'.
>>сен 12 16:26:40  lax.yukh.ru systemd[1]: Startup finished in 6.197s (kernel) + 1min 31.313s (userspace) = 1min 37.511s.
>>сен 12 16:26:40  lax.yukh.ru systemd[1]: dev-disk-by\x2duuid-EA245C80245C51A5.device: Job dev-disk-by\x2duuid-EA245C80245C51A5.device/start failed with result 'timeout'.
>>
>>На деле:
>>
>>[root @  lax.yukh.ru ~]# ll /dev/disk/by-uuid/EA245C80245C51A5.
>>ls: невозможно получить доступ к '/dev/disk/by-uuid/EA245C80245C51A5.': Нет такого файла или каталога
>>[root @  lax.yukh.ru ~]# ll /dev/disk/by-uuid/
>>итого 0
>>lrwxrwxrwx 1 root root  10 сен 12 16:25 f052100f-3f42-4100-97f3-8563fe976d7c -> ../../sda1
>>lrwxrwxrwx 1 root root  10 сен 12 16:25 7a1a0cf7-af0c-46e9-a308-352e24c7126d -> ../../sda3
>>lrwxrwxrwx 1 root root  10 сен 12 16:25 f12d62c8-ea1d-4c95-9cc6-fa1c9aab60b4 -> ../../sda5
>>lrwxrwxrwx 1 root root  10 сен 12 16:25 17e5aa57-e4bd-438d-a623-512f95c8d457 -> ../../sda4
>>lrwxrwxrwx 1 root root  10 сен 12 16:25 d56aff86-6f2b-4e59-ac0a-ff674a0d7bf0 -> ../../sda2
>>drwxr-xr-x 2 root root 140 сен 12 16:25 ./
>>drwxr-xr-x 6 root root 120 сен 12 16:25 ../
>>
>>Где посмотреть откуда взялась ссылка на /dev/disk/by-uuid/EA245C80245C51A5. ls: невозможно получить доступ к '/dev/disk/by-uuid/EA245C8
>>
>>
>>Отключил write-cache как на самом массиве, так и на дисках - пока 4 часа полет нормальный. По смарт-тестам, которые умеет контроллер через arcconf никаких ошибок не вижу вообще.  Куда еще посмотреть, кроме как снимать диски и тестировать их по-одному (в системе собран аппаратный RAID-5 на 6 дисках по 1ТБ).
>>пн, 9 сент. 2019 г. в 11:13, Sergey < a_s_y на sama.ru> :
>>>On Monday 09 September 2019, Yuri Khachaturyan wrote:
>>>
> А есть ли вообще где-нибудь принятые нормы создания ФС?
>>>
>>>Всё весьма условно:  https://www.altlinux.org/РазбиениеДиска
>>>
>>>-- 
>>>С уважением, Сергей.
>>>_______________________________________________
>>>community mailing list
>>>community на lists.altlinux.org
>>>https://lists.altlinux.org/mailman/listinfo/community
>>
>>-- 
>>С уважением, 
>>Хачатурян Юрий ( yukh на yukh.ru )
>
>-- 
>С уважением, 
>Хачатурян Юрий ( yukh на yukh.ru )
>_______________________________________________
>community mailing list
>community на lists.altlinux.org
>https://lists.altlinux.org/mailman/listinfo/community
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.altlinux.org/pipermail/community/attachments/20191121/4752e588/attachment.html>


Подробная информация о списке рассылки community