Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  

Показать сообщение отдельно

Забанен


Сообщения: 6158
Благодарности: 1300

Профиль | Цитировать


Кто-нибудь умеет в SCSI/SAS SMART? Оно очень отличается.
Высыпалось сегодня в лог
Код: Выделить весь код
Sep  8 07:33:29 ** Server_Administrator: 138941 2271 - Storage Service  The Patrol Read corrected a media error.:  Physical Disk 0:1:7 Controller 0, Connector 0
Смотрим на месте
Код: Выделить весь код
root@**:~# omreport system alertlog -fmt ssv | head
Alert Log

Alert Log contains...

Severity;ID;Date and Time;Category;Description
Ok;2243;Mon Sep  8 08:48:05 2014;Storage Service;The Patrol Read has stopped.:  Controller 0 (PERC H710P Mini) 
Ok;2095;Mon Sep  8 07:35:51 2014;Storage Service;Unexpected sense. SCSI sense data: Sense key:  3 Sense code: 11 Sense qualifier:  0:  Physical Disk 0:1:7 Controller 0, Connector 0
Ok;2271;Mon Sep  8 07:35:51 2014;Storage Service;The Patrol Read corrected a media error.:  Physical Disk 0:1:7 Controller 0, Connector 0
Ok;2095;Mon Sep  8 07:35:49 2014;Storage Service;Unexpected sense. SCSI sense data: Sense key:  3 Sense code: 11 Sense qualifier:  0:  Physical Disk 0:1:7 Controller 0, Connector 0
Ok;2271;Mon Sep  8 07:35:49 2014;Storage Service;The Patrol Read corrected a media error.:  Physical Disk 0:1:7 Controller 0, Connector 0
Ага, была бяка, но починилась, считаем бяки
Код: Выделить весь код
root@**:~# omreport system alertlog -fmt ssv | grep "The Patrol Read corrected a media error.:  Physical Disk 0:1:7" | wc -l
18
Смотрим здоровье
Код: Выделить весь код
root@**:~# smartctl -H -d megaraid,7 /dev/sda 
smartctl 5.43 2012-06-05 r3561 [x86_64-linux-2.6.32-22-pve] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

SMART Health Status: OK
Смотрим error log диска
Код: Выделить весь код
root@**:~# smartctl -l error -d megaraid,7 /dev/sda 
smartctl 5.43 2012-06-05 r3561 [x86_64-linux-2.6.32-22-pve] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net


Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:   3181831757        2         0  3181831759   3181831759      84239.684           0
write:         0        0         0         0          0      45618.629           0
verify: 2023424967        9         0  2023424976   2023424995      60874.261          18

Non-medium error count:       22
Те же 18 неисправленных ошибок, которые поправил контроллер read patrol'ом.

Вопрос, менять или ещё поживёт? Пока оставил пожить, считаю единичным сбоем.

Отправлено: 23:10, 08-09-2014 | #2444