|
Компьютерный форум OSzone.net » Железо » Накопители (SSD, HDD, USB Flash) » HDD - Все о SMART - расшифровка параметров, утилиты. |
|
HDD - Все о SMART - расшифровка параметров, утилиты.
|
Ушел из жизни Сообщения: 26925 |
Что такое S.M.A.R.T.
Как читать вывод показателей SMART Работа с показаниями Smartudm При чтении S.M.A.R.T. программа строит таблицу такого типа: Attribute * Spin Up Time ID 3 Threshold 63 Value 236 Worst 235 Raw 000000001199h Type PR SP Attribute - имя атрибута; ID - номер атрибута; Value - значение атрибута (выше лучше); Threshold - пороговое значения атрибута (если значение меньше чем Threshold, готовьтесь к неприятностям); Worst - самое низкое значение атрибута за все время тестирования; Raw - текущее значение атрибута в 16-ричном значении (меньше лучше); Type - тип атрибута (PR - Performance-related, ER - Error rate, EC - Events count, SP - Self-preserve). Значения параметров SMART Raw Read Error Rate - Частота появления ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине аппаратной части накопителя. Spin Up Time - Время раскрутки шпинделя. Среднее время раскрутки шпинделя диска от 0 RPM до рабочей скорости. Предположительно, в поле raw value содержится время в миллисекундах/секундах. Reallocated Sector Count - Количество переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи/верификации он пытается переместить данные из него в специальную резервную область (spare area) и, в случае успеха, помечает сектор как "переназначенный". Также, этот процесс называют remapping, а переназначенный сектор - remap. Благодаря этой возможности, на современных жестких дисках очень редко видны [при тестировании поверхности] так называемые bad block. Однако, при большом количестве ремапов, на графике чтения с поверхности будут заметны "провалы" - резкое падение скорости чтения (до 10% и более). Поле raw value содержит общее количество переназначенных секторов. Throughput Performance - Средняя производительность (пропускная способность) диска. Уменьшение значения value этого атрибута с большой вероятностью указывает на проблемы в накопителе. Start/Stop Count - Количество циклов запуск/останов шпинделя. Поле raw value хранит общее количество включений/выключений диска. Read Channel Margin - Запас канала чтения. Назначение этого атрибута не документировано и в современных накопителях не используется. Seek Error Rate - Частота появления ошибок позиционирования БМГ. В случае сбоя в механической системе позиционирования, повреждения сервометок (servo), сильного термического расширения дисков и т.п. возникают ошибки позиционирования. Чем их больше, тем хуже механики и/или поверхности жесткого диска. Seek Time Performance - Средняя производительность операций позиционирования БМГ. Данный параметр показывает среднюю скорость позиционирования привода БМГ на указанный сектор. Снижение значения этого атрибута говорит о неполадках в механике привода. Power-On Hours - Количество отработанных часов во включенном состоянии. Поле raw value этого атрибута показывает количество часов (минут, секунд - в зависимости от производителя), отработанных жестким диском. Снижение значения (value) атрибута до критического уровня (threshold) указывает на выработку диском ресурса (MTBF - Mean Time Between Failures). На практике, даже падение этого атрибута до нулевого значения не всегда указывает на реальное исчерпывание ресурса и накопитель может продолжать нормально функционировать. Spin Retry Count - Количество повторов попыток старта шпинделя диска. Данный атрибут фиксирует общее количество попыток раскрутки шпинделя и его выхода на рабочую скорость, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода. Recalibration Retries - Количество повторов попыток рекалибровки накопителя. Данный атрибут фиксирует общее количество попыток сброса состояния накопителя и установки головок на нулевую дорожку, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода. Device Power Cycle Count - Количество полных циклов запуска/останова жесткого диска. Soft Read Error Rate - Частота появления "программных" ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине программного обеспечения, а не аппаратной части накопителя. End-to-End error - Данный атрибут-часть технологии HP SMART IV, это означает, что после передачи через кэш памяти буфера данных паритет данных между хостом и жестким диском не совпадают. Reported UNC Errors - Ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами. Load/Unload cycle count - Количество циклов вывода БМГ в специальную парковочную зону/в рабочее положение. Подробнее - см. описание технологии Head Load/Unload Technology. Drive Temperature - Температура. Данный параметр отражает в поле raw value показание встроенного температурного сенсора в градусах Цельсия. Reallocation Event Count - Количество операций переназначения (ремаппинга). Поле raw value этого атрибута показывает общее количество попыток переназначения сбойных секторов в резервную область, предпринятых накопителем. При этом, учитываются как успешные, так и неудачные операции. Current Pending Sector Count - Текущее количество нестабильных секторов. Поле raw value этого атрибута показывает общее количество секторов, которые накопитель в данный момент считает претендентами на переназначение в резервную область (remap). Если в дальнейшем какой-то из этих секторов будет прочитан успешно, то он исключается из списка претендентов. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить данные и перенести их в резервную область, а сам сектор пометить как переназначенный (remapped). Постоянно ненулевое значение raw value этого атрибута говорит о низком качестве (отдельной зоны) поверхности диска. Uncorrectable Sector Count - Количество нескорректированных ошибок. Атрибут показывает общее количество ошибок, возникших при чтении/записи сектора и которые не удалось скорректировать. Рост значения в поле raw value этого атрибута указывает на явные дефекты поверхности и/или проблемы в работе механики накопителя. UltraDMA CRC Error Count - Общее количество ошибок CRC в режиме UltraDMA. Поле raw value содержит количество ошибок, возникших в режиме передачи данных UltraDMA в контрольной сумме (ICRC - Interface CRC). Примечание автора. Практика, собранная статистика и изучение журналов ошибок SMART показывают: в большинстве случаев ошибки CRC возникают при сильном завышении частоты PCI (больше номинальных 33.6 MHz), сильно перекрученом кабеле, а также - по вине драйверов ОС, которые не соблюдают требований к передачи/приему данных в режимах UltraDMA. Write Error Rate (Multi Zone Error Rate)- Частота появления ошибок при записи данных. Показывает общее количество ошибок, обнаруженных во время записи сектора. Чем больше значение в поле raw value (и ниже значение value), тем хуже состояние поверхности диска и/или механики привода. Disk Shift - Сдвиг пакета дисков относительно оси шпинделя. Актуальное значение атрибута содержится в поле raw value. Единицы измерения - не известны. Подробности - см. в описании технологии G-Force Protection. Примечание. Сдвиг пакета дисков возможен в результате сильной ударной нагрузки на накопитель в результате его падения или по иным причинам. G-Sense Error Rate - Частота появления ошибок в результате ударных нагрузок. Данный атрибут хранит показания ударочувствительного сенсора - общее количество ошибок, возникших в результате полученных накопителем внешних ударных нагрузок (при падении, неправильной установки, и т.п.). Подробнее - см. описание технологии G-Force Protection. Loaded Hours - Нагрузка на привод БМГ, вызванная общей наработкой часов накопителем. Учитывается только период, в течении которого головки находились в рабочем положении. Load/Unload Retry Count - Нагрузка на привод БМГ, вызванная многочисленными повторениями операций чтения, записи, позиционирования головок и т.п. Учитывается только период, в течении которого головки находились в рабочем положении. Load Friction - Нагрузка на привод БМГ, вызванная трением в механических частях накопителя. Учитывается только период, в течении которого головки находились в рабочем положении. Load/Unload Cycle Count - Общее количество циклов нагрузки на привод БМГ. Учитывается только период, в течении которого головки находились в рабочем положении. Load-in Time - Общее время нагрузки на привод БМГ. Предположительно, данный атрибут показывает общее время работы накопителя под нагрузкой, при условии, что головки находятся в рабочем состоянии (вне парковочной зоны). Torque Amplification Count - Количество усилий вращающего момента привода. Power-Off Retract Count - Количество зафиксированных повторов в(ы)ключения питания накопителя. GMR Head Amplitude - Амплитуда дрожания GMR-головок (GMR-Head) в рабочем состоянии. Программы для чтения SMART SpeedFan SMARTUDM - HDD S.M.A.R.T. Viewer MHDD Виктория К посту прикреплен официальный список значений атрибутов (eng) |
|
Отправлено: 11:39, 21-04-2007 |
Специалист Сообщения: 4186
|
Профиль | Сайт | Отправить PM | Цитировать Цитата Kluchnik_serg:
Увеличение значений RAW в 05, 196-198 атрибутах говорят об ухудшении физического состояния поверхностей HDD. Цитата Kluchnik_serg:
Цитата Kluchnik_serg:
Цитата Kluchnik_serg:
|
||||
------- Отправлено: 23:54, 26-03-2015 | #2601 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
- - - Сообщения: 12195
|
Профиль | Отправить PM | Цитировать Цитата Kluchnik_serg:
|
|
Отправлено: 00:24, 27-03-2015 | #2602 |
Специалист Сообщения: 4186
|
Профиль | Сайт | Отправить PM | Цитировать Цитата Normal:
![]() Или периодически снимать скриншоты с винта и сравнивать ? (Сомневаюсь что кто-то так и поступает). ![]() Реально же юзеры обращают внимание/узнают про СМАРТ лишь заметив-ощутив проблемы с накопителем. Но чаще всего - приходиться винт отнесть в гарантию, или бывает поздно уже и винт приходиться ремонтить (если нет гарантии как таковой) и ремонт вообще возможен. |
|
------- Последний раз редактировалось misha2, 27-03-2015 в 01:44. Отправлено: 01:39, 27-03-2015 | #2603 |
- - - Сообщения: 12195
|
Профиль | Отправить PM | Цитировать Цитата misha2:
|
|
Отправлено: 01:48, 27-03-2015 | #2604 |
Специалист Сообщения: 4186
|
Профиль | Сайт | Отправить PM | Цитировать Цитата Normal:
![]() Никогда не думал что время проведённое головами в распарковке - имеет какое-то реальное значение для юзера. ![]() Важнее ж аттрибуты дефектоскопий. Не правда ли ? Юзеров интересуют появления бэдов, а не амплитуды БМГ ж. |
|
------- Отправлено: 02:00, 27-03-2015 | #2605 |
- - - Сообщения: 12195
|
Профиль | Отправить PM | Цитировать |
Последний раз редактировалось Normal, 27-03-2015 в 02:13. Отправлено: 02:06, 27-03-2015 | #2606 |
Новый участник Сообщения: 3
|
Профиль | Отправить PM | Цитировать Цитата misha2:
Приведу в пример свою ситуацию. Мне необходимо не свой ПК мониторить, а организацию в 20шт кампов Linux+win. Zabbix состоит из агента (клиента) и сервера. Сервер подает запрос на каждого клиента по каждой переменной в назначенный промежуток времени. Так как СМАРТ из коробки он читать не умеет, делаем костыль в конфиге клиента: UserParameter=uHDD.health.[*], for /F "tokens=6" %a in ('c:\ZABBIX\smartmontools\smartctl.exe -H $1 ^| find "test result"') do @echo %a uHDD.health.[*] - это переменная, которую клиент вернет серверу. for /F "tokens=6" %a in ('c:\ZABBIX\smartmontools\smartctl.exe -H $1 ^| find "test result"') do @echo %a - команда, которая выполнится на стороне клиента, для получения переменной. Если винт первый, то вместо * и $1 будет /dev/sda/, если второй, то /dev/sdb и т.д. На сервере мы получаем значение "PASSED". Создаем тригер и сервер автоматом проверяет совпадает ли новое значение переменной со старым т.е. с PASSED. Если да, то все нормально, если нет, то можно назначить отправку почты с информацией о ПК о проблеме и СМС. Аналогично, при помощи командных файлов на стороне клиента, можно получать значения критических параметров SMART из вывода OpenHardwareMonitir и сервер будет следить за их изменением. А если что случается, то маяковать СМСками и на почту. Вопрос был в том, за какими значениями следить, за Value или за Raw. Ответ получил, всем спасибо. От использования CrystalDiskInfo и программ подобного класса для постоянного мониторинга и отправки уведомлений отказались в пользу zabbix, ибо он умеет много чего, температуру отслеживать, состоянии памяти, нагрузка на процессор, свободное место на разделах и пр. Если уже zabbix отмаякует, если что-то не так, то тогда уже по месту буду использовать CrystalDiskInfo, HDDScan или Викторию. |
|
Последний раз редактировалось Kluchnik_serg, 27-03-2015 в 10:48. Отправлено: 09:41, 27-03-2015 | #2607 |
Новый участник Сообщения: 6
|
Профиль | Сайт | Отправить PM | Цитировать Люди добрые подскажите, с таким SMART все HDD не жилец?
SMART
ST2000DL003-9VT166 5YD85FYM ------------------------------------------------------------------------- ID Name Value Worst Tresh Raw Health ------------------------------------------------------------------------- 1 Raw read error rate 88 72 6 45200494 •••• 3 Spin-up time 93 92 0 0 •••• 4 Number of spin-up times 100 100 20 488 ••••• 5 Reallocated sector count 52 52 36 31848 •• 7 Seek error rate 64 60 30 391069847082 ••• 9 Power-on time 72 72 0 24843 ••• 10 Spin-up retries 100 100 97 0 ••••• 12 Start/stop count 100 100 20 148 ••••• 183 unknown attribut 100 100 0 0 ••••• 184 End-to-End error 100 100 99 0 ••••• 187 Reported UNC error 1 1 0 28796 • 188 Command timeout 94 87 0 120260920821 •••• 189 High Fly writes 95 95 0 5 •••• 190 Airflow temperature 67 45 45 33°C/91°F •••• 191 G-SENSOR shock counter 100 100 0 0 ••••• 192 Power-off retract count 100 100 0 463 ••••• 193 Load/unload cycle count 100 100 0 488 ••••• 194 HDA Temperature 33 55 0 33°C/91°F •••• 194 Minimum temperature 90 55 0 6°C/42°F - 195 Hardware ECC recovered 37 12 0 45200494 • 197 Current pending sectors 1 1 0 32604 • 198 Offline scan UNC sectors 1 1 0 32604 • 199 Ultra DMA CRC errors 200 200 0 0 ••••• 240 Head flying hours 100 253 0 97938139275526 ••••• 241 unknown attribut 100 253 0 662539662 ••••• 242 unknown attribut 100 253 0 3874042289 ••••• |
Отправлено: 07:35, 01-04-2015 | #2608 |
Специалист Сообщения: 4186
|
Профиль | Сайт | Отправить PM | Цитировать Цитата Normal:
Но это ж лично для вас не даёт никакой гарантии что этих переназначений не было. Винт попросту не обязан сообщать все свои действия СМАРТу и ес-нно сам СМАРТ не может отображать все внутренние действия винта. Полно винтов/моделей где смотришь в СМАРТ и видишь аттр. 05, 196-198 по нулям. Смотришь сами листы дефектов например в РС3000, а записи оказыввается ведь есть там. Значит СМАРТ их не учёл/не вывел в отчёт. Видимо отображение записей начинается с некоего порога, а это уже вопрос к технологиям СМАРТа и фирмварям винтов. Полно встречается винтов с идеальным СМАРТом где всё по нулям, а поверхность разношена в хлам так, что удивляешься - а хде ж тот хвалёный СМАРТ, почему он не замечает очевидного. Так всё дело в фирмвари винта ж, как она обрабатывает и отрабатывает ошибки и записи логгирует и выводит в отчёт. А сам СМАРТ лишь отображение логов винта. И если винт ничего не делал по части дефектоскопий - то и в СМАРТе будет всё чисто и красиво, причём при ужасной поверхности дисков. Цитата blacking84@vk:
Обрушившиеся 197, 198 аттрибуты до упора ж. По всем показателям винт - в мусор, однозначно. Цитата Kluchnik_serg:
И наверно проще следить не за конкретными аттрибутами, а за статусом СМАРТа (Good-Bad). Потому что именно за аттрибутами не уследишь, у разных винтов с разными варями аттрибуты могут отображать совершенно разные цифры, а уж состояние их может и должно сильно различаться ж. Следить за аттрибутами можно лишь по состоянию - падение до упора (1), а не по количественой составляющей. Думаю что рассуждать стоит более проще, задав вопрос самому юзеру - "что его больше устроит" ? - 1. Падение аттрибутов до 1 и сообщение о полной невозможности работы винта. 2. Или же предупреждение о появившихся проблемах у винта (аттр. 05, 196-198). Но о состоянии, когда бэкап инфы и несложный ремонт винта ещё возможен. Т.е. речь о своевременном предупреждении или о критичности состояния, когда вообще уже ничего сделать нельзя (в т.ч. и инфу спасти). |
|||
------- Последний раз редактировалось misha2, 01-04-2015 в 09:08. Отправлено: 08:35, 01-04-2015 | #2609 |
Новый участник Сообщения: 6
|
Профиль | Сайт | Отправить PM | Цитировать |
Отправлено: 09:28, 01-04-2015 | #2610 |
![]() |
Участник сейчас на форуме |
![]() |
Участник вне форума |
![]() |
Автор темы |
![]() |
Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
Расшифровка папки администратора | sergant138 | Хочу все знать | 1 | 19-02-2009 13:07 | |
HDD - Стал меняться один из параметров SMART | Ser6720 | Накопители (SSD, HDD, USB Flash) | 8 | 20-01-2009 00:28 | |
Расшифровка | clop1000 | Хочу все знать | 4 | 27-11-2008 09:38 | |
S.m.a.r.t. расшифровка параметров | fooms | Хочу все знать | 12 | 27-02-2006 23:34 | |
Расшифровка названий | nikich555 | Хочу все знать | 25 | 27-12-2002 14:47 |
|