Цитата Cereal Keeler:
Вообще по идее при сбоях контроллер должен перевести накопитель в режим только для чтения, как раз на случай, если данные нужно с него восстановить, но то зависит от контроллера и его прошивки, в которых бывают ошибки. Не было б ошибок, не было б и катастрофических сбоев – ни разу не видел SSD, который бы умер от износа, все пациенты откисали из-за глюков. »
|
а это правда что сбои на ssd чаще всего "виновата служебная область"? либо сама прошивка контролера слетает
цитата
Скрытый текст
Почему SSD выходят из строя, если в SMART всё хорошо
Казалось бы, даже 20-30 циклов перезаписи – вполне приличная цифра, а уж 1000-1500 – и вовсе величина, для обычного пользователя запредельная. Если умножить на ёмкость накопителя в 512 ГБ, на него нужно записать 10-15 ТБ до того, как начнётся хоть сколько-нибудь заметная деградация ячеек. Если же брать цифру производителя, то данные и вовсе можно писать сплошным потоком в течение многих лет. Однако даже с учетом использования специальных алгоритмов «равномерности записи», проблемы наступают гораздо раньше.
Узким местом каждого накопителя является так называемая служебная область. Служебная область – это ограниченная фиксированная область, выделенная для хранения прошивки (управляющей микропрограммы) и служебных структур. Эта область постоянна и имеет ёмкость порядка 4-12 Гбайт. В ней хранятся все служебные структуры — модули (таблицы переназначенных блоков, части микрокода, отвечающие за хранение пароля, атрибуты SMART и т.д.)
Проблема же в том, что каждый раз при записи информации в доступной пользователю части накопителя меняются и служебные структуры, отвечающие за информирование контроллера о переводе физических блоков в логические. В зависимости от характера использования накопителя (запись последовательности данных большим куском или множества мелких операций записи) нагрузка на служебную зону, находящуюся по фиксированному адресу, может существенно вырасти. Для служебной зоны не работают алгоритмы равномерности записи (wear levelling); она не может быть переадресована при износе ячеек.
В результате в определённых сценариях использования (к примеру, SSD используется для активной работы базы данных с огромным числом транзакций, которые изменяют буквально несколько байт данных – но перезаписывают всё равно целый блок) уже через несколько месяцев (а не лет!) современные SSD начинают приходить в негодность. Закончиться всё может печально: совершенно неожиданно, при отличных показателях диагностики SMART и параметре износа порядка единиц процентов («оставшийся ресурс: 99%») SSD может просто пропасть из системы. Связано это с тем, что количество неисправных ячеек в служебной области увеличивается настолько, то коды ЕСС коррекции контроллера уже не могут их скорректировать, и SSD прекращает определяться в BIOS или показывать полную емкость.
Происходит следующий циклический процесс. Контроллер подгружает микропрограмму с NAND микросхем; микропрограмма содержит критическое количество ошибок; контроллер получает ошибку о невозможности считать микропрограмму; контроллер пробует прочитать ее снова и подгрузить в ОЗУ; снова получает ошибку; и так до бесконечности.
Как правило, наиболее частой неисправностью является выход из строя самого важного модуля – «транслятора», который транслирует адреса физических блоков в логические. С точки зрения пользователя это может выглядеть как катастрофическое падение определяемой ёмкости накопителя – к примеру, видны 2 МБ или 980 МБ вместо полноценных 512 ГБ.