Ситуация с RAID(5), Adaptec 5405
Сервак старый Depo Storm, материнка Supermicro, контроллер RAID Adaptec 5405 (Биос последней версии), RAID(5) из 10 x SAS Seagate 1 Tb (Проверяли, ремап недавно делали). Использовался как СХД для кластера VMware vSphere. 1 LUN на 10 Tb.
Было длительное отключение электричества, АПСы не продержались, сервак потух. При старте, во время загрузки RAID bios стал выдавать ошибку "Error controller kernel stopped running" и press any key to reboot... Ни в биос контроллера, ни в биос материнки не пускал. Почитав рекомендации адаптека в их KB (http://ask.adaptec.com/app/answers/d...ed-running%22), пришли к выводу что наш массив в "unknown array state". Запустили серв с физически отключенными хардами от контроллера. Загрузка прошла, в ACU (RAID Bios), войти получилось. Далее "нагорячую" повставляли харды в корзину, согласились с изменением конфигурации, вошли в диск утилити и сделали рескан HDD. Все харды обнаружились, засветились белым в списке. Зашли в Raid Configuration и обнаружили там наш массив в состоянии OFFLINE. Посмотрели его диски - в списке все присутствуют, все белые.После этого, в Raid Configuration нажали на массиве Force Online, и он автоматически перешел в состояние Build\Verify, и начал "верифицироваться".. Сделали все по рекомендациям Адаптек, но меня смутил этот самый Build\Verify, который, по идее, используется при создании массива с нуля :( Плюс, где-то в интернетах прочитал, что Force Online этот вообще нужно использовать как крайнюю меру для восстановления RAID, т.к. он может ушатать логическую структуру дисков :( Вопрос к тем, кто в теме: все ли сделано правильно и какова вероятность потери данных массива, учитывая, что с дисками все в порядке и данные на них мы не трогали. |
Поднялся массив, все работает... Данные целы.
В такой ситуации первым делом нужно попробовать стартануть сервак с отключенными хардами, затем, если ошибка пропала и в БИОС контроллера пускает - попробовать подключить диски, перезагрузиться. Если при загрузке массив в состоянии ONLINE или BUILD\VERIFY то норм, а если OFFLINE или FAILED, то плохо. Можно попробовать сделать Force online через ACU, главное убедиться, что со всеми HDD все в порядке, и есть бэкапы. После запуска Build/Verify, массив входит в рабочее состояние, но до завершения этого процесса его производительность будет значительно снижена. |
Время: 08:15. |
Время: 08:15.
© OSzone.net 2001-