Диски выходят из строя. Это не предположение — это статистика. Среднее время наработки на отказ у серверных жёстких дисков составляет 1–2 миллиона часов, но это усреднённая цифра по всему парку. На практике отказы распределены неравномерно: новые диски чаще ломаются в первые месяцы работы, затем наступает стабильный период, а после трёх-пяти лет вероятность отказа снова растёт. Если на сервере хранятся важные данные и нет защиты от отказа диска — это не вопрос «если», а вопрос «когда».
Аппаратный RAID-контроллер на каждом выделенном сервере THE.Hosting — это первый уровень защиты данных, встроенный прямо в железо. Семь локаций: Финляндия, Франция, Германия, Молдова, Нидерланды, США, Великобритания. Каждый сервер в каждой локации приходит с контроллером в стандартной комплектации.
Что такое RAID и зачем он нужен
RAID — избыточный массив независимых дисков. Технология объединяет несколько физических дисков в один логический том с определённой схемой хранения данных. В зависимости от выбранного уровня RAID обеспечивает защиту от отказа одного или нескольких дисков, ускорение операций чтения и записи, либо и то и другое одновременно.
Ключевое слово здесь — избыточность. Данные хранятся на нескольких дисках таким образом, что потеря одного (или в некоторых конфигурациях нескольких) физического носителя не приводит к потере данных. Массив остаётся работоспособным, операционная система продолжает работу, администратор получает уведомление и заменяет вышедший из строя диск.
Аппаратный RAID против программного: в чём разница
Существует два принципиально разных способа реализации RAID. Программный RAID — это когда массивом управляет операционная система, тратя ресурсы центрального процессора на расчёт чётности и управление операциями ввода-вывода. Аппаратный RAID — когда всю эту работу выполняет выделенный контроллер с собственным процессором и кэш-памятью.
Разница проявляется в нескольких аспектах. Первый — производительность. Аппаратный контроллер не нагружает центральный процессор сервера операциями с дисками. Расчёт чётности для RAID 5 или RAID 6 — вычислительно затратная операция, и при высокой интенсивности записи на программном RAID это ощущается. Аппаратный контроллер обрабатывает всё это самостоятельно.
Второй аспект — кэш с резервным питанием. Качественные аппаратные контроллеры оснащены собственной кэш-памятью с батарейной защитой или суперконденсатором. Это позволяет контроллеру подтверждать операции записи до того, как данные физически записаны на диск, что значительно ускоряет запись. При внезапном отключении питания кэш сохраняет содержимое и завершает операции после восстановления питания. Без этой защиты подтверждённые, но незаписанные данные теряются.
Третий аспект — независимость от операционной системы. Аппаратный контроллер управляет массивом на уровне ниже операционной системы. Это означает что переустановка ОС, смена дистрибутива, сбой на уровне операционной системы не затрагивают целостность массива. RAID остаётся стабильным вне зависимости от того, что происходит на уровне программного обеспечения.
Уровни RAID: что выбрать для выделенного сервера
RAID 1 — зеркалирование. Два диска содержат идентичные копии данных. При отказе одного второй продолжает работу без каких-либо перебоев. Скорость чтения выше чем у одиночного диска, скорость записи сопоставима. Полезная ёмкость — 50% от суммарного объёма дисков. Простейший и наиболее надёжный вариант для хранения критичных данных.
RAID 5 — распределённая чётность. Минимум три диска, данные и контрольная сумма распределены по всем дискам массива. Выдерживает отказ одного диска. Полезная ёмкость — объём всех дисков минус один. Хороший баланс между надёжностью, производительностью и эффективным использованием места. Широко используется для серверов баз данных и файловых хранилищ.
RAID 6 — двойная чётность. Схож с RAID 5, но выдерживает одновременный отказ двух дисков. Минимум четыре диска. Полезная ёмкость — объём всех дисков минус два. Выбор для критичных систем, где даже при замене отказавшего диска массив должен оставаться защищённым.
RAID 10 — зеркалирование плюс чередование. Минимум четыре диска, данные зеркалируются попарно и распределяются между парами. Высочайшая производительность и надёжность, но полезная ёмкость составляет лишь 50%. Оптимальный выбор для баз данных с высокой нагрузкой на запись, где важны и скорость, и защита данных.
Восстановление массива после отказа диска
Когда диск в массиве выходит из строя, аппаратный контроллер переводит массив в деградированный режим. Данные по-прежнему доступны — для RAID 1, RAID 5 или RAID 10 потеря одного диска не прерывает работу. Контроллер фиксирует событие в журнале, операционная система получает уведомление.
После замены диска начинается процесс перестройки массива. Контроллер восстанавливает данные на новом диске из существующих дисков и контрольных сумм. Время перестройки зависит от объёма дисков и нагрузки на массив во время восстановления — на современных дисках это занимает от нескольких часов до суток.
Важный момент: перестройка массива это период повышенного риска. Если в это время откажет ещё один диск — для RAID 5 это означает потерю данных. Именно поэтому для критичных систем рекомендуется RAID 6 или RAID 10, которые выдерживают двойной отказ.
Мониторинг состояния RAID
Аппаратный RAID-контроллер предоставляет инструменты для мониторинга состояния массива и каждого диска в отдельности. Большинство производителей контроллеров — LSI, Adaptec, HP SmartArray — выпускают утилиты командной строки и агенты для систем мониторинга.
Настройте уведомления о состоянии массива в первый день после получения сервера. Своевременное оповещение об отказе диска даёт время на замену до того, как ситуация станет критичной. RAID защищает от потери данных при отказе диска, но только если администратор знает об этом отказе и вовремя заменяет диск.
RAID — это не резервное копирование
Это разграничение необходимо повторить явно, потому что его часто путают. RAID защищает от аппаратного отказа диска. Он не защищает от случайного удаления файлов, от атаки с шифрованием данных, от программных ошибок, от пожара или затопления в дата-центре.
Аппаратный RAID-контроллер — первый уровень защиты. Регулярные резервные копии на внешнее хранилище — второй и обязательный уровень. Эти два механизма дополняют, а не заменяют друг друга.
Выбрать выделенный сервер с аппаратным RAID
Часто задаваемые вопросы
Какой уровень RAID установлен по умолчанию на серверах THE.Hosting? Уровень RAID настраивается при заказе сервера в зависимости от количества и типа дисков в конфигурации. Уточняйте при оформлении заказа — специалисты помогут выбрать оптимальный вариант под вашу задачу.
Можно ли изменить уровень RAID после запуска сервера? Изменение уровня RAID требует перенастройки массива, что обычно означает полное пересоздание с потерей данных. Планируйте конфигурацию RAID на этапе заказа. Переход между уровнями на работающем сервере возможен только с предварительным резервным копированием всех данных.
Влияет ли RAID на скорость работы сервера? Аппаратный RAID с кэш-памятью с резервным питанием на практике ускоряет операции записи по сравнению с одиночным диском без RAID. Чтение при RAID 1 и RAID 10 быстрее одиночного диска за счёт параллельного чтения с нескольких зеркальных дисков.
Что происходит с данными при отказе контроллера RAID? Данные остаются на дисках, но без контроллера недоступны в обычном режиме. При замене контроллера на идентичную модель массив восстанавливается автоматически. Это одна из причин документировать конфигурацию массива — модель контроллера, тип и уровень RAID.
Заменяет ли RAID резервное копирование? Нет. RAID защищает от физического отказа диска, но не от удаления данных, атак с шифрованием, программных ошибок или физических катастроф с оборудованием. Резервные копии на внешнем хранилище обязательны вне зависимости от конфигурации RAID.