Skip to main content

Что такое RAID? (Избыточный массив недорогих дисков)

Что такое RAID и как оно работает? (Май 2025)

Что такое RAID и как оно работает? (Май 2025)
Anonim

RAID - это решение, которое было первоначально разработано для рынка сетевых серверов как средство создания большого хранилища по более низкой цене. По сути, это потребует нескольких более дешевых жестких дисков и объединить их через контроллер, чтобы обеспечить единый привод большой емкости. Это то, что RAID означает: избыточный массив недорогих дисков или дисков. Чтобы достичь этого, для управления разделяемыми данными между различными дисками необходимы специализированное программное обеспечение и контроллеры.

В конце концов, вычислительная мощность вашей стандартной компьютерной системы позволила функциям фильтровать свой путь на рынок персональных компьютеров.

Теперь RAID-накопитель может быть основан на программном или аппаратном обеспечении и может использоваться для трех различных целей. К ним относятся пропускная способность, безопасность и производительность. Емкость является простой, которая обычно задействована почти в каждом типе используемой конфигурации RAID. Например, два жестких диска могут быть связаны друг с другом как один диск с операционной системой, что фактически делает виртуальный диск вдвое большим. Производительность - еще одна ключевая причина для использования настройки RAID на персональном компьютере. В том же примере, когда два диска используются как один диск, контроллер может разделить кусок данных на две части и затем поместить каждую из этих частей на отдельный диск. Это эффективно удваивает производительность записи или считывания данных в системе хранения. Наконец, RAID можно использовать для обеспечения безопасности данных.

Это делается путем использования некоторого пространства на дисках для по существу клонирования данных, которые записываются на оба диска. Еще раз, с двумя дисками, мы можем сделать так, чтобы данные записывались на оба диска. Таким образом, если один диск выходит из строя, у другого все еще есть данные.

В зависимости от целей массива хранения, которые вы хотите собрать для своей компьютерной системы, вы будете использовать один из различных уровней RAID для достижения этих трех целей.

Для тех, кто использует жесткие диски на своем компьютере, производительность, вероятно, будет скорее проблемой, чем пропускной способностью. С другой стороны, те, кто использует твердотельные диски, вероятно, захотят использовать меньшие диски и связать их вместе, чтобы создать один большой диск. Итак, давайте рассмотрим различные уровни RAID, которые можно использовать с персональным компьютером.

RAID 0

Это самый низкий уровень RAID и на самом деле не предлагает какой-либо формы избыточности, поэтому он относится к уровню 0. По сути, RAID 0 принимает два или более накопителей и объединяет их для создания накопителя большей емкости. Это достигается с помощью процессора, называемого чередованием. Блоки данных разбиваются на куски данных, а затем записываются в порядке по всем дискам. Это обеспечивает повышенную производительность, поскольку данные могут быть записаны одновременно на приводы контроллером, эффективно увеличивая скорость приводов. Ниже приведен пример того, как это может работать на трех дисках:

Привод 1Привод 2Привод 3
Блок 1123
Блок 2456
Блок 3789

Чтобы RAID 0 работал эффективно для повышения производительности системы, вам нужно попробовать и иметь соответствующие диски. Каждый накопитель должен иметь одинаковые возможности хранения и характеристики.

Если они этого не сделают, то емкость будет ограничена кратным наименьшим из дисков и производительностью до самого медленного из дисков, так как он должен ждать, пока все полосы будут записаны, прежде чем перейти к следующему набору. Можно использовать несогласованные диски, но в этом случае установка JBOD может быть более эффективной.

JBOD - это всего лишь куча дисков, и это просто набор дисков, к которым можно получить доступ независимо друг от друга, но они отображаются как один накопитель для операционной системы. Обычно это достигается за счет наличия диапазона данных между приводами. Часто это называется SPAN или BIG.

Фактически, работа видит их всех как один диск, но блоки будут записываться через первый диск до тех пор, пока он не заполнится, а затем перейдет ко второму, затем к третьему и т. Д. Это полезно для добавления дополнительной емкости в существующую компьютерную систему и с дисками разных размеров, но это не увеличит производительность массива накопителей.

Самая большая проблема с настройками RAID 0 и JBOD - это защита данных. Поскольку у вас несколько дисков, вероятность повреждения данных возрастает, потому что у вас больше точек сбоя. Если какой-либо диск в массиве RAID 0 выходит из строя, все данные становятся недоступными. В JBOD сбой диска приведет к потере любых данных, которые были на этом диске. В результате лучше использовать тех, кто хочет использовать этот метод хранения, чтобы иметь некоторые другие средства для резервного копирования своих данных.

RAID 1

Это первый истинный уровень RAID, поскольку он обеспечивает полный уровень избыточности для данных, которые хранятся в массиве. Это делается через процесс, называемый зеркалированием. Фактически все данные, которые записываются в систему, копируются на каждый диск в массиве уровня 1. Эта форма RAID обычно выполняется только с помощью пары дисков, так как добавление дополнительных дисков не добавит дополнительной емкости, а просто избыточность. Чтобы лучше привести пример этого, вот диаграмма, показывающая, как она будет записана на два диска:

Привод 1Привод 2
Блок 111
Блок 222
Блок 333

Чтобы получить наиболее эффективное использование с помощью настройки RAID 1, система снова будет использовать согласованные диски с одинаковой производительностью и производительностью.

Если используются несоответствующие диски, то емкость массива будет равна самому маленькому накопителю мощности в массиве. Например, если в массиве RAID 1 использовался один с половиной терабайт и один терабайт, емкость этого массива в системе была бы всего одним терабайтом.

Этот уровень RAID очень эффективен для обеспечения безопасности данных, поскольку два диска фактически одинаковы. Если один из двух дисков выходит из строя, то другой имеет полные данные другого. Проблема с этим типом настройки, как правило, определяет, какой из дисков не работает, потому что часто хранилище становится недоступным, когда один из двух не работает и не будет нормально восстановлен до тех пор, пока новый диск не будет вставлен вместо отказавшего и восстановление процесс выполняется. Как уже упоминалось ранее, от этого также не наблюдается повышения производительности. Фактически, из-за накладных расходов контроллера для RAID будет небольшая потеря производительности.

RAID 1 + 0 или 10

Это несколько сложная комбинация уровней RAID 0 и уровня 1. Эффективно для контроллера потребуется минимум четыре диска, чтобы работать в этом режиме, потому что он должен делать две пары дисков. Первый набор дисков - это зеркальный массив, который клонирует данные между ними. Второй набор дисков также зеркалирован, но настроен на полосу первого. Это обеспечивает как избыточность данных, так и прирост производительности. Ниже приведен пример того, как данные будут записываться на четырех дисках с использованием этого типа настройки:

Привод 1Привод 2Привод 3Привод 4
Блок 11122
Блок 23344
Блок 35566

Честно говоря, это не желательный режим RAID для работы в компьютерной системе. Хотя это и дает некоторое повышение производительности, это действительно не так хорошо из-за огромного количества накладных расходов на систему. Кроме того, это огромная трата пространства, так как массив дисков будет составлять не более половины емкости всех дисков. Если используются несоответствующие диски, производительность будет ограничена самым медленным приводом, а емкость будет вдвое меньше самого маленького диска.

RAID 5

Это самый высокий уровень RAID, который можно найти в потребительских компьютерных системах и является гораздо более эффективным методом увеличения емкости и избыточности. Это достигается благодаря процессу чередования данных с четностью. Для этого необходимо как минимум три диска, так как данные разбиваются на полосы на нескольких дисках, но затем один блок по полосе отложен для контроля четности. Чтобы лучше объяснить это, давайте сначала взглянем на то, как данные могут быть записаны на трех дисках:

Привод 1Привод 2Привод 3
Блок 112 п
Блок 23 п 4
Блок 3 п 56

По сути, контроллер накопителя берет фрагмент данных, который должен быть записан на всех дисках в массиве. Первый бит данных помещается на первый диск, а второй - на второй. Третий диск получает бит четности, который по существу представляет собой сравнение двоичных данных на первом и втором. В бинарной математике у вас всего 0 и 1. Булевский математический процесс выполняется для сравнения бит. Если они совпадают с четным числом (0 + 0 или 1 + 1), то бит четности будет равен нулю. Если два слагаются до нечетного числа (1 + 0 или 0 + 1), то бит четности будет равен одному. Причина этого в том, что если один из дисков выходит из строя, контроллер может затем выяснить, что такое недостающие данные. Например, если диск один не удается, оставив только диск два и три, а диск два имеет блок данных одного, а третий диск имеет блок четности, а недостающий блок данных на диске должен быть равен нулю.

Это обеспечивает эффективную избыточность данных, которая позволяет восстанавливать все данные в случае сбоя накопителя. Теперь для большинства пользовательских установок отказ будет по-прежнему приводить к тому, что система не будет, потому что она не находится в функциональном состоянии. Чтобы система функционировала, необходимо заменить неисправный диск новым диском. Затем процесс восстановления данных должен выполняться на уровне контроллера, который затем выполняет обратную логическую функцию для воссоздания данных на недостающем диске. Это может занять некоторое время, особенно для накопителей большой емкости, но по крайней мере восстанавливается.

Теперь емкость массива RAID 5 зависит от количества дисков в массиве и их емкости. Еще раз, массив ограничен самым маленьким диском в массиве, поэтому лучше использовать соответствующие диски. Эффективное пространство для хранения равно количеству приводов за вычетом минимальной емкости. Итак, в математическом плане это (n-1) * Capacitymin , Итак, если у вас есть три диска 2 ГБ в массиве RAID 5, общая емкость будет 4 ГБ. Еще один массив RAID 5, который использовал четыре диска емкостью 2 ГБ, имел бы емкость 6 ГБ.

Теперь производительность для RAID 5 немного сложнее, чем некоторые другие типы RAID, из-за логического процесса, который должен быть выполнен для создания бита четности, когда данные записываются на диски. Это означает, что производительность записи будет меньше, чем массив RAID 0 с таким же количеством дисков. С другой стороны, производительность чтения не страдает так же сильно, как и запись, потому что логический процесс не выполняется, потому что он считывает прямые данные с дисков.

Большая проблема со всеми настройками RAID

Мы обсудили различные плюсы и минусы каждого уровня RAID, который можно использовать на персональных компьютерах, но есть еще одна проблема, которую многие люди не понимают, когда дело доходит до создания настроек RAID-диска. Прежде чем использовать настройку RAID, сначала необходимо создать либо программное обеспечение аппаратного контроллера, либо программное обеспечение операционной системы. Это по существу инициализирует специальное форматирование, необходимое для правильного отслеживания того, как данные будут записаны и прочитаны на диске.

Вероятно, это не похоже на проблему, но если вам даже нужно изменить настройки вашего массива RAID. Например, скажем, что у вас мало данных и вы хотите добавить дополнительный диск для массива RAID 0 или RAID 5. В большинстве случаев вы не сможете без переконфигурации массива RAID, который также удалит любые данные, хранящиеся на этих дисках.Это означает, что вам необходимо полностью выполнить резервное копирование данных, добавить новый диск, перенастроить массив накопителей, форматировать этот массив накопителей и затем восстановить исходные данные на диск. Это может быть очень болезненный процесс. В результате убедитесь, что у вас действительно есть настройка массива так, как вы хотите в первый раз, когда вы это сделаете.