ЭТО RAID

Когда мы гово­ри­ли о резерв­ном копи­ро­ва­нии, то упо­ми­на­ли про RAID — тех­но­ло­гию хра­не­ния дан­ных, кото­рая защи­ща­ет их от пор­чи или поте­ри. Теперь раз­бе­рём подробнее.

Что такое RAID

RAID — это тех­но­ло­гия, с помо­щью кото­рой может быть орга­ни­зо­ва­но хра­не­ние дан­ных на жёст­ких дис­ках. По-простому — это инструк­ция, как хра­нить и читать ваши фай­лы на дисках.

Рас­шиф­ро­вы­ва­ет­ся так: Redundant Array of Independent Disks, по-русски — мас­сив неза­ви­си­мых дис­ков с избы­точ­но­стью. Избы­точ­ность — клю­че­вое слово.

Чаще все­го эту тех­но­ло­гию при­ме­ня­ют к несколь­ким дис­кам на одном устрой­стве. Напри­мер, у вас может быть сете­вое хра­ни­ли­ще, в кото­рое будут встав­ле­ны четы­ре дис­ка. Эти четы­ре дис­ка соби­ра­ют­ся в RAID-массив и после неко­то­рой ком­пью­тер­ной магии они ста­но­вят­ся более безопасными.

👉 Суть без­опас­но­сти RAID в том, что­бы при полом­ке одно­го из дис­ков дан­ные в целом не постра­да­ли. По край­ней мере, что­бы их мож­но было восстановить.

Как данные не пострадают

На прак­ти­ке это выгля­дит так:

  1. Вы созда­ё­те RAID-массив (напри­мер, в сете­вом хра­ни­ли­ще, но мож­но и внут­ри компьютера)
  2. Про­хо­дит 5 лет, вы спо­кой­но поль­зу­е­тесь мас­си­вом, пише­те на него фай­лы, чита­е­те, всё как всегда.
  3. Вдруг один из дис­ков выхо­дит из строя. Так быва­ет, пото­му что дис­ки хруп­кие и недолговечные.
  4. RAID-массив орёт бла­гим матом и про­сит вста­вить вме­сто сло­мав­ше­го­ся какой-нибудь све­жий диск.
  5. Вы извле­ка­е­те повре­ждён­ный диск, на его место ста­ви­те свежий.
  6. RAID-массив шур­шит внут­ри себя и вол­шеб­ным обра­зом вос­ста­нав­ли­ва­ет все дан­ные, кото­рые были утра­че­ны из-за полом­ки одно­го из дисков.
  7. Через час-другой у вас сно­ва пол­но­стью рабо­то­спо­соб­ный мас­сив, где все дис­ки живы и здоровы.
  8. Когда через пол­го­да посы­пет­ся дру­гой диск, вы сно­ва встав­ля­е­те в мас­сив све­жий диск на его место, и RAID вос­ста­нав­ли­ва­ет утра­чен­ные дан­ные. Мож­но ска­зать, что ваша фай­ло­вая систе­ма реге­не­ри­ру­ет в слу­чае аварии.

За счёт чего

Основ­ной сек­рет — в избы­точ­но­сти хра­не­ния. Это зна­чит, что RAID-массив хра­нит боль­ше дан­ных, чем отправ­ля­ет туда пользователь.

Напри­мер, вы отпра­ви­ли один файл раз­ме­ром 1 ГБ, но RAID хра­нит этот гига­байт немно­го избы­точ­но, делая несколь­ко фраг­мен­тар­ных копий это­го фай­ла по дру­гим дис­кам. Как бы «раз­ма­зы­ва­ет» данные.

В ито­ге файл может зани­мать не 1 ГБ, а 1,2 ГБ. Вот эти 0,2 ГБ — это та самая избы­точ­ность, бла­го­да­ря кото­рой в слу­чае полом­ки мож­но будет вос­ста­но­вить ваши дан­ные. Чис­ло 0,2 услов­ное — зави­сит от кон­фи­гу­ра­ции массива.

Как организованы RAID-массивы

Мы рас­ска­жем об основ­ных схе­мах, кото­рые луч­ше все­го под­хо­дят для нас с вами, и пока­жем, как имен­но они устро­е­ны, что­бы вы смог­ли выбрать для себя луч­ший вариант.

Важ­ный момент: луч­ше все­го исполь­зо­вать дис­ки, оди­на­ко­вые по всем харак­те­ри­сти­кам. Иде­аль­но, если мас­сив будет состо­ять из дис­ков одной и той же моде­ли — так не будет про­блем с вос­ста­нов­ле­ни­ем данных.

Для нача­ла про­стой при­мер: когда RAID нет: ×


Цвет­ные линии — это фай­лы на жёст­ком дис­ке. Сей­час все дан­ные хра­нят­ся на одном диске. 

Если сло­ма­ет­ся жёст­кий диск — все фай­лы пропадут. 

RAID0 — объём, скорость, но никакой надёжности

Несмот­ря на сло­во RAID в назва­нии, в нём нет избы­точ­но­сти дан­ных, и если сло­ма­ет­ся один из дис­ков, вы поте­ря­е­те все свои фай­лы. Всё дело в том, что дан­ные в RAID0 никак не резер­ви­ру­ют­ся, а про­сто по оче­ре­ди пишут­ся на два раз­ных диска.

Допу­стим, что у нас есть три фай­ла — обо­зна­чим их крас­ным, синим и зелё­ным. Тогда RAID0 запи­шет их себе в память так:


Каж­дый файл раз­би­ва­ет­ся на кусоч­ки и раз­ма­зы­ва­ет­ся по дискам. 

В резуль­та­те поль­зо­ва­тель полу­ча­ет боль­шой объ­ём хра­ни­ли­ща — в сум­ме как два дис­ка. Но это не даёт ника­кой надёж­но­сти. Вид­но, что три фай­ла про­сто раз­ма­за­лись по дис­кам и раз­ные части фай­лов лежат на раз­ных дис­ках. Оче­вид­но, что если один их них сло­ма­ет­ся, то у нас оста­нет­ся диск с кучей фраг­мен­тов дан­ных, кото­рые невоз­мож­но восстановить:

Един­ствен­ное, из-за чего это исполь­зу­ют, — ско­рость рабо­ты с дан­ны­ми. Файл делит­ся на несколь­ко частей и пишет­ся одно­вре­мен­но на раз­ные дис­ки — так полу­ча­ет­ся быст­рее, чем писать его цели­ком на один диск.

+ быст­рая ско­рость рабо­ты с файлами 

+ боль­шой объ­ём хранилища 

- ника­кой надёж­но­сти, малей­шая полом­ка — и вы теря­е­те все данные.

RAID1 — высокая надёжность ценой снижения объёма

В отли­чие от преды­ду­ще­го мас­си­ва, RAID1 прост и надё­жен как ска­ла. Пра­ви­ло про­стое — каж­дый файл запи­сы­ва­ет­ся одно­вре­мен­но на оба дис­ка, в ито­ге у вас полу­ча­ют­ся два оди­на­ко­вых дис­ка, каж­дый из кото­рых хра­нит все ваши дан­ные. Если один сло­ма­ет­ся, то всё оста­нет­ся на вто­ром. Из-за того что дан­ные оди­на­ко­вые, такой метод ещё назы­ва­ют зеркалированием.


Оба дис­ка содер­жат одну и ту же информацию. 

При полом­ке одно­го дис­ка все дан­ные мож­но сра­зу взять со второго. 

Но у это­го под­хо­да есть минус — если у вас два дис­ка по 10 тера­байт, то с RAID1 вы полу­чи­те не 20, а 10 тера­байт из-за того, что все дан­ные удва­и­ва­ют­ся. Если дис­ка не два, а три — то утраиваются.

С дру­гой сто­ро­ны, это самый про­стой спо­соб орга­ни­зо­вать без­опас­ное хра­не­ние данных.

+ надёж­но

- полез­ный объ­ём — самый малень­кий из всех RAID-массивов, вы полу­ча­е­те толь­ко один объ­ём дис­ка, а не сум­му всех вместе. 

RAID5 — большой, надёжный, но сложный

Есть ещё один спо­соб обес­пе­чить надёж­ность хра­не­ния дан­ных — запи­сы­вать куда-то допол­ни­тель­ную инфор­ма­цию о фай­ле, кото­рая помо­жет его вос­ста­но­вить. Для это­го тре­бу­ет­ся уже не 2, а 3 жёст­ких диска.

По это­му прин­ци­пу рабо­та­ет RAID5 — каж­дый файл он раз­би­ва­ет на 2 части, кото­рые запи­сы­ва­ет на раз­ные дис­ки, напри­мер, на пер­вый и вто­рой, а допол­ни­тель­ную инфор­ма­цию пишет на тре­тий диск. Для сле­ду­ю­ще­го фай­ла он дела­ет точ­но так же, толь­ко сам файл пишет на вто­рой и тре­тий диск, а допол­ни­тель­ные дан­ные — на пер­вый и так далее для каж­до­го файла.


Пре­ры­ви­стая линия — это допол­ни­тель­ные дан­ные для каж­до­го файла. 

Когда один из дис­ков вый­дет из строя, то все фай­лы мож­но вос­ста­но­вить из двух остав­ших­ся по спе­ци­аль­но­му алго­рит­му. Полу­ча­ет­ся, что если у вас есть три дис­ка по 1 тера­бай­ту, то с RAID5 вы полу­чи­те 2 тера­бай­та для хра­не­ния дан­ных, а 1 тера­байт будет исполь­зо­ван систе­мой для дан­ных восстановления.


Два из трёх — доста­точ­но для вос­ста­нов­ле­ния дан­ных в RAID5. 

+ боль­ше места, чем в RAID1 

+ надёж­но

- дан­ные хоть и мож­но вос­ста­но­вить без потерь, но сде­лать это гораз­до слож­нее, чем в RAID1 

А что есть ещё?

Ещё есть

  • RAID2, где при­ме­ня­ет­ся спе­ци­аль­ный алго­ритм, кото­рый может сам нахо­дить повре­ждён­ные дан­ные, но ему нуж­но мини­мум 7 дисков;
  • RAID3 и 4, кото­рые похо­жи на 5, но рабо­та­ют медленнее;
  • RAID10, где объ­еди­ня­ет­ся RAID1 и RAID0 — это даёт повы­шен­ную ско­рость и надёж­ность, но тре­бу­ет мно­го дисков

Но всё это уже экзо­ти­ка и для домаш­не­го при­ме­не­ния под­хо­дит сла­бо. Про­ще все­го купить гото­вый NAS, кото­рый уме­ет сам орга­ни­зо­вать нуж­ный мас­сив, и вам оста­нет­ся толь­ко вста­вить дис­ки. Но если вы буде­те знать, какой RAID-массив исполь­зу­ет­ся в NAS, вам будет лег­че подо­брать тот, кото­рый нужен имен­но вам.