Suchen

Basiswissen RAID Mit Redundanz Datenverluste vermeiden

| Autor / Redakteur: LineFeed / Rainer Graefen

RAID impliziert hohe Datenverfügbarkeit und Sicherheit durch Redundanz. Wie funktioniert ein Redundant Array of Inexpensive/Independent Disks? Was kann es leisten, und was nicht?

Bei RAID 5 werden die Daten auf mindestens drei Festplatten geschrieben. Mit Hilfe der Paritätsdaten können bei einem Defekt von Disk 0 oder Disk 1 alle Daten wiederhergestellt werden. In diesem Beispiel sind zwei Drittel der Gesamtkapazität nutzbar.
Bei RAID 5 werden die Daten auf mindestens drei Festplatten geschrieben. Mit Hilfe der Paritätsdaten können bei einem Defekt von Disk 0 oder Disk 1 alle Daten wiederhergestellt werden. In diesem Beispiel sind zwei Drittel der Gesamtkapazität nutzbar.
(Bild: Rainer Graefen / Microsoft)

Das Kürzel RAID mit der ursprünglichen Bedeutung „Redundant Array of Inexpensive Disk“ stammt aus einem Vortrag der Professoren David Patterson, Garth Gibson und Randy Katz der University of California in Berkeley (UCB) auf der SIGMOD Konferenz 1988.

Die zugrunde liegenden Konzepte sind älter; Katz und Kollegen fassten sie zusammen, teilten sie in sechs sogenannte Level ein und popularisierten die Idee, die in Servern verbauten „großen Schlitten“ („SLED“ = Slow Large Expensive Disk) durch Arrays kostengünstiger PC-Festplatten zu ersetzen und deren größere Fehlerhäufigkeit durch redundante Datenhaltung auszugleichen.

Wie weit sich die heutige Realität vom ursprünglichen Konzept entfernt hat, zeigt schon die Größe des ersten Clusters von damals spitzenmäßigen 40 Gigabyte. Aktuelle RAID-Systeme setzen hochwertige Festplatten ein, und entsprechend wird das Kürzel oft zu „Redundant Array of Independent Disks“ umgedeutet.

Die Standard-RAID-Level

RAID zielt auf zwei Arten auf eine Verbesserung der Datenverfügbarkeit: die Erhöhung der Datensicherheit sowie der Schreib- und Lesegeschwindigkeit. Die RAID-Level 0 und 1 geben diese Ziele in Reinform wider.

Level 0 verwendet gar keine Redundanz und erhöht ausschließlich die Geschwindigkeit. Dagegen nutzt Level 1 den gesamten zusätzlichen Festplattenplatz für die redundante Datenhaltung. Für sich allein genommen, ist beides nicht optimal. Vor allem RAID 0, weil das Risiko von Datenverlusten sogar noch steigt.

Level 0 lässt sich aber vorteilhaft mit anderen zu einem Nested-RAID-Level kombinieren, beispielsweise mit Level 1 zu einem RAID 10, sodass er trotzdem praxisrelevant ist. Der Vorteil von Level 0 entsteht durch das sogenannte „Striping“. Die Daten werden streifenweise auf alle Festplatten des Verbunds verteilt, sodass die Wahrscheinlichkeit hoch ist, dass bei jedem Zugriff mehrere Platten betroffen sind und die Datenübertragung parallel erfolgen kann.

Level 1 spiegelt den Dateninhalt der ersten Platte auf einer weiteren. Eher selten werden RAID-Konfigurationen gespiegelt. Solche Varianten heißen dann RAID-10 oder auch RAID-51. Die Kapazität des Verbunds entspricht derjenigen der ersten Festplatte. Bei RAID-1 ist der Ressourcenverbrauch am höchsten, da nur 50 Prozent der Gesamtkapazität nutzbar sind. Der Aufwand sinkt bei höheren RAID-Leveln wie Level 2 bis 5, da mittels verschiedener Arten der Prüfsummenberechnung die Redundanz mit geringerem Ressourcenverbrauch erreicht wird.

Die RAID-Level im Überblick:

  • 0 Striping (keine Redundanz)
  • 1 Mirroring (aufwändig)
  • 2 (historisch)
  • 3 (historisch)
  • 4 Striping mit Parity (selten)
  • 5 Striping mit verteilter Parity
  • 6 neu, wie 5 mit verdoppelter Parity

Bewertung und Alternativen

Jedes RAID kann Datenverluste nur in einem bestimmten Umfang verhindern. Ein Datenrisiko entsteht vor allem dann, wenn bei einem Festplattenausfall nicht schnell und richtig reagiert wird. Bei einem RAID-System mit einfacher Redundanz, wie einem Level 1 mit zwei oder einem Level 5 mit drei Platten, führt ein weiterer nicht behebbarer Lesefehler (URE) auf einer verbliebenen Festplatte während des Rebuilds nach dem Plattentausch in der Regel zu einem totalen Datenverlust. Die Wahrscheinlichkeit solcher Fehler nimmt mit der Festplattenkapazität zu. Der neuere Level 6 erhöht daher die Redundanz durch eine doppelte Paritätsberechnung.

Basiswissen RAID – Redundanz zur Datensicherung
Bildergalerie mit 9 Bildern

Als Alternative zum RAID können Festplatten in einem JBoD („Just a Bunch of Disks“) zu einem größeren Pool verbunden und die Redundanz auf andere Weise erzeugt werden. Eine Alternative, die eigentlich keine Alternative ist, sondern auch beim RAID eine Notwendigkeit und eine sinnvolle Ergänzung, ist die Datensicherung. Ein Backup im brandgeschützten Tresor bietet beispielsweise eine Redundanz, die auch gegen eine vollständige Zerstörung des primären Datenspeichers absichern kann. Beim RAID liegt der Vorteil darin, dass Daten automatisch und sofort nach der Speicherung geschützt sind.

(ID:44716832)