Definition

Mehr Datenverfügbarkeit durch RAID

| Redakteur: Rainer Graefen

RAID bietet verschiedene Vor- und Nachteile.
RAID bietet verschiedene Vor- und Nachteile. ( Kheng Guan Toh - Fotolia.com)

Unter dem Begriff RAID werden diverse Konfigurationen gekoppelter Festplatten zusammengefasst. Die verschiedenen Konfigurationen werden als Level mit einer nachfolgenden Ziffer bezeichnet. Ein Festplatten-Controller steuert die Verteilung der Daten auf die Level. Häufig benutzte Array-Konfigurationen sind RAID Level 1 und RAID Level 5.

Jeder Level eines Redundant Array of Independent / Inexpensive Disks (RAID) hat spezifische Vorteile bei den vier Parametern Geschwindigkeit, Datenverfügbarkeit, Speicherkapazität und Kosten. Nach außen hin sieht ein Festplattenverbund wie eine einzelne Festplatte aus, da der RAID-Festplattencontroller die miteinander verbundenen physischen Festplatten als logische(s) Laufwerk(e) präsentiert, moderner gesprochen virtualisiert.

Als das "Redundant Array of Independent Disks" entwickelt wurde, lag die Betonung auf Array, heute liegt die Betonung auf Redundant. Dadurch entstand das Verständnisproblem, das RAID Level 0, kurz auch RAID-0 genannt, keine Redundanz besitzt, so dass auf diesem Level keine wichtigen Daten gespeichert werden sollten. RAID-0 ist für den schnellen Datenzugriff optimiert.

Ein RAID (Ausnahme RAID-0) verbessert die Datenverfügbarkeit. Jede Konfiguration von RAID-1 bis RAID-5 verkraftet den Ausfall einer Festplatte.

Dieser Datenverfügbarkeit untergeordnet sind Gesichtspunkte wie Kosten, optimierte Speicherkapazität und Zugriffszeit. Das ist schön an den beiden Leveln 1 und 5 zu studieren.

RAID Level 1 und RAID Level 5

Bei RAID-1 werden zwei Festplatten-Volumes gespiegelt, die somit identische Inhalte haben. Das bedeutet: Die Kosten pro Gigabyte verdoppeln sich aufgrund der halbierten Speicherkapazität; die Zugriffszeit entspricht derjenigen einer einzelnen Festplatte. Die Daten sind bei Ausfall einer Festplatte ohne Einschränkungen nutzbar.

Bei RAID-5 sind mindestens drei Festplatten zu koppeln, als sinnvolle obere Grenze werden gerne zwölf bis 14 Disks gewählt, da ansonsten die Leerstände auf den einzelnen Volumes die Kosten in die Höhe treiben. Die Daten werden über die Festplatten „gestript“, d.h. jeder einzelne Datenblock wird über drei und mehr Festplatten verteilt. RAID-5 arbeitet mit rotierender Parität, die über alle Disks verteilt wird.

Dazu ein Beispiel

Datenblock eins von Festplatte A und Datenblock eins von Festplatte B erzeugen einen Paritätsblock auf Festplatte C. Dieses Verfahren wird rotierend angewandt. Bei RAID-5 verfügt man im Falle von drei Festplatten über Zweidrittel der addierten Speicherkapazität. Die allgemeine Formel zur Berechnung der Speicherkapazität lautet: (n-1)/n; n>=3.

RAID-5 ist damit kostengünstiger als RAID-1. Da die Daten gestript sind, ist die Lesegeschwindigkeit höher als bei RAID-1, beim Schreiben dagegen langsamer, da die Berechnung der Parität zusätzliche Lese- und Schreibvorgänge benötigt.

Nachteile von RAID

Grundsätzliches Problem der RAID-Technik ist die steigende Speicherkapazität von Festplatten. Fällt eine Festplatte im Verbund aus, müssen alle Daten auf der Austausch-Festplatte wiederhergestellt werden. Dieser Rebuild erfordert sehr viele Lese-, Berechnungs und Schreibvorgänge, sodass die Zeitdauer für die Wiederherstellung aller Dateninformationen bei Ein-Terabyte-Festplatten zwölf bis 24 Stunden dauern kann. In dieser Zeit gibt es keine Redundanz mehr, ein weiterer Fehler würde zum Verlust aller Daten führen.

Die Speicherbranche hat auf dieses Problem mit der Entwicklung von RAID-6 respektive RAID-DP (NetApp) reagiert. Alternative Verfahren sind die Spiegelung von RAID-Konfigurationen oder Grid-Storage. Die Entwicklung redundanter Konzepte für hochkapazitive Festplatten ist noch nicht abgeschlossen.

Kurzbeschreibung wichtiger RAID-Level:

Es gibt viele RAID-Varianten, die teilweise von der RAID-Organisation festgelegt, teilweise von Herstellern definiert werden und eine nicht-redundante Anordnung (RAID-0):

  • RAID-0: Diese Technik umfasst das Striping, bietet jedoch keine Datenredundanz. Sie bietet die beste Arbeitsleistung, jedoch keine Fehlertoleranz.
  • RAID-1: Dieser Typ ist auch als Festplattenspiegelung bekannt und besteht aus mindestens zwei Festplatten, von denen eine die Kopie der Daten speichert. Hier gibt es kein Striping. Die Leseleistung ist verbessert, da jede Festplatte zur gleichen Zeit gelesen werden kann. Die Schreibleistung ist die gleiche wie die bei der Speicherung auf nur einer Festplatte. RAID-1 bietet die beste Arbeitsleistung und die beste Fehlertoleranz in einem Multi-User-System.
  • RAID-2: Dieser Typ arbeitet mit dem Striping und bei einigen Festplattenspeichern mit der Fehlerüberprüfungs- und Korrekturinformation (Error Checking and Correcting – ECC). Gegenüber
  • RAID-3: Diese Variante verwendet Striping und reserviert eine Festplatte für das Speichern von Paritätsinformation. Die Embedded Error Checking (ECC)-Informationen werden für die Fehlerermittlung gebraucht. Die Datenwiederherstellung wird durch die Berechnung des exklusiven OR (XOR) der von anderen Festplatten aufgezeichneten Informationen erreicht. Weil eine I/O-Operation alle Festplatten zur gleichen Zeit adressiert, kann RAID-3 den I/O nicht überlagern. Aus diesem Grund ist RAID-3 am besten für Single-User-Systeme mit langen Datensätzen geeignet.
  • RAID-4: Dieser Typ verwendet große Stripes, was bedeutet, dass man die Datensätze von jeder Festplatte lesen kann. Dadurch kann man die Vorteile des überlagerten I/O für Leseoperationen nutzen. Weil alle Schreiboperationen die Paritätsfestplatte aktualisieren müssen, ist hier keine I/O-Überlagerung möglich. RAID-4 bietet gegenüber RAID-5 keine Vorteile.
  • RAID-5: Dieser Typ beinhaltet ein rotierendes Paritäts-Array und behebt daher die Schreibbegrenzung in RAID-4. Daher können alle Lese- und Schreiboperationen überlagert werden. RAID-5 speichert Paritätsinformationen, aber keine redundanten Daten (allerdings können die Paritätsinformation zur Rekonstruktion der Daten herangezogen werden). RAID-5 benötigt für das Array mindestens drei und meistens fünf Festplatten. Sie ist am besten für Multi-User-Systeme geeignet, bei denen die Performance unkritisch ist oder die nur wenige Schreiboperationen ausführen.
  • RAID-6: Dieser Typ ist dem RAID-5 ähnlich, er beinhaltet aber ein zweites Paritätsschema, das auf verschiedene Festplatten verteilt ist und daher eine extrem hohe Fehler- und Ausfalltoleranz im Bezug auf die Festplatten bietet.
  • RAID-7: Dieser Typ umfasst ein integriertes Echtzeit-Betriebssystem als Controller, Caching über einen Hochgeschwindigkeitsbus und weitere Eigenschaften eines Stand-Alone-Computers. Dieses System wird von einem Hersteller angeboten.
  • RAID-10: Die Kombination aus RAID-0 und RAID-1 wird oft als RAID-10 bezeichnet und bietet eine höhere Arbeitsleistung als RAID-1 – allerdings zu viel höheren Kosten. Es gibt zwei Subtypen: In RAID-0+1 werden die Daten auf mehrere Festplatten gestript, dann werden die Datensätze gespiegelt. In RAID-1+0 werden die Daten gespiegelt und die Spiegel gestript.
  • RAID-50 (oder RAID-5+0): Dieser Typ besteht aus einer Reihe von RAID-5 Gruppen und nutzt Striping wie RAID-0; so wird die Arbeitsleistung von RAID-5 verbessert, ohne dass sich der Datenschutz verringert.
  • RAID-53 (oder RAID-5+3): Dieser Typ verwendet Striping (im RAID-0-Stil) für die virtuellen Disk-Blocks von RAID-3. Das bietet eine höhere Arbeitsleistung als bei RAID-3, aber zu viel höheren Kosten.
  • RAID-S (auch als Parität-RAID bekannt): Das ist eine alternative, proprietäre Methode für Striped-Parity von EMC Symmetrix, die heute nicht mehr aktuell ist. Mit einigen Leistungsverbesserungen, die sich teilweise durch einen Hochgeschwindigkeits-Festplatten-Cache im Disk-Array ergeben, scheint es ansonsten dem RAID-5 ähnlich zu sein.

Die klassischen RAID-Level stehen seit vielen Jahren unter Druck. Angesichts steigender Kapazitäten bei Festplatten ist zwar die Verfügbarkeit der Daten beispielsweise bei RAID-5 und RAID-6 vorhanden, ein Rebuild kann jedoch inzwischen aber Tage, wenn nicht sogar Wochen dauern. RAID-Z von Suns Dateisystem ZFS und RAID-X von IBMs Speichersystem XIV oder auch Fast Rebuild von Fujitsu versuchen neue Wege zu gehen.

Allerdings zeigen Entwicklungen bei Objektspeichern, dass mit Erasure Codes ein wesentlich verbessertes Leistungsverhalten bei Verfügbarkeit und Kosten möglich ist. Und auf der untersten Hardware-Ebene, bei den Flash-Zellen selbst, reden die Hersteller zwar noch von RAID, aber eigentlich ist das nur eine Erinnerung an das tatsächlich beabsichtigte Ziel der Hochverfügbarkeit

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43813186 / Festplatte)