Schneller zurück zum hochverfügbaren Speichersystem Wie das Raid-Konzept überleben kann

Anbieter zum Thema

Unternehmen sind darauf angewiesen, dass ihre geschäftskritischen Anwendungen und Daten nonstop verfügbar sind. Um das Risiko möglicher Stillstandzeiten zu mindern, setzen sie in ihren Rechenzentren unter anderem auf Raid-Systeme. Doch hochkapazitative Festplatten lassen das klassische Raid-Konzept heutzutage alt aussehen.

Die Fast-Rebuild-Technik von Fujitsu sorgt für eine schnellere Wiederherstellung von Festplatten.
Die Fast-Rebuild-Technik von Fujitsu sorgt für eine schnellere Wiederherstellung von Festplatten.
(Bild: Fujitsu)

Nearline-SAS- oder SATA-Festplatten sind kostengünstig und zeichnen sich durch eine hohe Kapazität aus. Für das Zusammenspiel mit geschäftskritischen Anwendungen eignen sie sich allerdings bislang nur bedingt.

An dieser Beurteilung ändert sich wenig, wenn mehrere Laufwerken in einem Array zusammengeschlossen werden und der Ausfall von einer (Raid 1, Raid 5) oder auch zwei Festplatten (Raid 6) gar keinen Datenverlust nach sich ziehen würde.

Statusverlust

Sobald ein Laufwerk ausfällt, verliert das Raid-Array den eingestellten Status. Es ist nicht mehr hochverfügbar. Nur ein Rebuild kann das gewünschte Sicherheitsniveau wieder herstellen.

Für die Rekonstruktion des nicht mehr ansprechbaren Laufwerks sowie der darauf befindlichen Daten und Anwendungen auf einer Online-, Ersatz- oder Austauschplatte ist einiges an Zeit einzukalkulieren. Je nach Anzahl der in das RAID-Set integrierten Hard Disk Drives (HDDs), deren Kapazität und Schreib-/Lesegeschwindigkeit, dem verwendeten RAID-Controller-Typ sowie der für den Rebuild ausschlaggebenden Ursache, kann dies mehrere Stunden bis hin zu einigen Tagen, im Worst Case sogar Wochen, in Anspruch nehmen.

Für die Befüllung einer 1-Terabyte-Platte in einem RAID-Verbund ist unter guten Bedingungen ein knapper Tag, für ein 2-Terabyte-Laufwerk über eineinhalb Tage und für eine 4-TB-HDD bis zu vier Tage anzusetzen.

Der Rebuild findet in einem geschwächten System statt

Natürlich lässt sich der Rebuild-Vorgang durch die Einstellung einer hohen Wiederherstellungspriorität schneller bewerkstelligen. Der Haken dabei ist, dass dies die Ressourcen stark belastet und die Systemleistung einbrechen kann. Mark Staimer, einer der führenden Marktanalysten im Storage-Umfeld, beziffert den möglichen Performance-Rückgang auf über 50 Prozent.

Sinnvoller ist es daher, die Rekonstruktion im Hintergrund ablaufen zu lassen, um potenzielle Leistungseinbußen dadurch in einem einigermaßen akzeptablen Rahmen zu halten. Dies hat jedoch zur Folge, dass die Rebuild-Zeit überproportional ansteigt, es während dieser für die Laufwerke stressigen Phase zu weiteren Festplattenausfällen kommen kann und mit Datenverlusten zu rechnen ist.

Gleich wie man es also dreht und wendet: geht es um den Betrieb geschäftskritischer Anwendungen, die hohe Anforderungen an Leistung und Verfügbarkeit stellen und daher der Einhaltung strenger Service-Level-Vereinbarungen unterliegen, bieten sich traditionelle lediglich mit kapazitätsstarken Festplatten ausgestattete Raid-Systeme ungeachtet des Preisvorteils nur eingeschränkt an.

Raid-Alternative Tiering

Um die bislang mit Raid-Systemen verbundenen Schwachstellen auszumerzen und die Nachteile von Nearline-SAS- und SATA-Platten auszugleichen, treten die Hersteller seit geraumer Zeit mit neuen Techniken an. Gängig sind inzwischen automatisierte Storage-Tiering-Verfahren (AST), mittels deren sich Performance und Kapazität von Systemen optimal nutzen lassen.

Das Prinzip ist einfach. Abhängig von ihrer Nutzungsintensität und Bedeutung für das Unternehmen werden Daten regelgesteuert auf dem jeweils passenden Speichermedium abgelegt. Geschäftskritische Informationen, auf die Anwender schnell zugreifen müssen, liegen bei diesem Ansatz auf Hochgeschwindigkeits-SSDs oder SAS-Drives, weniger häufig angefragte Daten auf preisgünstigeren Nearline-SAS und SATA-Platten. Dies stellt sicher, dass die für den Betrieb unternehmensentscheidender Applikationen geforderte Leistung bereitsteht und diese weitestgehend störungsfrei laufen.

Einwandfreie Datenklassifizierung ist Voraussetzung

Diesen Vorzug im Auge, überrascht es nicht, dass unterschiedlich benannte AST-Lösungen bereits integraler Bestandteil der von großen Herstellern wie Dell, EMC, Fujitsu, Hitachi Data Systems, HP, IBM oder NetApp angebotenen Speichersysteme sind.

Das Konzept geht allerdings nur dann auf, wenn die Klassifizierung von Daten und Anwendungen einwandfrei verläuft. Ist dies nicht der Fall, können selbst in einer abgestuften Umgebung von I/O-intensiven Anwendungen wie Datenbanken erzeugte Blöcke durchaus einmal auf einem leistungsschwächeren für deren Vorhaltung weniger geeigneten NL-SAS- oder SATA-Laufwerk landen.

Fällt eine Festplatte im Raid-Verbund aus, lassen sich die für die Applikation geltenden Qualitätsanforderungen und zugeordneten SLAs aufgrund des bekannten Mankos der Wiederherstellungszeit nicht einhalten.

Datenextraktion …

Um dem entgegenzuwirken und das Defizit des langwierigen Rebuilds kapazitätsstarker Platten in den Griff zu bekommen, warten Anbieter wie Seagate oder Fujitsu mit innovativen Funktionen wie der Raid-Rebuild- oder der Fast-Rebuild-Technik auf.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Erstere extrahiert vor der Raid-Wiederherstellung möglichst viele Daten von der ausgefallenen Festplatte, anstatt diese von den anderen aktiven Laufwerken zu rekonstruieren. Dies beschleunigt den Recovery-Prozess, ohne dass es zu den sonst typischen signifikanten Leistungseinbußen kommt.

Fujitsu setzt bei seinem Fast-Rebuild-Verfahren hingegen auf reservierte Bereiche auf den einzelnen Platten, die den Einsatz einer Hot-Spare-Disk (HS) überflüssig machen.

… oder Reservespeicher

Die einem logischen Laufwerk zugehörigen HDDs werden zunächst in gleich große Sektionen unterteilt und die Nutzdaten und Paritätsinformationen auf den Segmenten verteilt. Zudem steht auf jeder Platte ein Bereich zur Verfügung, der nicht belegt ist. Fällt ein Laufwerk aus, werden diese freien Kapazitäten simultan für den Rebuild-Prozess genutzt, so dass dieser deutlich schneller von statten geht.

So lässt sich beispielsweise die Wiederherstellung einer 1-Terabyte-Platte in maximal 90 Minuten abschließen – bislang mussten IT-Verantwortliche hierfür mindestens neun Stunden bis hin zu einigen Tagen einplanen und alle damit verbundenen Gefahren in Kauf nehmen.

Mit der Fast-Rebuild-Technik von Fujitsu können Unternehmen somit erstmals in ihren Rechenzentren auch Nearline-SAS sowie SATA-Platten im Zusammenspiel mit geschäftskritischen Anwendungen einsetzen.

(ID:43652086)