Suchen

Disk-to-Disk-to-Tape kontra Dynamic Virtual Tape Tape-Virtualisierung verkürzt Backup-Zeiten und schont Streamer

| Autor / Redakteur: Julius Faubel, Consultant bei Overland Storage / Nico Litzel

Für deutsche Rechenzentrumsleiter ist das Band nach wie vor das Medium der Wahl, wenn es ums Backup geht. Allerdings erfordert der Einsatz von Tapes gute Kenntnisse. Ist beispielsweise der eingehende Datenstrom zu gering, schalten die Bandlaufwerke in den Start-Stopp-Modus, der Geräte und Medien stark beansprucht. Abhilfe kann hier Virtualisierung schaffen. Im folgenden Beitrag werden die Möglichkeiten von Disk-to-Disk-to-Tape (D2D2T) und Dynamic-Virtual-Tape-Laufwerken (DVT) aufgezeigt.

Firmen zum Thema

( Archiv: Vogel Business Media )

Die Frage nach Sicherheitssystemen in Autos ist längst beantwortet: Sicherheitsgurt, Airbag und ABS arbeiten „Hand in Hand“ und verhindern im Falle eines Unfalls Schlimmeres. Ähnlich sollte es in punkto Datensicherung auch in Unternehmen aussehen. Einzelne Systeme sorgen gemeinsam dafür, dass die Business Continuity gewahrt bleibt.

Ähnlich wie im Auto sollten auch die einzelnen Systeme zur Datensicherung nahtlos miteinander arbeiten. So gelangen die Daten sicher von den Produktivumgebungen zur Archivierung auf Tapes. Im Midrange-Bereich hat sich in den letzten Jahren als Bandtechnologie LTO etabliert und andere Formate wie etwa SDLT des Feldes verwiesen. Die Analysten von IDC gehen in ihrer zur CeBIT 2007 herausgegebenen Studie davon aus, dass die LTO-3-Technologie sowohl bei Laufwerken als auch bei den Medien die kostengünstigste Lösung ist (Preis pro Gigabyte).

Geschwindigkeit ist relativ

Wird die Geschwindigkeit betrachtet, mit der Daten auf Magnetbänder überspielt werden, so hat sich in den letzten Jahren viel getan. DLT8000-Bänder ließen sich mit 6 Megabyte pro Sekunde nativ und 12 Megabyte pro Sekunde komprimiert bespielen.

LTO-4-Bänder bieten heute native Übertragungsraten von bis zu 120 Megabyte pro Sekunde an, eine scheinbar „berauschende“ Geschwindigkeit. Der genaue Blick in die Protokolle der Backup-Software liefert allerdings oft ein ganz anderes Bild und offenbart, warum das Backup nicht zur berechneten Zeit beendet ist. Es sind nämlich oft Faktoren im Spiel, die den Backup-Prozess verlangsamen: große Datenmengen, ein aktivierter Virenscanner, Raid-Arrays oder der Datenweg über iSCSI. Unter realistischen Bedingungen gemessen, erreicht beispielsweise das Midrange-Modell REO 4500 eine Backup-Geschwindigkeit von 200 Megabyte pro Sekunde.

Messen statt schätzen

Anwender erhalten interessante Informationen über die Backup-Geschwindigkeit ihres Storage-Systems, wenn sie die zu sichernden Datenbereiche mit einem Tool im NullDevice eines Servers auslesen. Dadurch werden die einzelnen Glieder der Backup-Prozesskette aufgebrochen und man kann bestimmen, welcher Teil langsam ist. So bietet beispielsweise HP auf seiner Webseite das Programm Hpreaddata.exe an. Damit können ausgewählte File-Systeme oder Dateistrukturen gelesen und deren Einlesedaten dokumentiert werden.

Spätestens nach dem Lesen der Backup-Quellen wird Administratoren klar, dass in wenigen Fällen die maximale Geschwindigkeit der Bandlaufwerke genutzt wurden. Die bei LTO angegeben Geschwindigkeitswerte bedeuten, dass ein LTO-3-Band maximal 80 Megabyte pro Sekunde im Streaming Mode schreiben kann, wenn nichtkomprimierbare Daten angeliefert werden. Streaming bedeutet, dass das Band mit kontinuierlicher Geschwindigkeit schreiben oder lesen kann, ohne dass es repositioniert werden muss.

LTO mit Gangschaltung

Die mechanische Bandgeschwindigkeit wird durch das Laufwerk an den Füllstand des Eingangsbuffers angepasst, das sogenannte „Data rate matching“. Beispielsweise wird ein LTO-3-Laufwerk von Hewlett-Packard, das einen Eingangspuffer von 128 Megabyte aufweist, mit einem Datenstrom von 27 bis zu 80 Megabyte pro Sekunde am Streamen gehalten. Werden die Daten mit weniger als 27 Megabyte pro Sekunde angeliefert, geht das Laufwerk in den Start-Stopp-Modus über. Das heißt, nachdem im Eingangspuffer keine Daten mehr verfügbar sind, wird das Band zum Stillstand gebracht. Nun wird das Band rückwärts gefahren und wieder angehalten. Meldet der Eingangsbuffer nun wieder genügend Daten, wird das Band wieder in Schreibrichtung beschleunigt, das Ende des letzten Datenblocks auf dem Band gesucht, und der nächste Datenblock wird angehängt.

Der Start-Stopp-Betrieb wird auch „Shoeshine Mode“ (Schuhputz-Modus) genannt und nutzt sowohl das Laufwerk als auch das Medium mechanisch erheblich ab. Bedingt durch die Repositionierung und auf Grund der langsamen Datenanlieferung sinkt die Backupgeschwindigkeit. Fazit: Je größer der Eingangsbuffer, je weniger Start-Stopp-Zyklen, desto schneller das Backup.

Disk-to-Disk Backup

Um den minimalen Durchsatzwert zum kontinuierlichen Streamen zu halten, werden die Daten vor dem Speichern auf Band auf ein zweites Disk-System überspielt – eine Disk-to-Disk (D2D)-Umgebung entsteht. Nimmt man zu diesem Zweck ein „normales RAID-Array“ müssen nun einzelne Filesysteme erzeugt werden und in Sicherungspools der Backupsoftware zugewiesen werden, um sie nachher auf Tapes zu überspielen. So legen Anwender oft Filesysteme für Unix und Windows in verschiedenen Größen an, entsprechend den eingesetzten Tapes, und formatieren diese.

Allerdings können solche Filesysteme von Viren attackiert werden, die dann möglicherweise die Sicherungen nebst Quell-Filesystem zerstören. Zudem ist jede Änderung der Kapazität eines Backup-Ziel-Filesystems mit erheblichem administrativem Aufwand verbunden. Eine solche statische Tape-Virtualisierung hat also erhebliche Nachteile.

Eine auch für mittelständische Unternehmen interessante Lösung der angesprochenen Herausforderungen stellt die REO-Serie von Overland Storage zur Verfügung. In einer Anzahl von unterschiedlichen Ausbaustufen werden Sicherungskapazitäten von minimal 750 Gigabyte bis über 40 Terabyte – gemessen in Netto RAID 5 – angeboten. Denn hier können einfach über ein Web-GUI Diskkapazitäten, Dynamic-Virtual-Tape-Laufwerke (DVT) oder auch komplette Virtuelle Tape Libraries über LUN-Masking an iSCSI oder FC-Initiatoren exportiert werden.

DVT ganz einfach

Das Anlegen eines virtuellen Tapelaufwerks ist mit wenigen Mausklicks erledigt: Im ersten Schritt wird eine interne LUN (Logical Unit Number) angelegt, die im zweiten Schritt zum DVT erklärt wird. Nun fragt das System nach der maximalen Größe der Bandkapazität der im DVT-Laufwerk virtuell montierten Kassette. Zusätzlich können Anwender noch eine Softwarekomprimierung einschalten. Im letzten Schritt werden nun noch die iSCSI- oder FC-Initiatoren definiert und schon kann in den assoziierten Servern beispielsweise auf das „HP Ultrium LTO2“ zugegriffen werden.

In einem Backup-Exec-Umfeld kann so etwa eine Anzahl von Standalone-DVTs zur Parallelisierung der täglichen Sicherungen beitragen. Nach dem Ende der Backups lassen sich die Savesets tagsüber von den DVT-Laufwerken nacheinander auf physikalische Bandlaufwerke übertragen.

Doch wie funktioniert nun das Dynamische? Das Ganze läuft in Etappen ab: Anfänglich entnimmt eine DVT-Kassette ein Gigabyte aus einem Pool des RAID-Arrays. Wird beim fortlaufenden Schreiben des Backups nun mehr Kapazität benötigt, ruft die Software Kapazität in Gigabyte-Schritten ab und hängt sie an das DVT. Dies geschieht bis zum Erreichen der vorher festgelegten maximalen Größe der Kassette.

Wenn die Metadaten auf der Kassette abgelaufen sind und die Kassette von der Backupsoftware neu beschrieben werden kann, gibt die DVT-Kassette alle bis dahin angeforderten GB-Blöcke wieder an den freien Pool des RAID-Arrays zurück. Diese Blöcke können nun von anderen DVT-Kassetten angefordert werden. Sollten keine freien Blöcke mehr zur Verfügung stehen, melden alle Kassetten „End-of-Tape“, und die Backupsoftware sendet Mount-Requests an den Operator.

Es ist zu beachten, dass LTO2 nicht automatisch bedeutet, dass es sich um eine Kassette mit 200 oder 400 Gigabyte handelt. Die Backupsoftware schreibt solange auf die DVT-Kassette bis nach einem SCSI-Kommando das Laufwerk im Extended Status das „Physical-End-Of-Tape“-Bit gesetzt hat. Das bedeutet dann für die Backupsoftware, dass sie eine neue beschreibbare Kassette anfordern muss um das Backup fortzusetzen. So kann in der REO-Serie von Overland Storage die Kapazität einer DVT-Kassette zwischen eine Gigabyte und zwei Terabyte betragen. Da es für jedes Betriebssystem LTO2-Treiber gibt, werden die DVTs der REO ohne Probleme erkannt und integriert.

Sollen nun virtuelle Savesets auf physikalische Bänder dupliziert werden, übernimmt dies die Backupsoftware. Sie liest das Saveset vom DVT und schreibt es unter Beibehaltung des Quellenkontextes auf das physikalische Band. Dabei ist es unerheblich wie groß die Kapazitäten des DVT-Bandes und des physikalischen Bandes sind. Die Vorhaltezeiten der Savesets auf den virtuellen Bändern werden oft auf ein oder zwei Backup-Generationen in der Backup-Saveset-Datenbank begrenzt. Die Aufbewahrungsfrist der Savesets auf physikalischen Bändern hingegen wird oft über mehrere Monate definiert. Der Hintergrund dafür ist sicher die begrenzte Speicherkapazität in den D2D-Appliances.

Mit Dynamik zu mehr Sicherheit

Dynamic Virtual Tape hat also zahlreiche Vorteile und bietet im Zusammenspiel mit Datensicherungslösungen ein solides Data-Protection-System. Mit DVT ist vor allem das kontinuierliche und flexible Beschreiben von Tapes der große Pluspunkt. Denn zum einen kostet „Schuhe polieren“ Zeit und zum anderen können Daten innerhalb der Savesets mehrfach gesichert werden: einmal virtuell und einmal auf einem physikalischen Band. In einer Disk-to-Disk-to-Tape-Infrastruktur sind dann alle Sicherheitsmerkmale vereint, um Data-Protection mit all seinen Komponenten nahtlos miteinander zu einem System zu vereinen – ganz so wie Sicherheitsgurt, Airbag und ABS im Auto.

Artikelfiles und Artikellinks

(ID:2006708)