Herzlich Willkommen

Datenwachstum und virtuelle Maschinen haben ein Storage-Segment extrem belebt – das Backup und selbstredend auch die Umkehrung der Datensicherung, also die Wiederherstellung der Daten von Disk oder Tape.

Für Neulinge in der Terminologie von Backup & Recovery haben wir die diversen Teilprozesse möglichst präzise erläutert, die Profis werden sicherlich in den Beschreibungen viele Details finden, die ihnen neue Sichtweisen eröffnen.


Ich bin mir sicher, dass wir noch viele Begriffe in unserem Lexikon „Backup & Recovery virtueller und physischer Maschinen“ ergänzen müssen. Schreiben Sie an Rainer Graefen wenn Sie selber gerne einen Begriff erklären wollen oder wenn Sie einen vermissen.

Ihr Rainer Graefen
Chefredakteur Storage-Insider.de
 
Diese Begriffe von "Datastore" bis "File Level Restore" sollten Sie kennen.

Datastore: Der von mehreren virtuellen Maschinen benutzte gemeinsame Speicherbereich. Durch das Lock-Verhalten empfahl es sich bis zur Version vSphere 4.1, nicht mehr als acht Maschinen darauf zugreifen zu lassen. Mittels VAAI ist es nun möglich, 25 bis 30 Maschinen in einem Datastore laufen zu lassen.


Datenbanksicherung: Werden die Daten in einem VMFS abgelegt, kann man mit vMotion und den vStorage-APIs arbeiten. Werden die Daten per RAW-Device gespeichert, reduziert sich das Backup auf die Sicherung über das Netzwerk. (siehe auch: Daten in einer VM)


Daten in einer VM: Es gibt drei Möglichkeiten, einer virtuellen Maschine Storage zur Verfügung zu stellen: 1. VMFS – das VMware Filesystem. 2. Oracle-Datenbanken lassen sich virtualisieren, bevorzugen allerdings das RAW-Format. 3. eine LUN auf einem Array erstellen und diese dem iSCSI-Initiator (IQM) in der VM präsentieren.


Datensicherung an sich: So ab mehreren Hundert Terabyte Daten überlegen Anwender, ob sich die Datensicherung auf ein Tape-Medium noch lohnt. Die Datenverfügbarkeit lässt sich damit nicht verbessern und das Kopieren und Verwalten der Tape-Daten und -Medien kostet viel Geld, heißt es dann. Anwender mit solchen Datenmengen entschließen sich dann zu einer hohen Datenverfügbarkeit und kombinieren das mit einer nachlaufenden Replikation zum Schutz gegen logische Fehler. Das technische Konzept wird mit einer synchronen Spiegelung realisiert. Jeder Knoten repliziert die Daten explizit dann in eine dritte und vierte Lokation. Billig ist auch das nicht und wahrscheinlich für noch größere Datenmengen weder wirtschaftlich bezahlbar, noch technisch umsetzbar.


Deduplizierung: Bei der Deduplizierung handelt es sich um eine Technik, die binäre Daten von mehreren Kilobyte Umfang miteinander vergleicht. Sind zwei Datenblöcke identisch, so wird einer der beiden durch einen wesentlich platzsparenderen Zeigerwert (Pointer) ersetzt. Sehr wirksam ist diese Methode beim Backup von Vollsicherungen, die sich weitgehend ähneln. In vielen Fällen lässt sich die gesamte Datenmenge auf 5 bis 20 Prozent der ursprünglichen Menge reduzieren.
Dieselbe Methode mit veränderten Verarbeitungsvorgängen lässt sich auch beim Datentransport einsetzen, so dass sich virtuell über einer Datenleitung mehr Daten transferieren lassen als dies mit normalen Kompressionsverfahren möglich wäre. Die Deduplikation kann direkt an der Datenquelle, auf dem Weg zum Datenziel oder erst nach der Speicherung am Datenziel stattfinden. Von Inline-Deduplikation spricht man, wenn die Daten im Ziel komprimiert werden. Dazu erforderlich sind leistungsfähige Dedup-Appliances. Werden die Daten erst am Ziel auf einer Landing Zone zwischengespeichert und danach dedupliziert spricht man von Postprozess-Deduplikation.
Für ein Backup ergeben sich dadurch folgenden Konsequenzen:
1.    Das Backup dauert je nach Variante unterschiedlich lang. Da viel Prozessorleistung benötigt wird, ist die Deduplikation auf dem Client sehr belastend.
2.    Das Netzwerk ist bei Inline und Postprozessing stark belastet.
3.    Beim Postprozessing braucht man zusätzlichen Speicherplatz, hat aber ein vollständig unkomprimiertes Backup zur Verfügung.
Bei einem notwendigen Restore ist der größere Zeitaufwand für das Auspacken der Daten zu berücksichtigen. Durch die Deduplizierung können bei gleichem Speicherbedarf die Aufbewahrungszeiträume verlängert werden.


Differenzdatensicherung: Die Differenzdatensicherung unterstellt zu Beginn ein Voll-Backup. Da die Backup-Software bei dieser Variante das Archiv-Flag nicht zurücksetzt, werden immer alle seit dem letzten Voll-Backup geänderten Dateien auf das Backup-Medium geschrieben. Vorteil: Der Anwender muss nur Voll-Backup und Differenz-Backup zurückspielen, um den aktuellen Arbeitszustand wiederherzustellen.
Nachteil: Die Datenmenge beim Differenz-Backup steigt kontinuierlich an.


Disaster Recovery: Manche Fachleute behaupten, der Restore-Fall sei schon das Disaster. Das ist natürlich übertrieben. Die Aussage besitzt indes einen wahren Kern, da beim Disaster Recovery ein Ausnahmezustand besteht, in dem einer oder mehrere wichtige Produktionsprozesse ausgefallen sind und in kürzester Zeitspanne wieder in Betrieb gehen sollen. Hierbei sind viele Aspekte zu berücksichtigen, damit der Restore von Band oder Festplatte auch wirklich einwandfrei vonstatten gehen kann. Beim Disaster Recovery sollten im besten Fall alle notwendigen Schritte schon einmal erprobt worden sein.


Einzeldatei-Restore, Single File Restore: Die Wiederherstellung einer einzelnen Datei von Band benötigt zehn bis 15 Minuten. Im Backup-Katalog ist hierzu das Band zu identifizieren, das Band ist aus dem Archiv ins Laufwerk zu laden und der Streamer muss das Band bis zum nächsten Header vorspulen. Vergleich: Kann die Einzeldatei von einer Virtual Tape Library, also von Festplatte, geladen werden, ist ein Zeitaufwand von etwa zwei Minuten einzukalkulieren. Ob sich der technische Aufwand wie auch die zusätzlichen Lizenzkosten für diese zeitliche Ersparnis lohnen, hängt jedoch schwer von der Häufigkeit solcher Restores ab.


FC-Bandroboter, FC-Library: Während sich die VMware-Appliance beim Backup auf ein NAS-Share leicht tut, ist es für den IT-Administrator eine Herausforderung, einer virtuellen Maschinen (VM) durch einen ESX-Server hindurch eine FC-Library zu zeigen. Das unterstützen nur wenige FC-Bandroboter, so dass die Sicherung von Massendaten über ein schnelles Transportmedium in vielen Fällen nicht nutzbar ist.


File Level Restore aus einem VM-Snapshot: Nicht jede Backup-Software kann aus dem Snapshot einer virtuellen Maschine ein einzelnes File wiederherstellen. Die Frage stellt sich, wo die zeitliche Grenze für ein File Level Restore liegt.