Herzlich Willkommen

Datenwachstum und virtuelle Maschinen haben ein Storage-Segment extrem belebt – das Backup und selbstredend auch die Umkehrung der Datensicherung, also die Wiederherstellung der Daten von Disk oder Tape.

Für Neulinge in der Terminologie von Backup & Recovery haben wir die diversen Teilprozesse möglichst präzise erläutert, die Profis werden sicherlich in den Beschreibungen viele Details finden, die ihnen neue Sichtweisen eröffnen.


Ich bin mir sicher, dass wir noch viele Begriffe in unserem Lexikon „Backup & Recovery virtueller und physischer Maschinen“ ergänzen müssen. Schreiben Sie an Rainer Graefen wenn Sie selber gerne einen Begriff erklären wollen oder wenn Sie einen vermissen.

Ihr Rainer Graefen
Chefredakteur Storage-Insider.de
 
Diese Begriffe von "Backup-Service" bis "CSV" sollten Sie kennen.

Backup-Service in einem Cluster betreiben: Da bei diesem Konzept das Betriebssystem und die Backup-Applikation doppelt auf zwei physischen Servern vorhanden sind und die Daten für alle Knoten gemeinsam nutzbar auf einem redundanten Speicher liegen, ist die Verfügbarkeit des Services deutlich höher als auf einem Einzelsystem oder in einer virtualisierten Umgebung.


Backup-Service virtualisieren: Das ist aus zwei Gründen keine gute Idee. Erstens: Schreibt die Backup-Applikation in einer VM ihre Backup-Daten in ein SAN, dann darf das SAN niemals ausfallen. Zweitens: Die Backup-Applikation schreibt die Metadaten jeder Datensicherung in eine Datenbank. Liegt diese Datenbank auf demselben Array, wo auch die zu sichernden Daten liegen, dann wird eine massive I/O-Last beim Lesen der Daten, beim Schreiben des Backups und nicht zuletzt beim Schreiben der Metadaten in die Datenbank erzeugt. Das Backup würde sich selbst behindern.


Band, Bandlaufwerk, Tape, Tape-Streamer: Es gibt keine IT-Komponente, die die Gemüter professioneller Anwender mehr bewegt. Doch zur Ehrenrettung der Tape-Technik sei es auch an dieser Stelle gesagt: Es gibt kein schnelleres Speichermedium.
Das ewige Ärgernis vieler Backup-Anwender mit der Tape-Technik: Man hält sie für zu langsam, da sie dauernd stoppt. Es ist genau umgekehrt. Ein modernes LTO-5-Bandlaufwerk kann bis zu 450 MByte Daten pro Sekunde verarbeiten. Das schaffen nur wenige Server.
Wenn also nicht entsprechend schnell ausreichende Datenmengen geliefert werden, dann wird der Streamer in den Start-Stopp-Betrieb gezwungen, spöttisch auch mit „shoeshining“ bezeichnet, der Laufwerk wie Medium extrem belastet.
Es stimmt, das Tape spielt bei der Datensicherung von Fileservern nicht mehr die große Rolle früherer Zeiten, aber für die Sicherung von Datenbanken eignet es sich sehr gut aufgrund der hohen Backup-Geschwindigkeit. Auch für die Archivierung großer Datenmengen gibt es bislang keine wirtschaftliche Alternative. Eine neue Rolle könnte dem Tape ausgerechnet durch die Cloud zuwachsen: als Offline-Transportmittel mit hoher Kapazität. Wer den Anbieter wechseln oder ein Disaster Recovery durchführen muss, der hat keine Zeit, auf den wochenlangen Datentransfer größerer Datenmengen über eine WAN-Strecke zu warten. Eine vierte Option besteht in der Kombination von LTFS und Band. Diese Kombination ermöglicht eine Langzeitspeicherung von Filmen, medizinischen wie auch wissenschaftlichen Daten und erlaubt durch einen externen NAS-Filer mit LTFS-Verzeichnisdaten eine schnelle Rückgewinnung.


Bandmanagement: Eine professionelle Datensicherung arbeitet mit Barcodes auf den Tape-Medien. So kann die Backup-Software selbstständig erkennen, ob das in der Bandbibliothek abgelegte Band das korrekte ist und welche Inhalte hier gespeichert wurden. Das Bandmanagement muss man im Zusammenhang mit Aufbewahrungszeiträumen sehen. Damit diese eingehalten werden können, muss das Bandmanagement eine unveränderbare Konstante sein, auch über den Wechsel von Backup-Software oder Backup-Dienstleister hinweg.


Betriebssystem/Anwendungen: Nicht immer lohnt es sich, in die Ferne zu schweifen. Schon Betriebssysteme wie auch Anwendungen selbst bieten viele Optionen, um Daten wiederherstellen zu können. Datenbank-Anwendungen bieten ab und zu die Option an, zwei Kopien anzulegen. Das ist aus Sicht der Anwendung proaktiver Schutz gegen Datenverlust. Microsoft bietet mit VSS einen Snapshot-Service für Fileserver, Datenbanken und Hyper-V. Teilweise kann der Anwender selbst mit der rechten Maustaste seine gelöschten Daten wiederherstellen.


Bottleneck, Flaschenhals: Backup und Restore sind technisch sehr herausfordernde Anwendungen. Der Server muss über diverse Stufen wie Agenten, Dateisystem, Netzwerk einen beständigen Datenstrom an das Bandlaufwerk liefern, damit dieses mindestens mit der minimalen Bandgeschwindigkeit fortlaufend Daten auf das Band schreiben kann. Ein Cache im Bandlaufwerk und auch variable Bandgeschwindigkeiten können dafür sorgen, dass Schwankungen in der Datenstromgeschwindigkeit ausgeglichen werden. Ziel muss es sein, alle Engpässe auf dem Weg zum Bandlaufwerk zu beseitigen. Ein 1-GBit-Netzwerk, das pro Sekunde im besten Fall 125 MByte transportiert, wird für moderne LTO-Laufwerke zum Engpass und führt dadurch zum schnelleren Verschleiß des Gerätes.


CBT, Change Block Tracking: Während die Datensicherungsmethoden Voll, Differentiell und Inkrementell dem Backup-Server Informationen geben, welche Dateien zu sichern sind, ist das im SAN anders. Hier werden klassischerweise Blöcke ausgetauscht, die anders als im Filesystem kein Kennzeichen (Flag) über ihren Änderungsstatus besitzen. Im SAN konnte deshalb bislang nur eine Vollsicherung durchgeführt werden.
Mit dem CBT bekommen virtuelle Maschinen die Möglichkeit in einem Inhaltsverzeichnis aufzuzeichnen, welche Blöcke an den Backup-Sever gesendet wurden. Beim nächsten Mal müssen dann nur noch die geänderten Blöcke übertragen werden. Damit kann man auch im SAN die klassischen Datensicherungsmethoden umsetzen. Wendet man CBT für Datenbanken in einem VMFS-Umfeld an, lassen sich auch größere Volumes mit vMotion leichter auf ein zweites Speichersystem umziehen.


CDP, Continuous Data Protection: Einen Durchbruch hat CDP bisher noch nicht erlebt. Die gerne als kontinuierlicher Snapshot gepriesene Softwarelösung findet bislang keinen größeren Hersteller, der die Technik unterstützt. Die Übergänge von älteren Lösungen, die geänderte Dateien auf ein Zweitsystem replizieren, zu Block-orientierter Replikation, die jede Änderung auf das Sekundärsystem kopiert, sind allerdings schon zu beobachten. CDP könnte dort einen Einsatzort finden, wo es auf sehr hohe Verfügbarkeit der Systeme und das unterbrechungsfreie Weiterarbeiten zu im Vergleich mit Clustersystemen niedrigeren Kosten ankommt.


Clone, Volume Copy: Der Snapshot von einem Disk-Volume setzt in einer Liste die von diesem Volume benutzten Datenblöcke auf Read-Only, jede Änderung wird in einen eigenen Speicherbereich geschrieben. Diesen Snapshot kann man der Backup-Software präsentieren und eine Datensicherung veranlassen. Wird der Snapshot anschließend aufgelöst, so ist es nicht mehr möglich, einen Restore des Snapshots auf den originalen Speicherort durchzuführen. Das Backup des Snapshots müsste für ein Recovery auf ein frisches Volume durchgeführt werden, um die Daten anschließend wieder händisch auf den Ursprungsspeicherort zu übertragen. Der Zustand zum Zeitpunkt des Snapshots lässt sich nur wiederherstellen, wenn von dem Snapshot ein Clone erzeugt wurde, der eine exakte Kopie des Snapshots darstellt. Der Zeitaufwand für diese interne Speicherkopie liegt bei ein bis zwei Stunden für ca. 500 GByte Daten.


CSV, Cluster Shared Volume: Gängige Bezeichnung für ein (NTFS-) Laufwerk, das von allen Knoten eines Clusters benutzt wird.