Herzlich Willkommen

Datenwachstum und virtuelle Maschinen haben ein Storage-Segment extrem belebt – das Backup und selbstredend auch die Umkehrung der Datensicherung, also die Wiederherstellung der Daten von Disk oder Tape.

Für Neulinge in der Terminologie von Backup & Recovery haben wir die diversen Teilprozesse möglichst präzise erläutert, die Profis werden sicherlich in den Beschreibungen viele Details finden, die ihnen neue Sichtweisen eröffnen.


Ich bin mir sicher, dass wir noch viele Begriffe in unserem Lexikon „Backup & Recovery virtueller und physischer Maschinen“ ergänzen müssen. Schreiben Sie an Rainer Graefen wenn Sie selber gerne einen Begriff erklären wollen oder wenn Sie einen vermissen.

Ihr Rainer Graefen
Chefredakteur Storage-Insider.de
 
Diese Begriffe von "Multistreaming" bis "PACS" sollten Sie kennen.

Multistreaming: Dauert das Backup zu lange und soll gleichzeitig die Datenmenge dedupliziert werden, greift man auf mehrere parallele Datenströme zurück, die an entsprechend vielen Orten am Ziel gespeichert werden. Nur so kann man sicherstellen, dass die Datenänderungen im Vergleich zum Multiplexing gering bleiben, sich also gut deduplizieren lassen.


LAN Backup&Restore: Auch wenn Backup&Restore hier zusammengeschrieben werden, um den Sinn dieser Kopieraktion anzudeuten, so verlaufen beide Prozesse in der Praxis sehr unterschiedlich. Ein schnelles Backup ist nur auf Kosten eines langsamen Restores möglich oder umgekehrt.
Siehe auch: Multistreaming und File System Performance.


LTFS, Long Term File System: IBM brachte Anfang 2010 das Long Term File System (LTFS) auf den Markt, ein Dateisystem das LTO-Bänder in Bezug auf Interoperabilität und Geschwindigkeit quasi in große USB-Sticks verwandelt.
LTO-5-Bändern werden dazu in zwei Partitionen unterteilt: Auf der ersten legt LTFS einen unabhängigen hierarchischen Dateisystemindex der Inhalte ab, auf der zweiten werden die dazugehörigen Daten gespeichert.
Als eine Nutzungsmöglichkeit zeichnet sich ab, dass die Metadaten von LTO-5-Bandbibliotheken in Appliances mit größerem Cache gesammelt werden, so dass damit eine neue Art der Langzeitspeicherung für große, nicht ganz so häufig benötigte Datenarchive entstehen kann. IBM unterstützt das LTFS-Format auch bei den Enterprise-Streamer. Oracle scheint für die Storagetek-Streamerlinie ähnliches vorzuhaben.


LTO-5: Das derzeitige Maß aller Dinge in der kommerziellen Streamer-Technik – nach Marktanteilen betrachtet. Oracle wie auch IBM können leistungsfähigere Laufwerke liefern, die aber für den Massenmarkt zu teuer sind. Seit dem zweiten Quartal 2010 ist LTO-5 mit einer komprimierten Speicherkapazität bis zu 3 TByte sowie einer Transferrate von bis zu 280 MByte/s auf dem Markt. Um die Anforderungen an die Datenquelle zu senken, hat HP das eigene Laufwerk so modifiziert, dass unkomprimierte Datenraten im Bereich von 47 bis 140 MByte/s verarbeitet werden können.


Mirror-Clone: Ein Mirror-Clone wird eingesetzt, um den Aufwand für die Erzeugung eines Clones zu reduzieren. Beim Mirror-Clone müssen nur die inkrementellen Änderungen zwischen zwei Snapshots nachgeführt werden.


NDMP, Network Data Management Protocol: Proprietäres Protokoll, das bei Filern genutzt wird. Das Backup erfolgt sehr schnell, der Restore ist aufwendiger. NDMP umgeht den auch bei einem FC-SAN-Backup notwendigen Umweg über den Backup-Server und schreibt die Daten direkt vom Filer auf die Tape Library. Das macht NDMP so schnell.
Der Backup-Server erhält nur den Report über die gesicherten Dateien. Zu beachten ist, dass der Einsatz einer Deduplizierung nur mit einer für NDMP zertifizierten Dedup-Appliance möglich ist.


Notfallhandbuch: Ein Notfallhandbuch sollte die möglichen Fehlerquellen der Unternehmens-IT analysieren und Gegenmaßnahmen aufzeigen. Wichtig ist auch zu dokumentieren, wer entscheidet, ob überhaupt ein Notfall aufgetreten ist, und wer Anweisungen erteilen darf, einen Restore durchzuführen. Das Notfallhandbuch lässt sich beliebig mit Erfassung aller Services und Service-Owner und dem entsprechenden Wiederherstellungsprozessen erweitern.


Online-Backup: Gemeint ist nicht, die Datensicherung eines Speichersystems im laufenden Betrieb. Bei einem Online-Backup spricht die Backup-Anwendung über eine spezielle Schnittstelle wie RMON mit der Datenbank, die alle Transaktionen kurz anhält, sodass ein stabiler Zustand entsteht. Zusammen mit den Daten aus dem Transaktionslog lässt sich (meistens) ein arbeitsfähiger Restore generieren. Dies sollte ab und zu durch einen Test sichergestellt werden.


Online-Deduplizierung: Der Speicherplatz auf den primären Speichersystemen ist teuer. Warum also nicht direkt die Daten an der Quelle deduplizieren, sprich, komprimieren. NetApp zum Beispiel erlaubt es in einem Post-Prozess, ein Volume zu deduplizieren. Eine Überprovisionierung des Volumes ist damit möglich und auch gleichzeitig eine Gefahrenquelle. Eine gewisse Geschicklichkeit ist notwendig, wenn man das Backup dieses Volumes restaurieren will, da auf dem Tape nur die „entdeduplizierten“ Daten gespeichert werden. Einziger Anbieter ist Commvault, der auch deduplizierte Daten auf Band schreiben kann. Augenblicklich fehlen aber für eine Rücksicherung deduplizierter Daten in den Primärspeicher noch alle Bezugspunkte.


PACS, Picture Archiving and Communication System: Verfahren, um medizinische Daten wie Röntgenbilder (CT, MRT) verlustfrei zu speichern. Beispiel: Jede Herzkatheter-Aufnahme benötigt 5 GByte Speicher. Eine Deduplizierung wäre zwar technisch möglich, bringt aber keine Volumenreduzierung.