Herzlich Willkommen

Datenwachstum und virtuelle Maschinen haben ein Storage-Segment extrem belebt – das Backup und selbstredend auch die Umkehrung der Datensicherung, also die Wiederherstellung der Daten von Disk oder Tape.

Für Neulinge in der Terminologie von Backup & Recovery haben wir die diversen Teilprozesse möglichst präzise erläutert, die Profis werden sicherlich in den Beschreibungen viele Details finden, die ihnen neue Sichtweisen eröffnen.


Ich bin mir sicher, dass wir noch viele Begriffe in unserem Lexikon „Backup & Recovery virtueller und physischer Maschinen“ ergänzen müssen. Schreiben Sie an Rainer Graefen wenn Sie selber gerne einen Begriff erklären wollen oder wenn Sie einen vermissen.

Ihr Rainer Graefen
Chefredakteur Storage-Insider.de
 
Diese Begriffe von "File System Performance" bis "Multiplexing" sollten Sie kennen.

File System Performance: Dateisysteme sind langsame Datenlieferanten. Die Kommunikation der Backup-Software über das Betriebssystem wie auch tief gehende Verzeichnisstrukturen kosten viel Performance, sodass eine Single-Stream Backup-Software wie Backup-Exec nicht in der Lage ist, moderne Tape-Laufwerke mit einem kontinuierlichen Datenstrom zu versorgen.
Backup-Software wie Data Protector, Commvault und der TSM, die mehrere Datenströme (Multiplexing) gleichzeitig unterstützt, ist zwar flotter beim Backup, kann dafür dann aber beim Restore nicht mit der Single-Stream-Lösung mithalten. Ziel des Backups muss es jedoch sein, das Tape zum Bottleneck zu machen.
Zum Vergleich:
•    Die File Systeme Performance bei Windows liefert Daten mit 7 bis 15 Megabyte pro Sekunde ab.
•    Suse-Linux-Dateisysteme (Samba-Server mit Linux-Media-Agenten) transportieren Dateien mit bis zu 120 MByte/s.
•    Bei Datenbanken wie Oracle auf HP-UX bringt es die Backup-Software komprimiert auf 450 MByte/s pro Laufwerk.


Hypervisor: VMware, Hyper-V und Xen sind die bekannteren Hypervisoren. Obwohl sie dem Gast-Betriebssystem alle auf ähnliche Art und Weise die Ressourcen des Hosts zur Verfügung stellen, unterscheiden sie sich bei den Backup-Funktionen erheblich voneinander. Während VMware sich über VAAI und vStorage-APIs mit vielen modernen externen Speichersystemen verständigen kann, versucht Microsoft bei Hyper-V in Windows-Umgebungen mittels VSS konsistente Bedingungen bei der Datensicherung herstellen. Bei XEN ist der Administrator auf Scripts angewiesen.


Hyper-V: Hat Schnittstelle zu VSS. Das wird von vielen Backup-Programmen unterstützt. Ein Tool ist DPM.


Inkrementelle Datensicherung: Eine inkrementelle Datensicherung unterstellt zu Beginn ein Voll-Backup. Sichert man nur die geänderten Dateien seit dem letzten Voll-Backup spricht man von inkrementeller Datensicherung. Die Backup-Software setzt bei dieser Backup-Variante das Archiv-Flag zurück.
Vorteil: Beim inkrementellen Backup sind relativ betrachtet nur wenige Daten zu sichern.
Nachteil: Müssen Daten wiederhergestellt werden, sind neben dem Vollbackup alle inkrementellen Backup in der richtigen Reihenfolge zurück zu spielen. Das ist zeitaufwändig.


I/O, Input/Output, Ein-/Ausgabeoperation: Beim Datenzugriff auf die Festplatte entsteht mindestens ein I/O. Die Festplatte stellt diese Daten in einem internen Cache-Bereich zur Verfügung. Wie viele I/Os pro Sekunde eine Festplatte liefern kann, ist ein Folge ihrer Drehzahl und ihrer Zugriffsgeschwindigkeit. Als Faustregel kann man hier der Einfachheit halber den Kehrwert der Zugriffsgeschwindigkeit nehmen, der typischerweise zwischen vier und 15 Millisekunden liegt. Die Leistungsfähigkeit der Festplatte wird über die Anzahl von I/O pro Sekunde (IOPS) beschrieben.
Für SATA-Festplatten gelten im Lesebetrieb als Faustregel 80 I/Os, bei schnell drehenden SAS-Festplatten kann man von 150 bis 250 I/O pro Sekunde ausgehen. Im Produktivbetrieb besteht allerdings ein Mix aus Lese- und Schreiboperationen (60:40), sodass von niedrigeren Werten auszugehen ist. Bei VMware wird allerdings weniger gelesen als geschrieben, sodass sich das Verhältnis auf 40:60 umdreht.


iSCSI-Backup-Device, iSCSI-Disk-Device: Nachdem virtuelle Maschinen meist wenig mit FC anfangen können und so die Performance dieses Protokolls bei Backup und Restore nicht genutzt werden kann, kann man entweder Agenten oder das iSCSI-Protokoll für die Datensicherung und -wiederherstellung einsetzen. Das iSCSI-Backup-Device, die Library, wird bei dieser Variante direkt per vSwitch, Netzwerkkarte mit vier Ports und Netzwerkswitch in die virtuelle Maschine integriert.


iSCSI-SAN: Ein iSCSI-SAN sollte wie ein FC-SAN geplant werden. Um die Hochverfügbarkeit der Transportwege zu gewährleisten, sind redundante Datenpfade wie Switche einzuplanen Die Switche sollten Jumbo Frames transportieren können und Flow Control beherrschen.


Image: „Im Unterschied zu einem Backup enthält ein Image Informationen über die (Dateisystem-)Struktur des Originaldatenträgers inklusive des Master Boot Records, da die Rohdaten gelesen werden und nicht nur die Dateien. Dies ermöglicht es, schnell exakte Kopien eines Datenträgers herzustellen. Die hohe Geschwindigkeit, mit der ein Abbild hergestellt werden kann, resultiert aus der Möglichkeit, direkt Hardwarefunktionen aufzurufen, um die Daten zu lesen oder zu schreiben“, lautet ein Teil der Wikipedia-Definition. Ein Image ließe sich damit für ein Bare Metal Recovery einsetzen. Ein Image lässt sich fast immer in ein VMDK-File zurückspeichern und per virtueller Maschine bearbeiten.
Inzwischen gibt es Image-Software, die sich nicht nur komplett zurücksichern lassen, sondern auch einen Einzeldatei-Restore erlauben. Für Datenbanken sind solche Funktionen allerdings noch nicht vorhanden.


Migration virtueller in physische Maschinen und zurück: Unverzichtbar für das Disaster Recovery in virtualisierten Umgebungen. Ausnahmsweise steht nicht der Anbieterwechsel im Vordergrund, sondern die Aus- wie die Rückverlagerung von virtuellen Maschinen inklusive der Daten. Letzteres stellt die große Herausforderung für alle Virtualisierungsanbieter dar, da die Bewegung größerer Datenmengen zwischen zwei Standorten nur mit tiefen Griffen in die technische Trickkiste zu bewältigen ist. Während für VMware-Umgebungen viele, auch von Storage-Herstellern, Verfahren für die unterbrechungsfreie Migration und Weiterbenutzung zur Verfügung stehen, besteht bei Microsoft Nachholbedarf. Windows Server 8 soll Hyper-V fähig werden, sodass die gesamten Daten auch ohne den Virtual Machine Manager über das Netzwerk kopierbar werden sollen.


Multiplexing: Um einem schnellen Bandlaufwerk dauerhaft genügend Daten liefern zu können, verschachtelt die Backup-Software mehrere Datenströme aus unterschiedlichen Verzeichnispfaden oder mehreren Dateisystemen.