Deduplizierung in der Datensicherung

Arcserve setzt beim Backup globale Deduplizierung ein

| Autor / Redakteur: Andreas Lappano* / Rainer Graefen

(Arcserve)

Wir benötigen neue moderne Technologien, um dem unaufhaltsamen exponentiellen Wachstum von virtuellen Maschinen und Datenvolumina standzuhalten. In diesem Artikel werden zwei unterschiedliche Backup-Deduplizierungstechnologien verglichen und ihre Unterschiede beschrieben.

Zu viele Daten, zu wenig Zeit, nicht genügend Speicherplatz und natürlich ein knappes Budget. Kommt Ihnen das bekannt vor? Schon seit der Erfindung der ersten Großrechner gibt es Bemühungen, Speicherkapazitäten und Datensicherungsprozesse zu optimieren.

Auch bei den offenen Systemen von heute haben sich die oben erwähnten Probleme seit der Markteinführung der ersten Datendeduplizierungstechnologien vor Jahren nicht verändert. Backups funktionieren nicht, nehmen zu viel Platz in Anspruch und sind zu teuer.

Das Backup-Fenster passt nicht zur Datenflut

Heutzutage wachsen die Datenvolumina exponentiell und Unternehmen aller Größen haben mit diesem mittlerweile kostspieligen Problem zu kämpfen. Natürlich helfen preiswerte Speicher, doch stellen sie für viele Workloads keine geeignete operative Lösung dar. Der Datenumfang muss einfach auf ein praktischeres Maß reduziert werden. Zu viele Daten stellen ein ernsthaftes Problem für Unternehmen dar:

  • Unternehmen überdimensionieren ihre teure Backup-Infrastruktur.
  • Veraltete Systeme sind der Datenflut nicht gewachsen, sodass die Backups zu lange dauern oder nicht vollständig abgeschlossen werden können.
  • Unternehmen können Ihre Vorgaben für Wiederherstellungspunkte und -zeiten nicht einhalten.
  • Backup-Datenströme überlasten Infrastrukturen und die Netzwerkbandbreiten.
  • Unternehmen können keine neuen Technologien wie Cloud-Backups einführen, weil zu viele Daten über Wide Area Networks übertragen werden müssen.

In den letzten Jahren ist Unternehmen zunehmend klar geworden, dass Ihre traditionellen Backup-Architekturen nicht mehr ausreichen, um das Backup-Fenster einzuhalten. Neben der Backup-Leistung mussten sie zudem mit den grundlegenden Kosten für die Speicherung von großen Datenvolumina kämpfen.

Ziel-Deduplizierung

Im gleichen Maße, wie die Backup-Schemata zu implodieren begannen, fingen die Speicherkosten an zu explodieren. Dieses Problem wurde vorzugsweise mit Deduplizierungs-Anwendungen gelöst. Der Prozess umfasst das Abrufen der Backup-Daten, die Optimierung durch Deduplizierung und schließlich die Speicherung am Zielort. Das Konzept ist einfach: Sie „komprimieren“ Ihre Backup-Daten am Zielort und sparen so bares Geld.

Die Ziel-Deduplizierung funktioniert seit langem gut und wird noch immer in zahlreichen Umgebungen eingesetzt. Diese Lösung ist sehr attraktiv, weil sie die Benutzer nicht dazu zwingt, ihre Softwarekonfigurationen und Backup-Richtlinien grundlegend zu ändern. Es ist nur erforderlich, das Ziel der Backup-Datenübertragung zu ändern.

Die Ziel-Deduplizierung findet entweder direkt oder als Nachbearbeitungsprozess statt (Optimierung nach der Speicherung, um das eigentliche Backup zu beschleunigen). Bei der Ziel-Deduplizierung ist es die Aufgabe der Backup-Software, den Datenstrom der unbearbeiteten Backup-Daten auf das Ziellaufwerk oder VTL-System zu lenken.

Globale quellenseitige Deduplizierung

Warum Daten erst nach der Übertragung deduplizieren, wenn man nur die neuen und einzigartigen Datensätze im Zielsystem sichern will? Sofern der Client nicht beeinträchtigt wird, kann man so die erhebliche Bandbreite verringern, die benötigt wird, um Backup-Daten an das Ziellaufwerk zu übertragen.

Warum sollte die Deduplizierung nicht auch gleichzeitig für alle Clients eingesetzt werden? Dieser Ansatz nennt sich globale quellenseitige Deduplizierung; und das ist es auch, was die Industrie anstreben sollte. Viele Endbenutzer haben die globale quellenseitige Deduplizierung als die wichtigste Backup-Technologie der Zukunft erkannt. Das größte Problem der globalen quellenseitigen Deduplizierung ist es, sicherzustellen, dass das Quellsystem (der Client) nicht durch die Deduplizierungssoftware verlangsamt wird.

Hier kommt der Begriff „Global“ ins Spiel. Denn die gleichzeitige quellenseitige Deduplizierung aller Clients in der Infrastruktur ist von grundlegender Bedeutung, um zu verhindern, dass Backup-Daten unnötigerweise doppelt übertragen und gespeichert werden. Die Daten werden über Knotenpunkte, Jobs und Standorte hinweg dedupliziert. Die globale Deduplizierung überbietet die Fähigkeiten von Netzwerkanbietern, die ausschließlich den replizierten WAN-Cache, und nicht das ganze Laufwerk deduplizieren, was die potenziellen Vorteile für Bandbreite und Speichernutzung reduziert.

Für die Datensicherung aller lokalen und Remote-Standorte (private Cloud) wird der Datenbankindex für die globale Deduplizierung nachgebildet und verteilt, damit alle Quell- und Zieldaten auf allen Backup-Servern dedupliziert werden. Da die Backup-Daten im gesamten System dedupliziert und erst dann an den Ziel-Backupserver übertragen werden, werden nur geänderte und neue Daten über das Netzwerk gesendet, was die Übertragungsleistung verbessert und zu einer geringeren Bandbreitennutzung führt. Dieser gesamte Vorgang wird mit Datenverschlüsselung auf Speicherebene und der erneuten Passworteingabe für jede Sitzung geschützt.

Zusammenfassung

Durch die schnelle Verbreitung von Festplatten als Backup-Speicher hat die zielseitige Deduplizierung bedeutende Vorteile für die Speichereffizienz bei nur minimalen Störungen der bestehenden Backup-Software mit sich gebracht.

Die globale quellenseitige Deduplizierung stellt die neueste Technologie zur Steigerung der Backup-Speichereffizienz dar. Es handelt sich dabei nicht nur um eine bessere Technologie, sondern sie bietet auch Vorteile für Unternehmen:

  • Schnellerer Abschluss von Backups. Da weniger Daten übertragen und gespeichert werden, sind Backups schneller fertig. Das ist besonders wichtig, wenn das zu sichernde Gesamtdatenvolumen so groß ist, dass die Gefahr besteht, dass das nächste Backup bereits beginnt, bevor das erste abgeschlossen ist.
  • Geringere Bandbreite. Der Backup-Server ruft von einem Client nur neue oder geänderte Daten ab, und das mit einer hohen Granularität, die sogar bis zu 4-KB-Paketen reichen kann. Dadurch werden die Backup-Prozesse äußerst effizient.
  • Bessere Client-Leistung. Für virtualisierte Umgebungen reduzieren agentenlose VMware und Hyper-V Backups das Risiko von Engpässen und Leistungsabfällen auf Hardware-Ebene. Kurz gesagt, sie stellen sicher, dass die Backups die virtuellen Server nicht überlasten.
  • Einfachere Backup-Infrastrukturen. Es ist einfacher damit, Backup-Daten an verschiedene Standorte zu übertragen, zum Beispiel mit Azure oder Amazon Web Services in die Cloud, auf lokale Tape-Laufwerke oder eine private Cloud an einem anderen Standort. Durch die integrierte LAN- und WAN-Optimierung erfolgen alle Datenübertragungen schneller.
  • Verbesserte Stabilität und Verfügbarkeit. Die die Deduplizierungsdaten zentral auf dem Backup-Server gespeichert werden, wird es einfacher, die Backup-Infrastruktur zu schützen. So können zum Beispiel alle Informationen im Datenspeicher in die Cloud oder auf einen anderen Server im selben Rechenzentrum oder an einem anderen Standort repliziert werden.
  • Erfüllung von SLAs für Wiederherstellungspunkte und -zeiten. Mit der globalen quellenseitigen Deduplizierung können RPO- und RTO-Vorgaben einfacher eingehalten werden. Wenn weniger Daten übertragen werden, können Backups häufiger stattfinden und schneller abgeschlossen werden.

Die globale quellenseitige Deduplizierung ist in den Backup-Server integriert und beruht auf einem Datensicherungssystem der nächsten Generation. Alte Backup-Lösungen wurden nicht für die Deduplizierung entwickelt und können daher keine globale quellenseitige Deduplizierung bieten. Wenn Sie nach Produkten für die Datensicherung suchen, halten Sie die Augen nach neuen Lösungen offen, die globale quellenseitige Deduplizierung anbieten. Sie werden es nicht bereuen.

* Andreas Lappano ist Sales Director DACH bei Arcserve

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43527720 / Deduplizierung)