Data Deduplication

Bauplan für die Einmaligkeit

Seite: 3/3

Anbieter zum Thema

Um dem entgegen zu wirken, können aus den deduplizierten Daten bei Bedarf synthetisch Voll-Backups erzeugt werden und auf Medien geschrieben werden, die dann beispielsweise als Disaster-Recovery-Medien für eine schnelle Wiederherstellung dienen.

Die Virtuellen Tape Libraries, die ohnehin nur Medien emulieren, arbeiten häufig nicht auf der File- sondern auf Block- oder Bitmusterebene. Schon deshalb sind diese Systeme für die Dubletteneliminierung prädestiniert. Da hier die Deduplizierung auf der Ebene der VTL-Hardware erfolgt, muss die Backup-Applikation keine spezielle Fähigkeit zur Deduplizierung haben.

Bildergalerie

Beispiel Netzwerktransfer

Der zweite spannende Bereich ist die Deduplizierung von Daten im Transit. Vor allem bei einer Übertragung über das WAN spielen geringe Bandbreiten und hohe Latenzen ein traurige Rolle, da WAN-Verbindungen meistens weniger als ein Zehntel der Bandbreite bereitstellen, die die lokalen Systeme (LAN oder SAN) bieten. Deduplizierung wird hierbei in der Regel mit Übertragungs-Devices an beiden Enden der WAN-Strecke realisiert, die Daten intelligent analysieren und zwischenspeichern, um dann nur die jeweiligen Referenzen (oder Wiederaufbau-Anleitungen, auch Hashes genannt) an die Gegenstelle zu übertragen. Nur neue und bisher nicht bekannte Datenmuster müssen hierbei einmalig komplett übertragen werden. Wurden Datenmuster schon einmal übertragen, sind sie bekannt und können durch die jeweiligen Hashes ersetzt werden. Dadurch erscheint es so, als würde der Netzwerktransfer tatsächlich beschleunigt. Das Schöne an diesen Lösungen ist, dass die Wahrscheinlichkeit für wiederkehrende Datenmuster mit zunehmender Betriebsdauer und zunehmenden Datenvolumina steigt.

Kosten-/Nutzenüberlegungen

Aufgrund der vorangegangen Ausführungen sind auch die Kosten-Nutzenüberlegungen sehr klar. Zu Beginn der Einführung von Deduplication-Lösungen stehen die Anschaffungskosten. Gerade wenn Hardware wie Virtuelle Tape Libraries oder WAN-Optimierer angeschafft wird, mögen zunächst beträchtliche Kosten entstehen.

Aufgrund der Natur der Deduplizierungslösungen steigt aber der potenzielle Return on Invest (ROI) mit zunehmender Betriebsdauer überproportional schnell an, weswegen diese intelligenten Systeme klassischen Systemen (die nur komprimieren) definitiv vorzuziehen sind. Es braucht keine hellseherische Kraft, um vorherzusagen, dass wir in Zukunft sehr viele dieser Lösungen in allen Bereichen der Storage-Infrastruktur sehen werden.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

(ID:2004208)