Das Special von Storage-Insider zum Brennpunktthema

Warum ist Deduplizierung wichtig?

Kommt drauf, an welches Argument Sie überzeugen könnte. Der technische Begriff selbst gibt einen ersten Hinweis, worum es geht: Entdoppelung! Keine Chance mehr für Kopien, heißt die oberste Devise dieser Technik.

Den ersten Einsatz hat Deduplizierung bei der Datensicherung gehabt. Nirgendwo werden mehr Ressourcen verbraucht. Wer beim Backup altbewährte Vorgehensweisen praktiziert, kopiert an jedem Wochenende den gesamten Datenbestand auf ein oder mehrere Bänder, alle drei Monate lang wird eine Vollsicherung beiseitegelegt und dann wird jedes Quartal und jedes Jahr noch eine Vollsicherung in einem externen Schließfach untergebracht. Der gesamte Datenbestand des Unternehmens ist damit zwölfmal auf Bändern gespeichert – und ein dreizehntes Mal auf den Speichersystemen selbst.

Deduplizierung geht aber weit darüber hinaus, nur die Kopie einer Datei zu eliminieren. Digitale Daten haben in sich selbst sehr viele Wiederholungen. Mit ein wenig Rechenarbeit lassen sich auch diese binären Kopien finden und durch eine Art Fingerabdruck, der weniger Speicherplatz benötigt, ersetzen.

Das Datenwachstum an sich lässt sich mit Deduplizierung nicht aufhalten, aber auf jeden Fall durch die Entdoppelung dramatisch reduzieren. Je nach Art der Daten kann man von einer Kapazitätseinsparung zwischen Faktor 10 bis Faktor 40 ausgehen. Da noch eine externe Kopie des Datenbestandes notwendig ist, ließe sich der gesamte Datenbestand eines Unternehmens im günstigsten Fall auf weniger als der doppelten Speicherkapazität der Primärdaten reduzieren.

Neben diesen internen Aspekten gibt es auch externe Belege für die Bedeutung der Deduplizierungstechnik. Nie zuvor wurden Start-ups so schnell vom „Markt“ absorbiert. Quantum, Hersteller von Bandbibliotheken, baut seine Zukunft auf dieser Technik; EMC kaufte Avamar und kooperierte gleichzeitig mit Data Domain und Diligent. IBM wollte eine eigene Deduplizierungstechnik entwickeln, hat dies anscheinend, wie auch die Zusammenarbeit mit Falconstor, zugunsten der Übernahme von Diligent aufgegeben. Weitere interessante Kandidaten sind Exagrid und Sepaton, die nun langsam auf dem deutschen Markt sichtbar werden. Exagrid arbeitet mit einer speziellen Inline-Technik, und Sepaton bezieht als einziger Anbieter die Anwendung in die Entdopplung ein und dedupliziert „Application aware“.

PS: Anwender, die sich für diese Technik interessieren, sollten sich gut mit den Argumenten der beiden Deduplizierungs-Fraktionen Inline- respektive Postprocessing auseinandersetzen. Das Wichtigste aus der aktuellen Berichterstattung im Bereich Deduplizierung.

Weitere Artikel zum Thema Deduplizierung

Quantum und Fujitsu kooperieren. Fujitsu integriert Quantums Deduplizierungstechnik in die Eternus CS High End Data Protection Appliances. (Fujitsu Technology Solutions)
Fünf Mal höhere Skalierbarkeit als vergleichbare Systeme

Fujitsu stattet Eternus CS High End mit Deduplizierung von Quantum aus