Suchen

Data Deduplication Bauplan für die Einmaligkeit

Autor / Redakteur: Wolfgang Weith / Nico Litzel

Die Herausforderung des exponentiellen Daten- und Speicherwachstums bewältigen viele IT-Verantwortliche bislang durch das simple Hinzufügen von immer mehr Primär- und Sekundärspeichern. Eine Technologie wird hiermit aufräumen: Data Deduplication.

Firmen zum Thema

( Archiv: Vogel Business Media )

Das Problem der Lagerkosten beschäftigt die Speicherindustrie schon seit vielen Jahren. Vor einigen Jahren ist sie gar auf das aufwendige Konzept des Information Lifecycle Managements (ILM) verfallen. Ein „interessanter“ Versuch, den Kunden aufgrund unterschiedlicher Plattformpreise eine Speicherhierarchie mit herstellerspezifischem Management schmackhaft zu machen.

Doch jeder Anwender, der hinter die Datenmassen schaut, erkennt nicht nur Datenwachstum, sondern viele Duplikate. Deutlich bei jedem E-Mail-Programm zu sehen, aber auch bei Produktiv- und Testumgebungen. Und wer heute noch sein tägliches Backup macht, weiß, dass hier Lagerflächen x-mal mit den gleichen Daten belegt sind.

Bildergalerie

Manch einer hat schon seit langem ein vernünftiges Löschprogramm gefordert, um der Platzverschwendung auf den Speichersystemen Herr zu werden. Mit Data Deduplication gibt es nun ein Räumkommando, das nicht nur Platz schafft, sondern auch die Verstopfung auf den Informationsstraßen beseitigt. Hier ist nicht die Rede von traditionellen Kompressionsverfahren, die je nach technischer oder vertrieblicher Realität Effizienzen von 1,2:1 oder auch 2:1 erreichen, sondern Verfahren, die weit darüber hinausgehen.

Was bedeutet Data Deduplication?

Anders als Kompression ist Deduplication (deutsch: Deduplizierung) ein technologischer Ansatz, der Daten massiv auf das geringst mögliche Minimum an gemeinsamen und wiederkehrenden Mustern reduziert, was im Vergleich zu den gespeicherten oder transferierten Originaldaten Kapazitätsersparnisse von 20:1 erreichen kann.

Ein kurzes Beispiel soll das erläutern. Abbildung 1 zeigt ein traditionelles Backup ohne Kompression. Die wiederkehrenden Datenmuster werden auf das Band übertragen und verbrauchen dort einen bestimmten Platz. Nehmen wir an, diese Daten werden immer wieder gesichert (wöchentlich, monatlich etc.), so nehmen diese Daten beispielsweise nach drei Backups dreimal soviel Platz ein.

Weiter mit: Klassische Kompressionsmethoden und Deduplizierung im Detail

(ID:2004208)