Suchen

Atempo macht mit Software-basierter Deduplizierung die Daten kleiner

Der Dedup-Algorithmus löst sich langsam von der Appliance

Seite: 3/3

Firma zum Thema

Methode Just in Time

Bei der Inline-Deduplizierung hingegen wird der Datenstrom noch vor dem Speichern auf dem Backup-Medium bearbeitet. Das kostet allerdings Backup-Performance. Der Zeitverlust wird aber durch die geringeren Volumina kompensiert, die für das Disk-System notwendig sind.

Unter Umständen muss die Deduplizierung mit Systemen zum Bandbreitenmanagement kombiniert werden, um durchschlagende Resultate zu erzielen. Welche der beiden Methoden für die vorhandene Speicherumgebung geeignet ist, sollten Unternehmen vor dem Kauf sowohl mit langsameren Backups mit vielen unstrukturierten Dateien als auch mit schnelleren, Datenbank-basierenden Backups testen.

Anbieter wie Quantum – einer der Vorreiter der Deduplizierungstechnologie – verfolgen einen Hardware-basierten Deduplizierungsansatz mit Disk-Backupsystemen als Virtual Tape Library oder NAS-Share. Quantum bietet Anwendern außerdem die Möglichkeit, zwischen Inline- und Post-Processing Deduplizierung – oder auch nativer Dateneinspeisung ohne Deduplizierung – zu wählen.

Für jeden Speicherbedarf ein passendes Gerät

Allgemein kann man bei den Systemen von einer Datenreduktion um den Faktor zehn bis fünfzig ausgehen, wenn Deduplizierung konsequent für das Backup eingesetzt wird. Auch die Hardwaresysteme setzen dabei zusätzlich Kompressionsalgorithmen ein. Bei Konica Minolta konnte der Bedarf an Festplattenspeicher durch zwei Quantum DXi7500 mit 54 TB und 18 TB um mehr als 95 Prozent gesenkt werden – das entspricht einer Deduplizierungsrate von 26:1.

Mittlerweile gibt es nicht nur Disk-Appliances mit großen Datenkapazitäten für Enterprise Rechenzentren, sondern auch spezielle Lösungen für mittelständische Unternehmen oder Niederlassungen mit weniger Kapazität.

Diese machen Software-basierter Deduplizierung direkte Konkurrenz beim Sparen von Bandbreite bei der Datenübertragung zwischen zwei Standorten. Denn wie die Software-Variante sorgen die Disk-Appliances für Deduplizierung vor Ort und können im Anschluss die deduplizierten Backupdaten ebenfalls übers WAN mit geringen Bandbreiten an eine zentrale Stelle übertragen.

Fazit

Bei ein und derselben Deduplizierungslösung können die Deduplizierungsraten in jedem Unternehmen unterschiedlich ausfallen, je nach Datentyp, Häufigkeit von Datenänderungen und sogar der Backupstrategie.

Das gilt für Hardware-basierte Lösungen ebenso wie für Software-basierte. Es gibt keine allgemeingültige Strategie, aber eines steht fest: Deduplizierung schrumpft zwar das Datenvolumen, aber sie verursacht auch Arbeitslast auf dem System, auf dem sie ausgeführt wird – egal ob Produktionsserver, Backupserver oder Speicherhardware.

Die Wahl des Orts innerhalb der IT-Architektur, an der die Technologie zum Einsatz kommen soll, hängt also davon ab, wo die notwendigen Ressourcen vorhanden sind oder einfach eingefügt werden können. Entscheidet sich ein Unternehmen für Software-basierte Deduplizierung, muss als Grundvoraussetzung genügend CPU-Leistung auf den Servern vorhanden sein.

Unternehmen, deren Systeme nicht komplett ausgelastet sind und keine neue Hardware anschaffen wollen, sind mit Software-basierter Deduplizierung gut bedient. In Unternehmen mit ohnehin hoher Serverauslastung – beispielsweise durch Virtualisierung – wird Hardware-basierte Deduplizierung vielen Fällen sinnvoller sein.

(ID:2043975)