Anbieter zum Thema
Was ist Deduplizierung?
Sinn der Daten-Deduplizierung ist es, redundante Dateien, Bytes oder Datenblöcken zu entfernen, um zu gewährleisten, dass mehrfach vorhandene Daten nur einmal auf einer Festplatte gespeichert werden. Während der Deduplizierung wird die Datei zerlegt, jedem Einzelteil wird eine separate Nummer zugeordnet, die wiederum in einem Index gespeichert wird. Jeder Teil wird nur einmal gesichert, weitere identische werden im Index vermerkt.
Datendeduplizierung bietet zahlreiche Vorteile:
- Bedeutende Verringerung der erforderlichen Backup-Kapazität um durchschnittlich das 10- bis 20-Fache.
- Weit größere Netzwerkbandbreite im Backup-Prozess.
- Reduzierung von Übertragungszeiten.
- Vereinfachte Backup-Verfahren, verringerter Einsatz von Sekundärspeichern, Bändern etc.
- Enormes Einsparpotenzial bei den Kosten für Festplatten sowie unter anderem für die Stromversorgung und Kühlung.
Die Deduplizierung erfordert jedoch einen hohen Bedarf an Rechenleistung und Speicherplatz. Die Aufrechterhaltung der Leistung setzt zudem eine Optimierung der Indexgröße voraus. Dieser befindet sich für gewöhnlich im Festplatten-Cache des Deduplizierungs-Servers, der einen begrenzten Speicherplatz aufweist.
Verschiedene Arten der Deduplizierung
- Inline-Deduplizierung: Die Deduplizierung findet Host-seitig in der Backup-Anwendung oder in einer Appliance im Datenpfad statt. Diese Methode ist besonders effizient, wenn eine Verringerung des Speicherplatzes und eine starke Reduzierung der durch das Backup verursachten Netzwerkbelastung angestrebt werden. An entfernt liegenden Niederlassungen mit schwachen Links und virtualisierten Servern ist die Inline-Deduplizierung besonders zu empfehlen, da sie die ein- und ausgehende Datenmenge auf den Netzwerkadaptern reduziert. Abstriche sind bei der Performance und bei der Kapazität hinzunehmen. Daher ist das Inline-Verfahren besonders für Datenmengen unter zehn Terabyte geeignet.
Offline- oder Post-Process-Deduplizierung: Die Deduplizierung wird vom System oder einer Appliance vorgenommen, die sich außerhalb des Datenpfades befindet, und findet erst statt, wenn das Backup abgeschlossen ist. Dieses Verfahren ist weniger effizient, wenn es um die Freigabe von Speicherkapazität geht, kann jedoch bei Volumen von über zehn Terabyte eingesetzt werden, insofern das System für einen Datenempfang im Vorfeld der Deduplizierung ausgelegt ist.
Beide Verfahren bieten Vorteile, jedoch stellt sich eine wesentliche Frage: Warum sollten der Deduplizierung alter oder geschäftsirrelevanter Daten ohne Wert für das Unternehmen wichtige Ressourcen zugeteilt werden?
Weiter mit Storagemanagement kombiniert mit Deduplizierung lohnt sich
(ID:2019350)