Anbieter zum Thema
Die derzeitigen Unzulänglichkeiten beim Backup
Bis heute sind vier wesentliche Komponenten beim Backup involviert: der Client, die verwendete Infrastruktur für die Kommunikation, der Backupserver und das Zielmedium. Beim detaillierten Betrachten fällt auf, dass Vieles im Gesamtkonstrukt technologisch nur wenig auf das Thema Backup und dessen Eigenschaften sowie Herausforderungen optimiert ist.
Der eine Typ Client hält eine große Anzahl an Dateien vor, in Ausnahmefällen bis zu mehrere Millionen. TCP/IP und das darauf aufsetzende CIFS-Protokoll ist für eine performante Übertragung vieler kleiner Dateien gänzlich ungeeignet. Abhilfe kam mit der Entwicklung von NDMP (Network Data Management Protocol), sodass die Daten direkt und sehr performant vom Speicher auf das Backup Device, wie etwa eine Tape Library, gesichert werden konnten.
Die Entlastung von Client, Netzwerk und Backupserver sprechen für NDMP, die fehlende Cross-Plattform-Unterstützung trübt das Bild. Da die Storage-Hersteller unterschiedliche Methoden zum „Einsammeln“ der Daten nutzen – wie tar, dump oder cpio –, können Daten nur auf der gleichen Plattform wiederhergestellt werden.
Der andere Typ Client beheimatet Applikationen, die große Datenmengen verarbeiten. Diese Arbeitstiere sind mit einer hohen Anzahl CPUs und Arbeitsspeicher ausgestattet. Es lag daher nahe, die zu sichernden Daten nicht erst über den Backupserver zu schicken, sondern ebenfalls direkt auf das Tape Device. EMC nennt diese Clients „Storage Nodes“.
Konsequenterweise orientierte sich bis dahin das Backup am Tape. Sowohl NDMP als auch Storage Nodes konnten lange Zeit nur Tape bedienen. Die Unterstützung für Backup-to-Disk war später gegeben, eine echte Alternative wurde es aber auch hier erst wieder im Zusammenspiel mit Deduplizierung.
Das Boost-Protokoll von EMC
Der Anfang vom Ende der Unzulänglichkeiten wurde von EMC durch die Einführung des Boost-Protokolls eingeläutet. Von Grund auf für Backup und Restore entwickelt, könnten Backupkonzepte neu überarbeitet werden müssen. Was macht Boost und welcher Nutzen erschließt sich daraus?
Fand das Deduplizieren der Daten bisher komplett auf einer Data Domain statt, werden nun Teile davon auf den Backupserver oder Storage Node verlagert. Auf diese Weise werden zwischen Storage Node und Data Domain nur nicht redundante Datensegmente übertragen. Der Sicherungskatalog bleibt nach wie vor beim Backupserver, der eigentlichen Kontrollinstanz über Backup und Restore.
(ID:37320540)