Definition

Was ist Copy Data Management und welchen Nutzen bietet es?

| Autor / Redakteur: Peter Eicher, Director of Marketing at Catalogic Software / Rainer Graefen

(Bild: Catalogic)

Copy Data Management (CDM) ist eine relativ neue Kategorie von IT- Lösungen, welche der Erstellung, Nutzung, Verteilung, Speicherung und Verwaltung von Produktionsdaten oder Versionen von Datenkopien dient.

Datenkopien sind alle Daten, die derzeit nicht produktiv verwendet werden. Dieses können Snapshots, Sicherungen oder Repliken einer Version sein, die für verschiedene IT- oder Business-Funktionen erstellt wurden, wie zum Beispiel Datenwiederherstellung, Dev-Test, Datenanalysen und ähnliches.

Die CDM-Kategorie wächst schnell aufgrund diverser Anforderungen in der IT:

  • 1. Das Kopieren von Daten verbraucht viel Speicherkapazität und wächst um ein Vielfaches gegenüber den Produktionsdaten (oftmals mit dem Faktor 20).
  • 2. Die Nachfrage nach Zugang zu aktuellen Kopien von Produktionsdaten ist sprunghaft gestiegen, sowohl für traditionelle IT-Funktionen, als auch für neue Anwendungsfälle, wie DevOps und Dev-Test.
  • 3. Bis vor Kurzem gab es keine zentrale Lösung zur Erstellung und Verteilung von Datenkopien. Somit mussten sich die meisten IT-Organisationen auf eine komplexe Mischung aus Skripten und spezialisierten Tools ohne zentrale Steuerung verlassen.

Heute sind CDM-Lösungen von verschiedenen Anbietern auf dem Markt erhältlich und die Investitionen in diesem Bereich steigen an.

Die Copy Data Herausforderung

Das Problem mit Datenkopien ist: es gibt einfach zu viele Kopien. Die Herausforderung beginnt in der IT-Abteilung, die eine Aufgabe hat, Datenkopien für Backup-Zwecke zu erstellen. Dutzende von Kopien müssen für die Wiederherstellung bereitgehalten werden und diese Anforderung schließt lokale Kopien und Remote-Kopien für Disaster Recovery mit ein. Aber das ist nur der Anfang.

Die häufigsten Anwendungsfälle finden sich in folgenden Bereichen wieder:

  • Software Entwicklung und Test
  • Software Qualitätssicherung (QA) und Prüfung
  • Reporting und Analyse
  • Gesetzliche Vorschriften
  • Internes Systemtraining

Diese und andere Fachabteilungen verlangen häufigen Zugriff auf Daten. Nicht nur, dass dies den Speicherplatzbedarf drastisch steigen lässt, zusätzlich steigt hierdurch auch der Aufwand und die benötigte Zeit innerhalb der IT-Abteilung. Die resultierenden Probleme liegen auf dem Tisch.

Laut einer aktuellen IDC Studie werden Datenkopien Kosten in Höhe von 50 Milliarden US-Dollar bis 2018 verursachen. IDC schätzt, dass Datenkopien für bis zu 60 Prozent des Datenwachstums verantwortlich sind und es gibt keine Hinweise auf eine Trendwende.

Die Lösung des Copy Data Problems

Die potenziellen Auswirkungen einer CDM-Lösung sind signifikant und sofortige und immense Vorteile ermöglichen.

Die Grundfunktion einer CDM-Lösung besteht darin, die Erstellung und Nutzung von Datenkopien zu übernehmen und deren Verwaltung in einem Tool zu vereinheitlichen. CDM erlaubt es Ihnen, eine einzelne Datenkopie für mehrere Zwecke zu verwenden. Wenn Sie zum Beispiel fünf Entwickler haben, die jeweils eine Kopie Ihrer Oracle Datenbank benötigen, würden Sie fünf vollständige Kopien der Datenbank erstellen, die fünfmal so viel Speicherplatz benötigen. Mit CDM sind Sie in der Lage, eine Kopie für alle fünf Entwickler unabhängig voneinander zu verwenden.

Es ist wichtig, sich der Leistungsanforderung dieser geteilten Kopie bewusst zu werden. Falls diese auf einem herkömmlichen Festplattenspeicher beruht, mögen die IOPs nicht ausreichend sein, um alle 5 Entwickler zufrieden zu stellen. Ein All-Flash Speicher System kann problemlos mit diesem Anforderungsprofil umgehen.

Copy Data Management Architektur

Es gibt zwei gängige CDM-Architekturen:

Die erste ist wie ein Backup-Modell entworfen. Daten werden vom primären Speicher über den Host-Server zu einem sekundären Speichersystem kopiert. Kopien werden dann von diesem System gemounted und dem Endbenutzer zur Verfügung gestellt. Diese Methode wurde durch Actifio bekannt und wird außerdem von Rubrik und Cohesity verwendet.

Der Hauptvorteil dieses Modells ist, dass es mit jedem primären Speicher arbeiten kann. Allerdings kann der Copy Data Prozess die Host-Performance beeinflussen, insbesondere bei Datenbanksystemen. Zudem müssen Sie bei diesem Modell neue zusätzliche Hardware verwalten und managen, was zusätzliche Arbeit und Aufwand bedeutet.

Der zweite Ansatz besteht darin, Copy Data Dienste unter Verwendung der Kopiermerkmale des primären Speicherarrays bereitzustellen. Dies wird als In-Place oder integriertes Copy Data Management bezeichnet und wurde erstmals von Catalogic vorgestellt.

Nachfolgend haben IBM und EMC eigene In-Place CDM Lösungen vorgestellt. Mit dem integrierten CDM können Sie Kopien auf dem primären Speichersystem verwenden oder die Daten auf ein zweites Gerät replizieren und als CDM Quelle benutzen.

Dies ist eine typische In-Place Copy Data Management Architektur

Der zu berücksichtigende Faktor einer In-Place Architektur ist, dass die Software den vorhandenen Storage unterstützen muss.

Wenn die Unterstützung vorhanden ist, hat das In-Place Modell entscheidende Vorteile.

  • Erstens, arbeitet es mit dem vorhanden Speichersystem und es gibt somit keine Notwendigkeit, ein neues Storage-System anzuschaffen.
  • Zweitens, wenn Sie CDM für Dev-Test Zwecke verwenden, ist es hilfreich, Anwendungen auf dem gleichen Storage-Stack zu entwickeln, der auch als Produktivsystem verwendet wird.

Falls das nicht der Fall ist, kann es Probleme im Troubleshooting geben. Schließlich können In-Place-Storage Snapshots verlorene Dateien innerhalb von Minuten wiederherstellen, da keine Daten über das Netzwerk transferiert werden müssen. Dies kann vor allem bei versehentlich gelöschten Datenbanken, Dateifehlern und Virenangriffen kritisch sein.

Ein paar gemeinsame Merkmale sollten in jedem echten CDM-Angebot vorhanden sein. Dinge, auf die Sie achten sollten:

  • Zentraler Katalog
  • Eine CDM-Lösung sollte einen zentralen Katalog haben, der alle unternehmensweiten Kopien, einschließlich aller Remote-Standorte und Cloud-Umgebungen beinhaltet und alle Metadaten jeder Kopie verwaltet, einschließlich der Möglichkeit, die mit einer Anwendung oder VM verknüpften Kopie zu finden.
  • Policy Engine
  • Das CDM-Tool sollte ein richtlinienbasiertes Modell haben, welches es der IT ermöglicht, eine Reihe von Richtlinien zum Erstellen von Datenkopien zu definieren und ihren Workloads bei Bedarf zuzuordnen. Dieses verringert den Management-Aufwand.
  • Umfassendes Reporting
  • CDM-Lösungen sollten Möglichkeiten bieten, das IT Team mit Berichten über die Umgebung und die Datenkopien zu unterstützen. Hierdurch wird es möglich, die Umgebung zu verstehen, fundierte Entscheidungen zu treffen und wichtige Maßnahmen einzuleiten, um Probleme zu lösen oder alte ungenutzte Kopien zu bereinigen.

Fazit

Bei der Wahl zwischen verschiedenen Copy Data Architekturen kann das Backup-Modell für Sie dann die richtige Wahl sein, wenn Sie auf der Suche nach einer neuen Backup-Lösung sind. Sofern Sie mit Ihrer derzeitigen Backup-Lösung zufrieden sind, kann dieser Ansatz jedoch zu einem Konflikt in Ihrer Umgebung führen.

Der In-Place Ansatz kann für Sie richtig sein, wenn Sie die Erstellung und Verwendung von Kopien auf Ihrem primären Speicher vereinfachen möchten und zusätzliche Mehrwerte aus Ihrem vorhanden Storage erzielen möchten.

Dies gilt vor allem bei All-Flash Systemen, mit denen Sie mehrere Workloads aus einem einzigen Snapshot bedienen können.

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44567665 / Virtuelle Systeme)