Womit sich Startups heute beschäftigen, Teil 18 Datos IO beherrscht distributed Recovery in Multi-Cloud-Datenbanken
Moderne Applikationen werden heute meist verteilt in verschiedenen Umgebungen gelagert. Doch wer kümmert sich um die Datensicherung, wenn Applikation und Datenbank auf unterschiedlichen Cluster-Knoten tätig sind? Das Startup Datos IO hat dafür mit „RecoverX“ eine umfassende Datenmanagementlösung auf den Markt gebracht.
Anbieter zum Thema

Die Startup Company aus San José im Silicon Valley wurde erst 2014 von Tarun Thakur und Prasentjit Sarkar gegründet, hat seither aber für Furore gesorgt. Während Thakur als CEO die Geschicke leitet, übernimmt Sarkar als CTO und Vordenker die technische Entwicklung. Er bezeichnet das Produkt RecoverX als „Applikations-zentrierte Cloud-Management Software, die Backup und Recovery für moderne Anwendungen liefert“.
Heutige Applikationen sind praktisch „in der Cloud geboren“, d. h. sie sind für Cloud Computing entworfen worden. Sie nutzen nicht-relationale Datenbanken wie MongoDB, Apache Cassandra oder andere. Der Vorteil nicht-relationaler Datenbanken besteht vor allem darin, dass sie hoch verfügbar sind, allerdings hapert es meist an der Datenkonsistenz.
Herkömmliche Anwendungen, die für das Rechenzentrum alter Prägung entworfen wurden und auf relationalen Datenbanken betrieben werden, wandern heute zunehmend ebenfalls in Cloud-Umgebungen. „Dafür reichen die klassischen Strategien für das Datenmanagement aber nicht aus“, beschreibt Sarkar ein Problem, das RecoverX lösen will.
Das Verbindende ist der Content
Zeitgemäßes Datenmanagement muss also die neuen Herausforderungen, die durch Multi-Cloud-Umgebungen entstanden sind, für neue und alte Applikationen erfüllen. Datos IO hat dazu folgende Überlegungen für ein neues Datenmanagement angestellt:
- 1. Ein Bereitstellungsmodell, das nur auf Software basiert um mehr Flexibilität zu erhalten und dem Anwender die Wahl des gewünschten Speichers zu überlassen.
- 2. Da jede Cloud eine unterschiedliche Infrastruktur nutzt, sind der einzige gemeinsame Nenner die Daten selbst. „SCSI LUNs oder ESX virtuelle Maschinen existieren in der Public Cloud nicht. Das einzig Gemeinsame, das alle Clouds verbindet, sind die Daten selbst“, stellt der CTO fest.
- 3. Da Multi-Cloud-Datenbanken elastisch agieren, müssen die Datensicherheit und das Datenmanagement hoch verfügbar, skalierbar und ausfallsicher sein.
- 4. Zudem werden neue Point-in-Time-Techniken für die Einhaltung der Datenkonsistenz innerhalb eines Clusters benötigt.
Den Verantwortlichen bei Datos IO war klar, dass sie mit den herkömmlichen Architekturen des Datenmanagements die Herausforderungen heutiger und zukünftiger IT-Strukturen nicht bewältigen können. Deshalb entwickelten sie ein vollkommen neues Design, das sie „Consistent Orchestrated Distributed Recovery“ (CODR) nannten.
RecoverX will auch zukünftige Scale-out-Datenbanken bändigen
„Der Vorteil unseres anwendungszentrierten Ansatzes ist eine feinkörnige und sehr platzsparende Lösung für Data Protection und –Mobilität, die sich über Clouds auch jenseits von Netzverbindungen erstrecken kann“, beschreibt CTO Sarkar die Architektur.
Ein zusätzlicher Vorteil der CODR-Engine bestehe darin, dass umfangreiche Datenmanagement-Services wie Security, Data Governance und andere angeboten werden können. Damit unterscheide sich die Lösung von Datos IO fundamental von herkömmlichen Ansätzen, die auf virtuellen Maschinen oder LUN-basierenden beruhen und denen der Applikationsbezug fehle.
Eines der Elemente von CODR ist der Einsatz von Abstraktionen, die die Architektur von technischen Variationen der verschiedenen Datenquellen trennen. Als Beispiel nennt Datos IO die Verwendung des Open Database Connectivity (ODBC) API, um damit Datenbankmanagementsysteme (DBMS) zu erreichen. Eine Applikation, die ODBC verwendet, kann auf andere Plattformen – sowohl auf Client- als auch auf Server-Seite – portiert werden und benötigt dafür nur wenige Änderungen im Datenzugangscode.
Granulare semantische Deduplikation
Eine weitere Besonderheit sind die „Application Listeners“. Sie sind klein, stateless (speichern also keine Zustandsinformationen) und werden über ein Standard-API in die Datenbank integriert. Damit lassen sich Daten parallel auf einen zweiten Speicher streamen – ohne Unterbrechung (no choke point).
Dazu kreierten die CODR-Entwickler eine Scale-Out-Plattform, die die Datenbewegungen orchestriert, konsistente Backups veranlasst und Recovery-Operationen organisiert. Dieses Plattformprogramm liest die Daten, die die Applikation Listeners zum File oder Objekt im zweiten Speicher übertragen haben und bereitet sie für einen möglichen Recovery-Prozess auf.
Auch in puncto Deduplizierung haben sich die Entwickler etwas einfallen lassen: Statt blockbasierender wird jetzt die semantische Deduplizierung angewendet. Dabei werden nur die aktuellen Änderungen berücksichtigt, etwa ein einzelnes Element in einer einzigen Tafel. Daraus ergibt sich eine noch granularere Deduplikationsrate als bei herkömmlicher Vorgehensweise. Der Hersteller brüstet sich deshalb mit einer zehnmal so effizienten bidirektionalen Bewegungsrate im Vergleich zu anderen Methoden.
Neues in Version 2.5 von RecoverX
Kurz vor Weihnachten veröffentlichte die Company das Release 2.5 von RecoverX. Damit lassen sich jetzt Recovery-Prozesse von Select-Abfragen starten, die spezifische Spalten oder Zeilen eines Backups betreffen. Damit wird das Recovery genauer und reduziert Zeit und Kapazität. Sensible Spalten lassen sich zudem vom Recovery-Prozess ausschalten. Der Recovery-Prozess wurde zudem mit dem „inkrementellen Recovery“ ergänzt.
Er erlaubt die Wiederherstellung von Daten zwischen zwei Zeitpunkten statt wie bisher nur ab einem. Damit müssen nicht nur weniger Daten wiederhergestellt werden, sondern man kann daraus auch ein Archiv erstellen: Wiederhergestellte Daten lassen sich an einen Archivspeicher senden an den später nur mehr die geänderten Daten geschickt werden.
Für mehr Mobilität der Daten sorgt die neue Version 2.5 ebenfalls, denn Backup und Wiederherstellung können von überall aus gestartet werden. Zudem hat Datos IO bei RecoverX 2.5 auch noch die Verschlüsselung, Autorisierung und Authentifizierung verbessert.
* *Kriemhilde Klippstätter ist freie Autorin und Systemischer Coach (SE) in München.
(ID:45114240)