Gastbeitrag Stephan Orwart, CA Technologies

Effizientes Disaster Recovery geht nur automatisiert

| Autor / Redakteur: Stephan Orwat / Tina Billo

Stephan Orwat, Experte für Automation und Service Orchestration bei CA Technologies, erläutert, warum und wie Unternehmen von der Automatisierung von Disaster-Recovery-Prozessen profitieren können.
Stephan Orwat, Experte für Automation und Service Orchestration bei CA Technologies, erläutert, warum und wie Unternehmen von der Automatisierung von Disaster-Recovery-Prozessen profitieren können. (Bild: CA Technologies)

Vier Stunden warten, bis das System wieder funktioniert? Das ist definitiv keine akzeptable Situation. Obwohl sich die Digitalisierung der Disaster-Recovery-Prozesse bei Unternehmen schon deutlich verbessert hat, gibt es doch noch viele Baustellen. Diese lasssen sich mittels Automatisierung beheben.

Es ist gar nicht so selten, dass ein System ausfällt. 42 Prozent aller Unternehmen erleben das gemäß von IDG erhobener Zahlen mindestens einmal im Jahr. In der Regel löst dies bei den Verantwortlichen erst einmal hektische Betriebsamkeit aus. Sie müssen das Problem fixen, und das in 65 Prozent aller Fälle manuell. Meist zudem ohne Routine, denn die Disaster-Recovery- (DR) Strategie wird bei 72 Prozent der Unternehmen nur einmal im Jahr auf den Prüfstand gestellt.

Sicher, Unternehmen sind heutzutage oft mit extrem komplexen DR-Situationen konfrontiert. Natürlich lässt sich dies nicht komplett verallgemeinern. Doch grundlegend finden sich im Falle eines Desasters vier Hauptschauplätze in einem Unternehmen, die entsprechend in den DR-Prozess eingebunden werden müssen: Storage-Systeme, Datenbanken, Applikationen – lokal oder im Web –und der Netzwerk-Layer.

Nicht auf den Ernstfall vorbereitet

Hinter jeder dieser Technologien stehen Administratoren und Teams, die in einer solchen Situation miteinander kommunizieren und zusammenarbeiten müssen. Das macht die Sache nicht einfacher, denn sie sind größtenteils immer noch gewohnt, in ihren Silos zu arbeiten. Diese komplexe Koordinationslage führt dazu, dass Unternehmen ihr DR-System aus Zeit- und Kostengründen nicht eingehend hinterfragen.

Ähnlich vertrackt verhält es sich mit der Aufrechterhaltung der Failover-Site. Einerseits müssen die Komponenten und Konfigurationselemente aller Dienste in der DR-Site verfügbar sein, anderseits immer parallel angepasst werden. Das heißt, sobald an einer Komponente ein Upgrade oder eine Änderung vorgenommen wird, muss dies auch auf der Failover-Site berücksichtigt werden. Dies manuell zu managen, ist definitiv eine schwierige und fehleranfällige Angelegenheit.

Was einen guten DR-Plan ausmacht

Ohne Zweifel gibt es Situationen, in denen es "gerade noch so geht". Aber darauf zu setzen, ist äußerst riskant. Im Ernstfall reicht es nämlich bei weitem nicht aus, für eine bessere Lastverteilung zwischen Servern zu sorgen. Ein guter Disaster-Recovery-Plan (DRP) geht daher mit dem Business-Continuity-Plan des Unternehmens einher. Kritische Prozesse und Programme müssen gekennzeichnet und für diese einzuhaltende Recovery-Time-Objective- (RTO) und Recovery-Point-Objective- (RPO) Werte festgelegt werden.

Ein guter DRP sollte:

  • 1. ein Zeitfenster festlegen, wann der Betrieb wieder aufgenommen sein kann,
  • 2. kurzgefasst und einfach verständlich sein,
  • 3. diverse Szenarien abdecken – von kleinen bis großen Katastrophen.

Das alles zu berücksichtigen, ist durchaus eine Herausforderung. Vor allem, weil ein Dokument nicht mehr ist als eine Theorie. Ein DRP muss daher regelmäßig geprüft werden, denn die meisten Unternehmen setzen dabei nach wie vor auf manuelle Eingaben.

Automatisierung als Erfolgsschlüssel

Automatisiertes Disaster Recovery stellt sicher, dass dieselben Aktionen in derselben Reihenfolge ausgeführt und dieselben Prüfungen initiiert werden. Damit werden Unregelmäßigkeiten oder Unsicherheiten von vorneherein ausgeschlossen. Außerdem können Updates und Veränderungen einzelner Systeme direkt in den Workflow eingebunden werden. Das stellt eine zuverlässige parallele Weiterentwicklung des Disaster-Recovery-Plans sicher.

Zusammengefasst bietet ein automatisierter DR-Prozess vor allem auf den Gebieten Monitoring, Schnelligkeit, Testing und Minimierung der Fehleranfälligkeit viele Vorteile. Vor allem eine durchgängige Überwachung birgt enormes Potenzial für Unternehmen. Anstelle im Trüben zu fischen, wird so offensichtlich, an welcher Stelle der Schuh drückt. Dadurch können Probleme gezielter angegangen werden und das deutlich schneller, kostengünstiger und fehlerfreier als ansonsten der Fall.

Überwachen, testen, analysieren

Mit einer implementierten Monitoring-Lösung lassen sich zudem Echtzeit-Statistiken über den Verlust von Anwendungsdaten und die Wiederherstellungszeit bereitstellen. Überwacht wird nicht nur der gesamte Systemzustand, sondern auch die Verfügbarkeit des DR-Systems selbst sowie die einzelner Applikationen und Anwendungscluster. Mit Hilfe von Regeln werden Reaktionen auf einzelne Events definiert. Dabei kann es sich einfach nur um eine E-Mail an einen Administrator oder einen gesamten DR-Workflow handeln.

Der vermutlich größte Pluspunkt ist jedoch, dass sich Tests in kürzerer Zeit und einfacher durchführen lassen. Dabei gilt, je öfter getestet wird, desto besser lässt sich der für den Ernstfall angedachte Prozess letztlich vorbereiten. Natürlich kann der Faktor Mensch hier nicht völlig außen vorgelassen werden. Doch zumindest lassen sich manuell vorzunehmende Aufgaben auf das erforderliche Minimum reduzieren.

Detaillierte Analysen und Berichte geben darüber hinaus Einblick, ob einzelne DR-Prozesse richtig ausgeführt wurden und den erwünschten Effekt hatten. Das ist komplexer, wenn mehrere DR-Standorte involviert sind. Mit weitgehender Automatisierung können Unternehmen nicht nur den DR-Prozess analysieren, sondern auch beispielsweise vergangene Test mit neueren vergleichen. Dadurch erhalten sie einen Überblick darüber, was sich verbessert hat und an welchen Schrauben noch gedreht werden könnte.

DR ist mehr als nur Backup und Restore

Kurz gesagt: Disaster Recovery für eine gesamte Infrastruktur bereitzustellen, kann zur riesigen Herausforderung werden. Vor allem dann, wenn hybride Umgebungen auf begrenzte Kapazitäten in Bezug auf Personal und Budgets treffen. Ein Disaster-Recovery-Plan ist deshalb essenziell und umfasst wesentlich mehr als einfach nur einen Backup- und Restore-Prozess.

Rechenzentren mit Daten und Anwendungen müssen funktionieren – oder schnell zum Funktionieren gebracht werden. Das geht nur mit Automatisierung. So können mehrere Recovery-Schritte parallel angestoßen, eine gesetzte Reihenfolge eingehalten und das Testing durchgeführt werden. Das spart Geld und Zeit und vor allem auch Nerven.

* Stephan Orwat ist Experte für Automation und Service Orchestration bei CA Technologies

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45487242 / Notfallplanung)