Konzept zur Krisenbewältigung

Disaster Recovery im Rechenzentrum

Seite: 3/4

Firma zum Thema

Rechenzentrumswahl als Risikominimierung

Disaster Recovery ist eine Teildisziplin von Business Continuity Management (BCM), also eines Prozesses, der Konzepte zur Aufrechterhaltung des Geschäftsbetriebs entwirft und implementiert. Diese Konzepte sollen Unternehmen auf Störungen vorbereiten, diese minimieren und managen.

Sie sind personenunabhängig, nicht aber rollenunabhängig. BC-Konzepte enthalten Ablaufpläne für eintretende Katastrophe, die auch greifen, wenn der zuständige IT-Mitarbeiter nicht anwesend oder nicht mehr im Unternehmen beschäftigt ist.

Bei der Reduktion von Stör- und Katastrophenrisiken im Rahmen von BCM spielt die Wahl des passenden Rechenzentrums eine große Rolle. Dabei gilt es zu beachten, dass ein singuläres Rechenzentrum zwar die Hochverfügbarkeit von Daten durch zwei physisch getrennte Brandschutzbereiche bereitstellen kann, aber keine Disaster-Recovery-Funktionen aufweist.

Um diese Lücke zu schließen, bieten sich folgende kombinierbare Optionen an:

  • DR als Cloud-Service, gekoppelt an leicht skalierbare und kostengünstige Standby-Komponenten
  • DR an einem zweiten, eigenen geeigneten Rechenzentrumsstandort,
  • DR mit einem Co-Location-Partner in kurzer Entfernung, so dass im Unterschied zu den anderen Optionen synchrone Datenreplikation möglich ist,
  • DR mit einem über 200 Kilometer georedundanten Co-Location-Partner.

IT-Entscheider sollten Vor- und Nachteile der aufgeführten Wahlmöglichkeiten individuell abstimmen. Jedoch existieren Mindestanforderungen an die digitale und physische Sicherheit sowie an Kommunikationswege eines Rechenzentrums, die erfüllt sein sollten, wenn es Disaster Recovery leisten soll:

  • mindestens Klasse Tier III,
  • EN 50600 Zertifizierung,
  • Überwachungs- und Alarmempfangszentrale gemäß EN 50518,
  • minimale Bandbreitenkonnektivität von mindestens je 2 x 1 Gigabit pro Sekunde (Gbit/s) an jedem Standort für das Internet,
  • mindestens 2 x 10 Gigabit pro Sekunde für Konnektivität der Wege von Rechenzentrum zu DR, Rechenzentrum mit einer Latenzzeit von bis zu 30 Millisekunden,
  • mindestens zwei verschiedene redundante Kommunikationswege,
  • jeder Kommunikationspfad muss von einem anderen Carrier über verschiedene redundant ausgelegte Leitungen stammen,
  • wenn ein Rechenzentrum auch als Disaster-Recovery-Rechenzentrum eines weiteren Rechenzentrums verwendet wird, müssen die Kommunikationsleitungen physisch getrennt sein
  • Kommunikationswege müssen nach höchsten Standards verschlüsselt werden, also zum Beispiel nicht nur MPLS,
  • asynchrone, verschlüsselte Datenreplikation darf einen maximalen Versatz von einer Stunde aufweisen,
  • automatische Umleitung für angeschlossene Rechenzentren und deren Partner (Routen),
  • ein Fernzugriff bei Disaster Recovery sollte über einen zusätzlichen separaten Kommunikationspfad eingerichtet werden; alle Zugriffsmöglichkeiten müssen autonom von den Zugriffspfaden weiterer angeschlossener Rechenzentren sein.

Kontrolle ist besser

Wenn Disaster Recovery als funktionierender Baustein von Betriebskontinuitätsmanagement funktionieren soll, müssen Unternehmen bei gewohntem Betrieb mindestens jährlich DR-Failover-Tests und Wiederherstellungstests durchführen. Mit diesen IT-Feuerwehrübungen zeigt sich, wie lange es zumindest ohne großen Stress dauert, das Rechenzentrum umzuschalten und den Betrieb wieder aufzunehmen.

Sobald darüber hinaus größere Software-Upgrades im Zusammenhang mit der Datensicherung stattfinden, müssen diese Tests direkt nach dem Upgrade erfolgen. Dabei ist unerlässlich, dass alle CMDB-Informationen in jedem Rechenzentrum vorliegen, die in Disaster Recovery eingebunden sind.

(ID:46187039)