Mobile-Menu

Datensicherung in mindestens zwei Rechenzentren Schwarz Gruppe baut auf grenzüberschreitende Georedundanz

Von Johannes Streibich*

Die Schwarz Gruppe aus Neckarsulm will ihre kritische Infrastruktur, die sich in unmittelbarer Nähe eines Atommeilers befindet, auch gegen regionale Katastrophen schützen: mit Hilfe eines zweiten Standorts. Wie eine Disaster-Recovery-Strategie mit Continuous Data Protection über eine lange Distanz funktionieren kann, beschreibt Johannes Streibich von Zerto.

Anbieter zum Thema

Zwei Brückenpfeiler sind besser als einer: Auch die Golden Gate Bridge soll Erdbeben standhalten – wie eine georedundante IT.
Zwei Brückenpfeiler sind besser als einer: Auch die Golden Gate Bridge soll Erdbeben standhalten – wie eine georedundante IT.
(Bild: gemeinfrei: David Mark / Pixabay )

Viele Unternehmen haben in den letzten Jahren in Hochverfügbarkeitslösungen investiert, um die IT-Dienste ihrer Organisationen stets verfügbar zu halten. In der Praxis geschieht dies im Allgemeinen immer noch oft über eine synchrone Spiegelung zwischen zwei oder mehr Clustern innerhalb einer Entfernung von bis zu 50 Kilometern.

Im Falle eines Ausfalls von Komponenten oder eines Standorts kann die virtuelle Infrastruktur – und insbesondere die darin kritischen Workloads – von einem anderen Standort wieder gestartet werden. Dies funktioniert im Prinzip auch für den Disaster-Recovery-Fall, wenn etwa Naturkatastrophen dazu führen, dass ein Rechenzentrum teilweise oder gar vollständig ausfällt.

Die Georedundanz für einen kompletten Standort bereitstellen zu können, bedeutet somit die höchste Stufe der Widerstandsfähigkeit innerhalb einer BC/DR-Strategie (Business Continuity/Disaster Recovery). Denn damit kann eine Organisation ihre komplette virtuelle Infrastruktur auch gegen regionale oder nationale Katastrophen absichern.

Was einfach klingt, ist in der Praxis mit traditionellen Technologien kaum umzusetzen. Die Schwarz Gruppe aus Neckarsulm, die hauptsächlich aus den Supermarktketten Lidl und Kaufland besteht und damit der größte Handelskonzern Europas ist, hat jüngst ein neues georedundantes Rechenzentrum in Dienst gestellt. Dabei kommen Techniken zum Einsatz, die als Referenzarchitektur dienen können.

Metrocluster ist potenzieller „Single Point of Failure“. Die Schwarz Gruppe hat ihr Hauptquartier im Baden-Württembergischen Neckarsulm, nur 20 Kilometer vom in Obrigheim ansässigen Kernkraftwerk Neckarwestheim entfernt. Rund um den Hauptsitz betreibt das Unternehmen einen Metrocluster aus mehreren Rechenzentren, um Hochverfügbarkeit (HA) ihrer virtuellen Infrastruktur zu gewährleisten.

Die IT-Struktur

Der virtualisierte Footprint besteht aus mehr als 40.000 Virtuellen Maschinen (VMs), von denen 5.000 als unternehmenskritisch gelten und globale IT-Dienste für alle Einrichtungen des Konzerns bereitstellen. Die geographische Zentralisierung dieser Produktions-Workloads hat die Struktur bisher jedoch zu einem potenziellen Single Point of Failure gemacht. Im Falle eines Störfalls im Kernkraftwerk wäre nicht nur die Firmenzentrale betroffen, sondern potenziell auch alle Rechenzentren innerhalb des Metrocluster-Verbundes.

Im Falle einer regionalen Katastrophe, etwa durch ein Erdbeben, eine Überschwemmung oder einen Störfall im nahen Atommeiler, könnte der gesamte Konzern in Mitleidenschaft gezogen werden und die weltweit 12.900 Filialen in Mitleidenschaft ziehen. Um dieses Risiko zu eliminieren, beauftragte die Schwarz-Gruppe ihre interne IT bereits 2015 damit, den potenziellen Single Point of Failure des Metroclusters zu beseitigen.

Das Team machte sich in der Folge in einem Radius von 400 Kilometern auf die Suche nach einem geeigneten Standort für ein neues DR-Rechenzentrum. Die Entfernung zwischen dem neuen Rechenzentrum und dem Metrocluster am Hauptquartier in Neckarsulm sollte mindestens 200 Kilometer betragen.

Dies entspricht auch der Empfehlung des BSI, das den Mindestabstand zwischen zwei georedundanten Rechenzentren Anfang 2020 von ehemals nur fünf auf 200 Kilometer angehoben hatte. Am Ende der Suche und Planung entschied sich die Schwarz-IT aus zahlreichen Optionen dafür, ein komplett neues DR-Rechenzentrum aufzubauen, das im Ernstfall die kritischen Workloads übernehmen könnte.

Errichtet wurde es auf dem ehemaligen Gelände eines stillgelegten Kohlekraftwerks in Riedersbach bei Salzburg. Neben der ausreichenden Entfernung von Neckarsulm (circa 300 Kilometer Luftlinie) bietet der Standort optimale Voraussetzungen für den Aufbau eines Rechenzentrums: Sichere Stromversorgung mit günstigen Preisen, direkten Zugriff auf Kühlwasser und eine schnelle Glasfaserverbindung: zwei Standleitungen mit 40 Gigabit pro Sekunde.

Distanz bedingt Wechsel auf asynchrone Replikation und Continuous Data Protection (CDP), denn bei einer Entfernung von mehr als 50 Kilometern ist synchrone Replikation, wie sie innerhalb des Metroclusters genutzt wird, aufgrund der Latenz unmöglich – erst recht bei einer Entfernung von über 300 Kilometern.

Streamen von Blöcken über CDP

Prinzipiell gibt es mehrere potenzielle Techniken auf dem Markt, um Georedundanz zu erreichen, doch Hardware-basierte auf Storage-Ebene hat Schwarz-IT als Alternativen schnell ausgeschlossen, da auf der Ebene des Hypervisors repliziert werden sollte. Auch eine Möglichkeit zur Absicherung von Standorten mithilfe der vom Anbieter genutzten Virtualisierungsplattform hat die gesetzten Anforderungen nicht erfüllen können. Die Möglichkeit, klassische Snapshots zu replizieren, ist weder zeitgemäß noch mit der Größe der Umgebung und der limitierten Bandbreite vereinbar.

Anstelle einer Replikation von Snapshots in regelmäßigen Intervallen sollen nun kontinuierlich Blöcke repliziert werden. Die Schwarz Gruppe hat sich für eine Software entschieden, deren Replikation auf CDP aufbaut und auf der Hypervisorebene abläuft.

Die Replikation einzelner Blöcke mit einer CDP-Engine stellt sich im Vergleich mit der regelmäßigen, klassischen Replikation von Snapshots als deutlich sinnvoller dar. Die Schwarz Gruppe hat die von ihr bevorzugte Technik im Rahmen eines Proof of Concept selbst. Der produktive Einsatz der neuen Struktur hat dann Ende 2019 beginnen können.

Johannes Streibich ist Vertriebsleiter für die CEMEA-Region bei Zerto: „Mit der georedundanten DR-Strategie setzt die Schwarz-Gruppe neue Maßstäbe zum Schutz Ihres Geschäfts. Wir sind sehr stolz darauf, diese Strategie durch unsere Software-Plattform zu ermöglichen.“
Johannes Streibich ist Vertriebsleiter für die CEMEA-Region bei Zerto: „Mit der georedundanten DR-Strategie setzt die Schwarz-Gruppe neue Maßstäbe zum Schutz Ihres Geschäfts. Wir sind sehr stolz darauf, diese Strategie durch unsere Software-Plattform zu ermöglichen.“
(Bild: Zerto)

Mittlerweile bietet ist die DR-Software für alle kritischen VMs der Gruppe im Einsatz – mit sehr kurzen RTOs und RPOs: Die Replikation über die CDP-Engine setzt alle fünf bis zehn Sekunden Checkpoints, was bedeutet, dass alle VMs seitdem mit einem RPO von nur fünf bis zehn Sekunden wiederhergestellt werden können. Die Wiederherstellbarkeit einzelner VMs lässt sich über die Plattform mit nur wenigen Mausklicks auch testen, sollte ein solcher Test gegenüber der Revisionsabteilung notwendig sein.

*Der Autor: Johannes Streibich ist Vertriebsleiter für die CEMEA-Region bei Zerto.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

(ID:47969869)