Definition Was ist ein Failover?
Beim Failover handelt es sich um eine automatische Ausfallsicherung von IT-Systemen oder -Services. Fällt eine Komponente oder ein Dienst aus, übernimmt ein Ersatzsystem automatisch deren Aufgabe. Mithilfe des Failovers lässt sich die Verfügbarkeit von Services und Systemen steigern.
Anbieter zum Thema

Wörtlich übersetzt, bedeutet Failover „Ausfallsicherung“. Im Gegensatz zu einem Switchover handelt es sich aber nicht um ein manuelles Umschalten auf ein redundantes System, sondern um die automatische Übernahme eines ausgefallenen Services oder einer Komponente durch ein Ersatzsystem. In einigen Fällen funktioniert diese Übernahme sogar nahtlos, ohne dass Anwender vom Ausfall etwas mitbekommen.
Die automatische Ausfallsicherung lässt sich einsetzen, um die Verfügbarkeit von IT-Systemen zu steigern und kritische Störungen zu vermeiden. Beispiele von Services oder Systemen, die sich absichern lassen, sind Prozessoren, Speicherlaufwerke, Netzwerkkomponenten, Datenverbindungen, Server, Datenbanken oder Anwendungen und Dienste. Auch Wartungsarbeiten an Systemen können durch die automatische Ausfallsicherung ohne Störung für Anwender durchgeführt werden.
Um den Ausfall eines Systems zu erkennen, kommen Methoden wie der Heartbeat zum Einsatz. Das Zurückschalten auf den ursprünglichen Service wird Failback genannt und manuell oder automatisch durchgeführt.
Mögliche per Failover gesicherte Services und Komponenten
Im IT-Umfeld lassen sich prinzipiell fast alle Services und Hard- oder Software-Komponenten per automatischer Ausfallsicherung absichern. Dies sind beispielsweise:
- Prozessoren,
- Festplattenlaufwerke,
- alle Arten von Storage wie Netzwerk- und Cloud-Speicher,
- Netzwerkknoten und -komponenten wie Router, Switche, Firewalls, Proxys, Loadbalancer,
- Netzwerkverbindungen,
- Server wie Webserver, E-Mail-Server, Dateiserver,
- Datenbanken,
- Dienste und Anwendungen.
Hochverfügbare Cluster mit automatischer Ausfallsicherung
Hochverfügbare Cluster-Systeme sind in der Lage, mehrere Fehler abzusichern. Sie sind in sich völlig redundant aufgebaut und arbeiten so lange fehlerfrei, bis sämtliche redundanten Komponenten im Einsatz sind und keine Backup-Ressourcen mehr bestehen, um weitere Fehler abzusichern. Die Cluster stellen Services hochverfügbar bereit und garantieren intern die Ausfallsicherheit von Servern, Storage, Netzwerkverbindungen oder Datenbanken.
Die Einzelkomponenten tauschen sich ständig über ihren Status aus und halten Daten und Informationen durch Replikation synchron. Das aktive System, das den Service bereitstellt, ist das Primärsystem. Ein oder mehrere Standby- oder Backup-Systeme stehen für die Ausfallsicherung bereit und sorgen für die Redundanz und Hochverfügbarkeit. Um aus Netzwerksicht die Last jeweils passend auf die Systeme zu verteilen, kommen Loadbalancer zum Einsatz.
Failback – das Zurückschalten des Backups
Das Gegenstück zur automatischen Ausfallsicherung stellt der Failback dar. Beim Failback werden der Service nach Wiederherstellung des Primärsystems in die Ausgangssituation zurückgeschaltet und der Backup-Betrieb beendet. Zuvor muss das Primärsystem, sobald es wieder einsatzbereit ist, mit den Daten des aktiven Backup-Systems synchronisiert werden. Ist dies geschehen, kann die Umschaltung auf die primäre Konfiguration manuell oder automatisch erfolgen.
(ID:45841892)