Suchen

Mensch, Maschine oder Saft? Enlogic fragt nach den Gründen für ungeplante Ausfälle Die Top-Drei der Ausfallrisiken im Rechenzentrum

| Redakteur: Ulrike Ostler

Enlogic, Anbieter von intelligenten Power Distribution Units (iPDUs), veröffentlicht anhand einer Umfrage die 3 Top-Risiken, die zu Ausfallzeiten im Rechenzentrum führen.

Wer kein vernünftiges Strom-Management betreibt, riskiert Ausfälle im Rechenzentrum und permanent zu hohe Kosten.
Wer kein vernünftiges Strom-Management betreibt, riskiert Ausfälle im Rechenzentrum und permanent zu hohe Kosten.
(Bild: Enlogic)

Ungeplante Ausfallzeiten können finanzielle Verluste sowie Reputationsschäden nach sich ziehen. Die Reaktion ist oft die Installation von redundanter Ausrüstung, die bis zu einem möglichen Einsatz im Leerlauf bleibt. Dieser Ansatz ist jedoch kostenintensiv, da Anschaffungskosten vorab anfallen und zudem der Energiebedarf erhöht wird, indem Strom für Server im Leerlauf verschwendet wird.

„Es herrscht allgemeiner Konsens darüber, dass ein Ausfall im Rechenzentrum Kosten zwischen 60.000 und einer Million Euro pro Stunde verursachen kann, immer abhängig vom jeweiligen Unternehmen“, so Paul Inett, Vice President bei Enlogic in Europa, dem Nahen Osten und Afrika.

Enlogic wurde im März 2011 gegründet und zählt Niederlassungen in Großbritannien, Deutschland, den USA, Singapur, China und Australien. Gemeinsam sind rund 60 Enlogic-Mitarbeiter für 26 Patentanmeldungen verantwortlich, wovon 16 direkt mit der Gestaltung und Weiterentwicklung von Rack-PDUs zu tun haben.

Eine Minute und 100.000 Miese

Inett sagt: „Schätzungen innerhalb der Studie haben ergeben, dass nur eine Minute Ausfallzeit mehr als 100.000 Euro an Kosten auslösen kann.“ Wenn ein Rechenzentrum eine Stunde oder länger ausfällt, kann das für das Unternehmen zum Teil existenzbedrohend sein.

Doch nicht alle Fehler sind unvermeidlich. „Wenn kritische Fehler von einem einfachen Detail verursacht werden, wie beispielsweise einer Stromüberlastung, dann ist das ein schwerwiegender, aber vermeidbarer Fehler“, so Inett.

Die Umfrage, die Enlogic Ende des Jahres 2012 während einer Veranstaltung von DataCenter Dynamics unter 100 Teilnehmern getätigt hatte, kam heraus, dass mehr als ein Drittel (35 Prozent) der Meinung sind, dass zumeist menschliche Fehler die für Ausfallzeiten im Rechenzentrum verantwortlich gemacht werden können. Auf Platz zwei (25 Prozent) kommen Betriebsstörungen und auf den dritten Platz (20 Prozent) externe Stromausfälle.

Irren ist menschlich

Beispiele menschlichen Versagens sind etwa eine falsch eingestellte Temperaturskala – Fahrenheit anstelle von Celsius –, das ungewollte Herausziehen eines Stromkabels aus einem IT-Gerät oder eine Stromüberlastung, die durch einen versehentlichen Server-Anschluss verursacht wird.

„Man wird menschliche Fehler im Rechenzentrum nie ganz ausschließen können, aber man kann sowohl mit entsprechender Technologie als auch Trainingsmaßnahmen das Risiko solcher Ausfällen minimieren“, stellt Inett fest und fügt hinzu: „Interessanterweise sieht ein Viertel der Rechenzentrumsprofis Betriebsstörungen als Hauptursache für Ausfallzeiten. Die Verantwortlichen sollten hier also eher auf die Betriebssicherheit als auf die anfallenden Kosten für ihr Equipment achten.“

Man müsse dabei das eigene Investment nicht gleich verdoppeln, um Sicherheit zu schaffen. Es gehe vielmehr darum, zum Beispiel das Konzept von ,hot swappable‘ richtig einzusetzen. Eine PDU, deren Netzkarte im laufenden Betrieb ersetzbar ist, vermeidet im Gegensatz zum Einsatz einer nicht hot-swappable PDU eine Downtime von bis zu 30 Minuten während der Server vom Strom gekappt und eine neue PDU eingefügt wird. Wenn man auf solche Details achtet, vermeidet man Ausfallspiralen im eigenen Rechenzentrum.“

(ID:39044110)