Swisscom setzt auf Brocade Application Performance Monitoring sichert QoS
Große Banken, Eisenbahnunternehmen und andere Firmenkunden vertrauen auf Swisscom, um unternehmenskritische Applikationen zu hosten. Jetzt hat das Unternehmen seine Storage-Networking-Umgebung umgebaut und mit dem Application Performance Monitoring von Brocade ausgestattet.
Anbieter zum Thema

Wenn das Swisscom-Netzwerk zusammenbricht, können Unternehmen ihre Kunden nicht mehr zufriedenstellend bedienen und damit auch keine Gewinne erwirtschaften. Kommt es zum Beispiel bei der Ticket-Applikation der Bahn zu Verzögerungen, wirkt sich das auf alle Fahrkartenautomaten im gesamten Bahnnetz aus. Das führt im schlimmsten Fall dazu, dass tausende Bahnkunden ihre Züge verpassen.
Swisscom muss den Geschäftsbetrieb also stets aufrechterhalten und zugleich ausgezeichneten Kundenservice liefern. Um diese beiden Anforderungen auch in Zukunft erfüllen zu können, musste das Unternehmen seine Storage-Networking-Umgebung ausbauen.
Unternehmenskritische Application Performance verbessern
Swisscom unterstützt den unternehmenskritischen Geschäftsbetrieb seiner Kunden durch eine komplexe Storage-Umgebung. Mit der Zeit wuchs die Infrastruktur auf tausende physische und virtuelle Server sowie über 11.000 virtuelle Instanzen, 27.000 Storage Networking Ports und 20 Fabrics an, die sieben Standorte umspannen. Mit mehr als 9 Millionen Gigabytes an bereitgestelltem Speicher wurden die Größe des Netzwerks und die veraltete Storage-Architektur bald zum Problem, denn es war schwierig, mit großen Mengen von On-Demand Application Traffic zurechtzukommen.
Das Storage-Team wusste, dass einige Applikationen zu Stoßzeiten hohe Latenzen aufwiesen – bis zu 10 Sekunden für große Datenbankverarbeitungsabfragen. Lange Reaktionszeiten wirkten sich jedoch negativ auf die Application Performance aus, erhöhten die Latenz und machten oft eine wiederholte Übertragung der Daten nötig.
Oft kostete es Tage oder sogar Wochen, bis Swisscom zusammen mit Netzwerk-, Server- und Storageanbietern die Ursache eines Problems identifiziert und behoben hatte. Das Swisscom-Team hatte zudem Ziele für die Service Level Agreements (SLA) festgelegt, die nicht immer erreicht wurden. Ohne einen genauen Überblick über alle Pfade und Geräte, durch die Daten fließen, würde sich eine Performance-Verbesserung allerdings schwierig gestalten. Swisscom benötigte deshalb aussagekräftige Erkenntnisse und eine schnelle “Time-to-Insight”, um die SAN Performance für Kundenapplikationen zu verbessern.
Flows analysieren für maximale Performance
Swisscom entschied sich für die Brocade Analytics Monitoring Platform, um bessere Einsicht in das End-to-End Applikationsverhalten zu erhalten – vom Server bis zum Storage. Die Brocade Analytics Monitoring Platform ist eine speziell angefertigte Storage-Network-Anwendung, die Applications- und Device Level I/O Performance misst und Traffic Behaviour im gesamten Storage Fabric analysiert. Die Plattform operiert in Swisscoms Brocade Gen 5 und Gen 6 DCX 8510 Backbones und Brocade X6 Direktoren mit Brocade Fabric Vision Technologie.
Wenn Swisscom so weit ist, auf 32 Gbps/128 Gbps Storage Networking zu migrieren, profitiert das Unternehmen dank der Brocade X6 Direktoren von einer NVMe-over-Fabrics-Architektur und bahnbrechender VMware-Technologie. Zudem kann Swisscom die Brocade Analytics Monitoring Platform für tiefgreifende Einsicht in die gesamte Infrastruktur nutzen.
Swisscom stellte die Anwendungen der Brocade Analytics Monitoring Platform zur Verfügung, indem man sie über Analytics Switch Links mit mehreren Brocade DCX 8510 Backbones verknüpfte. Nicht-invasive virtuelle Taps am Rand des Storage- und Serverpfads senden Daten an die Anwendungen für das Application Performance Monitoring. Diese Architektur bietet Flexibilität und Skalierbarkeit, was es Swisscom ermöglicht, das Echtzeit-Monitoring von 60.000 Flows zu intensivieren.
Mit der Fabric Vision Technology Monitoring and Alerting Policy Suite (MAPS) von Brocade hat Swisscom für das Storage-Netzwerk Richtlinien für proaktives Application Performance Monitoring erstellt. Das Fabric Performance Impact Monitoring der Fabric-Vision-Technologie erkennt langsame Geräte und alarmiert das Team, sobald Überlastung oder Latenz die kritische Schwelle überschreiten. Die Slow Drain Device Quarantine (SDDQ) isoliert langsame Geräte aus dem Netzwerk und beseitigt den Einfluss von Latenzen auf andere Traffic Flows. Die Informationen der Fabric-Vision-Technologie werden verständlich und übersichtlich in den Network Advisor Dashboards dargestellt, um dem Team einen lückenlosen Überblick über alle Vorgänge im Storage-Netzwerk zu ermöglichen.
Sofortige Erkenntnisse
Nach nur 10 Minuten wies die Analytics Monitoring Platform auf eine große Menge ausstehender I/Os in Storage Ports hin. Zudem erkannte die Plattform, dass viele dieser Ports erheblich überbelastet waren. Diese Erkenntnis lieferte Swisscom die Lösung für das Problem, da Überbelastungen wesentlich für Latenzprobleme verantwortlich sind.
Mit den durch das Application Performance Monitoring erhaltenen Daten konnte das Data-Center-Team Server-to-Storage-Traffic umleiten, um die Performance zu maximieren. Durch das Bewegen und Umlegen von Traffic sind die verschiedenen Storage Arrays nun besser in der Lage, Daten zu verarbeiten und Workloads zu teilen.
„Die Verbesserungen waren erheblich,“ sagt Jean-Luc Tarik Aslan, Datacenter Architect bei Swisscom. „Wir konnten die Latenz zu Stoßzeiten von 10 Sekunden auf gerade einmal 250 Millisekunden reduzieren. Die Analytics-Monitoring-Plattform hilft uns dabei, eine lückenlose Application Performance für kritische Anwendungen sicherzustellen und zugleich die Fehlerbehebung zu vereinfachen.“
Früher dauerte es bis zu 30 Tage, um den Ursprung eines Problems zu identifizieren und zu beheben. Durch Application Performance Monitoring konnte Swisscom die Zeit bis zur Fehlerbehebung um 90 Prozent reduzieren. Zusätzlich wurde das Team auf Probleme aufmerksam, von deren Existenz es zuvor noch gar nichts wusste. Diese Probleme waren tief in der Infrastruktur versteckt und erhöhten die Latenz oder verkomplizierten die Traffic Flows. Nachdem auch diese Fehler behoben waren, konnte das Swisscom Team seine SLA-Performance-Reporting-Ziele erreichen, was zuvor unmöglich schien.
Bessere Reporting Visibility
Dank der tiefgreifenden Visibilität der Analytics Monitoring Platform kann Swisscom sein Netzwerk heute proaktiver als jemals zuvor verwalten. Application Performance Monitoring liefert z.B. die Daten, die das Data-Center-Team benötigt, um Trends auszumachen, Baselines festzulegen und Threshold Settings zu bestimmen.
„Unsere Server- und Storage-Teams wollen ihre Latenz-Reports täglich sehen,“ sagt Aslan. „Wenn das Network-Team die Reports nicht pünktlich schickt, erhält es kurz darauf eine Menge Anrufe, wo denn die Berichte bleiben. Diese Reports sind unabdingbar, um unsere Service Performance aufrechtzuerhalten.“
Die Reports sind kundenspezifisch und zeigen granulare Latenz- und Performancedaten. Jetzt kann Swisscom regelmäßig an seine Kunden berichten und einen Nachweis für die SLA-Compliance liefern, was die Kundenzufriedenheit erheblich steigert.
Existierende Investments erhalten
Swisscoms Application Performance Monitoring hilft dem Unternehmen, die Kundenzufriedenheit zu verbessern, ohne Server- oder Storagesysteme auszutauschen. So konnte das Unternehmen nicht nur sein SAN-Investment bewahren, sondern auch wertvolle Daten für die Geschäftsplanung und Entscheidungsfindung erhalten. Dadurch ist Swisscom zudem in der Lage, Ort und Ursache von Latenzen weiterhin genau zu bestimmen. Auch Netzwerk-, Server- und Storageanbieter können Probleme nun schneller lösen, um Swisscom zufriedenzustellen.
Nächste Schritte
Swisscom plant den derzeitigen Einsatz der Brocade Lösung auszuweiten und weitere Analytics-Monitoring-Platform-Anwendungen in seinen anderen SAN-Umgebungen einzusetzen. Denn durch hohe End-to-End Visibility in seine Storage-Umgebung hat Swisscom mehr Möglichkeiten als je zuvor, um seinen Kunden transparente hochleistungsfähige Services und kompromisslose Zuverlässigkeit zu bieten.
Über den Autor
Thomas Langkjaer ist Regional Sales Director bei Brocade.
* Dieser Artikel stammt von unserem Schwesterportal IP-Insider.
(ID:44610105)