Virtuelle Datentransfers erhöhen den Datendurchsatz auf latenzbehafteten Leitungen Backups zentralisieren durch WAN-Optimierung

Autor / Redakteur: Thomas Boele, Riverbed Technology / Rainer Graefen

Das lokale Netzwerk erlaubt schnelles Backup und Restore. Doch wie zentralisiert man das Backup von Zweigstellen. Einige wichtige Überlegungen für die Berechnung der WAN-Strecke.

Firmen zum Thema

Transport Streamlining reduziert Round Trips.
Transport Streamlining reduziert Round Trips.
( Archiv: Vogel Business Media )

Beim Backup im LAN müssen inzwischen kontinuierlich Daten mit Transferraten zwischen 30 bis 80 MByte pro Sekunde transportiert werden.

Solche Geschwindigkeiten scheinen auf breitbandigen Weitverkehrsstrecken (WAN) ebenfalls möglich. Die Latenzzeiten auf den Übertragungsleitung lassen allerdings viele optimistische Berechnungen alt aussehen.

Bildergalerie

Das Backup-Fenster im WAN-Stau

Ein Beispiel: Für die zulässige Ausfallzeit (Downtime) einer Anwendung wurde ein Backup-Fenster von acht Stunden definiert. Korrekterweise müsste man die Downtime aus der Summe aus Recovery Time und der Zeitspanne zwischen Recovery Point und Ausfallzeitpunkt festlegen. Das Backup-Fenster ist damit wesentlich kleiner.

In diesem Zeitfenster ist eine Datenmenge von ca. 120 GByte zu übertragen. Rein rechnerisch wäre eine E3-Leitung (34 MBit/s) ausreichend.

Steht jedoch für die Übertragung nur eine TCP Congestion Window Size von 64 KBytes (Default) zur Verfügung, wären selbst im Idealfall 1,875 Millionen Roundtrips nötig, um die Daten komplett zu übertragen (120 GBytes/64 KBytes).

Rundreisen dauern etwas länger

Bei einer typischen Roundtrip Time (RTT) von 100 Millisekunden würde die Abarbeitung der 1,875 Millionen Roundtrips zwei Tage dauern. Das verfügbare Backup-Window wäre erheblich überschritten, im K-Fall würde man über zwei Tage verlieren, bis man wieder einsatzfähig wäre – mit alten Daten.

Rechnet man die Sache andersherum, zeigt sich, dass eine Bandbreitenerhöhung das Problem ebenfalls nicht lösen kann, selbst wenn man die Kosten außer Acht ließe. Bei der gegebenen Verzögerung und der zulässigen Backup-Zeit, sind 288.000 Roundtrips das Optimum (8 h * 60 min * 60 s/ 100 ms). Das TCP Congestion Window müsste dann bei jedem Roundtrip circa 417 KByte übertragen.

Die hohe Anzahl an Roundtrips, die von Protokollen in der Transport- und Applikationsschicht benötigt werden, um Transaktionen auszuführen, sorgen auf solchen latenzbehafteten WAN-Strecken für eine nicht akzeptable Performance.

Transport-Deduplizierung – bin schon da

Einen Ausweg bietet der Einsatz von WAN-Optimierungssystemen, WAN Optimization Controller, kurz WOC.

Hier sollten Techniken zum Einsatz kommen, die auf drei Säulen aufbauen:

  • Datenreduktion mittels intelligenter Daten-Kompressions- und -Deduplikations-Verfahren („Data Streamlining“),
  • TCP Transport Streamlining und
  • Application Protocol Streamlining.

Aktuell verfügbare Datenreduktionsmechanismen in WAN Optimization Controllern bieten bei geeigneten Datenstrukturen eine Möglichkeit, die tatsächlich über das WAN übertragene Datenmenge um bis zu 99% zu reduzieren.

weiter mit: Startpunkt Client

Startpunkt Client

Zu beachten ist, dass Anfragen immer vom Client zum Server durchgereicht werden, um zu gewährleisten, dass die gelieferten Daten zu jedem Zeitpunkt aktuell sind.

Die Nutzlast (Payload) übertragener Daten wird dabei auf Byte-Level mit Hilfe sehr schnell konvergierender String-Search-Algorithmen auf redundante Daten hin untersucht, dabei werden Segmente variabler Länge in Wörterbüchern auf Speichersystemen oder im Hauptspeicher abgelegt und mit einer Referenz respektive mit einem Symbol versehen.

Wird ein derartiges Segment mithilfe des String-Search-Algorithmus später nochmals erkannt, wird lediglich das Symbol übertragen, auf der Gegenseite im Wörterbuch nachgeschlagen und die korrespondierende Byte-Sequenz wieder in ein Datenpaket als Payload eingefügt.

Ohne Datentransfer geht es schneller

Die Payload wird bereits bei der ersten Übertragung komprimiert, um schon beim „kalten“ Transfer eine Datenreduktion zu erreichen. Auf der Transportebene werden spezielle Verfahren angewandt, die die verfügbare Bandbreite möglichst schnell voll auszunutzen (darunter Congestion Window Extension, HS-TCP und MX-TCP) und die Anzahl der Roundtrips minimieren.

Mit dem Verfahren der Virtual Window Extension können die Congestion Windows theoretisch eine Größe von mehreren Megabytes erreichen, da anstatt physischer Daten lediglich komprimierte Daten bei Ersttransfers respektive Referenzen auf bereits bekannte Datensegmente übertragen werden, die ihrerseits wieder auf eine viel größere Menge tatsächlicher Daten verweisen.

Besonderheiten in Data-Protection-Umgebungen

Zwei Szenarien sind bei Weitverkehrsstrecken auseinander zu halten:

1. Durch die Integration von WOCs ist es möglich, die über das WAN übertragenen Daten so zu konditionieren, dass die vorgegebenen Ziele für die Übertragungszeiträume erreicht oder noch weiter unterboten werden können.

2. Im Falle gekoppelter Rechenzentren mit angemessenen Disaster-Recovery-Mechanismen herrschen im Vergleich zu herkömmlichen Außenstellen-Anbindungen, völlig andere Randbedingungen, die eine andere Parametrisierung der WAN Acceleratoren verlangen.

Rechenzentren sind in der Regel mit sehr schnellen Leitungen, teilweise mit Geschwindigkeiten von über 100 MBit pro Sekunde, miteinander verbunden. Es werden wenige, oft aber langlebige Sessions zwischen den Sites aufgebaut. Darüber werden große Daten-Repositorien übertragen, Last kann zufällig verteilt und sequentiell auftreten.

Während es bei relativ langsamen WAN-Verbindungen mit großen Delays oft darum geht, die Latenz virtuell zu eliminieren und die WAN-Kapazität stark zu erhöhen – geht es bei Long Fat Networks (LFNs) darum, die verfügbare Bandbreite überhaupt bis zum Kapazitätsmaximum auszulasten rsp. den maximalen LAN-Durchsatz zu erreichen.

weiter mit: Neue Kombination für High-speed Netze notwendig

Neue Kombination für High-speed-Netze notwendig

Für LFNs geeignete WOCs bieten umfangreiche Möglichkeiten, mit unterschiedlichen Parametern an die gesetzten Ziele für effektive Bandbreite und Übertragungsfenster angepasst zu werden. Je nachdem, welche Kombination an Bandbreite und Delay sowie welche Datentypen übertragen werden sollen, sollte eine Kombination gewählt werden aus

  • Disk- und Speicher-basierten Deduplikations-Verfahren,
  • adaptiver Deduplikation,
  • variabler LZ-Kompression.

Speziell für Data-Protection-Applikationen, die mit wenigen, aber sehr langlebigen TCP-Sessions arbeiten, wird via Multicore-Processing sichergestellt, dass diese auch über mehrere CPU-Kerne parallel bearbeitet werden können.

Tief in die Trickkiste gegriffen

Zur Anwendung kommen weiterhin speziell angepasste Übertragungsverfahren wie High-Speed-TCP. Gerne wird auch von „Fill-the-Pipe-Konfigurationen“ gesprochen, da es aufgrund der Ramp-Up und Backoff-Parameter im üblicherweise verwendeten TCP-Reno-Stack auf latenzbehafteten Hochgeschwindigkeitsleitungen dazu kommen kann, dass die Leitung nicht ausgelastet wird.

Im HS-TCP-Stack sind diese Parameter für die Umgebung bei großen Congestion Windows entsprechend angepasst und ermöglichen so eine schnelle Ramp-Up-Phase bis hin zur Maximalbandbreite und ein schnelles Recovery der Datenrate im Falle eines Paketverlustes. Bei kleinen Congestion Windows sind die Parameter annähernd gleich zum TCP-Reno-Stack, was HS-TCP für gemischte Umgebungen tauglich macht.

Sonderfälle

Einen Sonderfall stellt das MX-TCP-Verfahren von Riverbed dar, welches für exklusive und schnelle, aber verlustbehaftete Links – z. B. Laser-Optische oder Mikrowellen-Links – entwickelt wurde. Hier werden die Congestion-Avoidance-Mechanismen außer Kraft gesetzt und im Fall des Paket-Verlustes Retransmits bevorzugt, d.h. mit höchster Priorität, übertragen – mithin gibt es keinen Back-Off bei Paket-Verlusten.

Der aktuelle und ungebrochene Trend, Server, Datenhaltung und Backups zu zentralisieren, bringt neben einer Vielzahl von Vorteilen auch neue Herausforderungen für IT-Verantwortliche mit sich. Diese lassen sich mit Hilfe moderner WAN-Optimierungssystemen in den Griff bekommen oder werden durch diese erst ermöglicht.

(ID:2042119)