Die Brutto-Kapazität der Violin 6000er Serie steigt auf 60 Terabyte Mit Solid State Drive Arrays will Violin ins Enterprise

Autor / Redakteur: Jan Maue / Rainer Graefen

Beschleunigt man lieber die Anwendung oder gleich die unternehmenskritische Infrastruktur? Für Violin Memory ist das keine Frage. Die gemeinsame Nutzung im Netzwerk bringt die bessere Amortisationsrate.

Firma zum Thema

( Violin)

Erst vor wenigen Jahren hat Flash in Form von SSDs (Solid State Drives) den Einzug ins Rechenzentrum geschafft – man spricht auch von der 1. Generation von Flash-Lösungen. Damals wurden in konventionellen Speicher-Systemen die drehenden Platten durch die neue Technologie ersetzt, wodurch vor allem die Lese-Performance für „random“ IOs immens gesteigert wurde.

Zum Vergleich: Eine FC- oder SAS-HDD mit 15.000 Umdrehungen pro Minute liefert unter guten Einsatzbedingungen 180 I/O pro Sekunde. Eine SSD dagegen kann 4.000 und mehr I/Os pro Sekunde lesen, unabhängig davon, ob es sich um sequentielle oder „random“ Operationen handelt. Das ist Faktor 20. Inzwischen ist die dritte Generation der SSD-Technik auf dem Markt und bietet weitere Vorteile.

Bildergalerie
Bildergalerie mit 8 Bildern

1. Generation: SSD ersetzt Festplatte

Allerdings betrifft das nur die Lese-Operationen – bei den Schreib-Operationen erreichen SSDs diese Werte bei weitem nicht. Darüber hinaus stellt der Controller des Storage-Arrays einen Flaschenhals dar: meist dürfen nur wenige der neuartigen SSDs an einen Controllers angeschlossen werden; da sonst die Übertragungswege überlastet werden.

Zu berücksichtigen ist ebenfalls die Zugriffsverzögerung (Latenz) für den Server, die im Bereich von 2 Millisekunden liegt, obwohl Flash-Speicherzellen an sich Antwortzeiten von wenigen Mikrosekunden bieten Unter anderem liegt es daran, dass die klassischen RAID-Level (insbesondere RAID-5 und RAID-6) nicht für den Einsatz von Flash ausgelegt sind. RAID-1 kommt häufig wegen des hohen Preises für SSDs nicht in Frage.

2. Generation: Die Flash-Karte erweitert den Server-Cache

Die 2. Generation von Flash-Lösungen für den Einsatz im Rechenzentrum sind PCIe-Karten, die direkt in die Server eingebaut werden. Der Charme dieses Ansatzes liegt darin, dass der Storage näher an die Applikation rückt und die Latenzen auf ein Minimum reduziert werden – aber wieder nur für Lese-Operationen.

Außerdem handelt es sich nicht um eine hochverfügbare Konfiguration, da bei Ausfall des Servers auch kein Datenzugriff mehr möglich ist. Cluster-Konfigurationen müssen aufwändig über Applikationsmechanismen abgedeckt werden. Eine nahtlose Integration in eine bestehende Storage-Landschaft ist nicht möglich, und es sind durch das Server-Gehäuse Kapazitätsgrenzen gesetzt wie auch der Server-Bus mit zwei bis drei PCIe-Karten zum Flaschenhals wird.

3. Generation: Flash-Array beschleunigt Netzwerk-Traffic

Bei Violin Arrays der 3. Generation von Flash-Lösungen handelt es sich um Systeme, die speziell für den Einsatz für hochkritische Anwendungen im Rechenzentrum entwickelt wurden. Über FibreChannel, Infiniband, iSCSI oder FCoE können sie in bestehende Infrastrukturen mit geringem Aufwand integriert werden. (Abb. 2:)

Sämtliche Komponenten eines Violin Arrays sind redundant vorhanden, sodass der Datenzugriff auch im Fehlerfall gewährleistet ist. Falls eine Teilkomponente ausfällt, kann sie im laufenden Betrieb ohne Unterbrechung des Betriebs getauscht werden.

Violin Arrays weisen keinen „Write Cliff“ mehr auf, das heißt, sie liefern immer die maximale Performance bei niedrigster Latenz sowohl für Lese- als auch für Schreiboperationen – und das bei einer 100prozentigen Ausnutzung der Kapazität.

Das Top-Modell der Violin 6000er-Serie liefert bis zu eine Million I/O pro Sekunde bei Latenzen von weniger als 100 Mikrosekunden (0,1 Millisekunden). Die Messergebnisse wurden bei einem Mix von 4 Kilobyte Schreib- und Leseblöcken ermittelt.

Die Performance-Kostenschere

Die Einsatzgebiete für Flash finden sich in einem modernen Rechenzentrum fast überall. Es wird hauptsächlich zwischen zwei Datenklassen unterschieden: Online-Daten, für die ein performanter bis höchst performanter Zugriff benötigt wird, und Nearline-Daten für Ablage und Archivierung, bei denen eine lange Zugriffszeit toleriert werden kann.

SATA-Platten bieten sich für die Nearline-Daten sehr gut an, da sie eine akzeptable Performance zu einem günstigen Preis offerieren. Für die Online-Daten werden heutzutage hauptsächlich schnelle Fibre-Channel- oder SAS-Platten verwendet, die mit 10.000 oder 15.000 RPM drehen. In diesem Bereich wird mehr und mehr die Flash-Technologie Einzug halten, und viele Experten erwarten, dass die drehenden Platten mittelfristig komplett durch die nicht-mechanische Technologie abgelöst werden.

Die Preise haben sich mittlerweile so angenähert, dass der immense Performance-Vorteil in Verbindung mit anderen Vorzügen der Flash-Drives – wie geringerer Strombedarf, Reduzierung des Stellplatzes und Optimierung der gesamten Infrastruktur von Software-Lizenzen über Server und Netzwerk bis hin zum Storage selbst – die zunächst höheren Anschaffungskosten mehr als kompensiert. Schon über einen Betrachtszeitraum von 12 bis 18 Monaten ergeben sich häufig finanzielle Vorteile.

I/O-Rate kontra Kapazität

Ein Beispiel soll dies erläutern. Bessere Disk-Speichersysteme bieten die Möglichkeit alle installierten Festplatten zusammenzubinden und virtuell eine LUN über alle Disk zu legen. Daraus ergibt sich dann eine gewisse Speicherkapazität und vor allem eine I/O-Performance, die sich grob zu 100 bis 200 I/Os mal Anzahl der Disk (SATA/ SAS) errechnen lässt: Bei 20 Festplatten wären das 2.000 bis 4.000 I/Os, bei 200 Disks entsprechend 20.000 bis 40.000 I/Os.

Will sich der Storage-Operator nicht zufrieden geben mit der System-Performance, sondern eine I/O-Zahl vorgeben, beispielsweise 100.000 I/Os und nur eine geringe Speicherkapazität von wenigen Terabyte, dann wird die Lage kompliziert und lässt sich wahrscheinlich mit Festplatten gar nicht lösen. Überschlägig gerechnet benötigt man 500 schnelldrehende SAS_Platten mit je 200 I/Os zu je 300 GByte.

Die I/O-Performance lässt sich allerdings weder beim Schreiben halten, noch wenn andere Anwendungen ihre Daten auf den Festplatten ablegen und abrufen würden. Weitere Einschränkungen entstehen sicherlich auch aus dem gewählten RAID-Level.

Ein Violin-Array hingegen hätte genügend Reserven, um nicht Performance-Engpässe zu verursachen. Nicht zu vergessen, dass man mit einem Flash-Array auch auf 100 und mehr Terabyte zwangsläufig zu installierender Festplatten-Speicherkapazität verzichten könnte.

Die CPU läuft zu Hochleistung auf

Ein weiterer kostensparender Vorteil ergibt sich aus der Verringerung der Latenzzeit. Ausgestattet mit klassischen Speichersystemen verbringt ein Datenbankserver meist viel Zeit im „I/O wait state". Sobald Anwendungen um den langsamen Speicherzugriff konkurrieren, verwandeln sich sogar vermeintlich sequentielle Zugriffe in zufällige (random access).

Violin Flash Memory Arrays weisen per se bereits eine um Faktoren geringere Antwortzeit auf als konventionelle Arrays (50 bis 150 Mikrosekunden versus 2 bis 10 Millisekunden). Bei zufälligen Zugriffen fällt dieser Vorteil sogar noch viel höher aus, da hier die Festplatten basierten Systeme einbrechen.

In der Folge müssen die Server nicht mehr auf das langsame Medium Festplatte warten, und die CPU-Performance wird wesentlich besser ausgenutzt. Dieselbe Arbeit kann von weniger CPUs verrichtet werden. Kommen Lizenz- und Wartungsmodelle zum Einsatz, die nach der Anzahl von Prozessoren und Kernen berechnet werden, steht auch hier eine größere Kostenersparnis ins Haus.

Fazit

Die Violin-Systeme der 6000er-Serie sind vollwertige Enterprise-Class Geräte mit redundanten Komponenten, die im laufenden Betrieb getauscht werden können. Aufgrund dieser Eigenschaft und zusätzlichen Mechanismen wie Error Correction und Data Scrubbing erreichen sie eine Verfügbarkeit von 99,999%.

Die Daten werden auf den VIMMs (Violin Intelligent Memory Modules) gespeichert; diese ähneln somit einer SSD, die Sie bereits aus Cache-basierten Storage-Systemen kennen. Aber ein VIMM ist weithaus intelligenter, denn es enthält neben den eigentlichen Flash-Chips und dem DRAM für Metadaten einen Prozessor, der ständig Tasks wie das oben beschriebene „Garbage Collection“ ausführt. Auf diese Weise wird gewährleistet, dass auf jedem einzelnen VIMM immer genügend freie Zellen zum Schreiben vorhanden sind und der „Write-Cliff“ nicht eintritt.

Ein Violin-System der 6000er-Serie kann bis zu 64 VIMMs mit je 256 GByte bis demnächst ein TByte aufnehmen. Die Brutto-Kapazität eines dieser Rack-Geräte mit 3 Höheneinheiten (HE) erreicht dann mehr als 60 TByte.

(ID:34526300)