Eine Diskussion über Flash Storage, Endurance und Deduplizierung

Fünf Aspekte, die bei der Anwendung von All Flash beachtet werden sollten

| Autor / Redakteur: Ulrich Maue / Rainer Graefen

Das Violin 7300 ist ein All Flash Array mit abschaltbaren Dedup-Funktionalitäten.
Das Violin 7300 ist ein All Flash Array mit abschaltbaren Dedup-Funktionalitäten. (Violin Memory)

Nicht nur die Schreibfestigkeit der Speicherzellen von All Flash Arrays haben sich stark verbessert. Auch die Reduktion aller Schreibvorgängge hat die schnellen Speichersysteme sehr zuverlässig gemacht. Durch die nun erreichte Funktionsvielfalt bietet sich eine spezifische Einflussnahme auf die Antwortzeiten von Anwendungen.

Flash wurde Anfang der 1980er Jahre entwickelt und ist eng mit der Geschichte der Digitalkamera verbunden. An den Einsatz im Rechenzentrum oder in zentralen Speichersystemen wurde damals gar nicht gedacht.

Es ging vielmehr darum, einen kompakten, persistenten elektronischen Speicher für den Verbrauchermarkt zu entwickeln. Eine hohe Datendichte zu günstigen Preisen stand und steht bei der Entwicklung im Vordergrund; nachrangig waren die Anforderungen an Zugriffszeiten und Haltbarkeit.

Schreibschwäche ist optimierbar

Bei Flash werden die Daten in Zellen gespeichert, und je nach Flash-Typ „überleben“ einzelne Zellen gerade einmal 5.000, 10.000 oder - beim sehr teuren Flash-Medium SLC - 100.000 Schreibzyklen. Außerdem sind die Schreibvorgänge bis zum Faktor 10 langsamer als die Lesevorgänge. Wie passt das mit den Anforderungen an ein zentrales Speichersystem zusammen, bei dem es vorrangig um hohe Performance und höchste Zuverlässigkeit geht?

Viele Hersteller von Flash-basierten Storagelösungen sagen ihren Kunden, dass diese Nachteile des Speichermediums nur mit Inline-Deduplizierung und am besten kombiniert mit Kompression zu beantworten sind.

Immerhin lassen sich damit die Schreibvorgänge auf die einzelnen Flashbausteine erheblich reduzieren, sodass insgesamt weniger geschrieben wird, die Flashzellen damit weniger abgenutzt und die Performance-Nachteile des Schreibens umgangen werden.

Schwachstellen wie Interface und Hotspots begutachten

All diese Hersteller benutzen einen großen Schreibcache, um die Daten in einem schnellen Medium zwischenzuspeichern, auf Duplikate hin zu untersuchen und bei Bedarf zu komprimieren und schließlich auf das Flashmedium zu schreiben.

Außerdem haben es diese Hersteller gemeinsam, dass sie Flash in Form von SSDs – Solid State Disks – benutzen. SSDs sind der ideale Ersatz für rotierende Festplatten, da sie schließlich über dieselben Schnittstellen wie SAS oder SATA verfügen und wie ganz normale Platten angesprochen werden.

Der Nachteil von SSDs liegt aber genau in dieser Tatsache. Das eigentlich sehr schnelle Medium Flash wird durch diese lange am Markt befindlichen und für drehende Spindeln entwickelte Schnittstellen stark ausgebremst. Die SAS-Schnittstelle limitiert die Datenübertragung auf 1,2 GByte/s, wohingegen gute SSD-Laufwerke bereits 2 GByte/s und mehr liefern könnten.

Zudem hat das Gesamtsystem keinen Einfluss darauf, wohin die Daten tatsächlich geschrieben werden. Es können in der Tat Hotspots entstehen, die für eine schnellere Abnutzung einzelner Bereiche in den SSDs sorgen und schlussendlich zum Ausfall der gesamten Komponente führen.

Jede Speicherzelle darf einmal am Tag beschrieben werden

Einige Hersteller beschreiten allerdings einen radikal anderen Weg. Neben einem eigenen Flash-Controller verwendet beispielsweise Violin Memory als einzige Standardkomponente die Flash-Chips seines Lieferanten und größten Anteileigners Toshiba – der auch Erfinder von Flash ist und die Technologie vor über 30 Jahren entwickelt hat.

Über ein proprietäres, effizientes und performantes Protokoll sprechen die Speichersysteme die Flashbausteine direkt an und bestimmen selbst, wo die Daten hingeschrieben werden. Schreibvorgänge werden ständig gleichmäßig über das Gesamtsystem verteilt, sodass es zu keinen Hotspots kommt.

Zudem weiß das System, welche Flashchips gerade am schnellsten antworten können, und platziert die neuen Daten genau dorthin. Somit müssen Anwender keine „Angst“ vor Schreibvorgängen haben und können auch ohne künstliche Reduzierung von Schreiboperationen mit einer Lebenserwartung von mindestens fünf Jahren rechnen.

Dieser Wert ergibt sich, wenn der Kunde tagtäglich die nutzbare Kapazität des Arrays überschreibt. Überschreibt er nur 50 Prozent der Nutzkapazität täglich, dann ist eine Lebenserwartung von 10 Jahren realistisch. Bei niedrigerem Schreibaufkommen sind die Werte noch höher, sodass das Argument der geringen Schreibzyklen je Flashzelle nicht mehr gilt.

Wege in die Deduplizierung und aus ihr heraus

Man könnte also meinen, dass All-Flash-Arrays keine Datenreduzierung in Form von Inline-Deduplizierung und -Kompression benötigen. Das stimmt nicht so ganz! Immerhin hat die Datenreduktion einen erheblichen Vorteil: Kosten.

Je mehr Daten der Kunde „virtuell“ auf dem Storage-Array speichern kann und je größer der Faktor von effektiv gespeicherten Daten zu tatsächlich genutzter Kapazität ist, desto günstiger wird das Array auf Basis Euro pro Gigabyte. Dieser nicht unerhebliche Vorteil soll dem Kunden natürlich nicht vorenthalten werden.

Deswegen soll auch bei All-Flash-Speichersystemen und -Plattform auf Inline-Deduplizierungs- und Kompressionsfunktionalität geachtet werden. Allerdings ist ein flexibles System zu empfehlen, das dem Kunden erlaubt, sich selber zu entscheiden, für welche LUN im Array er die Datenreduzierung ein- und für welche er sie ausschalten will.

Ein weiterer wichtiger Faktor bei der Wahl des Systems ist die Möglichkeit dieses Ein- und Ausschalten sogar im laufenden Betrieb machen zu können, sprich: eine datenreduzierte LUN transparent in eine „normale“ unreduzierte LUN umzukonfigurieren und umgekehrt.

Inline-Dedup kostet IOPS-Performance

So können Kunden bequem und gefahrlos testen, wie die Auswirkung der Inline-Deduplizierung und -Kompression auf eine bestimmte Applikation im Hinblick auf den tatsächlich erreichten Reduktionsfaktor und auf die Performance konkret aussieht. Inline-Datenreduktion hat nämlich einen erheblichen negativen Einfluss auf die Antwortzeiten.

Für jeden Block, der geschrieben wird, muss vom Controller zunächst ein Hash-Wert errechnet werden, der dann gegen eine Hash-Tabelle geprüft wird. Dies geschieht zwar im Hauptspeicher des Controllers, ist aber trotzdem langsamer, als wenn der Block sofort auf die Flashkomponente geschrieben wird.

Mit Inline-Datenreduktion erreichen marktführende All Flash Arrays bis zu 200.000 IOPS bei Antwortzeit unter einer Millisekunde; ohne Datenreduktion sind es bis zu 1 Million IOPS bei ähnlich kurzen Antwortzeiten. Kunden können wählen, ob sie die ultimative Performance oder den Kostenvorteil des geringeren Kapazitätsbedarfs nutzen wollen, indem sie die Entscheidung auf LUN-Ebene fällen.

Somit ist es möglich, unterschiedliche Applikationen mit ganz verschiedenen Anforderungen an die Performance und Workload auf ein und demselben Array zu betreiben – ohne Zwang und Einschränkungen.

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43328109 / RZ-Hardware)