Ein Zusammenfassung der aktuellen Trends

Storage im Umbruch

| Autor / Redakteur: Michael Matzer / Rainer Graefen

Durch Flash und PCM erfolgt eine Neuordnung der Speicherhierarchie, wenn es nach den Vorstellungen von IBM gehen würde.
Durch Flash und PCM erfolgt eine Neuordnung der Speicherhierarchie, wenn es nach den Vorstellungen von IBM gehen würde. (IBM)

Mehrere Storage-Trends bestimmen derzeit die Entwicklung von Speichermedien. Sowohl die Speicherinfrastrukturen haben sich geändert als auch der Bedarf an Kapazität und Performance. Die Hersteller haben bereits Muster der nächsten und übernächsten Generation von Speichermedien vorgestellt. Storage-insider.de sprach mit Axel Köster, IBMs Chef-Technologen für Speichersysteme in EMEA.

Der Markt für Speichermedien ist stark in Bewegung geraten, seit immer mehr Nutzer von Mobilgeräten und eine wachsende Zahl von Geräten mit Sensoren nach höheren Speicherkapazitäten, aber auch andersartig gestalteten Speichermethoden verlangen.

Flash Memory

In Sachen Flash Memory hat sich nach Ansicht von IBMs Storage-Experte Axel Köster ein Wettrennen darum entwickelt, wer die meisten "Stockwerke" im 3D-Design von NAND-Flash-Chips erzielt. Derzeit sind Chips mit 32 Schichten verfügbar. Der Durchbruch für 3D-Flash kommt wohl dieses Jahr, also 2015. Köster erwartet eine jährliche Verdopplung der Speicherkapazität. Labormuster mit der zehnfachen Speicherdichte sind bereits machbar.

Hinzukommt, dass die 3D-Design-Fabrikation zwar aufwendiger, aber die Kosten pro Gigabyte mittlerweileunterhalb denen des 2D-Designs liegen, gemäß der Formel "Fläche pro Prozesskosten". Die zukünftigen 3D-PCM-Chips konkurrieren mit der 3D-NAND-Technik, die zusätzlich noch dank TLC-Technik 3 Bits pro Zelle speichern können.

Phase Change Memory

Eine Alternative zu der begrenzten Skalierbarkeit von elektrischer Ladung" als Speichermechanismus stellt nach Ansicht Kösters Phase Change Memory (PCM) dar. Dieses Mittelding aus Flash und DRAM ist 10.000 Mal haltbarer bei Schreibzugriffen als Flash, benötigt keinen "Aufräumdienst" mit entsprechendem Overhead und wird bald zu vergleichbaren Preisen wie NAND-Flash zur Verfügung stehen. Der produktive Einsatz mit geringen technischen Anforderungen wird seit einigen Jahren bei Mobilgeräten erprobt.

Flash-Arrays ohne SSDs

RAID wird nun anders implementiert. Durch die Einsparung von Komponenten für RAID-Adapter und SSD-Controller vor den Speicher-Chips sowie durch parallelisierten Zugriff wird hier eine Einsparung von Latenzzeit und Platz und Herstellungskosten erzielt, bei höherer Zuverlässigkeit.

Die Kunden wollen geringe Antwortzeiten statt "nur" hohe I/O-Zahlen pro Sekunde. Ein Trade-off: Wenn die Software intelligenter wird, steigt die Latenzzeit. Je "dümmer" der Controller und je geringer sein Overhead, desto geringer die Latenzzeit.

Festplatten

Im Zuge dieser Entwicklung im Flash-Markt werden Festplatten (HDDs) in der Herstellung teurer als Flash-Chips und somit zu einem Auslaufmodell, sofern HDD-Hersteller nicht ordentlich nachlegen. Seagate hat kürzlich 1 TByte in einem 2,5-Zoll-Format vorgestellt.

Die jüngsten HDD-Modelle Western Digital/HGST arbeiten mit Helium als niedrigviskosem Gas. Dies erlaubt kleinere Motoren, dadurch mehr Speicherfläche und höhere Speicherdichte. So lassen sich noch Kapazitäten jenseits von 8 bis 10 Terabyte realisieren. Die nächste Stufe sind überlappend schreibende HDDs, die eine vorraussichtlich 50-prozentige Steigerung der Kapazität möglich machen werden.

Grids

Der Trend geht weg von den HDDs. Eine Alternative zu monolithischen Speicherboxen sind Grid-Speicher auf Softwarebasis wie etwa IBM Spectrum Accelerate. Als Grid-Speicher sind max. 30 Server zu betreiben, die jeweils bis zu 12 HDDs plus 1 SSD umfassen mit jeweils x Terabyte Kapazität. Rechenbeispiel: 15 * 12 * 8 TB = 1440 TB = 1,44 PB pro Grid). Spectrum Accelerate ist auch als fertiges Hardwareprodukt namens XIV Storage System, dann mit maximal 15 Servern, zu haben.

Bandlaufwerke (Tapes)

Derzeit sind Tapes mit einer Speicherkapazität von 10 TByte pro Tape verfügbar. Es gibt indes bereits bei IBM Labor-Muster mit 220 TByte pro Kassette. Sie weisen eine andere Beschichtung auf, die von Fujifilm und IBM entwickelt wurde. Dafür sind andere Kassetten nötig als heute. Tape unterbietet jedes andere Speichermedium hinsichtlich Preis pro Terabyte, selbst wenn fortschrittliche Datenreduktionstechniken einsetzt werden.

Die Einsatzbereiche verlagern sich immer mehr vom reinen Backup hin zur Archivierung und Bereithaltung von "kalten" Daten. Auch als transportables Medium werden Tapes gern bei großvolumigen Dateien genommen, besonders seit hier bevorzugt der offene Standard LTFS (Linear Tape File System) für die Beschreibung des Inhalts verwendet wird .

Speicherinfrastrukturen

Bei den Speicherinfrastrukturen sieht man am ehesten, wie sehr sich die Welt der Storage-Praktiken geändert hat. Object Storage etwa ist heute bereits der Standard für Objekte wie etwa Online-Videos und -Audiodateien, die nur einmal gespeichert, aber nie verändert werden, weil sie nur durch ein Update ersetzt werden.

Hier spielen die diversen globalen Filesysteme wie etwa GPFS, BeeGFS oder Apache Lustre eine wesentliche Rolle. Speicherobjekte werden nicht mehr per Pfad, sondern nur noch per ID zugänglich gemacht. Dabei fällt jede Art der Authentifizierung weg. Auch andere Metadaten werden nicht gespeichert, so dass der Overhead minimal ist. Das Ziel ist maximaler I/O pro Sekunde bei minimalem Hardwareeinsatz.

Eine sinnvolle Nebenwirkung besteht in der Auswertung solcher Objektspeicher in einem Unternehmen. Bei IBM etwa gibt es Object Storage als eine Art Enterprise Dropbox. Darauf lassen sich Analysemethoden anwenden, die die Objekt-Produzenten und -Konsumenten - also IBM-Mitarbeiter und -Partner - nach Likes und Tags auswerten. Auf diese Weise konnte eine IBM-interne App namens "Expertise" entwickelt werden, die dem Benutzer sagt, welcher IBM-Mitarbeiter sich durch seinen geistigen Footprint als Spezialist für ein bestimmtes Fachgebiet ausgewiesen hat.

Das Prinzip "Eventual Consistency"

Die einmalige Speicherung von Objekten macht synchrone Techniken wie Dateisperrungen überflüssig und ermöglicht höhere Latenzen und größere Reichweiten. Viele Cloud-Dienste sowie Sync & Share-Clients arbeiten bereits so. Objekte werden meist repliziert, entweder als Sicherung oder zur Synchronisation zwischen - meist mobilen - Geräten. Manche dieser Replikate sind vielleicht nicht superaktuell, aber das ist für viele Benutzer akzepatbel. Inakzeptabel wäre die lange Wartezeit auf Replikate.

Dieses neue Paradigma trägt die Bezeichnung "Eventual consistency". Es ist das genaue Gegenteil zur Transaktionsdatenverarbeitung. Beispiele: Während die Version eines Kontostands, der nicht aktuell ist, inakzeptabel erscheint, erfüllt ein nicht ganz so aktueller Web-Index durchaus seine Aufgabe. Die etwas verspätete Version einer statistischen Verhaltensanalyse, wie sie etwa bei der Kaufempfehlung in einem Webshop ("andere Kunden interessierten sich auch noch für diese Produkte") auftaucht, ist akzeptabel, solange der Nutzer noch auf der Site surft.

"Eventual Consistency" bedeutet soviel wie: "am Ende des Tages sind die Versionen dieser Daten übereinstimmend". Wer dieses Prinzip umsetzt, kann die Infrastruktur seines Rechenzentrums erheblich vereinfachen. Denn da es keine Notwendigkeit für Synchronisationsaufgaben und keinen Bedarf an geringer Latenzzeit oder gar für Two-phase Commits (wie bei Transaktionen) gibt, besteht die einzige Notwendigkeit darin, möglichst hohe Skalierbarkeit sicherzustellen.

Software-defined Storage

Hier gibt es nach Ansicht von Axel Köster derzeit zwei beobachtbare Wege:

  • 1. Um etwa als Managed Service Provider bestimmte SLAs einzuhalten, greift ein Anbieter auf die entsprechend ausgestattete Storage-Hardware eines Herstellers zurück.
  • 2. Oder man nutzt nur diejenige Software, die man auf einer Hersteller-Disk bekommt und wendet sie auf die eigene Storage-Hardware an.

Das setzt allerdings entsprechende Fachkenntnisse voraus. Solch eine Software ist beispielsweise IBM Spectrum Accelerate. Spectrum Accelerate ist auch als fertiges Hardwareprodukt namens XIV Storage System (Grid-Speicherbox, s.o.), dann mit maximal 15 Servern, zu haben.

Speichernetzwerke

Je schneller die Medien für Storage werden, desto größer wird allerdings der Bedarf an geringer Latenz in Netzwerken, bis schließlich die Lichtgeschwindigkeit das Limit darstellt. Ethernet-LAN als Speichernetzwerk mit iSCSI- oder FCoE-Protokollen können nur durchschnittliche Latenzzeiten gewährleisten.

Fibre Channel SANs werden gemäß Kösters Vorhersage vorherrschen. Serialized SCSI (SAS), Infiniband und PCIe ermöglichen bereits, verborgen vorm Nutzer, die schnellsten internen Bus-Geschwindigkeiten in geclusterten Storage Arrays.

"Zum Vergleich: Die Gesamtleistung des geclusterten IBM XIV Storage System wurde mehr als verdoppelt, als das interne Ethernet-Grid durch Infiniband ersetzt wurde, denn auf diese Weise wurden Latenzbarrieren beseitigt."

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43612913 / Speicherhierarchie)