Suchen

Kommentar von Heiko Wüst, Nexenta Systems Hybrid Storage Pools nutzen die Stärken von HDD, SSD und DRAM

| Autor / Redakteur: Heiko Wüst / Nico Litzel

Wie balanciert man Kosten und Leistung beim Speicher mit verschiedenen Speichermedien optimal aus? Das Wichtigste dabei ist die Konzentration auf das „Working Size Set“, also die Daten, die tatsächlich genutzt werden.

Firmen zum Thema

Diagramm 1: Daten in einem Hybrid Storage Pool werden über den Adaptive Replacement Cache hierarchisch verteilt.
Diagramm 1: Daten in einem Hybrid Storage Pool werden über den Adaptive Replacement Cache hierarchisch verteilt.
(Grafik: Nexenta Systems)

In den vergangenen Jahren kristallisierte sich ein Problem moderner Speichersysteme mehr und mehr heraus: Normale Systeme konnten mit dem ungeheuren Bedarf moderner Applikationen nach immer mehr Leistung nicht Schritt halten. Die Leistungsschübe auf der Prozessorseite waren enorm, die Speicherseite ihrerseits stagnierte. Um diese Lücke zu schließen, mussten teure HDDs angeschafft werden, um einen moderaten Schub an Leistung in Form von kürzerer Latenzzeit zu erreichen oder es musste mehr Kapazität eingekauft werden als eigentlich nötig war, um die Leistung zu erhöhen.

Eine Möglichkeit, dieses Problem zu lösen, besteht grundsätzlich darin, Flash-Speicher zu nutzen. Jedoch sprechen die hohen Kosten in der Praxis oft dagegen. Nun, da die Preise für Flash langsam fallen, integrieren immer mehr Hersteller von Speicherhardware Flash in ihre Produkte. Ein architektonisch viel sinnvollerer Ansatz, Flash zu nutzen, liegt jedoch im Dateisystem. Dieses sollte verschiedene Speichermedien automatisch, effizient und intelligent nutzen – nicht zuletzt, um die hohen Investitionen in Flash-Speicher zu rechtfertigen.

Bildergalerie

Hybrid Storage Pools holen das Beste aus den Speicherressourcen heraus

Eine Technik, die es schafft, Flash effizient zu nutzen, ist der Hybrid Storage Pool (HSP) im Open-Source-Dateisystem ZFS. Dieser Pool integriert DRAM, SSDs und rotierende HDDs zu einem einzigen virtuellen beschleunigten Speichermedium. Der Hybrid Storage Pool ist ein Standard in ZFS-basierten Produkten, das man in vielen anderen Dateisystemen vergeblich sucht. Um maximale Effizienz und Performance zu erreichen, werden die Daten in einem Hybrid Storage Pool hierarchisch über drei unterschiedliche Pfeiler verteilt (siehe Diagramm 1).

DRAM ist die erste Wahl

Für alle geschriebenen Daten ist der schnelle Adaptive Replacement Cache (ARC), der sich im DRAM befindet, die beste Adresse. Das ist die Quelle für das Lesen von Daten mit der geringsten Latenz. ZFS prüft bei einer Anfrage nach Daten zuerst, ob sich diese im ARC befinden. Sind diese dort, können sie innerhalb von Nanosekunden gelesen werden und erreichen somit sehr schnell die Anwendung, die die Daten benötigt. Welche Daten innerhalb des ARC vorgehalten werden, entscheidet ZFS automatisch nach den Kriterien „Most Recently Used“ (MRU) und „Most Frequently Used“ (MFU).

(ID:42238772)