Das Beste aus den beiden Speicherwelten HDD und SSD rausholen All-Flash-Arrays sind nicht ausreichend kosteneffizient in einem Tiering-Konzept

Autor / Redakteur: Scott Harlin, Director Marketing Communications - Enterprise Solutions bei OCZ Storage Solutions / Rainer Graefen

Ja, es gibt sie noch. Antiquierte Speichergeräte mit drehenden Platten, eingeführt Mitte der 1950er Jahre. Sie werden immer noch dominierend als Sekundärspeicher in Rechenzentren eingesetzt und so wird es auch bleiben - wenn man die Performance-Stufe Tier 0 strategisch korrekt organisiert.

Firma zum Thema

( OCZ/Toshiba)

Seitdem die meisten von uns entweder privat oder geschäftlich Computer und Computernetzwerke nutzen, sind wir mit der Speicherung von Informationen auf traditionellen Festplatten (HDDs) vertraut.

1. Hybrid bringt Kostenvorteile

Diese Vormachtstellung herausfordernd haben Flash-basierten NAND-Speicher (SSDs) in den letzten paar Jahren erhebliche Fortschritte gemacht und liefern deutlich schnellere I/O-Zugriffe sowie beschleunigte Server-Anwendungs-Performance, was CAPEX, OPEX und Total Cost of Ownership (TCO) in Unternehmen reduziert hat.

Bildergalerie

Die Verwendung von HDDs und SSDs im Rechenzentrum muss nicht immer eine „entweder / oder“-Entscheidung sein. Eine Koexistenz kann sogar für eine optimale Balance aus Leistung, Kapazität und Kosteneffizienz sorgen, vor allem für jene weitverbreiteten Enterprise-Anwendungen wie hierarchisches Speichermanagement „Tiered Storage“ und Virtualisierung.

Der Zweck dieses Artikels ist es die Vorteile dieses Hybrid-Ansatzes zu skizzieren, welcher die Performance-Vorteile von SSDs und die kosteneffizienten Kapazitäts-Vorteile von HDDs vereint.

2. HDD-Enterprise-Einschränkungen

Basierend auf ihrem mechanischen Innenleben, haben HDDs sowohl mit Performance als auch mit physikalischen Einschränkungen zu kämpfen, welche verhindern, dass sie mit den wachsenden Server-Workloads Schritt halten können.

Während Basic-Server bereits Hunderttausende von Input/Output-Operationen pro Sekunde (IOPS) bearbeiten können, liefert eine traditionelle HDD typischerweise eine Leistung zwischen 200 und 350 IOPS. Für jede Anfrage, bei der Daten von einem anderen Ort auf der Festplatte benötigt werden, muss der mechanische Kopf der Festplatte sich bewegen, was sich allein durch die physikalische Beschaffenheit, auf die Lesegeschwindigkeit für zufällige Daten auswirkt.

HDDs sind für einfache Datenströme konzipiert, die sequentielle Lese-und Schreibvorgänge beinhalten, welche physisch auf der gleichen Spur abgelegt werden. Da moderne Betriebssysteme immer mehr komplexe und multiple Daten beinhalten, kommen auch immer mehr zufällige (Random) Lese- und Schreibvorgänge vor, so dass HDDs mit den wachsenden Server-Workloads einfach nicht mehr Schritt halten können.

Obwohl HDDs eine niedrige I/O-Leistung haben und physikalisch bedingt anfälliger für Fehler sind, liegt ihr Nutzen für Unternehmen in der großen Speicherkapazität, basierend auf grundlegenden Terabyte-Konfigurationen, die weit über den typischen Kapazitäten von SSD-Flash liegen. Eine einzige Flash-basierte SSD kann die Random-IOPS-Performance liefern, wie ein großes SAN-Array mit Tausenden von HDDs.

3. Performance jenseits der Disk

NAND-Flash-Zellen in einer SSD sind im Vergleich zu herkömmlichen Festplatten viel dichter und es werden keine rotierenden Scheiben oder magnetischen Köpfe für die Suche von bestimmten Orten verwendet, um auf die Daten zuzugreifen oder sie zu verarbeiten.

Der Controller hat die erforderlichen Datenstandorte bereits zur Verfügung, was zu schnelleren Lese- und Schreibzugriffszeiten führt sowie keine beweglichen Teile beinhaltet, welche kaputt gehen oder für Fehlfunktionen sorgen könnten und somit mühelos einen I/O- Zugriff auf zufällige Daten mit geringer Latenz begünstigt.

Tatsächlich kann eine einzelne Flash-basierte SSD so viele Random IOPS liefern, wie vergleichsweise ein großes SAN-Array mit Tausenden von HDDs. Mit einem Flash-Translation-Layers (FTL), erscheint der SSD-Flash-Speicher für das Betriebssystem als Laufwerk, was eine schnelle und einfache Integration ins Enterprise-Umfeld ermöglicht, insbesondere im Rahmen vorhandener HDD-Implementierungen.

SSDs sind als HDD-Ersatz im Rechenzentrum selbst dann wirksam, wenn die Anwendung

nur noch 50 Prozent des tatsächlichen Speichers zur Unterstützung des bestehenden SAN benötigt. Wird die Hälfte der Festplatten mit vergleichsweise performanten SSDs ersetzt, reduziert dies nicht nur den Platzbedarf bei geringeren Investitionen, sondern auch die SAN-Leistung wird zusätzlich noch dramatisch verbessert.

Dieser hybride Ansatz ist für jene IT-Manager sehr interessant, die ein Gleichgewicht aus Leistung, Kapazität und Kosteneffizienz anstreben, vor allem für solche weit verbreiteten Anwendungen wie Tiered Storage und Virtualisierung.

4. Hybrides hierarchisches Speichermanagement (Hybrid Tiered Storage)

Das beste Beispiel für die Kombination von Geschwindigkeit von SSDs mit der großen Kapazität von HDDs zeigt die Tier-Pyramide. Diese Anwendung kategorisiert Daten von Unternehmen, basierend auf bestimmten und verbunden Kriterien, wie beispielsweise den Performance-Anforderungen, dem Datennutzen, der Datengröße, deren Wichtigkeit, dem Grad für Datenschutz etc.

Die kategorisierten Daten werden dann verschiedenen Arten von Speichermedien zugeordnet, die sich entweder im SAN oder in bereitgestellten Anlagen (Storage-Arrays oder –Geräten) befinden, auch abhängig von den Kosten des Mediums. Dieser hybride Ansatz legt Wert auf Daten, priorisiert diese und reduziert damit die Gesamtkosten für das SAN/Speicher-Equipment.

Die wichtigsten Daten eines Unternehmens (Mission Critical), mit intensiven Transaktionen, brandaktuell und als „Hot“ sowie vertraulich eingestuft, werden zum Beispiel Tier-0-Daten zugeordnet. Ihre Bedeutung qualifiziert diese Daten für hoch-qualitative Speichermedien wie SSDs, die eine höhere Leistung, Beständigkeit und Zuverlässigkeit. Dieser hybride Ansatz bewertet Daten, priorisiert Daten und reduziert die Gesamtkosten für SAN- und Speicherequipment.

Weniger häufig verwendete Daten werden typischerweise Tier-1-Speichern zugewiesen, beanspruchen nicht unbedingt SSD-Performance sondern nur ein wenig mehr Leistung und Zuverlässigkeit wie Konsum-Lösungen. Damit sind HDDs, die 10k bis 15k U/min liefern, gut für dieses Spektrum geeignet. Eine große Menge an selten genutzten Daten, wird normalerweise als Tier 2 eingestuft. Hier passen Kapazitäts-orientierte HDDs mit 7.500 U/min.

Eine SSD pro Tier

Da die Tier-Abstufungen wachsen, könnte eine Vielzahl von Kategorisierungsstrategien implementiert werden, um weniger teure Medien wie Wechseldatenträger (z. B. CDs, Band, Low-End-HDDs) zu integrieren oder auch ein MAID (Massive Array of Idle Disks) einzubinden.

Die Kombination aus schnellen I/O-Zugriffen und beschleunigter Anwendungs-Performance von SSDs und der signifikanten Speicherkapazität von HDDs kann entsprechend den Anforderungen der Unternehmensstruktur implementiert werden. Um diesen Hybrid-Ansatz zu perfektionieren, wäre die Überlegung, eine SSD im Server selbst zu installieren und diese als Beschleuniger durch Caching der am häufigsten verwendeten Tier-0 und Tier-1 Daten zu nutzen.

Innerhalb eines jeden Anwendungsdaten-Zugriffprofils gibt es häufiger eine Datenteilmenge, die regelmäßig angefordert wird. Diese „Hot Data“ können auf der SSD im Server zwischengespeichert werden.

Auf diese Weise müssen diese angeforderten „Hot Data“ nicht vom SAN kommen, da sie bereits auf der SSD innerhalb des Servers kopiert worden sind. Dies eliminiert nicht nur Server-Engpässe sondern auch den Flaschenhals bei SAN-Zugriffen. Angesichts der von SSDs gegenüber HDDs gelieferten Leistung als auch I/O-Resonanz-Vorteile, wird der Zugang zu den „Hot Data“ stark verbessert.

Integriert man dieses Flash-Caching in die Infrastruktur, werden nicht nur die allgemeinen Investitionen gesenkt, da nur ein paar SSD-Flash-Medien benötigt werden, sondern auch die Leistung durch die Flash-Technologie erhöht.

Dies ermöglicht IT-Managern weiterhin die Kapazitätsvorteile von Festplatten für weniger frequentierte oder häufig verwendete Daten zu nutzen und bietet eine der kostengünstigsten und effizientesten Hybrid-Speicherlösungs-Ansätze heutzutage.

Fügt man Flash-Caching der Infrastruktur hinzu, werden nicht nur die allgemeinen Investitionen gesenkt, da nur einige SSD-Flash-Speicher benötigt werden, sondern es wird auch die Leistung durch die Flash-Technologie erhöht.

5. Hybrid-Virtualisierung

Virtualisierung ist eine Unternehmensanwendung, welche Server-Ressourcen verteilt und den physischen Host in mehrere isolierte virtuelle Umgebungen, sogenannte virtuelle Maschinen (VMs),unterteilt, um durch die bessere Auslastung der Host-Ressourcen kosteneffektiver zu werden. VMs helfen Systemlasten auszugleichen und erweitern die Verarbeitungskapazitäten, wodurch weniger physikalische Hosts pro Anwendungsbearbeitung benötigt werden und somit auch eine deutliche Reduktion der System- und Wartungskosten.

In diesen virtualisierten Umgebungen wurden Speichermedien traditionell in externen SANs oder Storage-Arrays mit HDDs ausgelagert, die in den meisten Fällen jedoch keine große Anzahl von VMs gleichzeitig bedienen können, geschweige denn mit ihrer IOPS-Leistung mit der benötigten Server-Arbeitslast Schritt halten können.

Da viele Anwendungen gleichzeitig laufen, werden ihre gemeinsamen Speicherzugriffe durch die Virtualisierung-Layer vermischt. Dadurch entstehen I/O-intensive Random-Zugriffe, was wiederum für HDDs das größte Problem darstellt und ihre physikalischen Köpfe sich so kontinuierlich von einem Ort zum anderen bewegen. Dies ist allgemein als I/O-Blender-Effekt bekannt.

Da alle VMs einer virtualisierten Umgebung gleichzeitigen Zugriff auf externe Speichermedien im Host haben müssen, ermöglicht das Caching der am häufigsten verwendeten Daten auf SSD-Flash-Speicher allen verbundenen VMs den Datenzugriff mit einer viel höheren Geschwindigkeit und geringerer Latenz. Daten auf welche nicht häufig zugegriffen wird oder die weniger wichtig sind, sind Anwärter für HDDs wie zuvor im Hybrid-Tiered-Storage-Abschnitt erläutert.

Flash-Cache richtig verteilen

Im Gegensatz zu HDD-Speichern haben Flash-basierte SSDs keine beweglichen Teile und können daher Random-Datenzugriffe mühelos bewältigen, so dass sie Virtualisierung effektiv unterstützen und gleichzeitig die Anzahl tausender Festplatten reduzieren, welche für die erforderliche I/O-Leistung benötigt wurden. In einer virtualisierten Umgebung liegt der Schlüssel darin, Random Loads effektiv zwischen allen verfügbaren Flash-Ressourcen der SSD zu verteilen, um somit schnellen und zuverlässigen Datenzugriff ohne Belastung der Host-CPU oder Speicher-Ressourcen zu liefern.

Um dies zu erreichen, ist zusätzlich eine intelligente Software erforderlich, welche Flash-Caching und Storage-Virtualisierung in einer virtualisierten Server-Plattform liefert, während dem Flash-Cache ermöglicht wird, die Größe des Clusters oder der gesamten verfügbaren HDD-Speicherkapazität aus dem externen SAN zu skalieren und damit eine Hybrid-Virtualisierung zu schaffen.

Diese Fähigkeit Flash unter den VMs je nach Bedarf aufzuteilen stellt sicher, dass keine VM den Flash-Speicher ineffizient in Beschlag nimmt, wenn er besser anderswo in der virtualisierten Umgebung verwendet werden kann.

Die von OCZ Storage Solutions entwickelte Lösung, behandelt PCIe-basierte SDDs nur als weitere virtuelle Ressource, und durch die VXL-Software wird ein zentrales virtuelles Instrument erstellt, das direkt mit dem Virtualisierungs-Hypervisor vom OS arbeitet, um dynamisch die benötigten Flash-Ressourcen nach VM-Bedürfnissen verteilt.

Die Fähigkeit den Flash-Speicher je nach Bedarf unter den VMs zu verteilen stellt sicher, dass keine VM ineffizient den Flash-Speicher belegt, während er besser anderweitig in der virtualisierten Umgebung verwendet werden kann und somit der Flash-Cache jederzeit optimal genutzt wird, unabhängig davon wie viele VMs gleichzeitig laufen.

Obwohl sich der Flash-Cache in einem Server befindet, kann diese Ressource von mehreren Servern gemeinsam genutzt werden. Dieser innovative Ansatz liefert den höchsten Return on Investment (ROI) einer virtualisierten Umgebung, in der sich viele VMs den Flash-Speicher teilen und oftmals nicht gleichzeitig Spitzenauslastungszeiten mit deren Anforderungen erreichen.

6. Fazit

In Unternehmen bietet die Koexistenz von HDDs und SSDs ein ausgewogenes Verhältnis aus Leistung, Kapazität und Kosteneffizienz für Anwendungen wie Tiered-Storage und Virtualisierung. Dieser Hybrid-Ansatz ermöglicht den HDD-Einsatz, um günstige Speicherkapazität aber auch die erforderliche Leistung von SSDs zu liefern. Die I/O-Performance muss daher nicht länger von einem großen Array rotierender und fehleranfälligen Festplatten erbracht werden.

Die Zusammenführung der Performance-Vorteile von SSDs mit den Kapazitäts-Vorteilen von HDDs schafft eine bessere Nutzung von Server-Ressourcen und reduziert die Anzahl erforderlicher Festplatten im Rechenzentrum. Dies wiederum senkt die Investitions- und Betriebskosten erheblich, wie auch den mit High-End-SAN-Arrays verbundenen Strom-, Kühlungs- und Wartungsaufwand. Am Ende entsteht eine schlankere Lösung, aber eine, die überragende TCO für das Rechenzentrum liefert.

(ID:43024056)