HDD-Array vs. SSD-Array – der Performance-Test Festplatte oder Flash – was speichert schneller?

Autor / Redakteur: Rainer W. Käse* / Dr. Jürgen Ehneß

In realen Applikationslandschaften besteht der Workload in aller Regel aus einer Mischung unterschiedlicher Block- und Dateigrößen. Ein umfassender Test zeigt, dass ab einer gewissen Blockgröße HDDs eine höhere Performance als SSDs bieten.

Anbieter zum Thema

HDDs und SSDs im Performance-Direktvergleich – Rainer W. Käse von Toshiba hat’s ausprobiert.
HDDs und SSDs im Performance-Direktvergleich – Rainer W. Käse von Toshiba hat’s ausprobiert.
(Bild: ©vladimircaribb - stock.adobe.com)

Wenn es lediglich um die Speicherung von großen Datenmengen bei niedrigen Kosten pro Kapazitätseinheit geht, führt an Hard Disk Drives (HDDs) kein Weg vorbei. Solid State Drives (SSDs) hingegen bieten Vorteile bei Applikationen, bei denen es auf eine hohe Performance ankommt. So lautet die allgemeine Einschätzung. Sie spiegelt allerdings nur die halbe Wahrheit wider. Eine nähere technische Betrachtung zeigt, dass vor allem auch die Block- und Dateigrößen für die HDD- und SSD-Performance entscheidend sind.

Zentraler Pluspunkt von SSDs sind die kurzen Datenzugriffszeiten. Damit sind sie hinsichtlich Input/Output Operations Per Second (IOPS) um ein Vielfaches schneller als HDDs. Wichtig ist dieser Punkt vor allem bei Applikationen wie Datenbanken oder bei der Verwendung als Boot-Medium, für die die Random-Performance das entscheidende Kriterium darstellt. Und bei Applikationen wie Videostreaming, bei denen die sequenzielle Performance von Bedeutung ist, bieten SSDs mindestens die doppelte Performance von HDDs, gemessen in Megabyte pro Sekunde (MB/s). Allerdings sind SSDs pro Kapazitätseinheit wesentlich teurer, etwa um den Faktor zehn bei vergleichbarer Technologie. Wenn eine Applikation nur einen relativ geringen Speicherbedarf hat und die Performance das Hauptkriterium ist, sind SSDs auf jeden Fall die naheliegende Wahl – zum Beispiel bei Boot-Laufwerken oder Tier-0-Storage-Anwendungen.

RAID und SDS

Bei Applikationen mit hohen Anforderungen an die Datenspeicherkapazität müssen mehrere SSDs oder HDDs in einer Storage-Lösung kombiniert werden – etwa unter Verwendung von RAID-Konfigurationen. Darüber hinaus bieten sich auch neue Software-Defined-Storage-Systeme (SDS-Systeme) an, mit denen kostengünstige, aber relativ langsame HDD-Komponenten so zusammengestellt werden können, dass sie nahezu die Performance von Lösungen mit einigen wenigen High-Speed-Komponenten erreichen. Als positiver Nebeneffekt ist die verfügbare und nutzbare Speicherkapazität dann wesentlich größer – und zwar zu den gleichen Kosten wie bei einer SSD-basierten Variante.

Wenn es um die konkreten Anforderungen hinsichtlich Kosten pro Kapazitätseinheit und Performance geht, könnte eine zugespitzte Frage folglich lauten: Kann ein Array mit mehreren Enterprise-HDDs sogar besser geeignet sein als eine Lösung mit wenigen Enterprise-SSDs? Die Antwort darauf lautet „ja“, wie der Vergleich einer typischen SSD- und HDD-Storage-Konfiguration zeigt.

Konkret besteht der SSD-Testaufbau aus acht 1,6-TB-3DWPD-SATA-Enterprise-SSDs in einer RAID-6-Konfiguration mit doppelter Parität für die Datensicherheit. 3DWPD bedeutet, dass ein Laufwerk jeden Tag dreimal komplett überschrieben werden kann. Dieser Wert ist die minimale Empfehlung für Enterprise-Storage-Applikationen auf SSD-Basis; HDDs weisen aufgrund ihrer Technologie keine Einschränkungen hinsichtlich der Anzahl der Schreibvorgänge auf. Die SSDs werden in der Testumgebung in der Frontplane des Referenzservers installiert und von einem internen RAID-Controller gesteuert.

Für den Vergleich wird eine HDD-basierte Konfiguration mit 24 HDDs mit einer Kapazität von bis zu 2,4 TB gewählt. Sie sind in einem 2-HE-24-Bay-JBoD installiert – verbunden mit einem zweiten RAID-Controller im Evaluierungsserver unter Verwendung einer externen Dual-Path-SAS-Verbindung. Die HDDs sind als RAID 10 konfiguriert, das RAID-0-Striping mit parallel genutzten Laufwerken zur Performance-Aggregation mit RAID-1-Spiegelung für die Datensicherheit kombiniert.

Die Testkonfiguration im Überblick

Storage 8 x eSSD SATA
1,6 TB 3DWPD
24 x HDD SAS
2,4 TB 10krpm
Konfiguration RAID 6 RAID 10
Controller Microsemi Adaptec
SmartRAID 3154-8i
Microsemi Adaptec
SmartRAID 3154-8e
Chassis Supermicro
CSE-826BAC4
(im Server)
AIC XJ1-20242-05
2 HE 24 x 2,5" Hot Swap Bays,
Hot Swap JBoD mit Dual SAS
12G Expander Controller,
Tool-Less HDD Tray,
549W 80+ Platinum RPS (extern)
Nettokapazität (TB) 9,6 28,8

Die HDD-Architektur bietet im Testaufbau somit die dreifache Nettokapazität der SSD-Umgebung – bei nahezu identischen Anschaffungskosten.

Die Performance-Evaluierung

Die Performance beider Lösungen wird mit Fio-Scripten evaluiert – durch Generierung eines synthetischen Random-Workloads mit 16 simultanen Lese- und Schreibaufgaben.

Die Tests liefern das erwartete Ergebnis: Bei kleinen Blockgrößen und einem hohen Anteil an Datensuchprozessen wird die Geschwindigkeit durch die IOPS dominiert, sodass die SSD-Lösung die erheblich bessere Performance bietet.

Blockgröße IOPS
8 x SSD
MB/s
8 x SSD
IOPS
24 x HDD
10,5k
MB/s
24 x HDD
10,5k
4 KB 80.000 320 11.200 45
8 KB 52.000 416 10.800 86
16 KB 30.000 480 10.000 160
32 KB 15.000 480 9.200 294

Je mehr die Blockgröße aber zunimmt, desto mehr bestimmt die sequenzielle Performance das Testergebnis. Obwohl SSDs doppelt so schnell wie HDDs sind, bieten 24 parallel genutzte HDDs eine höhere Performance bei Blockgrößen schon ab 64 KB.

Blockgröße IOPS
8 x SSD
MB/s
8 x SSD
IOPS
24 x HDD
10,5k
MB/s
24 x HDD
10,5k
4 KB 80.000 320 11.200 45
8 KB 52.000 416 10.800 86
16 KB 30.000 480 10.000 160
32 KB 15.000 480 9.200 294
64 KB 7.100 454 8.100 518
128 KB 3.750 480 6.900 883
256 KB 2.300 589 5.400 1.382
512 KB 1.500 768 2.800 1.434
1 MB 1.050 1.075 1.425 1.459
2 MB 590 1.208 715 1.464
4 MB 330 1.352 410 1.679
8 MB 170 1.393 235 1.925
16 MB 90 1.475 145 2.376
32 MB 45 1.475 85 2.785
64 MB 23 1.507 46 3.015

Bei Workloads mit kleineren Blockgrößen zwischen 4 KB und 32 KB ist die SSD-Lösung im Testaufbau somit schneller. Dieses Workload-Profil zeigt sich typischerweise bei Applikationen wie Datenbanken, hochperformanter Analytik oder Finanztransaktionen. Die benötigte Speicherkapazität ist bei diesen Applikationen im Allgemeinen sehr gering. Sie beträgt oft kaum mehr als ein paar Terabyte, sodass auch die Kosten der SSD-Technologie durch den Performance-Gewinn gerechtfertigt sind.

Bei Workloads, bei denen Blockgrößen von 64 KB oder mehr dominieren, sind hingegen die 24 parallel genutzten HDDs, also die Multi-Spindel-Lösungen, mit höherer Kapazität schneller als die SSD-Konfiguration. Die meisten Workloads in Bereichen wie Web- und E-Mail-Hosting, Cloud-Storage, Dokumentenmanagement, Backup und Archivierung fallen in diese Kategorie.

Im Hinblick auf diese Ergebnisse darf ein Punkt nicht außer Acht gelassen werden: In realen Applikationslandschaften besteht der Workload üblicherweise aus einem Mix von kleineren und größeren Blöcken und Dateien. Deshalb wird auch ein Test mit einem generischen, gemischten Workload durchgeführt. Dabei ergeben sich folgende Resultate:

Blockgröße IOPS SSD MB/s SSD IOPS HDD MB/s HDD
4 KB: 20%, 64 KB: 50%,
256 KB: 20%, 2 MB: 10%
2.400 800 3.300 980

In diesem realen Szenario bietet die HDD-Lösung also klar die höhere Performance. Der Grund: Obwohl eine einzelne SSD viel schneller ist als eine HDD, punktet die HDD-Lösung durch die höhere Anzahl parallel arbeitender Festplatten.

Die Kostenevaluierung

Nicht unterschlagen werden darf aber, dass im Testaufbau zwar identische Anschaffungskosten für die beiden Lösungen zugrunde gelegt werden, gleichzeitig aber die operativen Kosten betrachtet werden müssen. Klar ist, dass 24 HDDs mehr Energie als 8 SSDs verbrauchen. Bei der Messung der Leistungsaufnahme beider Konfigurationen ergeben sich folgende Werte: 90 Watt (W) für die SSDs (Laufwerke und Backplane) und 230 W für die HDDs (Laufwerke und JBoD) bei einem gemischten Workload (wie oben definiert). Auf das Jahr bezogen, ergeben sich somit die Werte 788 Kilowattstunden (kWh) für die SSD- und 2.015 kWh für die HDD-Konfiguration.

Unter der Annahme, dass Rechenzentren ungefähr 0,07 Euro pro kWh bezahlen und mit einer Power Usage Effectiveness (PUE) von 1,3 arbeiten, liegen die Betriebskosten (Operational Expenditure/OPEX) pro Jahr bei der HDD-Lösung bei 183 Euro und bei der SSD-Alternative bei 72 Euro. Der HDD-Einsatz verursacht also jährlich lediglich etwa 110 Euro Mehrkosten, das heißt im Monat weniger als 10 Euro.

Rainer W. Käse, Senior Manager Business Development, Storage Products bei Toshiba Electronics Europe.
Rainer W. Käse, Senior Manager Business Development, Storage Products bei Toshiba Electronics Europe.
(Bild: Toshiba Electronics Europe)

Und dabei darf ein entscheidender Aspekt nicht übersehen werden: Die HDD-Lösung bietet die dreifache Speicherkapazität und eine höhere Performance bei den meisten tatsächlichen Workloads. Reine HDD-Konfigurationen sind in vielen Fällen deshalb immer noch sinnvoll. Außerdem wird die HDD-Nutzung ohnehin noch lange nicht der Vergangenheit angehören. In diesem Jahr ist davon auszugehen, dass im typischen Rechenzentrum 90 Prozent der Kapazität weiterhin durch Festplatten – und gegebenenfalls durch Tapes – abgedeckt werden und lediglich 10 Prozent durch SSDs.

*Der Autor: Rainer W. Käse, Senior Manager Business Development, Storage Products bei Toshiba Electronics Europe

Im Fokus: Flash-Storage

Lesen Sie hier auch unsere weiteren Beiträge zu unserem Schwerpunktthema Im Fokus: Flash-Storage.

(ID:46057095)