Storage (nicht nur) für riesige Datenmengen: ZFS im Einsatz Herausforderungen und Lösungen – auf dem Weg zum idealen Speicher

Autor / Redakteur: lic.rer.publ. Ariane Rüdiger / Dr. Jürgen Ehneß

Auch außerhalb des Cloud-Native-Paradigmas kommen derzeit funktionale Neuerungen bei Storage-Lösungen vor allem durch bewährte und neue Software-Technologien zustande. Ein Beispiel ist ZFS.

Firma zum Thema

Zentrale Herausforderung: steigende Datenmengen, die nicht nur gespeichert, sondern auch verwaltet werden wollen.
Zentrale Herausforderung: steigende Datenmengen, die nicht nur gespeichert, sondern auch verwaltet werden wollen.
(Bild: gemeinfrei / Pixabay )

Eine wichtige Rolle in datenintensiven Umgebungen spielt ZFS (Zettabyte File System). Dieses transaktionale Filesystem wurde von Sun Microsystems entwickelt und kann riesige Datenmengen handhaben. RAID und Volume-Management sind integriert, vor Fälschungen und Übertragungsfehlern schützt eine Prüfsummentechnik.

Als Oracle Sun übernahm, wurde aus ZFS „Oracle ZFS“. Außerdem gibt es seit 2013 OpenZFS mit diversen Zweigen für FreeBSD, Linux, Mac oder Windows. Außerdem integriert das Open-Source-Betriebssystem Illumos, das aus OpenSolaris entstanden ist, ZFS. Davon gibt es ebenfalls mehrere Distributionen, unter anderem verwendet es Nexenta, das inzwischen bei DDN gelandet ist.

DDN, spezialisiert auf Highend-Storage für wissenschaftliche Anforderungen, hat vor einigen Jahren Tintri und schon vorher den SDS-Pionier Nexenta erworben. Nexenta seinerseits nutzt für sein Flaggschiffprodukt NexentaStor das oben bereits erwähnte Solaris-basierende Betriebssystem Illuminos, in das ZFS bereits integriert ist. Tintri hat sich auf die Speicherung strukturierter Daten mit einem Fokus auf geschäftskritischen Applikationen samt ihren Daten und virtuellen Maschinen spezialisiert („SQL Integrated Storage“).

Eine Zusammenführung der Plattformen Tintri, DDN und Nexenta ist von DDN laut eigenen Aussagen nicht geplant, sie rücken sich aber näher. So bringt DDN NexentaStor VSA for Tintri. Dahinter verbergen sich File-Services für hyperkonvergente Infrastrukturen unter VMware.

2021 ist für die DDN-Plattformen ein verbessertes, hoch automatisiertes Management- und Supportsystem geplant, das proaktiv arbeitet, über bereits automatisch ausgeführte Aktionen berichtet, die Gesundheit des Systems kontextbasiert bewertet und durch einen personifizierten digitalen Assistenten über unterschiedliche Kanäle mit dem Anwender kommuniziert.

Die Storage-Lösung VMstore von Tintri wird mit der IntelliFlash-Plattform integriert. Sie soll 2021 auch Oracle mit ihren Data-aware-Funktionen unterstützen, die Migration von Daten in die Cloud ermöglichen und Anomalien intelligent detektieren. Außerdem kommen neue Plattformen auf den Markt, die ausschließlich mit NVMe-Speicher arbeiten. IntelliFlash erhält mit Version 4.0 2021 unter anderem auch neue Cloud- und Sicherheitsfunktionen.

Open-Source-HCI auf ZFS-Basis

Doch ZFS ist auch im NAS-Bereich heimisch, und dort nicht nur im High-End. Ein Beispiel dafür ist der Open-NAS-Spezialist iXsystems. 2002 gegründet, baute iXsystems zunächst lediglich Server für Open-Source. Man engagierte sich beim Open-Source-Storage-Betriebssystem FreeNAS und integrierte das Filesystem OpenZFS in das Projekt. iXsystems nutzt ZFS in allen seinen Produkten – von den größten bis zu den kleinsten.

2013 brachte iXsystems mit TrueNAS HA seine erste hochverfügbare Storage-Appliance mit ZFS auf den Markt. FreeNAS existierte aber weiter. Erst 2020 war die Zusammenführung der beiden Brands mit der Version 12 von TrueNAS abgeschlossen.

Außerdem bastelte iXsystems an einer Version 2.0 von OpenZFS, die zur Basis der im Dezember 2020 angekündigten HCI-Lösung TrueNAS Scale geworden ist. OpenZFS 2.0 stellt die volle Kompatibilität und den reibungslosen Datenaustausch zwischen FreeBSD und anderen Linux-Dialekten sicher. Gleichzeitig kommt ein neues Spitzenmodell der leistungsstarken TrueNAS-M-Serie auf den Markt. Es bringt eingebaute Hochverfügbarkeit mit.

Das neue Spitzenmodel der TrueNas-M-Serie M60 ist für 2021 angekündigt.
Das neue Spitzenmodel der TrueNas-M-Serie M60 ist für 2021 angekündigt.
(Bild: iXsystems)

Das Modell M60 hat 64 Cores, 1,5 Terabyte RAM und vier 32-Gigabyte-NVDIMMs. In der Hochverfügbarkeitsausführung sind es bis zu 20 Petabyte Gesamt- und bis zu 4 PB All-Flash-Kapazität. Der Durchsatz liegt bei über 20 GB/s und mehr als einer Million IOPS für zehntausende VMs. Die Anbindung erfolgt über 100 GbE. Es sind acht 100-GbE-Schnittstellen vorhanden, über die der Verkehr der bis zu 24 HDDs oder 28 SSDs fließt. Dazu gibt es Erweiterungs-Shelves. Das Modell M60 fließt in hochverfügbare Varianten des HCI-Systems TrueNAS SCALE.

TrueNAS SCALE eignet sich für virtuelle Maschinen, Linux-Container, Kubernetes und KVM. Dabei lässt sich Scale-Out-ZFS auf jedem x8-Server installieren.

Fünf Neunen für Hochverfügbarkeit

Knoten gibt es in normalen und Hochverfügbarkeitsvarianten. Werden Hochverfügbarkeitsknoten verwendet, braucht man nicht die üblichen drei Knoten, da die Daten innerhalb des Knotens repariert werden. Dann sind „fünf Neunen“ (99,999 %) drin, was einer Ausfallzeit von 0,9 Sekunden täglich oder fünf Minuten und 16 Sekunden jährlich entspricht.

Standardknoten bringen es allein nur auf „drei Neunen“ bei Einknotensystemen – das bedeutet immerhin acht Stunden Ausfallzeit jährlich und damit nicht mehr hochverfügbar im eigentlichen Sinn des Wortes. Wer die Lösung nicht zusammen mit TrueNAS-Appliances verwenden möchte, kann auch eine reine Software-Lösung wählen.

TrueNAS-Scale-HCI kombinieren mehrere bei Bedarf um Storage- oder Compute-Ressourcen erweiterte M60-Knoten. Die Gesamtsysteme können dabei Hunderte Knoten haben.

Auch die Management-Software für alle Produkte der TrueNAS-Serie TrueCommand wird im Zuge der TrueNAS-Scale-Einführung erweitert. Wegen der ZFS-Basis der Systeme besitzt TrueNAS Command eine besondere „Bewusstheit“ für ZFS-Funktionen wie ZVOLs und ZFS-Datasets. Seit Version 2.0, freigegeben 2020, ist TrueCommand als Service erhältlich und hat mehr Automatisierungsfunktionen bekommen.

Im Jahr 2021 folgen neue Funktionen: Irgendwann im Laufe des Jahres soll TrueCommand auch TrueNAS-Scale-Instanzen und solche in den Clouds der großen Provider verwalten. Dadurch können Anwender ZFS-basierende Storage-Systeme auch über hybride Clouds hinweg aufbauen und betreiben.

Es muss nicht immer ZFS sein

Aber auch andere Software-Ansätze spielen bei einfallsreichen Storage-Lösungen eine Rolle, zum Beispiel bei StorPool. Das Unternehmen stammt – außergewöhnlich genug – aus Europa und existiert bereits seit 2011, ist also kein absoluter Newcomer mehr.

Seine Scale-Out-Block-Storage-Plattform verwandelt Standardserver und das vorhandene Netz in ein Highend-Shared-Storage-System, das sich für Tier 0/1 und Speichermengen größer 100 Terabyte eignet. Zielgruppe der Lösung, die KVM, VMware, Hyper-V und Bare Metal unterstützt, sind Service-Provider und Private Clouds. StorPool hat dafür einen vollständigen eigenen Storage-Stack entwickelt.

Die Architektur der StorPool-Scale-Out-Block-Storage.
Die Architektur der StorPool-Scale-Out-Block-Storage.
(Bild: StorPool)

Die Architektur eines StorPool-Clusters besteht aus mindestens drei Storage-Knoten, an denen beliebige Mengen von NVMe-Storage, SAS- oder SATA-Drives hängen. Die Zahl der Knoten kann weit in den vierstelligen Bereich skalieren. Ethernet-NICs verbinden sie redundant mit den ebenfalls redundant vorhandenen Ethernet-Switches, die wiederum mit 25 GbE redundant die Hosts anbinden. Letztere greifen auf die Block-Storage zu.

Die Umgehung des Prozessorkerns durch das Storage-Protokoll führt laut Anbieter zu einer Latenz von weniger als 100 Mikrosekunden und einem Durchsatz von 1 Million IOPS pro Storage-Knoten, der mit der Zahl der Knoten linear skaliert. Kapazität und Leistung werden gepoolt. Das System arbeitet ausfallsicher auf Basis von Aktiv-Aktiv-Multicontroller-Konfigurationen.

Die Software funktioniert API-gesteuert und schafft nachweislich Implementierungen mit mehr als 10.000 Volumes. Es gibt Integrationen mit OpenStack und CloudStack, OpenNebula, Kubernetes und anderen Cloud-typischen Lösungen. Außerdem sind eine genaue Überwachung und entsprechende Metriken mit reichlich Software-Intelligenz integriert.

(ID:47065151)

Über den Autor

lic.rer.publ. Ariane Rüdiger

lic.rer.publ. Ariane Rüdiger

Freie Journalistin, Redaktionsbüro Rüdiger