Cluster-Dateisystem für Forschung und Lehre Teil 2

Durch geschickte Datenverteilung zu Höchstleistungen

Seite: 3/3

Firma zum Thema

GPFS ist neben Schnelligkeit vor allem auf große Datenmengen optimiert. Dementsprechend sind die dort fixierten Obergrenzen beachtlich und aus heutiger Sicht unerschöpflich. Ein GPFS-Filesystem kann bis maximal 2 hoch 99 Bytes -1 ausgebaut werden. Das entspricht einer Kapazität von etwas mehr als 600.000 Yottabytes (genauer: Yottabibytes). Ebenfalls nicht absehbar ist, wann etwa eine einzelne Datei die festgelegte Maximalgröße von 16 Exabyte (genauer: Exabibyte) erreichen könnte. GPFS verwaltet dabei maximal bis zu 2 hoch 32 Dateien pro Dateisystem.

Auch die weiteren technischen Obergrenzen sind eher akademischer Natur und wurden noch nirgendwo auch nur annähernd ausgeschöpft. Pro Cluster unterstützt GPFS 256 Dateisysteme mit maximal 4.096 LUNs pro Dateisystem. Damit liegt die maximal erreichbare Kapazität bei mehr als einer Million Yottabytes. Das sind ausgeschrieben 1.000.000.000.000.000.000.000.000.000.000 Bytes!

Praktisch ergibt das unter Annahme von 8-Terabyte-LUNs ein Limit von 32 Petabyte oder 32.000 Terabyte pro Cluster. In der Praxis bewährt haben sich bislang Systeme mit bis zu zwei Petabyte. Der bekannte Mare-Nostrum-Rechner in Barcelona begnügt sich mit vergleichsweise bescheidenen 370 Terabyte.

Unter Laborbedingungen hat GPFS eine beeindruckende Maximalperformance gezeigt. Nach Herstellerangaben liegt sie bei circa 140 Gigabyte pro Sekunde und bei einem maximalen Datendurchsatz von circa 120 Gigabyte pro Sekunde, wenn alle Knoten nur eine Datei lesen oder schreiben.

Fazit

GPFS ist derzeit erst für eine wichtige kommerzielle Anwendung – den Real Application Cluster (RAC) von Oracle – zertifiziert. An weiteren Zertifizierungen arbeitet IBM. Für Betreiber eines FAN (File Area Networking) hält IBM noch eine Erweiterung von GPFS bereit, die Scale Out File Services. SoFS, die Kurzform der modular skalierbaren File-Dienste, basiert auf GPFS, beherrscht aber auch den Datentransport über die klassischen Netzwerk-ProtokolleCIFS (Common Internet File Services), FTP (File Transfer Protocol) und http (Hypertext Transfer Protocol). Damit stellt dieses Angebot dem Anwender eine Schnittstelle zu Windows und Samba, dem Linux-Derivat von CIFS, zur Verfügung.

Mit GPFS hat IBM ein Dateisystem im Portfolio, dessen Leistungsgrenzen auf lange Zeit nicht ausgereizt werden dürften. Natürlich bleiben noch Wünsche offen. Flexibilität zum Beispiel. GPFS unterstützt zwar eine breite Palette von Blockgrößen. Die Wahl ist allerdings endgültig und eine nachträgliche Korrektur ist nicht möglich. Auch ist GPFS nicht bootfähig, was bei einem verteilten Dateisystem allerdings auch nicht anders zu erwarten ist.

Dafür hat der Hightech-Anwender das beruhigende Gefühl, auf eine Lösung zu setzen, die bereits auf großen Installationen erprobt wurde, darunter sind die größten Speicherfresser im militärischen und zivilen Bereich. Wir werden noch viel von GPFS hören. Mit Sicherheit noch dieses Jahr, beim nächsten großen Update.

(ID:2018678)