Anbieter zum Thema
In Europa brachte zusätzlich der Teilchenbeschleuniger LHC (Large Hadron Collider) des CERN Schwung in die Cluster-Thematik, da alle beim Betrieb des LHC beteiligten Nationen einen Teil der enorm hohen Datenmengen über das europäische Grid abnehmen müssen. In Deutschland dient das GridKa des Forschungszentrum Karlsruhe als nationale Speicher- und Verteilzentrale für die Daten aus Genf. Als Dateisystem wird auch hier GPFS verwendet. In Karlsruhe experimentiert man allerdings auch mit einem wichtigen Konkurrenten von GPFS, dem ehemaligen Open-Source-Dateisystem Lustre (ein Wortspiel aus Linux und Cluster, wörtlich der englische Begriff für Lüster bzw. Kronleuchter).
Verteilte Metadatenknoten meistern Engpässe
Die Metadaten des Dateisystems belegen einen eigenen Bereich im Dateisystems. Man kann dafür eigene LUNs vorsehen oder sie mit den Daten auf den LUNs mischen. Für die Updates der Metadaten einer Datei ist dann der Metadatenknoten einer Datei zuständig, das ist eine Funktion, die dynamisch zwischen den Knoten verteilt wird. Es gibt in GPFS also keinen einzelnen Metadatenknoten wie in anderen Dateisystemen, denn dieser könnte sich leicht zum Flaschenhals entwickeln.
GPFS verteilt aus demselben Grund alle Input-Output-Operationen über alle dem betroffenen Dateisystem zugeordneten LUNs. Sollte ein Knoten über keinen direkten Zugriff auf eine LUN verfügen, kontaktiert er den sogenannten NSD Server (Network Shared Disk), der dann die Abfrage für ihn durchführt. Bis zu acht Knoten können pro LUN als NSD Server definiert werden. Der Kontakt erfolgt entweder über das Netzwerk oder über Infiniband, während die übrigen I/O-Operationen über SCSI oder Fibre Channel vonstattengehen.
Um die Ausdehnung der FC Fabric klein zu halten, verfügen auch Hochleistungs-Cluster, die aus Hunderten von Knoten bestehen, nur über ein Dutzend I/O-Server, mit direktem Zugriff auf die LUNs, Diese führen die I/O-Operationen für die anderen Knoten im Cluster durch. Sollte ein Knoten den direkten Zugriff zur LUN verlieren, schaltet er auf den NSD Server für die LUN um. Sobald das Problem behoben wurde und der lokale Zugriff wieder zur Verfügung steht, schaltet der Knoten zurück.
In den Dateisystemen eines Clusters lassen sich auch andere GPFS-Dateisysteme mounten, wobei dann für jedes dieser Dateisysteme eigene Mengenbegrenzungen (Quotas) gelten und jedes Dateisystem seine eigenen Snapshots hat.
weiter mit: Pools regeln die Migration und Endlagerung von Daten
(ID:2018669)