Anbieter zum Thema
Bei GlusterFS wachsen Kapazität und Performance im Gleichschritt. Damit entsteht eine leistungsfähige Storage-Infrastruktur zur Speicherung unstrukturierter Daten auf standardbasierten x86-Servern.
Zu den bedeutenden Herausforderungen einer softwarebasierten, verteilten Storage-Lösung zählen die logische und physische Lokalisierung von Daten. Die meisten verteilten Systeme lösen das Problem mit einem von der Speicherung getrennten Index, der Dateinamen und Metadaten zur Lokation enthält. Das Ergebnis ist jedoch ein Single Point of Failure und ein beachtlicher Performance-Bottleneck.
GlusterFS geht einen anderen Weg und beseitigt damit eine häufige Quelle für I/O-Engpässe oder gar die Anfälligkeit für Ausfälle. Um den Speicherort einer Datei oder eines Objektes festzulegen, verwendet GlusterFS einen Distributed Hash Table. Mit einem Algorithmus wird ein Hash-Wert für den Dateinamen berechnet, um damit den Speicherort von Files oder Objekten zu ermitteln.
Vergleich GlusterFS und ceph
Recht aufschlussreich ist an der Stelle ein kurzer Vergleich mit ceph, einem POSIX-kompatiblen, verteilten Dateisystem, das ebenso wie GlusterFS vom Open-Source-Infrastructure-as-a-Service (IaaS)-Cloud-Projekt OpenStack unterstützt wird. OpenStack ist ein Framework zur Erstellung und Verwaltung von Public, Private und Hybrid IaaS-Clouds, das aus den zentralen Komponenten Compute (bekannt auch unter dem Namen Nova) und Object Storage (bekannt auch unter dem Namen Swift) besteht.
Die Kernkomponente von ceph ist der Datenspeicher Rados, der mit dem Crush (Controlled Replication Under Scalable Hashing)-Algorithmus arbeitet. Crush verteilt die Daten in Einheiten von vier Megabyte statistisch über die verfügbaren Speichersysteme. Mit einem Eingabewert aus einer Platzierungsgruppe berechnet der Algorithmus den Speicherort aus einer Liste der verfügbaren Speicherorte.
Die Clustermonitore verwalten die Clustermap, die alle Speicherorte in einer hierarchischen Struktur darstellt. Die Platzierung der Daten ist über Regeln gesteuert. Hier wird beispielsweise auch definiert, wie viele Kopien aus Gründen der Ausfallsicherheit angelegt werden.
Wie geschildert, ist GlusterFS im Vergleich dazu modularer und einfacher aufgebaut. Die Architektur und Arbeitsweise sind deutlich weniger komplex und dadurch performanter. Während bei ceph das Disaster Recovery von der Komplexität der Regeln für die Ausfallsicherheit abhängt, bietet GlusterFS eine einfachere Lösung. Sind Server Nodes nicht mehr verfügbar, greift der Administrator auf die Daten im Backend File zurück.
(ID:42235867)