SeaweedFS kombiniert einfache Architektur mit skalierbarer Objektverwaltung. Das System eignet sich für Anwendungen mit vielen kleinen Dateien und bietet durch konstanten Zugriffspfad, flexible Replikation und optionale Cloud-Anbindung eine praktikable Alternative zu klassischen Dateisystemen.
SeaweedFS arbeitet es mit festen Datenvolumen von je bis zu 32 GiB.
(Bild: Dall-E / KI-generiert)
SeaweedFS verfolgt einen einfachen Ansatz für verteilte Dateisysteme. Statt wie HDFS oder Ceph auf fragmentierte Chunk-Architekturen zu setzen, arbeitet es mit festen Datenvolumen, die jeweils bis zu 32 GiB fassen. Die gesamte Dateiverwaltung liegt bei den Volume-Servern, deren Metadaten vollständig im RAM gehalten werden, mit nur 16 Byte Overhead pro Datei. Der Master-Server verwaltet lediglich die Zuordnung von Volume-IDs zu Volume-Knoten. Dateioperationen erfolgen so mit konstantem Zugriffsmuster und minimalem Latenzverhalten.
SeaweedFS im Detail
Der Lesezugriff benötigt in der Regel exakt eine Festplattenoperation. Dies ist der zentrale Vorteil gegenüber dateibasierenden oder blockorientierten Systemen, bei denen Metadatenzugriffe zwangsläufig zusätzliche IO verursachen. Das Konzept entlastet den Master-Node, macht ihn skalierbar und vermeidet Engpässe bei konkurrierenden Zugriffen.
Im Gegensatz zu GlusterFS, Ceph oder MooseFS ist SeaweedFS nicht auf große Dateien optimiert, sondern auf ein Massenszenario mit Milliarden kleiner Objekte. Für Warm-Daten integriert es Cloud-Storage über Tier-basierte Ablage. Neu angelegte Volumes verbleiben auf lokalen Servern, ältere wandern mit optionalem Erasure-Coding in die Cloud. Das reduziert Speicherbedarf und senkt die Zugriffsgebühren. Trotz ausgelagerter Daten bleibt die Zugriffszeit durch direkt adressierbare URL-Schemata im Bereich einer konstanten Leseoperation.
Replikation auf Volume-Ebene
Das System bietet differenzierte Replikationsstrategien auf Volume-Ebene. Parameter wie Rack-Zugehörigkeit oder Datenzentrum können bei der Dateivergabe gezielt gesetzt werden. Der Befehl „curl http://localhost:9333/dir/assign?replication=001“ löst zum Beispiel eine einfache Rack-lokale Replikation aus. Auch die manuelle Zuweisung zu bestimmten Datenzentren ist möglich. Dies erlaubt eine präzise Topologiekontrolle in heterogenen Rechenzentrumsumgebungen. Volume-Server deklarieren ihre Rechenzentrumszugehörigkeit beim Start, was die Steuerung des Datenflusses vereinfacht.
Die Dateiidentifikation erfolgt über dreiteilige FIDs, bestehend aus Volume-ID, File-Key und File-Cookie. Diese werden im Client gespeichert oder in externen Datenbanken gelagert. Durch das Append-only-Design bleiben Dateiadressen stabil, Kompaktierung und Garbage Collection laufen im Hintergrund und beeinträchtigen keine Leseoperationen.
S3-kompatible API
SeaweedFS stellt eine vollständiges S3-kompatible API bereit, unterstützt POSIX-Attribute per Filer-Modul und bietet ein CSI-Interface für Kubernetes. Der Filer selbst ist ein stateless skalierbarer Dienst mit frei wählbarem Backend, darunter Redis, Postgres, HBase, Cassandra, MongoDB, Elastic Search und weitere. Optional lässt sich Active-Active-Replikation zwischen Filer-Knoten konfigurieren.
Für Anwendungen, die auf ein zuverlässiges, schnell anpassbares Objekt-Backend angewiesen sind, kombiniert SeaweedFS einfache Deployment-Strukturen mit außergewöhnlicher Performance bei kleinen Objekten. Speichererweiterungen erfolgen durch Hinzufügen weiterer Volume-Server ohne zwingende Rebalancing-Vorgänge. Die Skalierung folgt linear, die Verwaltung bleibt überschaubar.
Aktuelles eBook
Open-Source-Storage – Speicher-Software zum Nulltarif
eBook „Open-Source-Storage“
(Bild: Storage-Insider)
Der Bedarf an Speicherkapazität steigt von Tag zu Tag – nicht nur, um die Daten von Produkten, Kunden und Transaktionen zu sichern, sondern auch, um Compliance-Anforderungen zu erfüllen und Auditierungen gut zu überstehen. Eine leistungsfähige Storage-Lösung ist also gefragt. Eine kostenlose Option bietet Open-Source-Software für Storage, insbesondere dann, wenn man sie selbst den eigenen Anforderungen anpassen darf.
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.