Mobile-Menu

Speicherung und Sicherung der Daten mit Hilfe von Filesystemen – ohne Kosten Open-Source-Dateisysteme

Von Michael Matzer 5 min Lesedauer

Anbieter zum Thema

Dateisysteme spielen eine wichtige Rolle, um Daten zu speichern und zu sichern. Skalierbare Dateisysteme können dazu dienen, Cluster mit einem Umfang von Petabyte zu verwalten: Nutzdaten, Metadaten und Namespace. Nicht nur um Kosten zu sparen, kann es sich lohnen, dafür Open-Source-Lösungen zu verwenden.

Open-Source-Storage-Software wird inklusive des Quellcodes zum Download bereitgestellt, häufig mit einer General-Public-License, die den Urheber schützt – darunter auch Open-Source-Filesysteme.(Bild:  ©NicoElNino, Getty Images via Canva.com)
Open-Source-Storage-Software wird inklusive des Quellcodes zum Download bereitgestellt, häufig mit einer General-Public-License, die den Urheber schützt – darunter auch Open-Source-Filesysteme.
(Bild: ©NicoElNino, Getty Images via Canva.com)

ZFS

ZFS ist ein von Sun Microsystems entwickeltes transaktionales Dateisystem, das zahlreiche Erweiterungen für die Verwendung im Server- und Rechenzentrumsbereich enthält. Hierzu zählen die vergleichsweise große maximale Dateisystemgröße, eine einfache Verwaltung selbst komplexer Konfigurationen, die integrierten RAID-Funktionalitäten, das Volume-Management sowie der prüfsummenbasierte Schutz vor Datenübertragungsfehlern. Der Name ZFS stand ursprünglich für „Zettabyte File System“.

Unter der Bezeichnung OpenZFS wurde im September 2013 damit begonnen, alle bisherigen ZFS-Entwicklungen in einem Projekt zusammenzuführen. Dabei sollte das Dateisystem unter anderem auch betriebssystemübergreifend vereinheitlicht werden. Als Basis dienten die bereits vorhandenen Weiterentwicklungen, wie jene aus FreeBSD, die wiederum auf der CDDL-Veröffentlichung von Sun basieren. OpenZFS ist daher grundsätzlich zwar zu Oracle ZFS kompatibel, aber nicht vollständig. Von OpenZFS gibt es einzelne Entwicklungszweige für diverse Betriebssysteme:

  • illumos – OpenZFS ist in das Betriebssystem integriert,
  • ZFS on FreeBSD (ZoF),
  • ZFS on Linux (ZoL),
  • OpenZFS on macOS (O3X),
  • OpenZFS on Windows (ZFSin).

GlusterFS

GlusterFS ist ein verteiltes Dateisystem, das Speicherelemente von mehreren Servern als einheitliches Dateisystem in einem Cluster präsentiert. Als Besonderheit können NAS-Systeme über Infiniband direkt in den Cluster eingebunden werden; auch eine redundante Anbindung von Speichermedien über TCP/IP, Infiniband Verbs oder InfiniBand SDP (Socket Direct Protocol) ist möglich.

Die Daten auf allen Cluster-Nodes können gleichzeitig gelesen und geschrieben werden, wobei alle Änderungen an Dateien auf allen Servern in Echtzeit umgesetzt werden. Das Dateisystem wird über ein FUSE-Kernel-Modul eingebunden und von POSIX-fähigen Betriebssystemen unterstützt, zum Beispiel Linux, FreeBSD, OpenSolaris und Mac OS X. Um einen GlusterFS-Server zu starten, wird kein Kernel-Modul benötigt. Ein Server kann sowohl Client als auch Server gleichzeitig sein. Ein Client für Windows-Systeme ist in Planung, wird aber von den Entwicklern erst umgesetzt, sobald das WinFUSE-Projekt stabil läuft.

Mit GlusterFS lässt sich eine Art Netzwerk-RAID erstellen, von welchem aus mehrere Rechner gleichzeitig auf ein gemeinsames Dateisystem zugreifen können. Es unterliegt hierbei nicht Limitierungen wie etwa, maximal zwei Server nutzen zu können. GlusterFS ist fehlertolerant, da dort Nutzdaten, Metadaten und Namespace verteilt gespeichert werden können. Durch jeden weiteren GlusterFS-Server erhöht sich der maximale Datendurchsatz des Dateisystems, so dass hier I/O-Bandbreiten von einigen Gigabyte pro Sekunde erreicht werden können. GlusterFS hat durch Scale-Out die Fähigkeit, beliebig zu skalieren.

Btrfs

Das Btrfs (B-tree FS) ist ein Copy-On-Write-Dateisystem, das seit 2007 als freie Software unter der GNU General Public License (GPL) für das Betriebssystem Linux und seit 2016, mit der Bezeichnung WinBtrfs, plattformübergreifend für Windows sowie ReactOS entwickelt wird.

Btrfs erlaubt integriertes RAID, Volume-Management sowie prüfsummenbasierten Schutz vor Datenübertragungsfehlern und nutzt Copy-on-Write, ein Verfahren, bei dem eine Kopie erst dann „real“ angefertigt wird, sobald sie von einem der Beteiligten verändert wird. Solange alle Beteiligten ihre Kopie nicht verändert haben, genügt es, das Original ein einziges Mal zu speichern. Die Kopie erfolgt also zunächst „virtuell“ und wird erst bei einer ersten Benutzung verzögert angelegt.

Aktuelles eBook

Open-Source-Storage – Speicher-Software zum Nulltarif

eBook Open-Source-Storage
eBook „Open-Source-Storage“
(Bild: Storage-Insider)

Der Bedarf an Speicherkapazität steigt von Tag zu Tag – nicht nur, um die Daten von Produkten, Kunden und Transaktionen zu sichern, sondern auch, um Compliance-Anforderungen zu erfüllen und Auditierungen gut zu überstehen. Eine leistungsfähige Storage-Lösung ist also gefragt. Eine kostenlose Option bietet Open-Source-Software für Storage, insbesondere dann, wenn man sie selbst den eigenen Anforderungen anpassen darf.

Die Themen im Überblick:

  • Warum Storage als Open Source?
  • NAS & Objektspeicher
  • Backup & Disaster Recovery
  • Dateisysteme
  • Technologiestapel & Ökosysteme

Das in das Dateisystem integrierte RAID-Subsystem bietet gegenüber klassischen Hardware- oder Software-RAID-Implementierungen den Vorteil, dass zwischen belegten und freien Datenblöcken unterschieden werden kann und somit bei der Rekonstruktion eines gespiegelten RAID-Volumens nur belegter Plattenplatz gespiegelt werden muss. Hieraus resultiert im Schadensfall, besonders bei wenig gefüllten Dateisystemen, eine enorme Zeitersparnis.

Die RAID-Funktionalität wird zudem, im Gegensatz zu klassischen RAID-Verfahren, mit Hilfe größerer Datenblöcke organisiert. Es erfolgt dann beispielsweise im RAID 1 keine Spiegelung der Datenträger, sondern es wird sichergestellt, dass jeder Datenbereich auf wenigstens zwei Datenträgern abgelegt wird. Sofern der größte Datenträger nicht größer ist als die restlichen zusammengenommen, wird es so möglich, ein RAID 1 aus einer ungeraden Anzahl von Datenträgern unterschiedlicher Kapazität zu bilden, unter voller Ausnutzung ihrer Kapazität.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Zu Btrfs gehört das Dienstprogramm btrfs-convert, mit dem bestehende Ext3- und Ext4-Dateisysteme in Btrfs-Dateisysteme konvertiert werden können. Die Konvertierung lässt sich rückgängig machen. Btrfs soll vor allem auch Funktionen bieten, die es vom derzeitigen Linux-Standard Ext3/Ext4, aber auch von anderen Dateisystemen wie XFS oder JFS abheben. Hierunter fallen:

  • erweiterter Speicherbereich (264 Byte),
  • effizientes Speichern kleiner Dateien und Verzeichnisse,
  • dynamische Inodes,
  • Snapshots,
  • mehrere Subvolumen,
  • Datenkompression,
  • Dateisystemcheck und Defragmentierung während des Betriebs,
  • effiziente interne inkrementelle Datensicherung,
  • Copy-on-Write,
  • Prüfsummen,
  • integriertes RAID, Spiegelung und Aneinanderhängen von Objekten (RAID 0, RAID 1, RAID 5, RAID 6, RAID 10).

Lustre

Lustre ist ein paralleles, verteiltes Dateisystem, welches üblicherweise in großen Cluster-Computing-Umgebungen Einsatz findet. Der Name Lustre leitet sich aus „Linux“ und „Cluster“ ab. Lustre ist unter der GNU GPL (nur v2) verfügbar und bietet ein hochperformantes Dateisystem für sowohl kleine wie auch große, über mehrere Standorte verteilte Cluster.

Da Lustre besonders auf hohe Leistungsfähigkeit ausgerichtet ist und unter einer freien Lizenz steht, wird es häufig im Umfeld des High Performance Computing (HPC) genutzt. 2012 setzten 15 der Top-30-Supercomputer auf das Lustre-Dateisystem, inklusive des ehemals weltschnellsten Top-500-Supercomputers.

Lustre-Dateisysteme sind skalierbar und unterstützen mehrere tausend Client-Systeme, mehrere Petabyte (PB) Speicherplatz und hunderte Gigabyte pro Sekunde (GB/s) gebündelter Schreib-/Lese-Last. Diese Performance und Vielseitigkeit machen Lustre zu einer beliebten Wahl für beispielsweise große Rechenzentren wie bei ISPs und MSPs, Finanzdienstleistern oder für die Öl- und Gasindustrie.

Mit Linux-Kernel 4.17 wurde Lustre aus dem Staging-Bereich des Kernels entfernt, nachdem es nicht gelungen war, deutliche Qualitätsverbesserungen in den Kernel einzupflegen. Die Weiterentwicklung erfolgt nun – wie schon teilweise zuvor – außerhalb des Kernels. Die derzeitige Version trägt die Bezeichnung v2.15.0.

(ID:49904754)