Welche Rolle Dateisysteme in der IT spielen, Teil 1 Wie man Millionen Dokumente ordentlich zusammenhält
Openstack ist in aller Munde. Ein Ziel ist es, Milliarden Dateien wieder auffindbar zu machen. Doch wie funktioniert eigentlich ein Dateisystem? Wie organisiert man denn die Inhalte von Festplatte, SSD oder DVD am besten? Einblicke in den Aufbau von Dateitabellen, von deren Metadaten und wichtiger Funktionen liefert dieser Beitrag.
Anbieter zum Thema

Ein paar Megabyte mehr oder weniger Durchsatz sind bei Festplatten und SSDs oft kaufentscheidend. Ob die Leistung auch bei den Applikationen ankommt, hat aber nicht nur mit der Hardware zu tun, sondern auch viel mit dem eingesetzten Dateisystem.
NTFS bei Windows oder ext3 bei Linux sind die selten hinterfragten Standardvorgaben. Doch mittlerweile gibt es zahlreiche Alternativen, die nicht nur in punkto Sicherheit sondern auch bei der Leistung handfeste Auswirkungen auf die Praxis haben können.
Zentrale Tabelle
Dazu müssten sich Anwender aber Gedanken zum Dateisystem machen, was sie in der Regel nicht tun. Das ist verständlich, denn das Organisationsschema ist normalerweise völlig unsichtbar und soll möglichst unauffällig im Hintergrund arbeiten.
Ein Dateisystem hat die Aufgabe, alle Dateien auf einem Datenträger zu verwalten. Das umfasst deren physikalischen Aufenthaltsort, die logische Struktur mit Verzeichnissen sowie dazu gehörende Metadaten wie Name und Größe der Datei, Uhrzeit der letzten Änderung und ähnliches. Je nach Dateisystem unterscheiden sich vor allem Anzahl und Umfang der unterstützten Metadaten enorm.
Und natürlich gibt es für unterschiedliche Betriebssysteme und verschiedene Arten von Datenträgern unterschiedliche Dateisysteme. Wie viele Dateien auf einen Datenträger passen und wie viele Verzeichnisse, wie groß der Datenträger und eine einzelne Datei sein darf, das alles legt das Dateisystem fest.
Aktivitätsprotokoll
Unternehmenskritische Dateisysteme kümmern sich auch um die Verfügbarkeit. Ein meist „Journaling“ genanntes Feature sorgt dafür, dass keine Daten verloren gehen oder korrumpiert werden, falls etwas bei einer Schreiboperation schiefgeht, zum Beispiel während eines Stromausfalls.
Das Betriebssystem muss wissen, wie es mit dem Dateisystem umgehen soll, es benötigt dafür Treiber. Treiber für die Default-Betriebssysteme sind fest im Kern des Betriebssystems verankert, Unterstützung für weitere Dateisysteme wie z. B für CDs kann nachträglich hinzugefügt werden. Alle Anwendungen und das Betriebssystem selbst können auf Dateien über deren Klartextnamen zugreifen, erst das Dateisystem übersetzt den Dateinamen in Positionsdaten auf dem Massenspeicher.
Die wichtigste Aufgabe eines Dateisystems ist es, Dateien abzulegen und wiederzufinden. Das lässt sich durch mehrere Techniken organisieren, beispielsweise, ganz simpel, mit einer Tabelle, in der Datenblöcke und ihre Position auf dem physikalischen Layout des Massenspeichers beschrieben sind.
Festplattenbelegungstabelle
Diese Dateizuordnungstabelle heißt auf Englisch „File Allocation Table“, abgekürzt FAT und ergibt so den Namen eines der am meisten verbreiteten Dateisysteme überhaupt. Genau genommen enthält die FAT Angaben über „Cluster“, das sind logische Konstrukte, die aus mehreren Blöcken bestehen.
Blöcke haben bei Festplatten eine Größe von 512 Bytes, ein Cluster besteht aus acht oder mehr Blöcken. Aus Sicherheitsgründen gibt es zwei Kopien der FAT auf dem Datenträger, auch wenn so gut wie nie von dieser Redundanz Gebrauch gemacht wird. Wie ein Dateisystem die Blöcke und Cluster organisiert hat direkte Auswirkungen auf die Effizienz.
Artikelfiles und Artikellinks
(ID:43119720)