Suchen

Welche Rolle Dateisysteme in der IT spielen, Teil 1

Wie man Millionen Dokumente ordentlich zusammenhält

Seite: 2/2

Firma zum Thema

Wenn nämlich der kleinste Container, in den Daten abgelegt werden können, 4096 Bytes groß ist (acht Blöcke zu je 512 Byte), folgt daraus, dass jede Datei mindestens 4 kByte belegt, selbst wenn sie nur 256 Byte groß ist. Dateisysteme mit FAT gehen sehr verschwenderisch mit dem Speicherplatz um. Der freie aber trotzdem belegte Platz wird übrigens „Slack“ genannt.

Ordnung und Struktur

Neben der FAT, die zwar bei geringen Kapazitäten leicht zu verwalten und damit schnell ist, gibt es andere Methoden, wie Dateisysteme Ordnung in den Massenspeicher bringen. Unixoide Dateisysteme setzen auf die Index-Node, oder kurz Inode. Eine Inode enthält alle Metadaten für eine Datei, umgekehrt hat jede Datei auch nur eine Inode.

Die Metadaten umfassen unter anderem Zugriffsrechte und Eigentümer von Dateien. Der Dateiname und Inhalt sind unabhängig von der Inode, bis auf sehr kleine Dateien unter etwa 100 Byte. Dabei führt der Weg zuerst zum Dateinamen, der den Verweis auf die Inode enthält, welche wiederum den Inhalt referenziert. Nur bei den angesprochenen sehr kleinen Dateien wird der Inhalt direkt im Inode abgelegt.

Der Über-Inode

Informationen über das Dateisystem selbst speichern solche Systeme im Superblock. Darin steht unter anderem der erste freie Block auf der Festplatte sowie alle Informationen rund um die Inodes. Der Superblock ist extrem wichtig für die Kohärenz des Dateisystem und wird deshalb durch viele, über die Platte verteilte, Sicherheitskopien geschützt.

Besteht der Verdacht, dass der Superblock beschädigt wurde, nutzten zahlreiche Tools die redundanten Kopien und versuchen den Defekt zu reparieren. Zu den Anfangszeiten von Personal Computern und Unix Servern dauerten diese Reorganisationsläufe nicht selten viele Stunden, in denen das System nicht zur Verfügung stand. Aktuelle Dateisysteme versuchen deshalb diese Reparaturvorgänge, so sie denn nötig werden, so kurz wie möglich zu halten.

Doppelte Buchführung

Um dem Problem der langen Prüfzeiten entgegenzuwirken und die Datenintegrität zu verbessern, kommt bei modernen Dateisystemen fast immer eine „Journaling“ genannte Funktion zum Einsatz. Es ist eine Art doppelte Buchführung, bei der anstehende Schreiboperationen nicht nur in der To-Do-Liste des Festplattencontroller, sondern auch in einem separaten Bereich auf der Platte verwaltet werden – dem Journal. Journaling wurde auf zahlreiche Arten implementiert, die sich in ihrer Geschwindigkeit und Sicherheit unterscheiden.

Es gibt neben dem Metadaten-Journaling, dass nur sicherstellt, dass das Dateisystem konsistent ist, auch das Full-Journaling, bei dem zusätzlich die Integrität der Dateiinhalte garantiert wird. In jedem Fall schreibt das Dateisystem vor jeder Änderung an realen Metadaten zunächst die anstehenden Aktion in das Journal.

Läuft die anschließende Schreiboperation erfolgreich durch, bestätigt das Dateisystem die durchgeführten Änderungen im Journal und gibt sie damit frei. Erst danach gelten die Metadaten tatsächlich als geändert. Bei Inkonsistenzen prüft das Dateisystem die Journaleinträge und verwirft alle Änderungen, die nicht im Journal erfolgreich bestätigt wurden. Das geht erheblich schneller, als ein kompletter Check aller Dateien auf der Platte.

Langsamer Dateizugriff

Apropos Geschwindigkeit: Ein Dateisystem kann enormen Einfluss auf die Durchsatzraten des Massenspeichers haben, auch wenn dieser Einflussfaktor nur sehr selten berücksichtigt wird. Als Faustregel gilt, dass modernere Dateisysteme schneller sind, doch der konkrete Anwendungsfall entscheidet über die beste Wahl.

Mit den heute üblichen Standards NTFS bei Windows und ext4 bei Linux macht man bei durchschnittlichen Anwendungen sicher nichts falsch. Doch wenn beispielsweise SSDs eingesetzt werden, sieht die Situation, in Abhängigkeit vom Controller der SSD anders aus. Tests zeigen, dass FAT32, eine beliebte Wahl aus Kompatibilitätsgründen, deutlich schlechtere Durchsatzwerte liefert als NTFS und exFAT.

Sollen Netzwerkspeicher zum Einsatz kommen, sind unter Umständen ganz andere Wahlmöglichkeiten gegeben die sich dramatisch auf die Performanz auswirken können. So unscheinbar und banal ein Dateisystem auf den ersten Blick wirken mag: Der Teufel steckt im Detail.

Artikelfiles und Artikellinks

(ID:43119720)