Mobile-Menu

Die Langzeitspeicherung ersetzt das Archiv LTFS macht Archivare zu Aktivisten

Redakteur: Rainer Graefen

„Next Generation Storage“ hört sich futuristisch an. Da kann es eigentlich nur um Nanotechnik gehen. Hat da eine sequentielle Aufzeichnungstechnik überhaupt etwas zu suchen? Ja. Die "erneute Wiederauferstehung" des Tapes könnte sogar etwas länger dauern.

Anbieter zum Thema

Das amerikanische Unternehmen Crossroads zeigt mit der Appliance Strongbox, was sich mit geeigneter Zusatzhardware alles aus Bandbibliotheken herausholen lässt. Filmindustrie, Gesundheitswesen und Videoüberwachung zeigen großes Interesse an dieser Art "aktiver Archive".
Das amerikanische Unternehmen Crossroads zeigt mit der Appliance Strongbox, was sich mit geeigneter Zusatzhardware alles aus Bandbibliotheken herausholen lässt. Filmindustrie, Gesundheitswesen und Videoüberwachung zeigen großes Interesse an dieser Art "aktiver Archive".
(Crossroads)

Die Argumente für Tape sind klar. Langlebige Medien, damit weniger Migrationen, niedrigere Kosten pro Terabyte als Disk und nicht zu vergessen, der Strombedarf, der jeden Vergleich mit anderen Speichermedien aushält.

Und wem das nicht reicht, der findet in der Cloud ziemlich viele Massendaten, die sich nur mit einem Tape transportieren lassen, um innerhalb kürzester Zeit eine Disaster Recovery durchführen zu können.

Das Archiv wird zum Langzeitspeicher

Wer dem Tape-Markt nur ein wenig folgt, der kommt an dem im Jahr 2010 von IBM eingeführten Longterm Filesystem, inzwischen weitgehend als Linear Tape Filesystem (LTFS) bezeichneten Aufzeichnungsformat nicht vorbei. Beim Formatieren des Bandes mit LTFS wird das LTO-Medium in zwei Partionen geteilt, die erste Partition mit etwa 100 GByte Kapazität enthält ein Dateisystem mit Dateistruktur und allen Metadaten, die zweite Partition mit 1,4 Terabyte Speichervolumen enthält die Rohdaten aller Dateien.

Das Format ist selbstbeschreibend und kann, das ist ebenfalls ein gewichtiger Aspekt, in ein Dateisystem eingebunden werden oder auch per NFS und CIFS gelesen werden. IBM beispielsweise realisiert dies mit einem passenden Treiber für sein GPFS-Dateisystem und Oracle macht ähnliches für die Oracle Enterprise Linux Server Edition 5.5 für x86-Rechner.

Modus operandi

LTFS gibt es für Standalone-Bandlaufwerke und für Bandbibliotheken. Im Library-Modus beherrscht LTFS eine Besonderheit. Es kann Daten schreiben, die größer sind als das Tape-Medium. Bislang ist das aber ein Detail, das für kaum jemand interessant ist, auch wenn Hollywood schon heute 90 Minuten Film mit mehr als vier Terabyte produziert. Vorzugsweise genutzt wird der Single Drive Modus (Standalone), da sich digitale Daten leicht in kleine Portionen teilen und miteinander verknüpfen lassen.

Für Film- und Fernsehschaffende ist damit das LTFS-Format von großem Interesse wie die diesjährige und auch schon der vorjährige IBC (International Broadcast Convent) in Amsterdam zeigte. „In den Archiven der Rundfunkanstalten schlummern zig Kilometer analoges Material und bei den schon digitalisierten Sendungen überschreitet beispielsweise bei der BBC in London die Datenmenge inzwischen ein Zettabyte“, weiß Bernd Krieger, Geschäftsführer der Crossroads Europe.

Ein Industriestandard für Archivsysteme

Mit LTFS wird ein Grundproblem der Archivare gelöst, sie haben damit ein Format, das sich auf jedem LTO5-Laufwerk und höher lesen lässt. IBM unterstützt LTFS auf 3592 Medien für das Enterprise-Laufwerk TS1140.

Und Oracles Storagetek bietet mit einer LTFS Open Edition Support für LTO-5- wie auch die eigenen T10000C-Laufwerke, die sogar die stattliche Datenmenge von fünf Terabyte Daten nativ speichern können.

In einer Active Achive Alliance überlegt inzwischen ein größerer Teil der Branche wie man die riesigen Offline-Langzeitarchive wieder aktivieren kann. Für die Zukunft ist durch LTFS schon einmal das Migrationsproblem zwischen den LTO-Generationen gelöst.

Bekanntermaßen kann Linear Tape Open Bänder beschreiben, die eine Generation älter sind und Bänder lesen, die zwei Generationen früher auf den Markt gekommen sind. Das bedeutet umgekehrt, dass in etwa zehn Jahren die LTO Generation 8 mit einer Speicherkapazität von 100 Terabyte auch noch die Medien der LTO-5-Generation, die mit LTFS formatiert wurden, lesen kann. IBM kündigte gerade die TS3500-Bandbibliothek an, die mit LTO-6-Laufwerken bestückt, bis zu 1,8 Exabyte komprimierte Daten speichern kann.

LTFS beim Netzwerk-Share

LTFS ist somit innerhalb von nur zwei Jahren zum Industriestandard geworden, so dass Daten auf jedem beliebigen LTO-5-Bandlaufwerk, das mit LTFS formatiert wurde, lesbar sind.

Krieger von Crossroads gibt für seine LTFS-Appliance Strongbox an, dass die Kosten für die Archivierung nicht mehr linear mit dem Datenwachstum steigen, sondern degressiv verlaufen, da viele klassische Verwaltungsarbeiten überflüssig werden.

In der Strongbox hat sich der Hersteller auf den Datenzugriff per NFS- und CIFS-Share fokussiert. Die LTFS-Partitionen und damit die Inhaltsverzeichnisse aller in der Strongbox verwalteten Bandmedien liegen als Kopie auf einer SSD in der Appliance vor.

Crossroads hat diese Appliance zusätzlich mit der Funktionalität der Read-Verify-Appliance kombiniert, so dass ständig die Verfügbarkeit von Band und Zugriffswegen überprüft wird. Soweit der grobe Rahmen.

Kombinierter Datenstrom

Damit nicht jeder Dateizugriff zu einem Geduldsspiel wird, speichert die Strongbox die Archivdaten zuerst auf dem lokalen respektive einem externen NAS-Cache. „Heiße“ Archivdaten, man spricht wohl besser von einer Langzeitspeicherung, sind so innerhalb weniger Sekunden abrufbar.

Die spätere Auslagerung auf das LTO-Medium erfolgt nach HSM-Kriterien wie Alter, Größe oder Füllstand des NAS-Speichers. Das Streaming-Problem löst Crossroads so, dass ca. 40 GByte Daten gesammelt werden, so dass man eine Spur kontinuierlich vollschreiben kann.

Als zweite Maßnahme für den relativ schnellen Datenzugriff, werden auch bei einer Auslagerung auf Tape standardmäßig 512 Kilobyte Daten im NAS-System vorgehalten. Damit sind auch bei „kälteren“ Dateien sofort Daten aus dem Cache abrufbar und verhindern, dass die Anwendung in einen Time Out läuft.

Während diese Daten zur Anwendung geschickt werden sucht du liest die Strongbox weitere Daten von Band ein und führt diese in den schon offenen Datenstrom zur Anwendung zu. Da einmalige Archivzugriffe selten sind, werden die von Band gelesenen Daten auch gleichzeitig wieder in das NAS-System nachgeladen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

(ID:36867540)