Kommentar von Marcus Stier, Crossroads Europe Langzeitspeicherung auf Tape hat Zukunft

Autor / Redakteur: Marcus Stier / Nico Litzel

„Tape is dead“, wer kennt sie nicht, diese etwas aggressive Aussage? Seit Jahren geistert sie durch die IT-Branche. Und doch finden sich in den meisten Rechenzentren immer noch aktive genutzte Tapes und Tape-Libraries. Sie werden für Backups, für die Auslagerung, Archivierung, Langzeitspeicherung und viele andere Funktionen eingesetzt, die sich mit Festplatten bis heute nicht zufriedenstellend abbilden lassen.

Firmen zum Thema

Der Autor: Marcus Stier ist Sales Engineer bei der Crossroads Europe GmbH
Der Autor: Marcus Stier ist Sales Engineer bei der Crossroads Europe GmbH

In der Realität ist das Tape also noch lange nicht tot. Um genau zu sein, ist es nicht wegzudenken aus den meisten Rechenzentren. Leider hat sich allerdings gerade im Tape-Bereich lange Zeit keine technische Revolution ereignet. Doch nun erlebt genau dieser Bereich durch eine neue Technik eine Renaissance!

Das Zauberwort heißt LTFS, „Linear Tape File System“ oder „Long Term File Storage“. LTFS ermöglicht es, beispielsweise ein LTO-5 Tape, welches mit diesem Format beschrieben wurde, an einem beliebigen Server oder PC wie einen USB-Stick zu lesen. Ein richtiges, lesbares Filesystem auf einem Tape – kein proprietäres Format!

Dadurch eröffnen sich ungeahnte Möglichkeiten: Die Kapazität und Zuverlässigkeit eines Tapes, kombiniert mit der Flexibilität eines frei lesbaren Filesystems. Was kann mit dieser Technik nicht alles erreicht, was nicht alles endlich sinnvoll mit Tape realisiert werden?

Kostengünstige Langzeitspeicherung

So zum Beispiel das Thema der kostengünstigen Langzeitspeicherung von Daten. Es ist ein immer wieder auftretendes Thema und so oft es aufkommt, so oft wurde es wieder verworfen und neu angedacht. Gerade in diesem Umfeld sind Festplatten nicht der Weisheit letzter Schluss.

Zum einen ist die Ausfallrate von Festplatten, im Vergleich zu einem Tape, relativ hoch und der Wiederaufbau eines RAID-Verbundes ist sehr langwierig. Zum anderen kann eine Festplatte nicht so einfach aus ihrem RAID-Verbund gelöst werden, um sie beispielsweise in einen Tresor, eine Bank oder einen Bunker zu legen.

Blinde Sammelwut ist teuer

Die Menschheit basiert seit jeher auf dem Prinzip des Jagens und Sammelns. Wir werfen ungern etwas weg, man könnte es schließlich nochmals benötigen. Mit den Daten ist das nicht anders, sondern eher noch gravierender. Niemand möchte eine Datei wegwerfen, vielleicht wird sie ja noch gebraucht. Es macht ja nichts, wenn man sie aufbewahrt. Außerdem kostet der Plattenspeicher doch nichts. Eine Terabyte-Platte ist schon für einen zweistelligen Eurobetrag zu haben. Da bin ich doch nicht blöd und werfe die Daten weg, denkt sich so mancher Nutzer.

Der Rechenzentrumsbetreiber, Storage-Verantwortliche oder auch der IT-Leiter sehen das ganz anders. Sie müssen dafür Sorge tragen, dass die Daten immer sicher und verfügbar sind – auch wenn sie möglicherweise nie wieder genutzt werden. Das kostet Geld. Da wird gespiegelt, geclustered, gesichert, kopiert und repliziert. Eine Datei wird schnell um das 100-Fache teurer, als das Terabyte vom Discounter. Selbst mit vergleichbarer Technik.

Noch dazu wird die Datei mit all diesen Sicherungsmethoden vervielfacht. Da hilft auch die schönste Deduplizierung und Komprimierung nichts mehr. Selbst in kleineren und mittleren Umgebungen lohnt sich somit der Weg in die Auslagerung der nicht mehr genutzten Dateien auf ein anderes Medium, ein Tape.

Es gibt heute Auslagerungs-Appliances, die mit einem hohen Automatisierungsgrad die nicht genutzt Dateien von teuren, hochverfügbaren NAS- oder SAN-Speichern auf kostengünstigere Medien, wie eben zum Beispiel LTFS Tapes, auslagern.

Die Einsparungen beim Filestorage sind immens. Geht man davon aus, dass der verfügbare Online Storage 100 Prozent der Kosten entspricht, dann liegt man im Tape-Bereich zwischen 25 und 35 Prozent dieser Kosten. Und die verfügbare Kapazität der Tapes nimmt ständig zu. Konnte ein LTO-3 Tape bis zu 400 Gigabyte unkomprimierter Daten aufnehmen, so hat das LTO-5 Tape heute bereits eine unkomprimierte Kapazität von 1,5 Terabyte.

Die Auslagerung

Wie kann so eine Auslagerung nun aussehen? Schließlich soll die Verfügbarkeit und Sicherheit der Daten gewährleistet sein. Die modernen Auslagerungs-Appliances, welche die Daten automatisiert auf Tape migrieren können, präsentieren sich heute als CIFS-, NFS-, oder FTP-Shares im Netzwerk. Somit sind sie wie ein NAS-System sichtbar und bringen auch ähnliche oder gar die gleichen Funktionalitäten mit.

Durch diese Art der Anbindung wird eine hohe Flexibilität erreicht. Die Daten können, ganz traditionell, in den Share abgelegt werden. Auch dafür gibt es verschiedene Möglichkeiten. Beispielsweise mit einer Applikation. Diese kann ein DMS-System darstellen oder eine Applikation, welche auch NAS-Systeme bereinigen kann.

Auch der Benutzer selbst kann in kleineren Umgebungen die Daten manuell oder mit einem „Move“- oder „Copy“-Befehl auf diesen Share bringen. Liegen die Daten erst einmal im Share der Appliance, greifen integrierte Regelwerke und migrieren die Dateien entsprechend dieser Regeln auf das LTFS Tape. Auf der Platte bleibt „nur“ eine Art Platzhalter zurück.

Der Platzhalter

Dieser Platzhalter hat je nach Appliance-Konzept unterschiedliche Größen und Eigenschaften. Im besten Fall beinhaltet der Platzhalter nicht nur alle Attributwerte einer Datei für die vollständige Transparenz gegenüber dem Benutzer oder der Applikation, sondern er hält auch noch einen Anteil der Datei vor, um diesen sofort – wie eine Art Vorschau – darstellen zu können.

Appliances, die so einen Platzhalter mit Dateianteilen nutzen, bieten auch eine höhere Recall-Geschwindigkeit, da sofort bei Auslösung des Recalls ein „Stück“ Datei geliefert werden kann. Vorteilhaft ist es, wenn die Größe des Platzhalters einstellbar ist und so den Bedürfnissen der Applikation oder der Umgebung angepasst werden kann.

Je kleiner ein Platzhalter gestaltet ist, desto weniger Cache wird benötigt. Je größer man einen Platzhalter wählt, umso schneller geht der Recall vonstatten, da mehr Dateianteil gespeichert werden kann. Die Größe des Platzhalters hängt also von der Anwendung und auch von den auszulagernden Dateien ab.

Der Recall

Wie kommt nun so eine Datei zurück vom Tape zum Anwender oder zur Applikation? Fordert die Applikation oder der User eine Datei an, liefert die Auslagerungs-Appliance sofort den Dateianteil des Platzhalters zurück. Somit entsteht ein geöffneter Datenstrom. Gleichzeitig wird das LTFS Tape in ein verfügbares Laufwerk geladen und auf die richtige Position gespult. Sobald das passiert ist, wird die Datei in den bereits offenen Datenstrom eingehängt. Die Geschwindigkeit des Datenstroms entspricht nun dem Lesen von Tape.

Parallel zu diesem Vorgang wird die Datei auch in den Cache der Appliance geladen. Priorität sollte aber immer die anfordernde Applikation sein. Dadurch geht der Recall bedeutend schneller vonstatten, als man dies aus der Vergangenheit von verschiedenen Lösungen her kennt. Die Applikation erhält keinen „Timeout“. Sie erhält die Daten, welche sie angefordert hat, in einer endlichen Zeit.

Sollte die Applikation die Datei nicht mehr benötigen, wird sie, wenn sie nicht geändert wurde, aus dem Cache nach vorhandenen Regeln wieder entfernt und der Platzhalter wieder generiert. Die Datei ist weiterhin auf dem Tape vorhanden. Sollte sie verändert worden sein, wird die Datei zuvor nach den Regelwerken wieder auf Tape migriert.

Monitoring und Self-healing

Ein wesentlicher Punkt bei der Auslagerung auf Tape ist die Lesbarkeit der Tapes noch nach vielen Jahren. In modernen Appliances werden Tapes nach integrierten Regelwerken und Funktionen immer wieder automatisch auf Lesbarkeit und Fehler überprüft.

Das Interessante ist, dass diese integrierten Funktionen ein Tape selbstständig umkopieren können, sofern der Verdacht auf Fehler besteht. Somit ist die Lesbarkeit der Tapes immer gegeben. Diese Aktionen laufen selbstverständlichen nebenher und verschwenden keine zusätzlichen Ressourcen. Die gleichen Funktionalitäten sorgen aber auch dafür, dass ein Medienwechsel zum Beispiel auf eine neue Bandtechnik automatisiert durchgeführt werden kann.

Setzt man heute zum Beispiel ein LTO-5 Tape ein und es kommen die LTO-6 Tapes auf den Markt, so wird ein neues Laufwerk in die Library eingebaut und das Umkopieren kann beginnen. Wahlweise mit den Tapes, die so oder so aufgrund der Analysen umkopiert werden müssten, oder eben nach eigenen Kriterien. Mussten vor Jahren noch Migrationspläne und Projekte erstellt werden, so geht das mit den neuen Systemen vollautomatisch.

Ausfallsicherheit

Ausfallsicherheit ist auch bei Auslagerungslösungen immer wieder ein Thema. Es ist nicht so dringlich, wie beim aktiven Online Storage, aber es ist vorhanden. Nur weil eine Datei über Jahre nicht genutzt wurde oder nicht gebraucht wurde, bedeutet das nicht, dass sie unwichtig ist.

Die Replizierung ist in diesem Zusammenhang ein Punkt, der betrachtet werden sollte. Am sichersten ist eine Replizierung von zwei Auslagerungssystemen über Standorte, mindestens jedoch über zwei Brandschutzzonen hinweg. Noch besser ist es, wenn die Auslagerungs-Appliance zusätzlich nicht nur eine Kopie der Datei auf ein Tape schreiben kann, sondern noch eine zweite Kopie in eine zweite Library.

Zur Ausfallsicherheit gehört aber auch, dass die Daten lesbar sind, wenn die Appliance vielleicht nicht verfügbar ist. Hier kommt erneut das LTFS ins Spiel. Solange ein funktionierendes LTO-5-Laufwerk verfügbar ist, können die Daten, welche auf das LTFS Tape geschrieben wurden, an jedem beliebigen Rechner gelesen werden. LTFS zeigt sich wie ein Filesystem mit Strukturen und Dateien.

Als Fazit lässt sich an dieser Stelle festhalten: Wir haben mit dem Tape ein kostengünstiges Medium. Durch die Auswahl der richtigen Appliance erreichen wir die Lesbarkeit der Tapes über viele Jahre hinweg, die automatische Medienmigration, eine hohe Ausfallsicherheit und einen schnellen Recall. Alle das sind Funktionen und Vorteile, die bei einer Auslagerungslösung für Langzeitdaten wünschenswert sind.

Einsatzgebiete

Für welchen Bereich oder welche Branche kann so ein Auslagerungssystem passen? Grundsätzlich für jeden Bereich, in welchem Daten anfallen, welche nicht ständig genutzt und geändert werden. Denken Sie beispielsweise an die Filmbranche, in der große Datenmengen produziert werden, welche nach der Fertigstellung eines Filmes nur noch selten benötigt werden.

Des Weiteren sind Forschung und Lehre, Medizin, Videoüberwachung, Automotive und Branchen zu nennen, in denen Daten und Informationen sehr lange Zeit gespeichert werden müssen, ohne dass permanent auf die Daten zugegriffen werden müsste. Es gibt verschiedene Produkte am Markt, die diesen hier skizzierten Anforderungen Rechnung tragen. So zum Beispiel die StrongBox von Crossroads.

Sollten Sie eine Entscheidung über eine solche Lösung für die Langzeitspeicherung Ihrer Daten treffen wollen, so sollten Sie auf einige Punkte achten:

  • Herstellerunabhängigkeit
  • Unterstützung von LTFS
  • Funktion zur Replizierung
  • Einfache Integration in die bestehende Umgebung
  • Tape-Analysen
  • Automatische Migrationen

Die Unabhängigkeit von der Hardware für den Plattencache und für die Tape Library ist ein extrem wichtiger Punkt. Je unabhängiger die ausgewählte Lösung, desto nahtloser passt sie sich in Ihre Umgebung ein und desto leichter ist sie zu implementieren. Weiterhin können Sie Ihre vorhandene Hardware für den Einsatz der Langzeitspeicherung nutzen.

LTFS ist die Zukunft im Tapemarkt! Eine Auslagerung von Daten gerade auf diese Technik ist sinnvoll. Nutzen Sie eine Lösung, die die Zukunftssicherheit Ihrer Langzeitspeicherung umfassend gewährleisten kann!

(ID:32665120)