Definition Was ist Hierarchical Storage Management (HSM)?
Bei HSM – der Abkürzung für Hierarchical Storage Management oder auf Deutsch Hierarchisches Speichermanagement – handelt es sich um einen richtlinienbasierten Prozess der Datenmigration über mehrere Stufen von Speichersystemen und deren automatisierte Wiederherstellung. Ziel ist es, teuren Speicherplatz von älteren, nicht genutzten Dateien zu befreien, diese aber durch Stubs so mit dem preiswerteren Speicherplatz zu verknüpfen, dass sie jederzeit mit einem gewissen Zeitaufwand wiederhergestellt werden können.
Anbieter zum Thema

Obwohl HSM auf einem Standalone-System realisiert werden kann, findet man diese Technik häufiger im verteilten Netzwerk eines Unternehmens. HSM benutzt unterschiedliche Speicherklassen wie RAID (Redundant Array of Independent Disks), Nearline-Speichersysteme und Bandbibliotheken, um die Kosten der Lagerung von Daten zu optimieren.
Meist werden Richtlinien angewandt, die Daten verschieben, wenn diese längere Zeit nicht mehr benutzt worden sind. Da im Dateisystem sogenannte Stubs (Pointer) verbleiben, die wenig Platz benötigen, sind die Daten für alle Anwender weiterhin im Zugriff.
Allerdings verursacht die Verschiebung auf langsamere und teilweise offline gelagerte Medien längere Wiederherstellungszeiten. Andere Richtlinien können auch die Verlagerung abhängig vom Füllgrad des Primärsystems oder dessen Antwortzeiten betreffen.
HSM modern hieß ILM und steckt auch in Tiered Storage drin
Man könnte HSM als den Grundgedanken einer ganzheitlichen Datenspeicherung sehen. Alle im Unternehmen erzeugten Daten sollen zugreifbar sein. Der Kostengesichtspunkt, der aus dem Mainframe-Umfeld stammenden Technik, hat sich in späteren Jahren in eine Theorie über den Wert der Daten verwandelt und wurde im Jahr 2003 als Information Lifecycle Management (ILM) neu vermarktet.
Inzwischen ist der Grundgedanke von HSM auf eine automatisierte Verschiebetechnik namens Autotierung/Storage-Tiering geschrumpft worden. Mittels statistischer Analysen werden die Zugriffe auf Datenblöcke, nicht auf Dateiein insgesamt, ermittelt. Die so errechneten „heißen“ Datenblöcke werden auf dem schnellsten Speichermedium vorgehalten, die „kalten“ Datenblöcke auf dem preiswertesten. Bei hochaktiven Anwendungen ist allerdings darauf zu achten, dass die statistische Analyse die Datenverschiebung in Echtzeit vornimmt.
Mit dem Aufkommen der Datenauslagerung in die Cloud stellt sich für Administratoren das Problem der Wiederfindbarkeit von Daten auf einer höheren Stufenleiter. Ideell gelöst scheint diese Dauermigration von Daten in der Technik des Tiered Storage. Ungeklärt sind allerdings viele Details, wie dies auch schon bei ILM der Fall war, beispielsweise wie das Löschen von Dateien auf einer Speicherstufe auch an Filesysteme, Speicherspiegel oder Caches weitergereicht werden kann.
Tiered Storage im Speichermodul
Die neueste Variante des HSM-Konzept ist in Hybrid-DIMMs zu finden. Dabei werden DRAM- und Flash-Speicher in einem Speichermodul miteinander kombiniert. Das DRAM dient hier nur als Cache für den Flash-Anteil, das NAND-Flash ist der non-volatile Hauptspeicher. Die Daten sind nun also schnell zugreifbar und nun nicht-flüchtig gespeichert.
Die beiden Speicherkomponenten kommunizieren mit sehr kurzen Zugriffszeiten über das NVMe-Protokoll miteinander, so dass sichergestellt ist, dass veränderte (dirty) Cache-Inhalte innerhalb des Moduls weggeschrieben und Datenzugriffe auf den Flash-Teil möglichst schnell bereitgestellt werden.
2017 will Hersteller Netlist in Kooperation mit Samsung Hybrid-DIMMs mit 32 Gigabyte DRAM und 1 Terabyte Flash auf den Markt bringen. Änderungen am Betriebssystem sind entgegen früheren Varianten nicht mehr notwendig.
(ID:43812431)