Content Addressed Storage und E-Mail-Archivierung

Metadaten – der Heuhaufen der Suchmaschinen

13.11.2007 | Autor / Redakteur: Bernd Schöne und Rainer Graefen / Nico Litzel

Illustration: Ed Fotheringham
Illustration: Ed Fotheringham

Hitachi Data Systems hat sich nach nur einem Jahr technologischer Partnerschaft den CAS-Spezialisten Archivas einverleibt. Interessant ist die CAS-Lösung nicht nur für die größer werdenden E-Mail-Archive, sondern auch für sensible Personal- oder Krankenakten.

Wohin man schaut, die Datenarchivierung erregt die Gemüter – momentan vor allem die Gemüter von Vertriebsmitarbeitern. Jeder von ihnen kennt Dutzende von Gesetzen, die alle von den potenziellen Kunden nicht ausreichend beachtet werden. Und Finanzämter und Gerichte kleben den Unternehmen an den Fersen, warnen dieselben Kassandrarufer unermüdlich.

Gefordert ist, wie schon immer, „die umfassende und revisionssichere Aufbewahrung aller geschäftsrelevanten Dokumente“, die früher per Post ins Unternehmen flatterten und dort mehr oder weniger sachgerecht in Aktenordner eingeheftet wurden und etwas später dann im Keller verschwanden. Wurde ein älteres Dokument gesucht, fanden die Archivare dies dann nach mehr oder weniger langem Blättern in den Archivdokumenten.

Heute dagegen müssen die geschäftsrelevanten Dokumente auf Knopfdruck bei einer Betriebsprüfung zur Verfügung stehen, reden einem die Anbieter des Content Adressable Storage (CAS) ins Gewissen. Ansonsten drohen Millionenverluste, wenn der Kläger oder auch der Beklagte für seine Sicht der Dinge nicht den gesamten Schriftverkehr mit der Gegenpartei belegen kann. Bei soviel Drangsal sind natürlich auch die Anbieter gefordert. Hitachi Data Systems (HDS) tritt daher gleich mit einer zertifizierten Lösung für den deutschsprachigen Raum an, die Gesetzeskonformität garantiert.

Erfunden hat die neue Speicherkategorie CAS der Platzhirsch EMC, der im Jahr 2002 mit der Centera ein neuartiges Speichersystem einer damals noch staunenden Öffentlichkeit vorstellte. Auch Network Appliance bietet mit Snaplock ähnliche Möglichkeiten bei seinen NAS-Filern. CAS, damals unglaublich, heute unverzichtbar, ist eine Kombination von Festplatteneinschüben, deren Daten sich weder löschen, noch verändern lassen und die auch nicht über ein Dateisystem abrufbar sind.

Was ein Dokument einmalig macht

Grundlage eines CAS-Speichers ist ein Hash-Wert, der aus dem Dokument und zusätzlichen Metadaten gebildet wird. Nur mit dem so ermittelten eindeutigen Zahlenwert ist der Zugriff auf die Datei möglich. Damit ist sichergestellt, dass die Datei nicht unbemerkt verändert und manipuliert werden kann. Das CAS-System schließt sie sozusagen in einen digitalen Panzerschrank ein, unabhängig vom physikalischen Speicherort des Datensatzes.

Die Dicke des Panzerschranks hängt dabei entscheidend von der Qualität der eingesetzten Hash-Algorithmen ab. Wobei nicht fix vorgegeben ist, welche spezielle Rechenvorschrift zur Anwendung kommt. Hitachi benutzt als Rechenvorschrift für seine Hitachi Content Archive Platform, kurz HCAP, SHA-1 mit 256, 384 und 512 Bit und MD5, RIPEMD-160. „Der Anwender kann auf Wunsch auch einen Algorithmus seiner Wahl einbauen und eine andere Schlüssellänge wählen“, erläutert Dr. Georgios Rimikis, Manager Storage Strategy von Hitachi Data Systems.

Nicht minder entscheidend als der Hash-Wert ist der Arbeitsablauf, sprich die festzulegenden Policies und die Datenbank mit den Metadaten. Sie befindet sich auf einem separaten Server, der von einem beliebigen Hersteller stammen kann. HDS liefert eine Liste mit zertifizierten Systemen. Über die Metadaten sind blitzschnelle Recherchen möglich. Es ist also nicht nötig, die Originaldateien zu durchforsten, um im CAS-System ein Dokument wieder zu finden. Das Resultat ist ein nicht zu unterschätzender Geschwindigkeitsvorteil gegenüber CAS-Systemen der ersten Generation, die sich an klassische Archivlösungen anlehnten und diese oft einfach nur emulierten.

Kontrolliertes Aufbewahren und Löschen

Archivierung wird gerne mit E-Mail-Archivierung gleichgesetzt. Es gibt aber auch noch vieles andere sicher zu verstauen. So sollte der Hamburger Dienstleister Info AG jede Menge Personalakten für einen Konzern archivieren. „Diese hochsensiblen Informationen müssen für einen bestimmten Zeitraum aufbewahrt werden und dürfen von Unbefugten weder eingesehen, noch verändert werden“, sagt Thomas Ultsch von der Hamburger Info AG. Sozusagen der klassische Fall für ein CAS-System. Der kleine Wunschkatalog machte die Info AG zu einem der ersten Archivas-Kunden in Deutschland. „Was in der Praxis lockt, sind vor allem die klaren Policies“, erklärt Ultsch. Der Kunde legt einmalig für seine Datensätze fest, wie lange sie aufbewahrt werden müssen und wann das System sie zu vernichten hat.

Letzteres ist gar nicht so unwichtig, obwohl sich Archiv-Administratoren für gewöhnlich eher vor dem Verlust als vor dem Behalten von Daten fürchten. Aber in Deutschland verlangt das Gesetz, aus den Personalakten ausgeschiedener Mitarbeiter bestimmte Informationen nach zwei Jahren zu löschen, und dieses Gesetz gilt auch für Daten im Archiv. Das will ebenfalls zertifiziert sein. Für das sichere Vernichten arbeitet HCAP nach der US-Norm US DoD 5520-M spec.

„Archivas ist in dieser Form einzigartig, es stellt die Einhaltung der Vorschriften für den Gesamtprozess vom Front- bis ins Backend sicher“, erläutert Thomas Ultsch, „das gilt auch für die Leseberechtigungen, selbst Administratoren können die Datensätze nicht anschauen, das geht nur über das Frontend.“

CAS, ein Fall fürs Outsourcing?

Krankenhäuser und Röntgenlabore haben ganz ähnlich gelagerte Probleme. Einige lassen gerade kalkulieren, ob sie ein externer Dienstleister wie die Info AG für die Dauerlagerung nicht preiswerter kommt, als entsprechende Kapazität im eigenen Haus bereitzustellen.

Auch in der Logistik dürften CAS-Systeme in Zukunft eine große Rolle spielen. Zahlreiche Gesetze verlangen inzwischen den Nachweis über die Unschädlichkeit der Inhaltsstoffe eines Produktes. Die Bleifarben auf chinesischem Kinderspielzeug sind dafür ein aktuelles Beispiel. Kann ein Importeur diese Nachweise nicht schnell genug erbringen, hängen die Container im Freihafen fest und dürfen nicht zum Kunden. „Solche Fälle“, erläutert Ultsch, „kommen immer häufiger vor“. Der Schaden ist immens. Neben den Umsatzeinbußen muss sich der Importeur noch mit verärgerten Kunden und frustrierten Händlern herumschlagen.

Die Rückkehr des Originals

Gedacht ist HCAP für alle „unveränderlichen“ Dokumente, angefangen von Vertragstexten wie Versicherungspolicen, Belege für das Finanzamt, E-Mail-Archive, Bild- und Audiodateien bis hin zu Bauplänen von Flugzeugen und Kraftwerksanlagen. Das alles wird nur einmal gespeichert und danach nicht weiter verändert. Sollte es nötig werden, sie trotzdem noch einmal zu überarbeiten, entsteht ein zweites Dokument, das sich vom ersten unterscheidet, aber nur eine Version darstellt. Das Original bleibt so stets rekonstruierbar. Alle Zugriffe lassen sich zudem protokollieren und die Ergebnislisten im gängigen XML- oder CSV-Format ausgeben. Auch so etwas kann wichtig sein, etwa wenn Unregelmäßigkeiten auftreten sollten.

Irgendwann wird das Hyperthema E-Mail-Archivierung auch für die Info AG zum Geschäft werden, höchstwahrscheinlich aber auf kleiner Flamme. Zurzeit gibt es bei der Info AG keine Nachfrage. „Viel Lärm um nichts“, wie Thomas Ultsch meint, „schließlich schreibt der Gesetzgeber nur vor, wichtige Mails aufzubewahren.“

Viel wichtiger sind da in der Praxis Eigenschaften wie das einfache und schnelle Nachrüsten von frischer Disk-Kapazität, ohne dass dazu das System ausgeschaltet werden muss. „Das funktioniert bei unserem System ausgezeichnet. Wir erweitern die logische Festplatte (LUN); das war es“, sagt Ultsch zufrieden.

Mit Offenheit und Zertifikaten punkten

Gegenüber den etablierten Produkten von EMC und Network Appliance will man sich mit der bereits erwähnten Zertifizierung, der ausgeklügelten Indexierungsfunktion und 370 unterstützten Dateiformaten absetzen.

Für die Anwender wohl mindestens genauso wichtig: Es kann, es muss aber nicht ein Hitachi-Speichersystem zum Einsatz kommen. Sollte sich ein Kunde entscheiden, nur die Software von Hitachi zu erstehen, ist allerdings die Universal Storage Platform als Virtualisierungsschicht zwischen HCAP und Fremd-Hardware zu schieben.

Daten tauscht die Archiv-Plattform per NFS (Network File System), CIFS (Common Internet File System) und HTTP (Hypertext Transfer Protocol) aus. Das Management kann über SMI-S (Storage Management Initiative-Specification) erfolgen. Der Vorteil für die Softwarehäuser: Sie können ihre Lösungen mit HCAP vernetzen, ohne Lizenzgebühren zu zahlen oder den Kunden damit auf eine bestimmte Hardware festzulegen. Rund 50 bis 60 Independent Software Vendors (ISV), so schätzt man bei Hitachi Deutschland, nutzen diese Chance weltweit.

Soviel Service gibt es nicht umsonst. Mindestens 60.000 Euro müssen Anwender zahlen. Für die anvisierte Kundschaft – Banken, Versicherungen und deren Dienstleister – dürfte diese Summe keine unüberwindliche Hürde sein.

Weltweit soll es mittlerweile einige hundert HCAP-Installationen geben, so genau weiß der deutsche HDS-Vertrieb das nicht. Unter den Kunden befinden sich aber schon jetzt so zugkräftige Namen wie das zentrale Krebsforschungsregister der USA und die NASA.

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 2007892 / CAS)