Auszug aus dem IBM Storage System Kompendium 1999 bis 2005 – die Epoche der Multiplattform-Systeme und des Fibre Channel SAN und NAS, Teil 6

Autor / Redakteur: Kurt Gerecke und Klemens Poschke / Nico Litzel

Archivierung von Informationen ist ein sehr altes Thema, denkt man an die Höhlenmalereien der Grotte Chauvet im Vallon Pont d’Arc in Südfrankreich, die auf ca. 31.000 Jahre geschätzt werden. Die Techniken, der Nachwelt Informationen zukommen zu lassen, haben sich seitdem stets verbessert. Zunächst wurden Information in Stein gemeißelt und in Ton gebrannt, bis die Ägypter etwa 4.000 Jahre vor unserer Zeit den Papyrus – den Vorgänger des heutigen Papiers – entdeckten, um Informationen darauf festzuhalten.

Firmen zum Thema

Die Entwicklung der optischen Techniken in den 90er-Jahren
Die Entwicklung der optischen Techniken in den 90er-Jahren
( Archiv: Vogel Business Media )

Mit fortschreitender Technik war es nun auch möglich, mehr Informationen zu speichern und der Nachwelt zu hinterlassen. Denken wir nur an das Alte Testament, das einen Zeitraum von ca. 2.000 Jahren vor Christi Geburt umfasst und aus insgesamt zwölf Büchern besteht. Mit der Erfindung des Buckdrucks durch Johannes Gutenberg aus Mainz, Mitte des 15. Jahrhunderts, war es dann auch möglich, Informationen einfach zu vervielfältigen, was zu vielen interessanten Überlieferungen beigetragen hat und natürlich auch zum Wachstum an Informationen.

Entwicklungsallianz zwischen IBM und Sony

Bereits 1982 gründeten IBM und Sony eine Entwicklungsallianz mit dem Ziel, optische Technologien gemeinsam weiterzuentwickeln. So enstanden im IT-Umfeld Anfang der 90er-Jahre optische Archivierungsmöglichkeiten, sogenannte Juke-Boxen mit optischen Platten und entsprechenden Schreib-/Lesegeräten, die sich in dieser Zeit auch als Archivierungseinheiten zur Langzeitarchivierung durchsetzten. Es etablierten sich drei unterschiedliche optische Medien, die WORM-Platte (Write Once Read Many), die magneto-optische Platte MO und die „Schein-WORM“-Platte, die sogenannte CCW-Platte (Continuous Composite WORM), eine magneto-optische Platte, die bei der Herstellung eine Kennzeichnung bekommt, die sicherstellt, dass das Medium nicht versehentlich überschrieben wird.

Bildergalerie
Bildergalerie mit 5 Bildern

Bereits 1992 begann man, die für die IT-Branche entwickelten Formate WORM, MO und CCW, basierend auf der Rote-Laser-Technik, zu standardisieren. Ein ISO-Standardisierungsgremium bildete sich und selbst der deutsche DIN bildete den NI23-Arbeitskreis, einen Ausschuss des deutschen DIN zur Normierung von optischen Datenträgern, der der internationalen ISO direkt zuarbeitete und seine entsprechende Position abgab.

ISO-Norm

Die als 1-x-Standard verabschiedete ISO-Norm reflektierte eine 650-Megabyte-Platte in allen drei Formaten, mit dem 2-x-Standard kam die 1,3-Gigabyte-, mit dem 4-x-Standard die 2,6-Gigabyte-Platte. 1998 wurde der letzte Standard als 8-x-Standard verabschiedet, der immer noch auf dem roten Laser basierte. Der 8-x-Standard bot auf allen drei Formaten 5,2 Gigabyte Kapazität pro Platte.

Um Rückwärtskompatibilität zu gewährleisten, war der Standard so gestaltet, dass Medien des 1-x-Standards sowohl lese- als auch schreibmäßig von Schreib-/Lesegeräten des 2-x-Standards verarbeitet werden konnten und selbst der 4-x-Standard noch in der Lage war, Medien des 1-x-Standards zu lesen. Mit dem 8-x-Standard kam der Bruch, da nicht mehr vorgesehen war, Medien des 1-x-Standards auf Schreib-/Lesegeräten des 8-x-Standards verarbeiten zu können.

Weiter mit: WORM-Platten

WORM-Platten

Mitte der 90er-Jahre wurde die WORM-Platte – vom Gesetzgeber anerkannt für viele Archivierungsanforderungen – mit einer Haltbarkeit von 300 Jahren spezifiziert. Viele Unternehmen gingen dazu über, Langzeitarchivierung auf diesen optischen Juke-Boxen zu betreiben. IBM bot auf diesem Gebiet das optische Archivsystem IBM 3995 an.

Nach der Verabschiedung des 8-x-Standards passierte viele Jahre nichts mehr bezüglich einer sinnvollen Standardisierung. Dies lag darin begründet, dass ein 16-x-Standard technisch nicht realisierbar war, da der rote Laser in diesem Bereich eine Streuung zeigte, die es nicht zuließ, auf einem nach 8-x-Standard erzeugten Pit durch Optimierung der Laserfrequenz vier Pits unterzubringen. Auch trug der technologische Wechsel zur Blaue-Laser-Technik (auch „Blue Ray“ genannt) dazu bei, dass ein noch realisierbarer Standard in Rote-Laser-Technik als 12-x-Standard nicht weiterverfolgt wurde.

Gemeinsame Entwicklung von IBM und Sony

Hier noch ein wichtiger Hinweis, der zeigt, wie tief IBM in der Entwicklung von optischen Technologien engagiert war: Der heutige blaue Laser ist ein IBM-Patent, das aus einer gemeinsamen Entwicklung von IBM und Sony hervorging.

Im Jahr 2000 ergab sich in Deutschland eine massive Änderung für die Langzeitarchivierung. Die GDPdU-Richtlinie wurde verabschiedet und im Jahr 2001 nochmals genauer verifiziert. Diese Richtlinie nahm Abschied von der Vorgabe, bei bestimmten aufzubewahrenden Daten optische WORM-Medien zu verwenden. Damit war der Weg frei, neue Lösungskonzeptionen zu entwickeln, die nicht unbedingt auf optischen Technologien aufgebaut sind.

Wenn die Archivierung gesetzlichen Bestimmungen und Anforderungen unterliegt, spricht man auch von revisionssicherer Archivierung. In vielen Bereichen erkennt der Gesetzgeber die digitale Archivierung als revisionssicher an, stellt aber gleichzeitig auch Anforderungen an die Art und Weise der Archivierung. In Deutschland gibt es z. B. die Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU). Viele Gesetze und Bestimmungen stellen allgemeine Anforderungen an die revisionssichere Archivierung. Zumeist werden die Aufbewahrungszeiträume von archivierten Daten vorgeschrieben.

Weiterhin muss sichergestellt sein, dass die Daten im digitalen Archiv nicht verändert oder gelöscht werden können – in einer Welt mit zwei bis drei neuen Computerviren pro Tag gar keine so einfache Sache. Einige Bestimmungen schreiben auch vor, Kopien der Originaldaten in getrennten Räumen zu erstellen. Revisionssicherheit bedeutet natürlich auch, dass die Integrität der Daten zu jeder Zeit nachweislich gewährleistet ist. Es muss also auch anhand von Protokollen nachgewiesen werden, dass die Daten dem Original entsprechen. Die eingesetzte Technologie zur Archivierung wird aber heute von fast keinem Gesetz oder einer Bestimmung vorgeschrieben.

Weiter mit: Hat ein digitales Archiv 30 Jahre Bestand?

Hat ein digitales Archiv 30 Jahre Bestand?

In einigen Fällen, z. B. im medizinischen und pharmazeutischen Bereich, müssen Daten 30 Jahre und länger archiviert werden. Eine Frage, die sich daraus ergibt, ist: Gibt es ein digitales Archiv, das auch in 30 Jahren noch Bestand hat? Eine zeitgemäße Antwort darauf ist, dass die Informationen von Zeit zu Zeit auf neue Systeme und Technologien überführt werden müssen. Überführung von Informationen und informationsverarbeitenden Systemen auf neue Systeme und Technologien – nachfolgend auch Migration genannt – ist heutzutage der einzige Weg, um die Daten auch in 30 Jahren noch lesen zu können.

Aufgrund der veränderten Bedingungen für die Langzeitarchivierung kündigte IBM das System DR450 im Oktober 2003 an. Das System wurde mit Standardkomponenten aufgebaut und als Langzeitarchivierungslösung für den Open-Systems-Bereich zur Verfügung gestellt. Die Lösung bestand aus zwei pSeries-p615-Servern, die in einem hochverfügbaren HACMP-Cluster (AIX-Betriebssystem) zusammengefasst waren. Auf diesen Servern war der IBM Tivoli Storage Manager für Data Retention aufgesetzt, der sicherstellte, dass die archivierten Dateien und Dokumente innerhalb der Aufbewahrungsfrist nicht gelöscht oder modifiziert werden.

Die Daten wurden auf SATA-Platten (siehe auch Technologie-Anhang) einer FAStT600 mit EXP100-Erweiterungseinheiten abgespeichert. Kapazitäten von 3,5 bis 56 Terabyte konnten konfiguriert werden. Das Magnetplattensystem war über ein redundant ausgelegtes, Fibre-Channel-basierendes SAN an die Server angeschlossen. Optional konnten an diesem SAN auch 3592-Bandlaufwerke mit entsprechenden WORM-Kassetten und/oder überschreibbaren Kassetten betrieben werden.

DR550 – die Weiterentwicklung der DR450

Bereits im Jahr 2005 kam die Weiterentwicklung der DR450 mit der DR550 auf den Markt, die im Jahr 2006 mit allen seinen Komponenten auf RoHS-Konformität umgestellt wurde. Das IBM-DR550-System besteht heute aus den IBM-Standard-Software- und Hardware-Komponenten AIX, SSAM, pSeries p52A, den SAN-Komponenten 2005-B16, Disk System DS4700 und Disk-Erweiterungseinheiten EXP810. Optional kann man ein hochverfügbares DR550-System bestellen. Dabei beinhaltet das System zusätzlich noch die Cluster-Software HACMP.

Der Vorteil dieses Konzepts liegt auf der Hand: Der Anwender erhält ein System, dessen Komponenten schon lange im Markt erprobt sind. Kernkomponente von DR550 ist der System Storage Archive Manager, ein Derivat vom Tivoli Storage Manager for Data Retention, der jegliche Veränderung oder Löschung von Informationen verhindert und somit die revisionssichere Speicherung erlaubt.

In der Produktfamilie IBM System Storage DR550 gibt es drei Modelle:

  • Das DR550-Express-System ist eine Einstiegslösung, die aus einer IBM pSeries Model 52A besteht mit internen SCSI-Festplatten, die als RAID5 konfiguriert sind. Mit dem DR550-Express-Model wird ein Monitor-Kit mit Keyboard und Maus geliefert sowie ein SAN Switch 2005-B16, der für den Anschluss von Tape oder einer Disk-Erweiterungseinheit vorgesehen ist. Ein DR550-Express-System erhält man mit einer Einstiegskapazität von 1,1 Terabyte (brutto). Das System kann um vier oder acht Terabyte (brutto) erweitert werden, durch den Anschluss eines DS4700-RAID5-Systems. Ein entsprechender Einbauschrank kann optional mitbestellt werden.

Weiter mit: Das DR550-Single-Node-System

Das DR550-Single-Node-System

  • Das DR550-Single-Node-System besteht aus einem Einbauschrank, in dem eine IBM pSeries p52A, ein SAN Switch 2005-B16, ein Disk System DS4700 und optional ein oder mehrere EXP810 eingebaut und fertig konfiguriert sind. Ein Single-Node-System kann man mit einer Festplatten-Kapazität von acht oder 16 Terabyte bestellen und bis auf 112 Terabyte (brutto) ausbauen.
  • Das DR550-Dual-Node-System besteht aus den gleichen Komponenten wie das Single-Node-System, mit dem Unterschied, dass alle Komponenten redundant (doppelt) ausgelegt sind. Das heißt, in den Einbauschrank sind zwei IBM p52A und zwei SAN Switches 2005-B16 eingebaut und redundant konfiguriert. Ein Dual-Node-System kann man mit einer Festplatten-Kapazität von acht oder 16 Terabyte bestellen und bis auf 112 Terabyte (brutto) ausbauen. Es handelt sich hierbei um ein hochverfügbares System.

Die Informationen werden innerhalb der DR550 auf Festplatten gespeichert – optional auch verschlüsselt – und erlauben schnelle Zugriffzeiten. Die Performance aus Anwendersicht kann mithilfe der Multiobjekt-Transaktion noch gesteigert werden, insbesondere, wenn viele Objekte mit einem Male gelesen oder geschrieben werden. Dabei werden innerhalb einer Transaktion mehrere Objekte gespeichert oder gelesen.

Logische Trennung von Speicherbereichen

Mandantenfähigkeit lässt sich mit SSAM auch realisieren. Das erlaubt die logische Trennung von Speicherbereichen für verschiedene Klienten und auch das Reporting von benutzter Speicherkapazität. Dabei ist sichergestellt, dass ein Klient nur auf die Daten zugreifen kann, die in seiner Partition gespeichert sind.

Die Anbindung des Archivsystems IBM DR550 an die Anwendung erfolgt über das Tivoli Storage Manager for Data Retention API (Application Programming Interface). Typische Anwendungen, die Daten auf einem DR550-System zu archivieren, sind Dokumenten-Management-Systeme, wie z. B. IBM Content Manager oder Enterprise-Content-Management-Systeme, wie z. B. Opentext Lifelink Enterprise Archive Server. Das TSM API steht dem Anwender frei zur Verfügung. Alle Anwendungen, die das TSM API implementiert haben – gleichgültig auf welcher Plattform diese Anwendung betrieben wird – können Datenobjekte auf der DR550 archivieren und lesen.

File System Gateway für die DR550

Im Mai 2007 kündigte die IBM für die DR550 ein File System Gateway an. Über das DR550 Gateway kann ein Dateisystem aufgebaut werden, in dem die Daten vor dem Überschreiben geschützt sind. Das Gateway wird vorkonfiguriert ausgeliefert. Nach außen wird ein CIFS- oder NFS-Dateisystem ausgegeben. Die Gateways können „geclusteret“ werden, um eine HA-fähige (High Availability) Lösung aufzubauen. Im August 2007 stellte IBM der DR550 750-Gigabyte-SATA-Platten zur Verfügung. Mit diesen neuen großen Platten kann eine DR550 auf bis zu 168 Terabyte Kapazität ausgebaut werden.

Weiter mit: Komplettlösungspakete für die E-Mail-Archivierung

Komplettlösungspakete für die E-Mail-Archivierung

Seit August 2007 stehen mit der DR550-Komplettlösungspakete für die E-Mail-Archivierung zur Verfügung. Diese Komplettlösungen für Lotus Domino und Microsoft Exchange adressieren die Anforderungen kleinerer und mittelständischer Unternehmen. Das Lösungspaket aus einer Hand enthält aufeinander abgestimmte, skalierbare Software- und Hardware-Komponenten der IBM und kann rasch implementiert werden. Basierend auf unternehmensspezifischen Aufbewahrungs- und Zugriffsprofilen ermöglicht die Lösung eine sichere Verwaltung und Archivierung von E-Mails einschließlich Dateianhängen in deren gesamten Lebenszyklus.

Dabei wird sowohl geschäftlichen Anforderungen als auch nationalen oder internationalen Compliance-Vorschriften Rechnung getragen und ebenso den Wünschen vieler Unternehmen nach einer Optimierung des Speicherbedarfs und der Reduzierung von Administrationskosten. Das Komplettpaket zur E-Mail-Archivierung für den SMB-Bereich (Small and Medium Business) ist jederzeit zu einer umfassenden Archivierungslösung erweiterbar, die sämtliche unstrukturierten Unternehmensinformationen wie z. B. digitalisierte Korrespondenz, Office-Dokumente, Faxe, Präsentationen, Audio- und Videodateien etc. verwalten kann.

Ebenso ist eine Anbindung an SAP zur Dokumenten- und Datenarchivierung möglich. Auf diese Weise kombiniert das Komplettpaket modernste Technologie mit einem raschen ROI sowie höchster Investitions- und Zukunftssicherheit.

IBM CommonStore für Lotus Domino und Microsoft Exchange

Das Komplettpaket besteht aus der benutzerfreundlichen und leistungsfähigen E-Mail-Archivierungslösung IBM CommonStore für Lotus Domino und Microsoft Exchange sowie dem IBM Content Manager als Basis-Repository. Hinzu kommt ein IBM-System-x3650-Server mit Intel-Xeon-Quadcore-Prozessoren, der speziell für anspruchsvolle Aufgaben im Unternehmenseinsatz wie z. B. Enterprise Content Management (ECM), Virtualisierung, Enterprise Resource Planning (ERP) oder Datenbankanwendungen entwickelt wurde.

Als Speicherkomponente dient das IBM System Storage DR550, das eine leistungsfähige Funktionalität zur Ablage relevanter Dokumente gemäß gesetzlicher Aufbewahrungsfristen und -vorschriften auf magnetischen Speichermedien bietet. Die DR550 unterstützt dabei eine nicht löschbare und nicht wieder beschreibbare Datenspeicherung.

Im Februar 2008 machte IBM die DR550-Lösung als Maschine mit zwei Modellen DR1 und DR2 in der Version 4.5 verfügbar. Dies zeigt deutlich, dass IBM stark in das Information-Retention-Segment investiert. Durch die erweiterte Nutzung des System Storage Archive Managers (SSAM) für policy-basierten Information-Retention-Betrieb ermöglicht die DR550 eine transparente und automatisierte Bewegung archivierter Daten zwischen verschiedenen Speicherklassen. Dadurch können Kosten eingespart werden, ohne die Sicherheit der archivierten Daten zu gefährden. Das inzwischen preisgekrönte System ist jetzt als Maschine verfügbar.

Weiter mit: Zwei Modelle

Komplettlösungspakete für die E-Mail-Archivierung

Es stehen zwei Modelle zur Verfügung: Die DR1 besteht aus einem 25U-Einheiten großen Rack, ist vorintegriert und eignet sich besonders für mittelständische Kunden. Die DR2 wurde speziell für Großunternehmen entwickelt und ist in einem größeren 36U-Einheiten-Rack untergebracht. Die DR2 bietet Single- oder Dual-Node-Konfigurationsoptionen für höhere Verfügbarkeit und Skalierbarkeit.

Die physikalische Anbindung der DR550 an die Serversysteme erfolgt über Ethernet-Schnittstellen und basiert auf dem TCP/IP-Protokoll. Standardmäßig wird ein Ethernet Interface benutzt. Wahlweise können aber auch zwei oder mehr Ethernet Interfaces angeschlossen werden, was eine Skalierbarkeit des Datendurchsatzes erlaubt.

Das TSM API im Zusammenwirken mit SSAM bietet der Anwendung verschiedene Möglichkeiten zur Kontrolle der Aufbewahrungszeit. So kann eine Anwendung unter Benutzung der Ereignis-basierenden Aufbewahrungsregel Datenobjekte mittels Event löschen. Natürlich nur unter der Bedingung, dass die konfigurierbare Mindestaufbewahrungszeit für das Datenobjekt bereits abgelaufen ist.

Haltbarkeitsdatum für Files

Mithilfe der chronologischen Aufbewahrungsregel sorgt SSAM für die Löschung der Daten nach Ablauf einer festgelegten Aufbewahrungszeit. Die Aufbewahrungsregeln werden dabei in sogenannten Management-Klassen definiert, die Anwendung weist ein Objekt dann nur noch einer Management-Klasse zu, wodurch dem Objekt die entsprechende Aufbewahrungszeit zugeordnet wird. Mit dem zusätzlichen Löschschutz, einer weiteren Option des TSM API, kann die vordefinierte Aufbewahrungsregel für Objekte außer Kraft gesetzt werden. Damit kann verhindert werden, dass ein Objekt nach Ablauf der normalen Aufbewahrungsfrist gelöscht wird.

Die DR550 bietet auch den Anschluss anderer externer Speichertechnologien wie z. B. WORMTape oder optische Speicher. Generell wird empfohlen, dass ein externes Gerät eine Native-WORM-Funktionalität besitzt, wenn es an ein DR550-System angeschlossen wird. Der Anschluss von Bandlaufwerken an die DR550 erfolgt über das SAN. Die Anbindung von WORM Tape hat zwei entscheidende Vorteile für den Anwender:

  • Kopien der Daten können auf WORM Tape geschrieben werden und in einem anderen Brandabschnitt katastrophensicher aufbewahrt werden.
  • Wenn die Daten auf Festplatte in der DR550 „altern“ und somit die Zugriffe seltener werden, können sie auf WORM Tape ausgelagert werden. Die Tapes benötigen weniger Strom, Wartung und Austausch und sind somit viel kostengünstiger als Festplatten.

Im Herbst 2003 wurde endlich ein neuer Standard, basierend auf dem blauen Laser, auf dem Markt verfügbar. Der neue 1-x-Standard reflektierte eine 30-Gigabyte-Platte in den bisher klassischen Formaten WORM, MO und CCW. Die Firma Plasmon, die auch sehr aktiv in der Standardisierung der neuen Blaue-Laser-Technik mitwirkte, bot als erste Firma im Jahr 2004 Juke-Boxen mit den neuen optischen Platten an.

Weiter mit: OEM-Vertrag zwischen Plasmon und IBM

OEM-Vertrag zwischen Plasmon und IBM

Im Herbst 2005 kam ein OEM-Vertrag zwischen Plasmon und IBM zustande, der es IBM erlaubt, diese Juke-Boxen unter IBM-Logo zu vermarkten. Am Anfang war der Verkauf zum Anschluss an iSeries-Server beschränkt, seit Juni 2006 können die Juke-Boxen auch an pSeries-basierende Server angeschlossen werden. Mit den Modellen 32, 80 und 174 bietet die IBM 3996 Kapazitäten von 960 Giga- bis 5,2 Terabyte an.

Im August 2007 kündigte IBM für die 3996 optischen Archivsysteme die Verwendung der neuen optischen Platten mit 60 Gigabyte in den Formaten WORM, MO und CCW an. Die neue Plattengeneration reflektiert den 2-x-Standard, basierend auf der blauen Laser-Technologie. Damit skaliert die IBM 3996 auf eine Kapazität von bis zu 10,4 Terabyte. Die kapazitiven Möglichkeiten liegen also deutlich unter den Möglichkeiten einer DR550.

Es bleibt abzuwarten, ob – basierend auf der Blaue-Laser-Technik – ein klassischer optischer 4-x-Standard verabschiedet wird, da inzwischen andere Lösungsoptionen für die Langzeitarchivierung auf dem Markt etabliert sind.

Holografische Medien

Hinzu kommt noch die Tatsache, dass, ebenfalls auf Blaue-Laser-Technik basierend, der Standard der ersten holografischen Platte mit einer Kapazität von 150 Gigabyte im XY-Format im Jahr 2003 verabschiedet wurde, Anfang 2005 bereits der 2-x-Standard mit einer 500-Gigabyte-Platte und Ende 2005 ein 2-x-Standard als Zusatzstandard für die „Consumer“-Industrie in Form einer 300-Gigabyte-Platte. Holografische CDs und CD-ROMs lassen sich aufgrund der verwendeten Polymerbeschichtung (Kunststoff) wesentlich kostengünstiger produzieren als z. B. klassische DVDs oder im IT-Umfeld verwendete WORM-, MO- oder CCW-Platten.

Dieser Artikel ist ein Auszug aus dem IBM-System-Storage-Kompendium. Hier finden Sie das vollständige Kompendium in Form eines Whitepapers.

(ID:2043495)