Definition Storage

Was ist Storage?

| Autor / Redakteur: Walter Schadhauser / Rainer Graefen

Faszinierend: Die Daten wachsen durch die Digitalisierung mit zunehmender Beschleunigung und weil fast jeder vieles gerne noch einmal für sich alleine hätte.
Faszinierend: Die Daten wachsen durch die Digitalisierung mit zunehmender Beschleunigung und weil fast jeder vieles gerne noch einmal für sich alleine hätte. (Bild: Rainer Graefen)

Die kurze Antwort heißt: Speicherung von Daten. Für die längere Antwort sollte man antizipieren, dass viele Jahre vor unserer Zeitrechnung die Informationen in Stein gemeißelt wurden. Diese „Daten“ existieren noch heute. Wer dasselbe von einem modernen Speichermedium erwarten würde, wäre sehr schnell sehr enttäuscht.

Schon aus diesem kurzen Vorspann kann man einiges über die Aufgabe von Storage, der Aufbewahrung von Informationen ableiten. Der ins deutsche transferierte Begriff Speichertechnik weist eigentlich genauer darauf hin, dass diverse Ingenieurswissenschaften notwendig sind, um dem eigentlichen Thema Ideen- und Erkenntnisweitergabe gerecht zu werden.

Zu viele Daten nerven - noch

Aus der Gegenwart heraus betrachtet, ist sicherlich erfreulich, dass Informationen Jahrtausende überdauern können und wir einiges über unsere Vorfahren erfahren und manchmal auch lernen können. In der Gegenwart selbst zeigt sich allerdings ein modernes Phänomen: technisch induzierte Geschwätzigkeit.

Soll heißen, mit moderner Technik kann heute ziemlich jede Lebensäußerung aufgezeichnet werden, die eine sehr mitteilsame Menschheit so von sich gibt. Mit der Flut ihrer individuellen Erkenntnisse über sich und die Welt wird eine Datenmenge produziert, die im Jahr 2031 in Yottabyte gemessen werden muss (Im Jahr 2025 sollen es nach derzeitigen Prognosen 163 Zettabytes sein). Ob diese Maßzahl gleich als Maßstab des menschlichen Wissens betrachtet werden sollte, sei einmal dahingestellt.

Noch erschrecken viele Menschen, ob dieser Datenflut, die allerdings erst den Anfang eines informationsgetriebenen, rundum digitalisierten Lebens kennzeichnen. Ob man alles und jedes aufheben sollte oder nur das Wichtige, werden nachfolgende Generationen besser entscheiden können – oder eine globale Katastrophe durch z. B einen Meteor löst das Problem, so dass wir uns heute freuen, wenn wir von Dinosauriern Skelette oder Fußspuren finden.

Aber selbst diese Reste haben viele Erkenntnisse über die Vielfältigkeit des Lebens nach sich gezogen. Und schaut man Archäologen oder Historikern über die Schulter, so freuen sich diese über Schutthaufen von Tonscherben, in denen damals Gebrauchsgüter aufgehoben wurden, oder über Bücher, in denen aufgelistet wird, was früher so zum Essen auf den Tisch kam. Nachfolgende Generationen werden also noch viel Spaß mit unseren Hinterlassenschaften und Erkenntnissen haben.

Die Dimensionen der Speichertechnik

Informationen, die nicht aufzufinden sind, sind so gut wie gelöscht. Nichtsdestotrotz ändert das nichts daran, dass sie da sind. Eine erste Dimension von Storage/Speichertechnik besteht also darin, Informationen dauerhaltbar zu machen. Ein wichtiger Stein in der Menschheitsgeschichte, der Rosetta Stone, zeigt jedoch, dass die Dauerhaltbarkeit eine generelle Verfügbarkeit der Rosetta-Stone-Informationen ohne Gabelstapler und andere Schwerlast-Transportmittel extrem erschwert.

Die eingemeißelten Schriftzüge dann vom Speichermedium Stein auf das Speichermedium Papier zu übertragen, hat die Verbreitung der Information wesentlich vereinfacht. Generell betrachtet, sorgt die zweite Dimension der Speichertechnik, die Verfügbarkeit von Informationen herzustellen, dafür, Informationen masselos zu machen. Die Digitalisierung von Informationen hat hier ganze Arbeit geleistet und die Information weitgehend von ihrem Trägermedium gelöst. Dies ist aber nur für die kleine Zeitspanne der Zurverfügungstellung gültig, also während des Transports. Am Anfang und Ende des Transportweges muss sich die Information manifestieren und benötigt dazu ein Trägermedium in Form eines Displays oder einer Speicherzelle.

Eine dritte Dimension von Storage ist die Zugriffszeit. Waren es vor 20 Jahren noch Sekunden, so hat die Zugriffszeit durch moderne Halbleiterspeicher eine Dimension bekommen, die in Nanosekunden gemessen wird.

Doch eine weitere Dimension, die vierte, fehlt noch. Einzigartige Informationen, Originale, sind zwar von Sammlern hoch begehrt, doch die Einzigartigkeit ist eine Gefahr für jedes Datum. Ein kleiner Fehler, eine Katastrophe, kann dieses Original zerstören. Auch hier hat die Digitalisierung mit Kopien dafür gesorgt, dass Original und Kopie kaum noch auseinanderzuhalten sind. Diese Redundanz ist unverzichtbar für den Vergleich von Original und Kopie, um die Eindeutigkeit einer Information sicherzustellen.

Wirtschaftlichkeit, die 5. Dimension

Die Hauptschlagwörter der Speichertechnik, die jedes Hersteller-Marketing für sich beansprucht, sind dementsprechend: Availability, Reliability, Scalability, Performance, Fault Tolerant (Verfügbarkeit, Zuverlässigkeit, Skalierbarkeit, Leistung, Fehlertoleranz). Zusammen mit den Kosten eröffnet sich hier ein immenses Spielfeld für das Marketing und die angewandte Wissenschaft.

Nicht nur für Anwender sind die technischen Begrifflichkeiten schwer zu verstehen. Availability zum Beispiel wird bei Einsatz eines RAID-Systems gerne gleichgesetzt damit, dass der Ausfall einer Festplatte keinen Einfluss auf den Datenzugriff hat. Generell stimmt das, in der Praxis stellt sich allerdings heraus, dass die Performance des Datenzugriffs mehr oder weniger stark betroffen ist. Um so länger, je intensiver das RAID-System Energie auf die Wiederherstellung des Ausgangszustandes verwendet und je mehr Kapazität die Festplatten besitzen. Da kann man dann nur hoffen, dass die Speicherlösung auch in dieser Notlage "reliable" arbeitet und nicht durch die außerplanmäßige Belastung eines Rebuild einen Shutdown erleidet.

Was des einen Mangel, ist des anderen Stärke. Zum Beispiel Flash: Die anfangs hohe Performance, leidet mit zunehmender Benutzung des schnellen Speichers. Der Grund liegt in der Blockstruktur des Speichermediums. Wird der Speicherplatz knapp, müssten manchmal nur einzelne Daten gelöscht werden, um Platz zu schaffen. Doch jeder Löschvorgang wird auf zigtausende von Datenzellen angewandt. Das kostet Zeit und zieht die Performance nach unten. Ein eigener Prozessor, der sich um die Garbage Collection, also das Aufräumen, kümmert, kann hier vieles verbessern.

Ein anderes Beispiel ist RAID, das Redundant Array of inexpensive / independent Disks. RAID sorgt dafür, dass trotz des Defekts an einer Festplatte, die anderen Festplatten im Array noch alle Daten zur Verfügung stellen können. Doch mit zunehmender Skalierung der Festplattenkapazität dauert die Reorganisation eines Arrays nach einem Festplatten-Crash übermäßig lange, so dass ein weiterer Komponentenverlust nun den Zugriff auf alle Daten in diesem Array verunmöglicht. Erasure Coding und die globale Verteilung der Daten könnten diesen Ereignis verhindern.

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44620363 / Speichersysteme)