Was ist ein Speichersystem / Storage-System?

Lösung zur permanenten Ablage digitaler Daten Was ist ein Speichersystem / Storage-System?

13.06.2022Von Dipl.-Ing. (FH) Stefan Luber

Ein Storage-System ist eine Speicherlösung zur nicht-flüchtigen Ablage digitaler Daten. Das System besteht aus verschiedenen Komponenten und stellt Speicherkapazität im benötigten Umfang zur Verfügung. Datenspeichersysteme skalieren von wenigen Terabyte Speicherplatz, beispielsweise bei Lösungen für den Consumerbereich, bis zu einigen Petabyte und Exabyte bei einem High-End-Speicher (HPC-Storage) für Unternehmen. Als physische Datenspeicher kommen HDD-Speicher, Disk-Arrays, All-Flash-Speicher, Hybrid-Systeme oder Tape-Lösungen zum Einsatz.

Anbieter zum Thema

DataCore Software GmbH

FAST LTA GmbH

Die wichtigsten IT-Fachbegriffe verständlich erklärt.
(Bild: © aga7ta - Fotolia)

Was macht ein Speichersystem?

Aufgabe eines Speichersystems ist es, Massenspeicher zur permanenten (nicht-flüchtigen) Ablage (Speicherung oder Archivierung) digitaler Daten bereitzustellen. Die gespeicherten Daten stehen zur weiteren Verarbeitung den IT-Systemen zur Verfügung, dienen als Datensicherung (Backup) oder zu Archivierungszwecken. Speichersysteme werden zwar auch im privaten Umfeld (Consumerumfeld) genutzt, Haupteinsatzbereich ist aber der Unternehmensbereich. Dort bilden sie die Speicherplattform eines Unternehmens und stellen Speicherkapazität im benötigten Umfang zur Verfügung.

Je nach Anforderung und Verwendung ist ein Datenspeichersystem vom Terabyte-Bereich bis in den Petabyte- und Exabyte-Bereich skalierbar. Der physische Speicherplatz lässt sich über verschiedene Hardware-Technologien mit unterschiedlichen Eigenschaften wie Festplattenspeicher, Flash-Speicher, Hybrid-Speicher oder Tape-Speicher realisieren. Die Aufgabe von Tape-Speicher ist in der Regel die langfristige Speicherung der Daten zu Archivierungs- oder Backup-Zwecken.

Je nach Art des Speichers liefert ein Storage-System Block-Storage oder File-Storage. Hinsichtlich des Zugriffs und der Anbindung an die IT-Landschaft bestehen unterschiedliche Möglichkeiten. Ein Storage-System kann direkt an einen Rechner angebunden sein (Direct Attached Storage – DAS), als Storage-Server in Form eines Network Attached Storage (NAS) Speicherplatz bereitstellen oder als Storage-Verbund in einem Speichernetzwerk (Storage Area Network – SAN) realisiert sein. Zur Verarbeitung der auf dem Speichersystem abgelegten Daten werden sie über die jeweilige I/O-Anbindung mit direkten Schnittstellen oder Netzwerkverbindungen in den flüchtigen Arbeitsspeicher eines Rechners geladen und stehen dort dem Prozessor zur Verfügung.

Im Unternehmensumfeld bestehen hohe Anforderungen an die Leistungsfähigkeit und die Verfügbarkeit eines Storage-Systems. Um die Verfügbarkeit der Daten zu erhöhen, kommen Redundanzverfahren wie die automatische Spiegelung oder das Replizieren von Daten, auch über mehrere Standorte hinweg, zum Einsatz. Technologien wie RAID (Redundant Array of Independent Disks) sorgen für die logische Organisation mehrerer Massenspeicher und verbessern abhängig vom RAID-Level die Verfügbarkeit und/oder Performance.

Aus welchen Hardware-Komponenten besteht ein Storage-System?

Storage-Systeme gibt es mit verschiedenen Speicherkapazitäten und unterschiedlichen Performancewerten. Der grundsätzliche Aufbau eines Storage-Systems, egal, ob Einstiegs- oder Enterprise-Storage-System, ist ähnlich. Unverzichtbare Hardware-Komponenten eines Storage-Systems sind:

der physische Massenspeicher,

I/O-Komponenten zur Anbindung des Massenspeichers an einen Rechner oder ein Netzwerk,

Managementkomponenten zur Verwaltung des Massenspeichers und zur Steuerung des Zugriffs (Storage-Controller).

Speichersysteme für den Consumerbereich vereinen die verschiedenen Komponenten in der Regel in einem einzigen Gerät. Sie sind beispielsweise als USB-Speicher, externe Festplatte (USB-Festplatte) oder als kleine NAS-Systeme (Network Attached Storage) realisiert. Storage-Lösungen wie ein USB-Speicher oder eine externe Festplatte (USB-Festplatte) besitzen im Vergleich zu professionellen Systemen begrenzte Leistungsfähigkeit und Skalierbarkeit.

Der Aufbau von Enterprise-Storage-Systemen ist modular. Die Hauptkomponenten wie Storage-Controller, Netzwerkschnittstellen und physische Massenspeicher setzen sich aus mehreren Teilkomponenten zusammen. Sie können in einem Gerät integriert (Storage-Server) oder über mehrere Geräte und Standorte verteilt in einem Speichernetzwerk realisiert sein.

Den eigentlichen Speicherplatz stellt der physische Massenspeicher bereit. Klassische Massenspeicher sind Festplattenspeicher (HDD-Speicher), die zu einem Festplattensystem (Disk-Array) verknüpft sind. Herkömmliche Festplattenspeicher werden mehr und mehr von schnelleren Flash-basierten Speichersystemen abgelöst. In einem All-Flash-Array (All-Flash-Speicher, All-Flash-Storage) sind die mechanischen Festplatten im Disk-Array durch nichtflüchtigen NAND-Flash in Form von SSDs oder Flash-Modulen ersetzt. Darüber hinaus gibt es Hybrid-Systeme, die die Vorteile von Festplattenspeicher und All-Flash-Storage vereinen. Weniger oft benötigte Daten werden in einem günstigen Festplattensystem gespeichert. Daten, auf die oft zugegriffen wird, hält schneller Flash-Storage mit kurzen Zugriffszeiten bereit.

Geht es um die langfristige Speicherung der Daten (Archivierung), bietet Datenspeicher in Form von Bandspeicher (Tape-Speicher) oder in Form einer Bandspeicherbibliothek (Tape-Library) geeignete Lösungen. Mit einem Bandspeicher lassen sich große Datenmengen günstig und langfristig speichern. Die Speichermedien sind als Offline-Data-Storage getrennt von den Systemen lagerbar. Für den Zugriff auf die Daten ist allerdings deutlich mehr Zeit notwendig als bei einem Festplattenspeicher oder Flash-Storage.

Skalierung eines Speichersystems bis zum HPC-Storage (High-Performance-Computing-Storage)

Das Spektrum an verfügbaren Speichersystemen ist riesig. Abhängig von den Anforderungen lassen sich die Lösungen in einem großen Umfang bis zum HPC-Storage (High-Performance-Computing-Storage) skalieren. Der Bedarf an High-End-Speicher (Hochleistungsspeicher) steigt aufgrund der immer größer werdenden Mengen zu verarbeitender Daten. Technologien wie Künstliche Intelligenz (KI), Maschinelles Lernen (ML) und Big Data treiben diese Entwicklung voran.

Ein Hochleistungsspeicher besitzt große Speicherkapazität und hat eine hohe Speicherdichte, Performance und Verfügbarkeit. Er ist in der Lage, die großen Datenmengen mit der benötigten Geschwindigkeit einer Vielzahl verarbeitender IT-Systeme bereitzustellen. HPC-Speicher erlauben eine Skalierung bis in den Petabyte- oder Exabyte-Bereich und sind mit hochperformanter I/O-Technik ausgestattet. Die datenverarbeitenden Prozessoren der Rechner werden nicht durch langsame Datenzugriffe ausgebremst. Die HPC-Speicher bieten parallele Datenzugriffe und Dateisysteme, niedrige Latenzzeiten, performante Storage-Technologien mit hoher Speicherdichte wie Flash-Speicher, schnelle Zugriffsprotokolle, hohe Transfergeschwindigkeiten, Cluster-Technik, fehlertolerantes Design und nahezu grenzenlose Skalierbarkeit.

Storage-Systeme und -Netzwerke (NAS und SAN)

Im Gegensatz zu einem Direct-Attached-Storage-System (DAS), bei dem der Massenspeicher direkt und exklusiv an einen einzelnen Host über Protokolle wie Serial Attached SCSI (SAS) oder Fibre Channel Point-to-Point (FC-P2P) angebunden ist, sind Netzwerk-Storage-Systeme über ein Netzwerk verbunden und kommunizieren über Netzwerkprotokolle mit den Host-Systemen.

Bei einem NAS (Network Attached Storage) handelt es sich um einen am bestehenden Netzwerk angeschlossenen Storage-Server, der häufig in kleinen bis mittleren Unternehmen Verwendung findet. Er stellt seine Speicherkapazität unabhängig von einem Rechner über eine Standard-IP-Netzwerkverbindung zur Verfügung. Ein NAS besteht aus einem oder mehreren Laufwerken und hat ein eigenes Betriebssystem. Das Speichersystem kommuniziert per TCP/IP, ist Multi-User-fähig, unterstützt Protokolle wie SMB (Server Message Block) für den Zugriff auf die Dateien und bietet häufig Konnektivität über das Internet.

Wesentlich flexibler und leistungsfähiger ist ein Speichernetzwerk in Form eines Storage Area Networks (SAN). Massenspeicher sind in einer dynamisch skalierbaren Storage-Plattform zusammengefasst und stehen einer Vielzahl an Servern zur Verfügung. Die Speichermedien sind über ein Netzwerk, das ausschließlich für die Übertragung der Daten der Massenspeicher vorgesehen ist, verbunden. Verschiedene Speichermedien wie Disk-Arrays oder Tape-Systeme sind performant miteinander vernetzt. Während ein NAS in der Regel File-basiert arbeitet, erfolgt der Zugriff in einem SAN häufig blockbasiert. Es kommen Übertragungsmedien und Protokolle mit hoher Performance wie Fibre Channel, Gigabit-Ethernet, iSCSI oder InfiniBand zum Einsatz.

Redundant Array of Independent Disks (RAID)

Zentrale Anforderungen an ein Storage-System sind eine gute Performance und eine hohe Verfügbarkeit der Daten. Um diese Anforderungen zu erfüllen, kommen Technologien wie RAID zum Einsatz. RAID ist das Akronym für Redundant Array of Independent Disks. In einem RAID-System sind mehrere physische Laufwerke über RAID-Controller und Software zu einem logischen Laufwerk verknüpft. Je nach RAID-Level besitzt das logische Laufwerk Eigenschaften, die von den Eigenschaften der physischen Einzellaufwerke abweichen.

So bietet ein RAID-System mit RAID-Level 1 Redundanz, indem es den Inhalt eines Laufwerks auf ein anderes Laufwerk spiegelt. In einem solchen Verbund bleibt der Ausfall einer einzelnen Festplatte ohne Folgen, da alle Daten auf der gespiegelten Festplatte weiterhin zur Verfügung stehen. Selbst der RAID-Controller lässt sich redundant ausführen und ist gegenüber Ausfall geschützt.

Mithilfe von RAID lässt sich aber auch die Performance und Lese- und Schreibgeschwindigkeit verbessern. In einem Verbund mit RAID-Level 5 sind mehrere Festplatten so miteinander gekoppelt, dass Datenblöcke über mehrere physische Festplatten verteilt gespeichert sind (Striping). Striping ermöglicht parallele Datenzugriffe und verbessert die Leistung des logischen Verbunds im Vergleich zu den Einzellaufwerken.

Die Bedeutung der Virtualisierung für Storage-Systeme

Speichervirtualisierung ist eine wichtige Basisfunktion vieler professioneller Storage-Systeme. Bei der Storage-Virtualisierung ist der logische Speicherort vom physikalischen Speicher entkoppelt. Der Zugriff auf die Daten erfolgt über Zuordnungstabellen. Das bietet den Vorteil, dass die Daten unabhängig vom tatsächlichen Speicherort immer über die gleichen Pfade erreichbar sind.

Virtualisierter Speicher kann sich über beliebige physische Speichermedien erstrecken und bietet eine hohe Flexibilität. Die Speicherkapazität ist nicht mehr durch die Kapazität der Einzellaufwerke begrenzt, sondern lässt sich dynamisch über mehrere Laufwerke zuweisen und verteilen. Die physischen Speichermedien stellen ihre Kapazität einem Speicherpool zur Verfügung, der sich per Software verwalten lässt.

Virtualisierung ist sowohl für blockbasierte als auch für dateibasierte Storage-Systeme möglich. Oft ist im Zusammenhang mit der Speichervirtualisierung auch von Unified Storage die Rede. Verschiedene Speicherarten sind miteinander kombiniert und auf einer einzigen Plattform vereint. Die Speicherplattform ermöglicht block- oder dateibasiertes Speichern der Daten und unterstützt Protokolle wie CIFS (Common Internet File System), SMB (Server Message Block) oder NFS (Network File System).

Funktionen der Storage-Systeme: Speicherplattformen für Block- und File-Storage, Backup und Archivierung

Je nach Anforderung stellen Speichersysteme unterschiedliche Arten Speicher und verschiedene Funktionalitäten bereit. Eine Storage-Plattform kann Speicher in Form von Block-Storage oder in Form von File-Storage anbieten.

Für Block-Storage ist charakteristisch, dass die Zugriffe auf die Daten blockbasiert erfolgen. Block-Storage ist häufig in SAN-Umgebungen zu finden. Um die Daten zu speichern, werden sie in Blöcke aufgeteilt, mit Adressen ausgestattet und auf einem oder mehreren Storage-Systemen abgelegt. Diese Art der Datenspeicherung bietet eine hohe Performance bei geringer Latenz und eignet sich für Daten mit einem hohen Transaktionsaufkommen.

In einem File-Storage (Dateispeicher, File-Level-Storage oder Datei-Storage) sind die Informationen in Form von Dateien gespeichert. Daten sind in einer hierarchischen Struktur, bestehend aus Verzeichnissen und Unterverzeichnissen, abgelegt. Die Verzeichnisstruktur und der Speicherort (Pfadinformationen) werden von File-Systemen (Dateisystemen) verwaltet und gespeichert. Die File-basierte Speicherung von Daten gehört zur ältesten Art der digitalen Informationsspeicherung und ist häufig bei einem Datenspeichersystem in Form eines Direct Attached Storage oder Network Attached Storage (NAS) zu finden. Zugriffsberechtigungen lassen sich komfortabel verwalten, und es besteht eine gute Kompatibilität zu vielen Rechnersystemen und Anwendungen.

Häufig werden Speichersysteme zur Datensicherung (Backup) und Archivierung von Daten eingesetzt. Für diese Funktionen spielen kurze Zugriffszeiten eine untergeordnete Rolle. In der Regel geht es darum, große Datenmengen auf günstigen Speichermedien über längere Zeit sicher aufzubewahren. Im Bereich der Langzeitspeicherung und Archivierung von Daten haben das Bandlaufwerk (Tape) und die Bandbibliothek (Tape-Library) große Bedeutung. Auf einem solchen Offline-Data-Storage lassen sich aktuell nicht benötigte Daten günstig auslagern und langfristig aufbewahren.

Die Bedeutung des Datenmanagements für Speichersysteme

Ein effektives Datenmanagement (Data Management) ist für Speichersysteme von großer Bedeutung. Unter den Begriff Datenmanagement fallen die konzeptionellen, organisatorischen und technischen Maßnahmen zur Datenerhebung, Datenspeicherung und Datenbereitstellung für eine optimale Unterstützung der Unternehmensprozesse. Wichtige Aufgabe des Datenmanagements ist die Sicherstellung der Datenqualität, der Datenkonsistenz, des Datenzugriffs, der Datenverfügbarkeit, der Datensicherheit und des Datenschutzes.

Der komplette Lebenszyklus der Daten von der Datenentstehung über die Datenerhebung bis zur Archivierung oder Löschung der Daten wird im Rahmen des Data Lifecycle Managements (DLM) betrachtet. Daten haben zur Einhaltung der Qualität bestimmte Kriterien zu erfüllen. Um den Missbrauch von personenbezogenen Daten zu verhindern, sind Datenschutzmaßnahmen vorzusehen. Datensicherung, Datenverschlüsselung und die Authentifizierung der Zugriffe schützen vor Datenverlust, Datenmanipulation und unerlaubtem Zugriff.

Das Datenmanagement hilft, die benötigten Daten schnell zu finden und auf sie zuzugreifen, gesetzliche Vorgaben und Compliance-Richtlinien einzuhalten, sensible und kritische Daten zu schützen, große Datenmengen effizient zu verwalten und Hard- und Software-Ressourcen wie Speicherplatz und Rechenleistung zu optimieren.

Da klassische Ansätze des Datenmanagements im Big-Data-Umfeld nur begrenzt anwendbar und praktikabel sind, ist ein eigenes Big-Data-Management entstanden. Es managt strukturierte und unstrukturierte Daten bis in den Peta- und Exabyte-Bereich. Rohdaten werden so erfasst, aufbereitet und gespeichert, dass sie für Big-Data-Anwendungen wie Business-Intelligence-Analysen einsetzbar sind.

(ID:48297092)