Suchen

ATA als SAN-Protokoll für Ethernet-Netzwerke High Performance Cluster beim Human Genome Projekt nutzt Coraid-Technik

| Redakteur: Rainer Graefen

Speicherkapazität soll immer billiger zur Verfügung stehen und gleichzeitig mit höchsten Geschwindigkeiten zugreifbar sein. Die nationale Genom-Sequenzierung in Amerika benutzt dazu das Blockprotokoll AoE und das High-Performance Speichersystem Etherdrive SR2461.

Firma zum Thema

SR2461 High Performance Speichersystem von coraid mit 24 SATA-Festplatten mit je ein Terabyte Speicherkapazität und 2x 10 Gigabit Ethernet oder 1x ein GbE.
SR2461 High Performance Speichersystem von coraid mit 24 SATA-Festplatten mit je ein Terabyte Speicherkapazität und 2x 10 Gigabit Ethernet oder 1x ein GbE.
( Archiv: Vogel Business Media )

ATA over Ethernet (AoE) gehört noch nicht zu den populären Block-Protokollen wie Fibre Channel (FC), Fibre Channel over Ethernet (FCoE), SCSI, iSCSI oder SAS. Erfolgsberichte mit angesehenen Unternehmen sind dementsprechend dünn gesät.

Für den bekanntesten AoE-Protagonisten Coraid ist aktuell das National Human Genome Research Institute (NHGRI) das Vorzeigeprojekt, in dem der Speichersystem-Hersteller die Leistungsfähigekeit seines Produktes nachweisen durfte.

High Performance Cluster hilft bei Genom Sequenzierung

Das NHGRI ist weltweit bekannt geworden durch die Erforschung der menschlichen Genomsequenzen, im wesentlichen angetrieben durch Craig Venter and Francis Collins. Grundlage der schnellen Entzifferung des menschlichen Genoms, waren die Zerschlagung des Genoms in viele Teile, die sich schneller analysieren ließen und die man anschließend wieder zusammensetzte. Auf der technischen Seite half dann High Performance Computing (HPC) bei der Berechnung.

Auf Grundlage dieser Erkenntnisse ist unter anderem ein HPC-Cluster mit 60 Linux-Knoten entstanden, der mit den Etherdrive Systemen SR2461, SR1521 und SR2421 die drei primären Funktionsbereiche abdeckt: den Compute Cluster, eine Nachbearbeitung durch weitere Anwendungsprogramme und die Backup-Dienste.

Inzwischen umfasst der Gesamtspeicher mehr als 200 TByte Speicherkapazität, wobei der Speicher für den Compute Cluster über zehn Gigabit Ethernet und die beiden anderen Funktionen über Gigabit Ethernet angebunden sind.

Für Newcomer von technischem Equipment ist die wissenschaftliche Forschung immer schon ein beliebter Einstieg gewesen, da es vor allem in HPC-Projekten vor allem um Geschwindigkeit und Kosten geht. Das AoE-Protokoll liefert beides.

Spitzengeschwindigkeiten wie bei Fibre Channel

Das AoE-Protokoll kann per NAS-Gateway auch als NFS- oder CIFS-Speicher für die Datenspeicherung verwendet werden. (Archiv: Vogel Business Media)

Coraid benutzt bei seinen Etherdrive-Speichersystemen Standard-Ethernet mit ein oder zehn Gigabit pro Sekunde. Der Speicher lässt sich bis auf mehrere Petabyte Kapazitäten ausbauen und kostet nach Angaben des Herstellers weniger als 46 Euro-Cent pro Gigabyte.

Wie bei anderen Speichersystemen auch kann RAID mit den Leveln 0, 1, 5, 6 und 10 konfiguriert werden.

Da der Protokollstack von ATA over Ethernet ohne TCP/IP funktioniert, werden kontinuierliche Transfergeschwindigkeiten von mehr als 500 Megabyte pro Sekunde erreicht, die mit denen von Fibre Channel vergleichbar sind und die weit über denen von iSCSI liegen.

Bei Coraid setzt man auf diesen im Vergleich zu iSCSI und Fibre Channel einfachen Stack, da er die Speicherzugriffsstrukturen vereinfacht und durch massive Parallelisierung mehr Bandbreite bis zur einzelnen Disk bietet.

Die Skalierbarkeit auf diesem verschlankten Stack soll nach Angaben des Unternehmens für 60.000 Knoten ausreichend sein. Die Performance-Tests in VWare-Umgebungen mit ESX-Servern verweisen iSCSI nicht zuletzt deshalb auf den letzten Platz.

Was Speicherhersteller Coraid jetzt noch fehlt ist eine Success-Story, die auch in kommerziellen Umgebungen die hochverfügbare Datenhaltung nachweist. In wissenschaftlichen Cluster-Umgebungen ist dieser Aspekt häufig nachrangig.

(ID:2044496)