Die Lage-Einschätzung der zukünftigen Big-Data-Plattform könnte unterschiedlicher nicht sein

Welcher Storage-Anbieter setzt bei HDFS auf den richtigen Elefanten-Treiber?

Seite: 2/2

Firmen zum Thema

Alternativ zu HDFS auf DAS besteht auch die Möglichkeit, das Dateisystem auf einem Storage Area Network (SAN) zu installieren. Dann sind die Festplatten logische Volumes in Storage Arrays, auf die aus dem gesamten SAN zugegriffen wird.

HDFS bemerkt bei dieser Methode keinen Unterschied, aber die SAN Arrays haben jeder einen eigenen Cache, Redundanz und Replikation. Die Zuverlässigkeit ist also höher als bei DAS und es nicht nötig, immer drei Kopien anzulegen. Dafür wächst bei HDFS auf SAN die Komplexität. Auch die Kostenseite spricht häufig gegen die SAN-Lösung.

Bildergalerie

Das kleinste gemeinsame Nenner ist bei HDFS noch nicht gefunden

Apache Hadoop gibt es in drei Distributionsvarianten, von

ein Unternehmen, das von HDFS nicht allzu viel hält und auf seine eigene Lösung setzt.

HP hat für diese drei Distributionen eine Reihe von Referenzarchitekturen entwickelt.

Außerdem ist die Analyseplattform HP Vertica komplementär zu Hadoop. Ende Juli 2014 hat HP beschlossen, dieses Riesenunterfangen einzugrenzen und die Zusammenarbeit mit Hortonworks mit 50 Millionen Dollar befördert, so dass hier wohl bald eine engere Zusammenarbeit zwischen beiden Anbietern zu erwarten ist.

EMC integriert Hadoop und setzt mit Smart-Flash auf HDFS auf

Aktuell hat EMC angekündigt, dass die Isilon-Lösungen die gleichzeitige Ausführung mehrerer Instanzen von Apache Hadoop-Distributionen verschiedener Anbieter und außerdem mehrere Versionen von HDFS unterstützen.

HDFS ist in Isilon nativ integriert, so dass der Anwender keine zusätzliche Hadoop-Infrastruktur bereitstellen muss. EMC hat darüber hinaus vor, eine Smart-Flash-Plattform herauszubringen, die auf HDFS aufsetzt. EMC ist damit der einzige größere Storage-Anbieter, der schon auf der Hardware-Seite HDFS implementiert.

Plattformvielfalt

Netapp verlässt sich auf die Partnerschaft mit Cloudera. Beide Anbieter haben die Netapp Open Solution for Hadoop (NOSH) entwickelt, die HDFS-Metadaten integriert.

IBM hat mit InfoSphere BigInsights eine Plattform auf der Basis von Hadoop entwickelt mit HDFS als wesentlichen Bestandteil.

Und Hitachi Data Systems bietet eine Referenzarchitektur für die Cloudera Distribution und die Hitachi Compute Rack 220S Server an.

(ID:42847966)