Suchen

Apache Software Foundation veröffentlicht nach sieben Jahren stabile HBase Version 1.0 Hadoops HBase wird noch schneller und vor allem robust

| Autor / Redakteur: Dipl. -Ing. Thomas Drilling / Rainer Graefen

Die Hadoop-Erweiterung Hbase, eine Datenbank zur Verwaltung der im Hadoop-Cluster anfallenden Datenmengen, ist sieben Jahre nach dem Projektstart in einer offiziellen, stabilen Version 1.0 erschienen. Zeitgleich haben die Entwickler auch die auf Hbase basierende SQL-Datenbank Apache Phoenix auf Version 4.3 aktualisiert.

Firmen zum Thema

Apache HBase nach sieben Jahren in Version 1.0 erschienen
Apache HBase nach sieben Jahren in Version 1.0 erschienen
(Bild: Apache Software Foundation)

HBase ist eine Erweiterung für Hadoop und stellt eine skalierbare Datenbank zum Verwalten der sehr großen Datenmengen von Hadoop-Clustern zur Verfügung. Im Kern beruht HBase auf einer freien Implementation von Google BigTable. Google BigTable wird vom Internetkonzern seit 2004 entwickelt und ist Grundlage vieler Google-Produkte, darunter MapReduce, Google Maps, YouTube oder Google Earth.

Google BigTable und auch HBase sind mit Ihrer nicht-relationalen Struktur speziell für in großen Computer-Clustern anfallende, riesige Datenmengen optimiert, besonders wenn diese häufig erweitert, aber selten strukturell verändert werden. Daher sind Google BigTable und auch Apache HBase extrem skalierbar und performant.

DIE Hadoop-Datenbank

HBase gilt allgemein als DIE Datenbank des Hadoop-Projektes, kommt primär in Clustern zum Einsatz und kann Tabellen mit Milliarden Zeilen und Millionen Spalten verwalten. HBase ist allerdings nicht dazu gedacht und optimiert, einzelne Datensätze zu finden, sondern Operationen so effizient und schnell wie möglich auf sämtliche Datensätze der Struktur anzuwenden. Laut HBase-Projektseite setzen hunderte von Unternehmen die Datenbank ein, insbesondere wenn es um das Bereitstellen von Internet-Diensten geht, die sehr viele Teilnehmer haben.

Das Datenmodell von HBase
Das Datenmodell von HBase
(Bild: Apache Software Foundation)

Schneller, stabiler und benutzerfreundlicher

Dass nach sieben Jahren Entwicklungszeit eine Version 1.0 erscheint, signalisiert vor allem die inzwischen nach Ansicht der Entwickler erreichte Stabilität. Zu den Neuerungen gehört auch, dass HBase 1.0 im Vergleich zur Version 0.98 noch etwas performanter geworden sein soll.

Ferner haben die Entwickler die vorhandenen APIs erweitert und teilweise neu organisiert. Darüber hinaus muss bei Änderungen an der Konfiguration jetzt nur noch ein Teil der Server-Konfiguration neu geladen werden. Darüber hinaus unterstützt HBase 1.0 jetzt timeline-konsistente Region-Replikationen, was das Garantieren einer extrem hohe Leseverfügbarkeit erlaubt.

Die Entwickler haben auch die Oberfläche neu überarbeitet, sodass diese jetzt besser benutzbar sein soll. Auch die Dokumentation ist überarbeitet worden.

Weitere Details, auch zur Zukunft von HBase, finden sich in einem Blogeintrag von Release-Manager Enis Söztutar, einschließlich einer Foliensammlung zur neuen Version. HBase 1.0 ist unter der Apache-Lizenz 2.0 lizenziert und steht ab sofort zum Download zur Verfügung.

Hadoop-SQL mit Phoenix 4.3

Zeitgleich mit HBase 1.0 ist auch die auf HBase basierende SQL-Datenbank Apache Phoenix in einer neuen Version 4.3 erschienen. Phoenix setzt als relationaler Datenbank-Layer direkt auf HBase auf und lässt sich einfach als JDBC-Treiber in Anwendungen einbetten. Trotzdem soll die Geschwindigkeit mit herkömmlichen SQL-Datenbanken konkurrieren können. Phoenix übersetzt quasi SQL-Statements in HBase-Scans.

Zu den Neuerungen in Phoenix 4.3 gehören die Unterstützung für funktionale Indexe, MapReduce über Phoenix-Tabellen, Cross-Joins und für das ISO-8601-Datumsformat. Ferner beherrscht Phoenix 4.3 Abfrage-Timeouts, ein manuelles Optimieren von Abfrage-Optimierungen und die Funktion RAND. Auch Phoenix 4.3 steht ab sofort zum Download zur Verfügung.

(ID:43239463)

Über den Autor

Dipl. -Ing. Thomas Drilling

Dipl. -Ing. Thomas Drilling

IT-Consultant, Trainer, Freier Journalist