Business-Intelligence-Lösung für performanten Zugriff auf große Datenmengen Pentaho unterstützt EMC Greenplum Hadoop Distribution
BI-Experte Pentaho unterstützt EMCs Greenplum Hadoop Distribution, eine Lösung zur parallelen Verarbeitung großer Mengen strukturierter und unstrukturierter Daten. Zusätzlich können Pentaho-Anwender den Bulk Loader Greenplum GPLoad nutzen; damit lassen sich große Datenmengen bequem und graphisch bearbeiten.
Anbieter zum Thema
Mit Greenplum HD liefert EMC eine Grundlage zur Analyse großer Mengen strukturierter und unstrukturierter Daten. Die als Software oder Appliance verfügbare Lösung nutzt ein Hadoop Distributed File System (HDFS), um performant auf Informationen zuzugreifen. BI-Experte Pentaho unterstützt die EMC-Lösung jetzt offiziell.
Getestet wurde dabei das Zusammenspiel der Produkte Pentaho Data Integration und Pentaho BI Suite Enterprise Edition mit EMC Greenplum Hadoop sowie EMC Greenplum Datenbanksoftware und Greenplum Data Warehouses.
Damit haben Anwender Zugriff auf einen kompletten Big Data Stack, zu dem Speicher und ein MapReduce-Framework gehören. Durch die Integration will Pentaho zudem die Einstiegshürden für die Nutzung von Hadoop senken.
Mit der Lösung erleichtert Pentaho Anwendern beispielsweise die Orchestrierung von Hadoop-Jobs für ETL- (Extract, Transform, Load) und BI-Workflows. Zudem können Anwender graphisch MapReduce-Jobs entwerfen und von parallelisierten Auswertungsprozessen profitieren.
Pentaho unterstützt nativ den Bulk Loader Greenplum GPLoad. Nutzer können damit massive Datenmengen mit den Greenplum-Werkzeugen verarbeiten. Auch hierbei soll ein vereinfachtes Interface helfen.
Nutzer, die die Pentaho BI Suite für EMC Greenplum Hadoop evaluieren wollen, können sich per E-Mail an EMCHadoop@pentaho.com wenden.
(ID:2051564)