Datenintegration von SAP und Data Lake bei der badenova SAP mit Seeblick

Autor / Redakteur: Alexander Freimark* / Dr. Jürgen Ehneß

Der IT-Provider badenIT legt für den Energieversorger badenova neben der SAP-Landschaft einen Data Lake an. Entscheidend ist die Datenübertragung zwischen verschiedenen Systemen, die mit Unterstützung von Datavard realisiert wird.

Firmen zum Thema

Die badenIT hat für den Energieversorger badenova einen Data Lake und eine SAP-Landschaft angelegt.
Die badenIT hat für den Energieversorger badenova einen Data Lake und eine SAP-Landschaft angelegt.
(Bild: ArtHouse Studio - Pexel)

Data Science ist sexy – in Cambridge an der Harvard University, aber auch in Freiburg im Breisgau. Hier sitzt die badenIT, ein IT-Service-Provider und Arbeitgeber von Dr. Alexander Schätzle. Seine Aufgabe: für den Dienstleister den Bereich für Big Data und Data Services aufzubauen. „Im Kern geht es darum, unsere Datenplattform und Infrastruktur so zu modernisieren, dass sie für Analytics-Projekte der Kunden optimal geeignet ist“, berichtet Schätzle.

Richtige Data Science stellt komplexere Anforderungen an die IT

Zu den Kunden zählt auch die badenIT-Muttergesellschaft, der kommunale Energie- und Umweltdienstleister badenova. Deren IT-Ausgangssituation lässt sich schnell umschreiben: SAP – wie so oft in der Branche. Doch Data Science stellt andere Anforderungen an die IT: Externe Daten, neue Quellen und ein gewaltiges Volumen mussten flexibel integriert werden, ohne dass Kosten und Aufwand explodieren. Die Zeit drängte: „Wir haben schnell gemerkt“, erinnert sich Schätzle, „dass die Relevanz für die Umsetzung von Data Analytics in den Fachbereichen der badenova sehr hoch ist.“

Dr. Alexander Schätzle, Big Data Architect bei badenIT: „Wenn man aus Daten Mehrwerte generieren will, geht es im ersten Schritt nicht um die Sammlung großer Datenmengen, sondern schlicht um die Möglichkeit, Data Science in der Organisation überhaupt betreiben zu können.“
Dr. Alexander Schätzle, Big Data Architect bei badenIT: „Wenn man aus Daten Mehrwerte generieren will, geht es im ersten Schritt nicht um die Sammlung großer Datenmengen, sondern schlicht um die Möglichkeit, Data Science in der Organisation überhaupt betreiben zu können.“
(Bild: Britt Schilling)

Konkretes Beispiel: Eine Infrastrukturtochter des Versorgers will Informationen über ihr Netz künftig per Funk übertragen, also etwa Zählerstände und die Zustandsüberwachung. Neben der vereinfachten Abrechnung zielen die Maßnahmen auf Mehrwertservices wie Predictive Maintenance. Tausende Einzelwerte pro Funkzähler und Jahr müssen in ein System überführt werden, um sie für Analysen vorzuhalten, Aggregierungen zu bilden und die Plausibilität zu prüfen. Sie bilden dann die Informationsbasis für detaillierte Analysen im Wasser- oder Energiemanagement.

Wanted: flexible und dynamische IT-Lösung

Bei diesen Anforderungen sei zwangsläufig die Frage aufgekommen, ob alle Daten grundsätzlich in der SAP-Umgebung gespeichert werden sollten.

„Aber unter SAP sitzt bei uns jetzt mittlerweile HANA, und wir sind auf der Entwicklungs-Roadmap Richtung S/4 unterwegs“, erläutert der Datenexperte. Kein Zweifel, HANA sei eine schnelle und performante Datenbank, so Schätzle, „aber HANA ist auch teuer“.

Zudem benötige SAP IS-U im Wesentlichen nur die aggregierten Informationen, also den Monats- oder Jahresverbrauch. Gefragt ist eine Lösung, um Daten wirtschaftlich sinnvoll und technisch optimal abzuspeichern.

Allerdings war auch klar, dass es sich nicht auszahlt, Daten in einem Data Lake lediglich zu Archivierungszwecken wegzuspeichern. „Wir wollen auch nicht-relationale Daten verarbeiten können, die viel stärker eventbasiert sind“, erklärt Schätzle die Vision. Im IoT-Umfeld sind dies beispielsweise semi-strukturierte Daten von Sensoren oder Zählern sowie Geo-Informationssystemen, die auch von extern zugekauft sein können: „Diese Flexibilität war uns ebenfalls wichtig.“

Die Vision: eine „bimodale IT“, in der sich die Produktionslandschaft am Tagesgeschäft orientiert und mit hohen Betriebsanforderungen belegt ist. In Ergänzung dazu sollte eine flexiblere, dynamischere Plattform etabliert werden, auf der die badenova stärker in Richtung Data Analytics geht – anfangs als Sandbox, perspektivisch als Data Lake. So entsteht eine IT, in der sich die Anforderungen an Flexibilität, Performance, Kosten und Zukunftssicherheit nicht gegenseitig blockieren.

Mehrwert aus allen internen und externen Daten schaffen

Der neuralgische Punkt ist die Verbindung zwischen dem produktiven SAP-System und dem Daten-Pool. Schnell wurde offensichtlich: Mit einem einfachen Datenexport kommt man nicht weit. Gesucht wurde Schätzle zufolge eine generische Schnittstelle zwischen den beiden Welten, welche sich im Idealfall bidirektional nutzen lässt – und ein Expertenteam, das all das kompakt anbietet.

„Wenn man nach unseren Anforderungen und Rahmenbedingungen sucht, landet man schnell bei Datavard.“ Dass die Software-Firma aus Heidelberg die badenova bereits bei einer SAP-BW-Migration unterstützt hatte, rundete laut Schätzle die Entscheidung ab. „Dem Fachbereich war wichtig, dass sich Datavard erwiesenermaßen mit der Materie auskennt.“

Ergänzendes zum Thema
Über Datavard

Datavard ist ein Anbieter von cleveren Software-Lösungen und Consulting für SAP-Datenmanagement, S/4HANA-Transformation, Data Warehouse Modernisation, reorganisatorischer Transformation, Stilllegung von Altsystemen, Integration von SAP-Daten in Big Data sowie Managed Services. Datavard hat seinen Hauptsitz in Heidelberg und Niederlassungen in EMEA, den USA und Asien. Mehr Informationen zum Projekt und der eingesetzten Software gibt es auf www.datavard.com oder unter info@datavard.com.

Zum Einsatz kommen zwei eigens entwickelten Tools von Datavard. Mit Datavard OutBoard werden Daten aus SAP in Richtung Hadoop (Data Offload: „cut & paste“) transferiert, während Datavard Glue perspektivisch (auch) in die andere Richtung zielt (Data Transform: „copy & paste“): „Durch die Schnittstelle wird es uns möglich sein, einerseits Speicherplatz zu reduzieren und andererseits Mehrwert aus allen verfügbaren internen und externen Daten zu schaffen“, erläutert Schätzle.

Ergänzendes zum Thema
OutBoard DataTiering

OutBoard DataTiering kombiniert Offloading und Archivierung von Daten und ist die einzige Lösung auf dem Markt, die alle SAP-Systeme abbilden kann: SAP ECC, SAP S/4HANA, SAP BW, BW/4HANA, SAP CRM und sogar HANA native. Es unterstützt die SAP-Standardschnittstellen (ArchiveLink, NLS, SDA+ oder DTO) und wählt je nach Anwendungsfall die richtige aus. Datavard OutBoard unterstützt zudem verschiedene Speicherlösungen wie traditionelle Datenbanken, große Datentechnologien (HDFS, Hadoop Hive, Impala) sowie Cloud-Lösungen (S3, Redshift, Azure blob oder AzureSQL). In der Praxis lässt sich damit bis zu 50 Prozent Speicherplatz einsparen. Auf lange Sicht bremst OutBoard das Datenwachstum und verbessert die Systemleistung. Der ROI wird in der Regel nach sechs bis 18 Monaten erreicht.

Den Projektverlauf mit Absprachen und Termintreue bezeichnete Big-Data-Experte Schätzle als hervorragend: „Die Datavard-Kompetenzen beim Datenmanagement und im SAP-Bereich waren sehr hoch – wir hatten immer mit Experten zu tun, die wissen, wovon sie reden.“ Hinzu kamen eine Hands-on-Mentalität und der Wille zur Problemlösung im Projektteam, um auch bei komplexen Herausforderungen schnell und unbürokratisch zu einem befriedigenden Ergebnis für alle Seiten zu kommen. Das muss nicht immer gleich Big Data sein, bilanziert badenIT-Experte Schätzle: „Wenn man aus Daten Mehrwerte generieren will, geht es im ersten Schritt nicht nur um die Sammlung großer Datenmengen, sondern schlicht um die Möglichkeit, Data Science in der Organisation überhaupt betreiben zu können.“

Alexander Freimark
Alexander Freimark
(Bild: Christine Basler)

*Der Autor: Alexander Freimark ist freier Autor für Medien und Unternehmen. Sein inhaltlicher Fokus liegt in den Bereichen IT, Engineering und Organisation.

Das neue Storage-Kompendium zum kostenfreien Download

Die Zeiten, in denen Backups ausschließlich auf Tape angefertigt wurden, sind vorbei. Heute stellt sich die Situation bezüglich Backup-Medien und -Strategien deutlich vielfältiger dar, was auch zu Unsicherheiten führt.

Backup & Archivierung – gestern, heute und morgen

Storage-Kompendium Backup & Archivierung
Storage-Kompendium Backup & Archivierung
(Bildquelle: Storage-Insider)

Die Hauptthemen sind:
# Auf dem Weg zur passenden Backup-Strategie
# Cloud-Backup und Hybrid-Backup
# Tape – der wehrhafte Dinosaurier
# Datensicherheit und Storage: Welche gesetzlichen Vorgaben gelten?
# Langzeitarchivierung mit Objektspeicherung
# Unstrukturierte Daten ohne Backup schützen
# Erstklassige Backup- und Archivierungsstrategie


>>> Storage-Kompendium „Backup & Archivierung“ downloaden

(ID:47430697)