Das exponentielle Wachstum an strukturierten, semistrukturierten und unstrukturierten Daten erfordert neue Ansätze für das Enterprise Data Management. Mit einem Data Lakehouse können Unternehmen nicht nur ihre Kosten im Griff behalten, sondern auch effiziente Prozesse und Workflows aufsetzen, um wertvolle Informationen aus ihren Daten zu gewinnen – ganz gleich, in welcher Form diese vorliegen.
Das exponentielle Datenwachstum stellt sowieso schon gesteigerte Anforderungen an Storage-Systeme. Sollen zudem Informationen aus den Daten gewonnen werden, sind komplett neue Ansätze nötig.
Storage-Systeme spielen für das Enterprise Data Management mehrere maßgebende Rollen. Eine ihrer Schlüsselfunktionen ist es, die Abfrage und die Analyse von Daten zu erleichtern, da dies für eine fundierte Entscheidungsfindung in Enterprise-Organisationen unerlässlich ist.
Wir leben im Zeitalter des datengesteuerten Unternehmens: Big Data, KI und maschinelles Lernen erfordern es, dass Storage-Lösungen riesige Datenbestände, die schneller als je zuvor generiert werden und in einer Vielzahl von Formaten vorliegen, unterstützen. Die Bereitstellung datengestützter Erkenntnisse, Prozesse und Workflows entscheidet darüber, ob Unternehmen die Kontrolle über ihre Kosten behalten und im Wettbewerb erfolgreich bestehen können.
Obwohl sich Data Warehouses und Data Lakes in der Vergangenheit als unschätzbar wertvoll erwiesen haben, können sie heute die von den Unternehmen geforderten Funktionalitäten oftmals nicht mehr erfüllen und sind zudem zu kostenintensiv. Ein modernes Enterprise Data Management erfordert einen neuen Ansatz für die Speicherung, die Abfrage und die Analyse von Daten.
Die Grenzen von Data Warehouses
Werfen wir zunächst einen Blick auf das Data Warehouse. Aufgrund der zentralen Speicherung der Daten in relationalen Datenbanken war diese Lösung hervorragend geeignet, um die Komplexität der Data Managements zu senken und die Informationssilos in den Unternehmen aufzubrechen. Mit einem Data Warehouse können Unternehmen eine Reihe von Use Cases, einschließlich Business Intelligence und Reporting, relativ einfach umsetzen. Dies hat wesentlich zu dem großen Erfolg dieser Technologie beigetragen: Heute werden rund 37 Prozent der Unternehmensdaten in Cloud-basierten Data Warehouses und 35 Prozent in Data Warehouses On-Premises gespeichert.
Data Warehouses sind jedoch auch gewissen Beschränkungen unterworfen – in zweierlei Hinsicht. Zum einen können sie unstrukturierte Daten nicht problemlos speichern oder verarbeiten. Herkömmliche Data Warehouses sind auf strukturierte Daten ausgelegt, die in Tabellen mit Zeilen und Spalten formatiert sind. Unstrukturierte Daten, zu denen Texte, Bilder, Videos und andere Formen nicht-relationaler Daten zählen, passen nicht in diese traditionellen Zeilen- und Spaltenstrukturen. Zum anderen stellen die Kosten eine erhebliche Beschränkung dar. Vereinfacht gesagt, sind Data Warehouses in einer Welt, in der das Datenvolumen exponentiell wächst, nicht kosteneffizient. Das liegt daran, dass Data Warehouses eine strukturierte Speicherung, eine komplexe Datenverarbeitung und zusätzliche Funktionen für die Analyse und das Reporting erfordern und somit oftmals höhere Kosten verursachen.
Data Lakes sind nur eine Teillösung
Data Lakes sind entstanden, um diese Herausforderungen zu bewältigen. Sie sind speziell für die Speicherung einer Vielzahl von Datentypen konzipiert, darunter auch semistrukturierte und unstrukturierte Daten in ihrem ursprünglichen Format. Data Lakes bieten mehr Flexibilität und verursachen geringere Kosten als Data Warehouses – über die gesamte Lebensdauer hinweg betrachtet. Sie können jedoch auch Herausforderungen hinsichtlich der Data Governance und der Geschwindigkeit, die zur Gewinnung neuer Erkenntnisse erforderlich ist, mit sich bringen. Ungeachtet dessen werden die Kostenvorteile von Data Lakes zum Teil durch die Tatsache aufgehoben, dass viele Unternehmen eine hybride Lösung einsetzen, die unstrukturierte Daten in einem Data Lake und strukturierte Daten in einem Data Warehouse speichert.
Darüber hinaus setzen Data Lakes ein umfassendes Know-how und eine hohe Qualifikation der Mitarbeiter voraus. Während die Struktur von Data Warehouses es Nutzern mit relativ begrenzten IT-Kenntnissen ermöglicht, Daten mit einfachen SQL-Befehlen abfragen, sieht die Situation bei Data Lakes ganz anders aus: Nur Mitarbeiter mit fundiertem Fachwissen und unter dem Einsatz fortschrittlicher Tools und Techniken können aus einem unstrukturierten Data-Lake-Storage wertvolle Erkenntnisse für ihr Unternehmen gewinnen.
Data Lakehouses – die Evolution des Enterprise Data Managements
Diese verschiedenen Beschränkungen treiben die Entwicklung neuer Technologien für das Enterprise Data Management voran – die Entstehung von Data Lakehouses. Data Lakehouses ermöglichen es Unternehmen, die kostengünstigen und leistungsstarken Funktionen von Data-Lake-Storage mit den strukturierten Funktionen für die Datenabfrage und das Datenmanagement von Data Warehouses zu kombinieren. Data Lakehouses erreichen dies, indem sie mithilfe von Schemata und KI eine Struktur für unstrukturierte Daten schaffen. Diese semistrukturierten Daten können dann mit einfachen SQL-Anweisungen abgefragt werden.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Im Wesentlichen sieht der Ansatz den Aufbau eines großen Data Warehouse auf einem Data Lake vor, sodass Unternehmen ihre kostenintensiven Data Warehouses ein für alle Mal außer Betrieb nehmen können. Unternehmen haben das Potenzial von Data Lakehouses schnell erkannt: Aktuell nutzen circa 70 Prozent der Unternehmen ein Data Lakehouse, führen ein Pilotprojekt durch oder planen die Einführung eines Data Lakehouses innerhalb der nächsten 12 Monate.
Erste Schritte mit einem Data Lakehouse
Wie auch bei jeder anderen Technologie sind nicht alle Data Lakehouses gleich. Falls Sie diese Technologie für Ihr Unternehmen in Betracht ziehen, sollten Sie sich diese drei Schlüsselfragen stellen, um eine optimale Umsetzung zu gewährleisten:
1. Bietet das Data Lakehouse benutzerfreundliche Self-Service-SQL-Analysen? Im Idealfall können auch technisch weniger versierte Nutzer Abfragen ohne die Hilfe von IT-Experten durchführen. Das spart Zeit, senkt die Kosten und erhöht die betriebliche Agilität.
2. Basiert das Data Lakehouse auf offenen Standards? Open-Source-Lösungen ermöglichen es Unternehmen, erstklassige Processing-Engines zu nutzen und die Abhängigkeit von einem einzelnen Anbieter zu vermeiden (Vendor Lock-in).
3. Bietet die Lösung flexible Optionen für die Bereitstellung? Da keine IT-Infrastruktur der anderen gleicht, müssen Data Lakehouses sowohl auf großen Cloud-Plattformen als auch in den Data-Centern vor Ort im Unternehmen eingesetzt werden können.
Da Unternehmen Daten zunehmend als zentrale Assets erachten, die essentiell für die Förderung von Innovationen, Wettbewerbsvorteilen und betrieblicher Effizienz ist, entwickeln sich herkömmliche Modelle zur Datenspeicherung und Datenverarbeitung kontinuierlich weiter. Nur so lässt sich das enorme Wachstum an strukturierten, semistrukturierten und unstrukturierten Daten bewältigen. Dies treibt die Einführung flexibler, skalierbarer und effizienter Systeme für das Enterprise Data Management stark voran, wobei ein Data Lakehouse an der Spitze dieser Entwicklung steht. Unternehmen, die diesen Weg einschlagen und neue, innovative Technologien nutzen, können genau die Erkenntnisse gewinnen, die sie für ein erfolgreiches Wachstum benötigen.
Andreas Vogels, Head of Central Europe bei Dremio.
(Bild: Dremio)
* Der Autor: Andreas Vogels ist Head of Central Europe bei Dremio, hat mit Dremio vor vier Jahren als „First man on the Ground“ gestartet und verantwortet inzwischen die Region Zentraleuropa. Zu den namenhaften Kunden gehören u. a. Allianz Global Investors, Böhringer Ingelheim, DATEV, RWE und Software AG. Vor seinem Wechsel zu Dremio war er bereits 12 Jahre in den Bereichen Software / Analytics & Datenmanagement tätig.
Aktuelles eBook
All-Flash-Arrays mit NVMe – eine Chance für neue Use Cases
eBook „All-Flash-Arrays mit NVMe“
(Bild: Storage-Insider)
Gegenüber herkömmlichen drehenden Festplatten setzen sich zunehmend mit SSDs bestückte Flash-Systeme durch und punkten im Verbund mit NVMe vor allem durch hohe Geschwindigkeit. Wann lohnt sich der Einsatz eines All-Flash-Arrays im Unternehmen? Und welches System ist das passende? Diese und weitere Fragen beantwortet unser neues, kostenloses eBook.
Die Themen im Überblick:
Technologische Grundlagen: Was ist NVMe-Flash?
Use Cases: Wann lohnt sich ein NVMe-Array fürs Unternehmen?