Daten geschäftsfördernd einsetzen – das ist das Ziel von Unternehmen, die auf Data Analytics und damit verbundene Self-Service-Tools setzen. Doch damit alle Mitarbeitenden Daten zielführend analysieren können, müssen diese sinnvoll aufbereitet, am passenden Ort gespeichert und für die jeweiligen Anwender leicht zugänglich sein.
„Je mehr Anwendungsfälle auf Basis von Daten im operativen Geschäft umgesetzt werden sollen, desto stärker zeigen sich die Schwächen rein zentraler Ansätze wie dem Data Warehouse und dem Data Lake. Sie sind nur begrenzt skalierbar und sorgen für organisatorische Bottlenecks“, heißt es bei PWC. Die Alernative ist eine vermaschte Datenarchitektur.
Dass aber Daten sinnvoll bearbeitet und passend gespeichert werden, ist allerdings nur in 8 Prozent der Unternehmen der Fall, so eine aktuelle PwC-Studie. Ein Datenarchitekturansatz wie Data Mesh liefert dafür die passende Infrastruktur und trägt maßgeblich zur Datendemokratisierung bei.
Die moderne Datenlandschaft: Speicherung, Verwaltung, Analyse ...
Zur Dateninfrastruktur in Unternehmen gehören üblicherweise Tools für die Speicherung, Verwaltung und Analyse von Daten. Für ersteres nutzen Organisationen klassischerweise Datenbanken, in denen sie ihre operativen und analytischen Daten in roher Form speichern. Bei der Verwaltung und Aufbereitung der gespeicherten Daten kommen größere Repositorys wie Data Warehouses und Data Lakes zum Einsatz, die Daten aus mehreren Quellen wie verschiedenen Datenbanken konsolidieren. Spezielle Analytics-Tools ermöglichen die Recherche und Auswertung von Daten, um daraus Erkenntnisse zu ziehen und entsprechende Entscheidungen zu treffen.
Data Warehouses und Data Lakes unterscheiden sich vor allem in der Funktionalität. Data Lakes zeichnen sich durch eine hohe Flexibilität aus und dienen der Datensicherung sowie fortgeschrittenen Analysen. In ihnen „schwimmen“ sowohl strukturierte als auch unstrukturierte Daten. Dadurch eigenen sie sich perfekt für Big-Data-Analysen, Machine Learning und explorative Analysen.
Ein Teil der Daten wird wiederum aufbereitet und strukturiert in Data Warehouses transferiert. Diese bieten durch die Eigenschaft eines Warenlagers eine leicht zugängliche Verwaltung konsolidierter Daten, die vor allem im Kontext datenbasierter Entscheidungen zum Tragen kommen. Nutzer können auf diese Daten über Business-Intelligence- (BI-) und Data-Science-Anwendungen einfach zugreifen.
... und Data Lakehouses
Unternehmen, die die Funktionalitäten sowohl von Data Lakes als auch von Data Warehouses benötigen, können auch eine Kombination aus beiden verwenden, so genannte Data Lakehouses. Dort können sie sowohl strukturierte als auch unstrukturierte Daten speichern, verwalten und bedarfsgerechte Analysen durchführen.
Welches Repository für ein Unternehmen das richtige ist, hängt auch damit zusammen, welche Art von Analysen durchgeführt werden sollen. Grundsätzlich sollte aber die Datenanalyse nicht als Ebene über den Verwaltungssystemen liegen, sondern im Optimalfall in diese integriert sein und von vorneherein mitgedacht werden. Analytics-Datenbanken als Basis erlauben beispielsweise die direkte Verknüpfung mit Analyse- und BI-Tools, die es ermöglichen, die gespeicherten Daten auszuwerten.
Unternehmen arbeiten in der Regel mit einer Vielzahl an verschiedenen, verteilten Systemen, wodurch sich die Datenlandschaft sehr komplex und umfangreich gestaltet. Hinzu kommt, dass all diese Systeme nicht nur auf eine Vielfalt an Quellen, sondern außerdem sowohl auf Cloud- als auch On-Premises-Umgebungen zugreifen. Dadurch entstehen Datensilos, und die Governance über die Systeme ist erschwert.
Das Zusammenführen verteilter Daten
Damit die verschiedenen Systeme zusammengeführt, einheitlich und zugänglich werden, bedarf es einer ausgeklügelten Datenarchitektur, die definiert, wie alle Daten des Unternehmens erfasst, gespeichert, verwaltet und verwendet werden. Bei der Entscheidung für die richtige Datenarchitektur haben Unternehmen je nach Bedarf die Wahl zwischen einem zentralen Ansatz wie Data Fabric oder einem dezentralen Ansatz wie Data Mesh.
Was ist der Unterschied? Data Fabric verbindet zentral Daten aus allen Umgebungen und fungiert als Zugriffspunkt. Das „Datengewebe“ identifiziert dabei auch Relationen zwischen den zahlreichen Quellen und Datenpunkten und automatisiert wiederkehrende Aufgaben. Durch diese übergreifende Funktion können Unternehmen den Wert ihrer Daten vergrößern.
Doch Data Fabric hat einen großen Nachteil: Durch den zentralen Ansatz befinden sich die Daten nicht unbedingt bei den tatsächlichen Nutzern, sondern liegen weiterhin in einem Silo bei wenigen Datenspezialisten. Eine Regelung, die im Widerspruch zu den Entwicklungen in den letzten Jahren steht: Die Anzahl der Anwender hat sich durch die fortschreitende Datendemokratisierung deutlich vergrößert, und mittlerweile benötigen auch Mitarbeitende ohne entsprechenden Background Zugang zu Daten.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Data Mesh: ein soziotechnischer Ansatz
Data Mesh will diesen Anwendern die Hoheit über ihre eigenen Daten zurückgeben. Die Erfinderin Zhamak Dehghani erklärt den Kern ihres Ansatzes wie folgt: „Dieser neue Weg führt uns weg von der Zentralisierung von Daten und deren Ownership hin zu einem dezentralen Modell.“
Wie das in der Praxis aussieht, definiert sie in vier Prinzipien:
1. Domain Ownership/Datendomänen: Um dezentrale Ownership zu erreichen, etabliert der Data-Mesh-Ansatz Datendomänen innerhalb des Unternehmens, die die Verantwortung über ihre eigenen Daten übernehmen. Diese korrespondieren häufig mit bestehenden Abteilungen. Jede Domäne verfügt mindestens über einen dedizierten Spezialisten, der die Daten der gesamten Domäne verwaltet. Die Einführung der dezentralen Domain Ownership vereinfacht die Skalierung, schafft Agilität und verbessert die Datenqualität durch das Zusammenrücken von Datenherkunft und -nutzung.
2. Data-as-Product: In einer Data-Mesh-Architektur sind Daten als Produkte klassifiziert, so genannte „Datenprodukte“. Jedes Datenprodukt sollte auffindbar, adressierbar, verständlich, vertrauenswürdig, nativ zugreifbar, interoperabel, eigenständig wertvoll und sicher sein. In der Praxis bedeutet das, es besteht aus mindestens folgenden Komponenten: den Daten an sich, Metadaten, einer klaren Zuordnung in Form eines Codes und darauf bezogenen Richtlinien. Die Klassifizierung als Produkt bedeutet auch, es gibt einen „Kunden“, in diesem Fall die Datennutzer. Die Datenteams innerhalb der einzelnen Domäne stellen diesen die passgenauen Datenprodukte zur Verfügung und bauen so Silos ab.
3. Self-Service-Data-Plattform: Mitarbeitende erhalten durch die dezentrale Verteilung in den Domänen einfachen Zugang zu ihren eigenen Datenprodukten. Die Datenspezialisten der einzelnen Domänen-Teams stellen über eine Self-Service-Data-Plattform die passenden Datenprodukte zur Verfügung und verwalten den gesamten Lebenszyklus der Datenprodukte. Die Self-Service-Plattform fungiert als Schnittstelle für das gesamte Unternehmen und reduziert die allgemeine Komplexität des Datenmanagements.
4. Federated Computational Governance: Der Data-Mesh-Ansatz gibt einer großen Gruppe an Mitarbeitenden die Macht über ihre Daten. Das geht einher mit Verantwortung und Entscheidungsgewalt. Wenn es um die Themen Sicherheit und Compliance geht, ist eine zentrale Steuerung unumgänglich. Damit die Domänen- und Plattformteams dabei interoperabel bleiben und ihre Autonomie und Agilität aufrechterhalten, setzt die Data-Mesh-Struktur auf eine föderale Lösung. Diese definiert (automatisiert) übergreifende Governance-Anforderungen für alle Datenprodukte, erlaubt aber auch lokale Richtlinien.
Die optimale Datenlandschaft sieht in jedem Unternehmen anders aus. Der strategische Aufbau und das Zusammenführen der einzelnen Puzzleteile lohnt sich langfristig, um ein datengesteuertes Geschäftsmodell zu etablieren und echten Wert aus den eigenen Daten zu schöpfen. Data Mesh stellt als Architektur der nächsten Generation einen innovativen soziotechnischen Ansatz dar, der Unternehmen auf die nächste Stufe der Digitalisierung heben kann.
*Der Autor Mathias Golombek ist seit Januar 2014 Mitglied des Vorstands der Exasol AG. In seiner Rolle als Chief Technology Officer verantwortet er alle technischen Bereiche des Unternehmens, von Entwicklung, Produkt Management über Betrieb und Support bis hin zum fachlichen Consulting.