Mobile-Menu

Datenmanagement Ein Netz statt eines Sees für die Daten

Von lic.rer.publ. Ariane Rüdiger 5 min Lesedauer

Anbieter zum Thema

Viele Unternehmen setzen beim Datenmanagement auf zentralisierte Ansätze wie Data Lake oder Data Warehouse. Eine andere, dezentrale Herangehensweise sind Data Meshes. Diese Dateninfrastruktur verwendet der Kugellagerhersteller SKF.

Die SKF-Zentrale in Schweinfurt.(Bild:  SKF)
Die SKF-Zentrale in Schweinfurt.
(Bild: SKF)

Der richtige Umgang mit den eigenen Daten wird in Zukunft für die meisten Unternehmen erfolgsentscheidend. Denn nur, wenn Daten schnell zugänglich sind und den richtigen Bereichen jeweils die richtigen Daten im richtigen Moment zur Verfügung stehen, können sie optimal Entscheidungen unterstützen.

Beim Kugellagerhersteller SKF hat man sich anders als in vielen Firmen für ein Data Mesh entschieden. „Das ist kein Produkt, sondern eher eine organisatorische Herangehensweise“, erklärt Stefan Schleyer, Domain Principal Architect Technology Development bei SKF. Er betreute auf dem Datacenter Strategy Summit 2024 einen Workshop zum Thema und ist bei SKF für das Data Mesh zuständig.

Bildergalerie

Vielfältige Datenquellen

SKF ist ein globaler Player mit langer, traditionsreicher Geschichte. Das Unternehmen wurde 1907 gegründet und hat seinen Sitz in Schweinfurt. Im Jahr 2022 lag der Umsatz bei 8,699 Milliarden Euro. Der Kugellagerfabrikant beschäftigt um die 42.000 Mitarbeiterinnen und Mitarbeiter. SKF fertigt an 120 Standorten in 29 Ländern. Niederlassungen befinden sich in 130 Ländern.

Klar, dass es auch in einem so großen Unternehmen vielfältige Datenquellen gibt. Um sie optimal zu nutzen, erschienen SKF irgendwann die Architekturen von Data Lake und Data Warehouse nicht mehr passend.

Denn bei beiden sind die zentralen Data-Warehouse- beziehungsweise Data-Lake-Teams dafür zuständig, die Daten in die zentrale Struktur einzubringen. Und auch dafür, sie so, wie die Anwender sie brauchen, als Report wieder auf deren Tisch zu expedieren.

Was ist ein Data Mesh?

Genau das aber wollte SKF ändern. Hierfür bot sich die dezentrale Data-Mesh-Architektur an. Doch was ist ein Data Mesh im Detail?

Es gibt vier wesentliche Eigenschaften von Data Meshes: Erstens bleibt jeder Fachbereich, also die Domain, für seine eigenen Daten zuständig, weil man dort am besten weiß, was in diesen Daten steckt und wie man sie sinnvollerweise zugänglich machen sollte, damit andere etwas damit anfangen können.

Das bedeutet, dass es in der Domain ein Datenteam geben muss. Oft reichen dafür wenige Personen, die diese Aufgabe möglicherweise in einem Teil ihrer Zeit übernehmen. Nutzen kann das Datenteam theoretisch alle vom Fachbereich erzeugten Daten, seien diese nun operational oder analytisch.

Theoretisch kann also jede Form von Fachbereichsdaten in ein Datenprodukt einfließen: Datenstreams aus der Überwachung von Produktionsmaschinen genau wie klassische oder atypische Datenbanken und andere Datenquellen, seien sie nun strukturiert oder unstrukturiert.

Daten werden zum Produkt

Zweitens werden Daten wie sonstige Erzeugnisse der jeweiligen Fachbereiche als Produkt aufgefasst, das heißt: Sie müssen für andere als solches erkennbar sein und auch irgendwie konsumiert werden können. Außerdem brauchen sie Spielregeln für die Nutzung. Dazu gehören SLAs, Update-Zyklen oder ein Preis, den Nutzer des Produkts zahlen. Solche Informationen werden in einem sogenannten Data Contract zusammengefasst.

Wie ein spezielles Datenprodukt aufgebaut ist, welche Daten sich dazu eignen, sie als Produkt zu verpacken und anzubieten, muss das Datenteam des Fachbereichs sich ausdenken und auch umsetzen. Dazu gehören auch die Entwicklung und Bereitstellung geeigneter Schnittstellen, über die andere dann auf die jeweiligen Daten zugreifen und sie nutzen können. Hier ist also technische Expertise beim API-Bau nötig.

Selbstbedienungsplattform für Datenprodukte

Die dritte charakteristische Eigenschaft von Data Meshes betrifft die Bereitstellung der Datenprodukte. Meist werden die Datenprodukte in eine Selbstbedienungs-Datenplattform eingespeist, wo sie interessierte Anwender abrufen können. Die Datenplattform ersetzt gewissermaßen die ehemaligen Data-Marts und Data Lakes.

Grundbestandteile von Selbstbedienungs-Datenplattformen sind eine Storage- und Query-Engine, ein Datenkatalog mit den vorgehaltenen Datenprodukten, das Zugangsmanagement und die Überwachung der Plattform. Außerdem sollten möglichst viele Benutzungsregeln automatisiert werden, um den Aufwand fürs Admin-Team zu verringern.

Für die Datenplattform ist ein eigenständiges Datenplattform-Team zuständig, das sich mit den Fachbereichs-Datenteams abstimmen muss. Beispielsweise kann es über die interne Architektur des Selbstbedienungs-Datenmarktes oder die Benutzeroberfläche der Selbstbedienungsplattform aufgerufen werden.

Vielleicht bestimmt das zentrale Datenplattform-Team auch, ob ein Datenprodukt eines Fachbereichs den Anforderungen der zentralen Plattform genügt oder nicht. Wenn nicht, wird es wahrscheinlich Nachbesserungsanregungen geben, um das Datenprodukt doch noch in die Datenplattform zu bekommen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Gemeinsame Regeln, gemeinsames Management

Viertens geht es um gemeinsame Regeln für die Datenhandhabung, die im ganzen Unternehmen gelten und die Richtschnur sowohl für die Teams in den Fachbereichen als auch für das zentrale Team sind. Dazu gehören die Definition des Kontexts, eine Gliederung der verschiedenen Datenbestände und Fragen von Automatisierung oder Zugriffsrechten, die zentral geregelt werden müssen.

Für diese Aufgaben ist ein zentrales Governance-Team zuständig. Dort sollten alle Datenteams aus dem Unternehmen beteiligt sein. Nur so lässt sich sicherstellen, dass die generierten Regeln am Ende auch von allen akzeptiert und angewendet werden.

Zu den zentralen Aufgaben des Governance-Teams gehören also Regeln für die Interoperabilität, die Dokumentation, die Sicherheit, den Datenschutz und die Einhaltung rechtlicher oder von Branchenregeln.

Einstiegshilfe

Zwar gehört dies nicht zu den Wesensmerkmalen eines Data Mesh, doch empfiehlt es sich beim Umstieg von einer anderen Datenmanagementarchitektur auf ein Data Mesh, ein Enabling-Team einzusetzen. Es holt Mesh-Neulinge an Bord, indem es berät, Beispiele oder Best Practices publiziert und überhaupt Ansprech- und Ermutigungsparter für alle an dem Mesh-Projekt Beteiligten ist.

Pro und contra

Der wesentliche Vorteil von Data Meshes ist, dass der produktorientierte Ansatz bei der Erzeugung von Datenprodukten weit schneller funktioniert. Bei SKF arbeiten Datenteams meistens in Sprints und stellen schnell erste Prototypen von Datenprodukten bereit, die dann im Lauf der Zeit erweitert und vervollkommnet werden. Schleyer: „Oft dauert es Monate, bis ein Data Mart einen gewünschten Report oder ein Datenprodukt umsetzt. Mit der Data-Mesh-Methode ist so eine Aufgabe meistens innerhalb weniger Tage erledigt.“

Allerdings hat auch der Data-Mesh-Ansatz seine Probleme. So sind Aufbau und Betrieb keinesfalls banal und können sehr aufwändig hinsichtlich Zeit, Ressourcen und Erfahrung ausfallen. Auch der Betrieb und die Wartung von Data Meshes sind keineswegs banal. Hier gilt es, zwischen Modularität und Einfachheit abzuwägen. Funktioniert ein Data Mesh schlecht, kann das dazu führen, dass Daten fragmentiert werden und der Informationsaustausch zwischen den organisatorischen Bereichen stockt.

Es gilt also sorgfältig abzuwägen, ob ein Data Mesh wirklich das Richtige ist. Ist die Entscheidung für ein Data Mesh einmal gefallen, entscheidet die Sorgfalt bei der Umsetzung über den praktischen Erfolg dieser Datenarchitektur.

Aktuelles eBook

Alle Daten im Griff – der Weg zum passenden Data-Management

eBook Data-Management
eBook „Data-Management“
(Bild: Storage-Insider)

Daten nur zum Selbstzweck zu speichern, kann sich heute praktisch kein Unternehmen mehr leisten. Um den Überblick zu behalten und Nutzen aus den gespeicherten Daten zu ziehen, wird ein entsprechendes Datenmanagement benötigt. Unser neues eBook erläutert detailliert, worauf es dabei ankommt, welche Ansätze es gibt und wo Potenziale zur Verbesserung liegen.

Die Themen im Überblick:

  • Data-Management lokal und in der Private Cloud
  • Data-Management in der Cloud
  • Globales Data-Management

(ID:50214966)