Mobile-Menu

Erfolgreich durch optimierte Data-Governance-Strategie Datenverwaltung neu gedacht: wie transformative KI-Resultate gelingen

Ein Gastbeitrag von Cody David* 4 min Lesedauer

Anbieter zum Thema

Anhaltende geschäftliche Herausforderungen können Entscheidungsträgern rasch über den Kopf wachsen. Vor diesem Hintergrund scheint es nicht verwunderlich, dass Branchenführer auf der Suche nach innovativen Lösungsansätzen vermehrt auf Künstliche Intelligenz setzen.

Jede KI kann nur so gut sein wie die Daten, mit denen sie trainiert wurde. Deshalb müssen Daten entsprechend bereinigt, überprüft und organisiert werden.(Bild:  Dall-E / KI-generiert)
Jede KI kann nur so gut sein wie die Daten, mit denen sie trainiert wurde. Deshalb müssen Daten entsprechend bereinigt, überprüft und organisiert werden.
(Bild: Dall-E / KI-generiert)

Das Capgemini Research Institute zeigt in seiner zweiten Ausgabe einer Studie zum Wert generativer KI und deren Anwendungsfällen auf, dass sich der Einsatz in Unternehmen von 2023 auf 2024 vervierfacht hat. Ein Großteil der befragten Unternehmen gibt dabei an, dass sich mithilfe generativer KI Umsatz und Innovationskraft steigern lassen (international: 74 Prozent der Unternehmen, in Deutschland: 66 Prozent).

Die Nachfrage nach GenAI ist enorm. Gleiches gilt für die Verbreitung von KI-Tools. Vor diesem Hintergrund ist es dringend erforderlich, sich der Herausforderung mangelhafter Unternehmensdaten zu stellen. Denn herausragende KI-Ergebnisse beginnen mit der Implementierung von Data-Governance. Nachfolgend zeigen wir auf, weshalb das so ist.

Die Zukunft der Data-Governance im Kontext von KI

Jede KI im Unternehmensbereich und jedes große Sprachmodell (LLM) können letztlich nur so gut sein wie die Daten, mit denen sie trainiert wurden. Richtlinien zur Datenverwaltung geben Einblick in bewährte Praktiken mit Blick auf das Sammeln, Speichern und Verwalten umfangreicher Datenmengen innerhalb von Organisationen.

Daten die nicht bereinigt, überprüft und organisiert wurden, können die Qualität von KI-Resultaten und Geschäftsergebnissen auf vielfache Weise beeinträchtigen:

  • ungenaue oder voreingenommene Ergebnisse,
  • widersprüchliche Erkenntnisse und unzuverlässige Vorhersagen,
  • Compliance-Probleme durch Verweise auf klassifizierte oder eingeschränkte Daten,
  • geringeres Vertrauen in Geschäftsentscheidungen,
  • Erosion des Vertrauens bei internen Nutzern sowie externen Kunden/Partnern,
  • verminderte Produktivität und Effizienz,
  • ungenaue Risikobewertung, Risikoidentifikation und Risikominderung.

Selbst kleinere Diskrepanzen können sich hierbei zum Problem auswachsen, wenn GenAI mit eigenen Ergebnissen trainiert wird – denn dadurch werden Fehler und Verzerrungen letztlich nur verstärkt. Es ist deshalb von entscheidender Bedeutung, sich darauf zu konzentrieren, mit KI korrekt zu arbeiten.

Hier bietet Data-Governance hilfreiche Strukturen (und nicht etwa Einschränkungen). Sachgemäß bereinigte, strukturierte Datensätze schaffen eine faire, unbeeinflusste Grundlage für ein individuelles KI-Modell. Selbst einfache Schritte wie etwa die Standardisierung von Dateiformaten, Benennungskonventionen sowie Definitionen können Diskrepanzen verhindern und die Genauigkeit von KI-Resultaten verbessern.

Vor diesem Hintergrund kann nicht genug betont werden, dass es ratsam ist, umfassende Richtlinien zur Data-Governance zu etablieren, bevor ein Unternehmen GenAI in seine Geschäftsabläufe integriert.

Drei erste Schritte für eine intelligentere KI von morgen

Das Fundament für ein GenAI-Projekt zu legen, ist entscheidend, um präzise, zuverlässige Ergebnisse zu erhalten und um Erkenntnisse zu gewinnen, die Teams in die Lage versetzen, entschlossen und mit Zuversicht auf geschäftliche Herausforderungen zu reagieren. Mit diesem Framework wird die Datenbasis nachhaltig gestärkt:

1. Definition von Datenbesitz und Verantwortung

Datenverwaltung ist mehr als die Summe von Regeln und Standards; sie umfasst auch die Organisation von Arbeitsabläufen, die ein Gleichgewicht zwischen Geschwindigkeit und Sicherheit herstellen. Datenverantwortliche müssen die Bedeutung ordnungsgemäß organisierter und gesicherter Daten unterstreichen.

Teams sollten wissen, für welche Datensätze sie jeweils verantwortlich sind, wie sie deren Qualität aufrechterhalten, und auch, wie sie auf weitere Datensätze zugreifen können, die sie für ihre Arbeit benötigen.

2. Strenge Standards in den Bereichen Datenschutz und Compliance

Daten unterliegen je nach Branche und Standort unterschiedlichen Vorschriften. Die Einhaltung dieser jeweiligen Standards ist von entscheidender Bedeutung mit Blick auf Vertrauen, Datenschutz sowie Sicherheit. Teams sollten im Detail mit Richtlinien und Vorschriften vertraut gemacht werden, die den Datenzugriff sowie die Datenspeicherung regeln. Ferner sollte die Einhaltung dieser Vorschriften zu allen Zeiten sichergestellt werden.

Durch interne Rechtsberater und Experten (einschließlich eines Chief Privacy Officers) kann der gewünschte KI-Erfolg erzielt werden, ohne dabei Sicherheit, Vertrauen oder Compliance zu gefährden.

3. Regelmäßige Datenprüfungen und Datenaktualisierungen

Sobald die Daten bereinigt und umstrukturiert wurden, sollten sie durch regelmäßige Prüfungen und Audits in optimalem Zustand gehalten werden. Diese Prüfungen könnten folgende Schritte umfassen:

  • Entfernen irrelevanter oder veralteter Datensätze,
  • Überprüfen der Genauigkeit und Konsistenz zwischen Datenbanken,
  • automatisierte Prozesse zur Identifizierung von Duplikaten oder beschädigten Datensätzen.

Konstante Maßnahmen im Bereich des Datenmanagements verhindern, dass kleinere Probleme sich zu echten Krisen entwickeln können. Ferner wird es so verunmöglicht, dass systemische Datenprobleme den Fortschritt in einem Unternehmen schleichend behindern.

Kontrolle der Datenqualität

Die Priorisierung von Daten führt zu langfristig positiven Effekten, die jede Organisation weit über die eigentlichen KI-Initiativen hinaus voranbringen. Minderwertige Daten zu zentralisieren, ohne die zugrunde liegenden Probleme zu beheben, bedeutet im Umkehrschluss, alle Datenfehler und Diskrepanzen an einem Ort zu konsolidieren. Daraus resultiert ein Risiko für die strategische und operative Effizienz.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Für optimale Ergebnisse wird empfohlen, einen „Data-first“-Ansatz zu verfolgen. Dahinter verbirgt sich eine Strategie, welche die Qualität und Integrität von Daten als ersten Schritt jeder KI-Initiative begreift. Eine robuste, zuverlässige Datenbasis ermöglicht es, Entscheidungen zu treffen, die aktuelle und zukünftige Geschäftsergebnisse verbessern. Dieser Ansatz hilft Branchenführern, Abläufe zu optimieren, Innovationen zu fördern und in dynamischen Märkten führend zu bleiben.

Für den Erfolg gut aufgestellt

Richtig umgesetzt, stellt Data-Governance ein Unternehmen für den Erfolg mit GenAI optimal auf: mittel- und langfristig. Der Fokus auf Datenqualität garantiert den Zugang zu den richtigen Daten zur richtigen Zeit. Dies führt zu überlegenen KI-Ergebnissen, optimierten Entscheidungen und insgesamt verbesserten Geschäftsergebnissen.

* Der Autor: Cody David ist GenAI Managing Solution Architect bei Syniti, einem Unternehmen von Capgemini

Aktuelles eBook

Storage für HPC & KI

eBook Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)

Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?

Die Themen im Überblick:

  • Aktuelle Trends in der Künstlichen Intelligenz
  • High-Performance Computing – Explosion der Innovationen
  • Künstliche Intelligenz – nahezu Echtzeit-Datenverarbeitung

(ID:50391161)