Anhaltende geschäftliche Herausforderungen können Entscheidungsträgern rasch über den Kopf wachsen. Vor diesem Hintergrund scheint es nicht verwunderlich, dass Branchenführer auf der Suche nach innovativen Lösungsansätzen vermehrt auf Künstliche Intelligenz setzen.
Jede KI kann nur so gut sein wie die Daten, mit denen sie trainiert wurde. Deshalb müssen Daten entsprechend bereinigt, überprüft und organisiert werden.
(Bild: Dall-E / KI-generiert)
Das Capgemini Research Institute zeigt in seiner zweiten Ausgabe einer Studie zum Wert generativer KI und deren Anwendungsfällen auf, dass sich der Einsatz in Unternehmen von 2023 auf 2024 vervierfacht hat. Ein Großteil der befragten Unternehmen gibt dabei an, dass sich mithilfe generativer KI Umsatz und Innovationskraft steigern lassen (international: 74 Prozent der Unternehmen, in Deutschland: 66 Prozent).
Die Nachfrage nach GenAI ist enorm. Gleiches gilt für die Verbreitung von KI-Tools. Vor diesem Hintergrund ist es dringend erforderlich, sich der Herausforderung mangelhafter Unternehmensdaten zu stellen. Denn herausragende KI-Ergebnisse beginnen mit der Implementierung von Data-Governance. Nachfolgend zeigen wir auf, weshalb das so ist.
Die Zukunft der Data-Governance im Kontext von KI
Jede KI im Unternehmensbereich und jedes große Sprachmodell (LLM) können letztlich nur so gut sein wie die Daten, mit denen sie trainiert wurden. Richtlinien zur Datenverwaltung geben Einblick in bewährte Praktiken mit Blick auf das Sammeln, Speichern und Verwalten umfangreicher Datenmengen innerhalb von Organisationen.
Daten die nicht bereinigt, überprüft und organisiert wurden, können die Qualität von KI-Resultaten und Geschäftsergebnissen auf vielfache Weise beeinträchtigen:
ungenaue oder voreingenommene Ergebnisse,
widersprüchliche Erkenntnisse und unzuverlässige Vorhersagen,
Compliance-Probleme durch Verweise auf klassifizierte oder eingeschränkte Daten,
geringeres Vertrauen in Geschäftsentscheidungen,
Erosion des Vertrauens bei internen Nutzern sowie externen Kunden/Partnern,
verminderte Produktivität und Effizienz,
ungenaue Risikobewertung, Risikoidentifikation und Risikominderung.
Selbst kleinere Diskrepanzen können sich hierbei zum Problem auswachsen, wenn GenAI mit eigenen Ergebnissen trainiert wird – denn dadurch werden Fehler und Verzerrungen letztlich nur verstärkt. Es ist deshalb von entscheidender Bedeutung, sich darauf zu konzentrieren, mit KI korrekt zu arbeiten.
Hier bietet Data-Governance hilfreiche Strukturen (und nicht etwa Einschränkungen). Sachgemäß bereinigte, strukturierte Datensätze schaffen eine faire, unbeeinflusste Grundlage für ein individuelles KI-Modell. Selbst einfache Schritte wie etwa die Standardisierung von Dateiformaten, Benennungskonventionen sowie Definitionen können Diskrepanzen verhindern und die Genauigkeit von KI-Resultaten verbessern.
Vor diesem Hintergrund kann nicht genug betont werden, dass es ratsam ist, umfassende Richtlinien zur Data-Governance zu etablieren, bevor ein Unternehmen GenAI in seine Geschäftsabläufe integriert.
Drei erste Schritte für eine intelligentere KI von morgen
Das Fundament für ein GenAI-Projekt zu legen, ist entscheidend, um präzise, zuverlässige Ergebnisse zu erhalten und um Erkenntnisse zu gewinnen, die Teams in die Lage versetzen, entschlossen und mit Zuversicht auf geschäftliche Herausforderungen zu reagieren. Mit diesem Framework wird die Datenbasis nachhaltig gestärkt:
1. Definition von Datenbesitz und Verantwortung
Datenverwaltung ist mehr als die Summe von Regeln und Standards; sie umfasst auch die Organisation von Arbeitsabläufen, die ein Gleichgewicht zwischen Geschwindigkeit und Sicherheit herstellen. Datenverantwortliche müssen die Bedeutung ordnungsgemäß organisierter und gesicherter Daten unterstreichen.
Teams sollten wissen, für welche Datensätze sie jeweils verantwortlich sind, wie sie deren Qualität aufrechterhalten, und auch, wie sie auf weitere Datensätze zugreifen können, die sie für ihre Arbeit benötigen.
Daten unterliegen je nach Branche und Standort unterschiedlichen Vorschriften. Die Einhaltung dieser jeweiligen Standards ist von entscheidender Bedeutung mit Blick auf Vertrauen, Datenschutz sowie Sicherheit. Teams sollten im Detail mit Richtlinien und Vorschriften vertraut gemacht werden, die den Datenzugriff sowie die Datenspeicherung regeln. Ferner sollte die Einhaltung dieser Vorschriften zu allen Zeiten sichergestellt werden.
Durch interne Rechtsberater und Experten (einschließlich eines Chief Privacy Officers) kann der gewünschte KI-Erfolg erzielt werden, ohne dabei Sicherheit, Vertrauen oder Compliance zu gefährden.
3. Regelmäßige Datenprüfungen und Datenaktualisierungen
Sobald die Daten bereinigt und umstrukturiert wurden, sollten sie durch regelmäßige Prüfungen und Audits in optimalem Zustand gehalten werden. Diese Prüfungen könnten folgende Schritte umfassen:
Entfernen irrelevanter oder veralteter Datensätze,
Überprüfen der Genauigkeit und Konsistenz zwischen Datenbanken,
automatisierte Prozesse zur Identifizierung von Duplikaten oder beschädigten Datensätzen.
Konstante Maßnahmen im Bereich des Datenmanagements verhindern, dass kleinere Probleme sich zu echten Krisen entwickeln können. Ferner wird es so verunmöglicht, dass systemische Datenprobleme den Fortschritt in einem Unternehmen schleichend behindern.
Kontrolle der Datenqualität
Die Priorisierung von Daten führt zu langfristig positiven Effekten, die jede Organisation weit über die eigentlichen KI-Initiativen hinaus voranbringen. Minderwertige Daten zu zentralisieren, ohne die zugrunde liegenden Probleme zu beheben, bedeutet im Umkehrschluss, alle Datenfehler und Diskrepanzen an einem Ort zu konsolidieren. Daraus resultiert ein Risiko für die strategische und operative Effizienz.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Für optimale Ergebnisse wird empfohlen, einen „Data-first“-Ansatz zu verfolgen. Dahinter verbirgt sich eine Strategie, welche die Qualität und Integrität von Daten als ersten Schritt jeder KI-Initiative begreift. Eine robuste, zuverlässige Datenbasis ermöglicht es, Entscheidungen zu treffen, die aktuelle und zukünftige Geschäftsergebnisse verbessern. Dieser Ansatz hilft Branchenführern, Abläufe zu optimieren, Innovationen zu fördern und in dynamischen Märkten führend zu bleiben.
Für den Erfolg gut aufgestellt
Richtig umgesetzt, stellt Data-Governance ein Unternehmen für den Erfolg mit GenAI optimal auf: mittel- und langfristig. Der Fokus auf Datenqualität garantiert den Zugang zu den richtigen Daten zur richtigen Zeit. Dies führt zu überlegenen KI-Ergebnissen, optimierten Entscheidungen und insgesamt verbesserten Geschäftsergebnissen.
* Der Autor: Cody David ist GenAI Managing Solution Architect bei Syniti, einem Unternehmen von Capgemini
Aktuelles eBook
Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)
Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?
Die Themen im Überblick:
Aktuelle Trends in der Künstlichen Intelligenz
High-Performance Computing – Explosion der Innovationen