Mark Molyneux von Cohesity erläutert im Gastbeitrag, warum Datenindexierung in Unternehmen eine Schlüsselrolle für Datenmanagement, KI-Erfolg, Sicherheit und Compliance spielt.
Der Einzug von KI-Modellen in Unternehmen lenkt den Blick auf die adäquate Datenverwaltung. Grundlegend dafür ist eine strukturierte Datenindexierung und -klassifizierung.
(Bild: Midjourney / KI-generiert)
Im Jahr 2024 sind die Datenmengen unter anderem durch den verstärkten Einsatz künstlicher Intelligenz (KI) weltweit weiter stark gewachsen. Derzeit sind es etwa 400 Millionen Terabyte täglich, und diese Datenmenge wächst in einem immer schnelleren Tempo an. Von Social-Media-Interaktionen bis hin zu beruflicher Kommunikation, von Versandzeiten bis zu Kundendaten – alle diese Informationen müssen zuverlässig gespeichert und verwaltet werden. Viele Unternehmen sammeln und speichern aber Daten immer noch, ohne dass Transparenz darüber besteht, welche Daten existieren, wo sie liegen und wer Zugriff darauf hat – im Durchschnitt trifft das auf etwa 70 Prozent der gespeicherten Daten zu.
Der verkannte Wert der Datenindexierung und -klassifizierung
Eine wichtige, aber vielfach sträflich vernachlässigte Aufgabe ist daher eine strukturierte Datenindexierung und -klassifizierung. Die Indexierung gibt Unternehmen umfassendes Wissen über ihre Daten, einschließlich Details wie Zeitverlauf, Datum, Alter, Größe und Autor. Durch die Klassifizierung wird dies mit Informationen darüber erweitert, worum es sich bei den Daten handelt und wie lange sie auf der Grundlage der entsprechenden Aufzeichnungsrichtlinie des Unternehmens aufbewahrt werden müssen. Dieser Ansatz hat erhebliche Auswirkungen auf die Einhaltung gesetzlicher Vorschriften, Kosteneinsparungen, den Mehrwert von auf den Daten basierenden KI-Lösungen, Nachhaltigkeit, Cybersicherheit und Zugriffskontrolle.
Nicht zuletzt ermöglicht die Datenklassifizierung auch ein enormes Potenzial für Kosteneinsparungen. Eine wahllose Speicherung wird so verhindert und unnötige Datenflut reduziert. Dies senkt beispielsweise die Speicherkosten – ein entscheidender Pluspunkt für Unternehmen, aber nicht der Einzige.
Data-Governance vereinfacht die Einhaltung gesetzlicher Bestimmungen
Verordnungen und Richtlinien wie DSGVO, NIS-2 und DORA stellen strenge Anforderungen an die Datenverwaltung und -verarbeitung. Durch die Klassifizierung von Daten können Unternehmen sicherstellen, dass sie diese Anforderungen erfüllen, und damit hohe Geldstrafen vermeiden.
Es ist jedoch nicht sinnvoll, einfach jede neue Datenverordnung zu befolgen, sobald sie in Kraft tritt. Diese Vorgehensweise führt zu einem reaktiven und fragmentierten Compliance-Ansatz und verbraucht erhebliche Ressourcen. Stattdessen sollten sich Unternehmen darauf konzentrieren, einen standardisierten Prozess für Data-Governance zu schaffen. Ein robuster Data-Governance-Rahmen bietet einen einheitlichen und umfassenden Ansatz für die Verwaltung von Daten im gesamten Unternehmen.
Eine ordnungsgemäße Datenklassifizierung und -indexierung ist für KI-Systeme unerlässlich. Denn redundante, veraltete und triviale Daten können oft zu Halluzinationen oder zur Weitergabe privater Daten in LLMs führen. Durch organisierte und kategorisierte Daten können KI-Algorithmen leichter Muster und Beziehungen erkennen. Das führt zu präzisen Vorhersagen und Empfehlungen. Indexierte und klassifizierte Daten ermöglichen der KI dabei den Zugriff auf strukturierte, relevante Datensätze. Dies ermöglicht fundiertere Geschäftsentscheidungen und verbessert insgesamt die betriebliche Effizienz.
Sicherheit erhöhen
Eine effektive Datenklassifizierung und -indexierung gewährleistet auch die Datenintegrität und -sicherheit. Durch die Trennung sensibler Daten können Unternehmen Zugriffskontrollen und Verschlüsselung implementieren, um das Risiko von Datenschutzverletzungen zu verringern und die Einhaltung gesetzlicher Vorschriften zu gewährleisten. Dies ist für den KI-Einsatz von entscheidender Bedeutung, da der Missbrauch personenbezogener Daten erhebliche rechtliche und ethische Folgen haben kann.
Ransomware-Kampagnen und Wiper-Angriffe sind häufige Bedrohungen, mit denen Cybersicherheitsexperten konfrontiert werden. Eine ordnungsgemäße Datenindexierung und -klassifizierung verbessert auch die Zugriffskontrolle und unterstützt IT-Sicherheitsteams dabei, den Wert von Daten, für die Lösegeld gefordert ist oder die zerstört wurden, richtig einzuschätzen.
Der Weg zu strategischer Data-Governance
Ein weiterer wichtiger Schritt, um Skalierbarkeit und Sicherheit in Einklang zu bringen, ist die Implementierung robuster Data-Governance-Rahmenwerke. Dazu gehören die Festlegung klarer Datenschutzrichtlinien, die Durchführung regelmäßiger Datenaudits und die Schulung der Mitarbeiter in Bezug auf bewährte Datenschutz- und Sicherheitsverfahren. Durch die Förderung einer Kultur der Datenhygiene auf allen Ebenen und in allen Geschäftsbereichen können Unternehmen sicherstellen, dass ihre Daten verantwortungsvoll und sicher verwaltet werden.
Die Einführung eines standardisierten Data-Governance-Prozesses stellt sicher, dass Unternehmen neuen gesetzlichen Anforderungen immer einen Schritt voraus sind. Dieser proaktive Ansatz verbessert nicht nur die Einhaltung von Vorschriften, sondern auch die Datenverwaltung insgesamt. Das führt zu einer besseren Datenqualität, einer höheren betrieblichen Effizienz und einem größeren Vertrauen der Beteiligten.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Die Nutzung skalierbarer Infrastrukturen wie Cloud-Lösungen und hybrider Modelle kann Unternehmen auch dabei helfen, Skalierbarkeit und Sicherheit in Einklang zu bringen. Denn Cloud-Lösungen bieten Flexibilität und Skalierbarkeit bei gleichzeitiger Gewährleistung robuster Sicherheitsmaßnahmen. Hybride Modelle, die lokale und Cloud-Lösungen kombinieren, bieten einen ausgewogenen Ansatz, der sowohl die Skalierbarkeits- als auch die Sicherheitsanforderungen erfüllt.
Die Verbesserung von Cybersicherheitsmaßnahmen ist für den Schutz von Daten unerlässlich. Dazu gehören die Verschlüsselung von Daten im Ruhezustand und bei der Übertragung, die Einführung strenger Zugangskontrollen, die Aktualisierung von Systemen und Software mit den neuesten Sicherheits-Patches sowie der Einsatz von Funktionen zur Erkennung und Abwehr von Bedrohungen. Durch die Anwendung dieser Praktiken können Unternehmen ihre Daten vor potenziellen Bedrohungen wie Ransomware schützen.
Zusammenfassend lässt sich sagen, dass das Gleichgewicht zwischen Skalierbarkeit und Sicherheit bei der Datenverwaltung einen ganzheitlichen Ansatz erfordert, der moderne Datenschutztechnologien, robuste Governance-Rahmenwerke, eine skalierbare Infrastruktur und strenge Cybersicherheitsmaßnahmen kombiniert. Durch die Indexierung und Klassifizierung von Daten, den Einsatz skalierbarer Lösungen und die Förderung einer unternehmensweiten Kultur der Datenhygiene können Unternehmen das komplexe regulatorische Umfeld meistern und gleichzeitig den Wert ihrer Daten erhöhen.
Mark Molyneux, EMEA CTO bei Cohesity.
(Bild: Cohesity)
* Der Autor: Mark Molyneux, EMEA CTO bei Cohesity, leitet seit über 20 Jahren große, weltweit verteilte Teams in den Bereichen Group Storage, Virtualisierung und Public Cloud Operations. Zudem besitzt er umfangreiche Fachkenntnisse auf den Gebieten strategische technologische Entscheidungsfindung, Finanzmanagement sowie Personalentwicklung.
Aktuelles eBook
Ransomware-Schutz durch Object Lock und WORM
eBook „Ransomware-Schutz“
(Bild: Storage-Insider)
Um ein Storage-System effektiv von Ransomware-Angriffen zu schützen, bieten sich neben Backup/Disaster Recovery und Verschlüsselung vor allem Object Lock und WORM an. Das gelingt nicht nur im eigenen Haus, sondern auch in der Hybrid-Cloud.