Mobile-Menu

Maß für Daten Was ist Datenqualität?

Von Dipl.-Ing. (FH) Stefan Luber 2 min Lesedauer

Anbieter zum Thema

Die Datenqualität ist ein Maß dafür, wie gut Daten die Anforderungen hinsichtlich verschiedener Kriterien wie Korrektheit, Aktualität, Zuverlässigkeit, Vollständigkeit, Genauigkeit und anderer erfüllen. Die Qualität der Daten ist die Voraussetzung für fehlerfrei und effizient ablaufende datengetriebene Prozesse und korrekte datengestützte Entscheidungen. Zur Prüfung und Verbesserung der Qualität lässt sich ein Data-Governance-Programm etablieren.

Die wichtigsten IT-Fachbegriffe verständlich erklärt.(Bild:  © aga7ta - Fotolia)
Die wichtigsten IT-Fachbegriffe verständlich erklärt.
(Bild: © aga7ta - Fotolia)

Datenqualität (im Englischen Data Quality – DQ) ist ein Maß dafür, wie gut ein Datenbestand oder ein einzelner Datensatz die Anforderungen hinsichtlich verschiedener Kriterien wie Genauigkeit, Korrektheit, Vollständigkeit und anderer erfüllt. Nur bei qualitativ hochwertigen Daten ist sichergestellt, dass sie für den beabsichtigten Verwendungszweck effektiv eingesetzt werden können. Datengetriebene Geschäftsprozesse oder datenverarbeitende Anwendungen laufen bei entsprechender Qualität der Daten fehlerfrei und effizient ab. Datengestützte Entscheidungen lassen sich genau und fundiert treffen.

Durch die zunehmende Digitalisierung und technische Entwicklungen wie Cloud-Computing, Echtzeit-Datenstreaming, Big-Data-Datenverarbeitung, das Internet der Dinge, Künstliche Intelligenz und Maschinelles Lernen hat die Qualität von Daten stark an Bedeutung gewonnen. Hinsichtlich der Einhaltung von rechtlichen Vorgaben und Compliance-Richtlinien gibt es ebenfalls steigende Anforderungen an die Qualität der Daten. Eine schlechte Datenqualität kann schwerwiegende Folgen haben wie fehlerhafte Datenanalysen, falsche Entscheidungen, mangelhafte Umsetzung rechtlicher Vorgaben, Umsatzeinbußen, Imageschäden und vieles mehr.

In Unternehmen übernimmt häufig ein Data Steward die Rolle des Wächters der Datenqualität. Er steht in der Verantwortung, die Qualität der Daten zu überwachen, zu messen, zu kontrollieren und gegebenenfalls zu verbessern.

Die wichtigsten Kriterien der Datenqualität

Es gibt zahlreiche Kriterien, an denen sich die Qualität der Daten festmachen und messen lässt. Typische Qualitätskriterien sind:

  • Korrektheit: korrekte Abbildung der Realität,
  • Aktualität: Abbildung des aktuellen Zustands,
  • Zuverlässigkeit: Nachvollziehbarkeit der Datenentstehung und der Datenquelle,
  • Vollständigkeit: Vorhandensein aller notwendigen Attribute und Datenelemente,
  • Genauigkeit: Vorliegen der Daten in der geforderten Exaktheit,
  • Relevanz: Erfüllung des gewünschten Informationsbedarfs,
  • Verständlichkeit: für den Informationsempfänger klare und verständliche Begrifflichkeit und Struktur,
  • Einzigartigkeit: kein Vorkommen von Datendubletten,
  • Eindeutigkeit: eindeutige Interpretierbarkeit,
  • Einheitlichkeit: einheitliche Strukturierung und Formate,
  • Portabilität und Interoperabilität: Übertragbarkeit und Nutzbarkeit der Daten auf verschiedenen Systemen,
  • Konsistenz: Widerspruchsfreiheit zu anderen Datensätzen gleicher oder verschiedener Datenquellen.

Ursachen für eine schlechte Datenqualität

Eine schlechte Datenqualität kann viele Ursachen haben. Zu diesen Ursachen zählen eine fehlende oder schlechte Data Governance und Datenstrategie, fehlende oder mangelhafte Dokumentation der Daten, die Existenz von Datensilos, fehlende Abstimmungen zwischen verschiedenen Fachbereichen, zu hohe Datenkomplexität, Integrationsprobleme, sich zu schnell verändernde Datenbestände, fehlerhafte manuelle Prozesse, menschliche Fehler und anderes.

Überprüfung und Verbesserung der Datenqualität

Durch die Implementierung einer guten Data Governance lässt sich die Datenqualität kontinuierlich prüfen und verbessern. Die Data Governance gibt die Ziele, den organisatorischen Rahmen und die Regelwerke vor. Die operative Umsetzung dieser Rahmenbedingungen erfolgt durch Maßnahmen des Datenmanagements. Die konkreten Maßnahmen sorgen in den verschiedenen Phasen des Datenlebenszyklus für die Anpassung der Daten an die vorgegebenen Qualitätskriterien.

Die Maßnahmen können automatisiert über Tools oder manuell umgesetzt werden und umfassen zum Beispiel die Datenbereinigung, Datenergänzung, Datenaktualisierung oder Datenstandardisierung und mehr. Darüber hinaus können Mitarbeiter durch Schulungen und Bewusstseinsbildung für das Thema Datenqualität und ihre Bedeutung für das Unternehmen sensibilisiert werden.

(ID:49968489)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung