Ungehobener Datenschatz Was sind Dark Data ?

Autor / Redakteur: Egoloizos / Dr. Jürgen Ehneß

Dark Data bezeichnen den großen Datenschatz bisher nicht genutzter und nicht ausgewerteter Daten. Speziell im Zusammenhang mit Big Data bleibt vieles unberücksichtigt. Dark Data verschwinden oftmals aus dem Bewusstsein der Anwender.

Firma zum Thema

Die wichtigsten IT-Fachbegriffe verständlich erklärt.
Die wichtigsten IT-Fachbegriffe verständlich erklärt.
(Bild: © aga7ta - Fotolia)

Dark Data sind so genannte „dunkle Daten“, die zwar von Informationssystemen gespeichert werden, jedoch ungenutzt bleiben. Große Datenmengen (Big Data) stellen eine große Herausforderung für die Datenanalyse und Datenauswertung dar. Die Verarbeitungskapazität ist oft nicht gegeben. Dies hat zur Folge, dass ein großer Teil der Daten niemals betrachtet oder genutzt wird. Die Existenz der Dark Data lässt sich oftmals nur erahnen oder ist den Datenverantwortlichen nicht mehr bewusst.

Ein Problem der Dark Data besteht in ihrer großen Menge und der damit einhergehenden Unkontrollierbarkeit. Diese Art von Daten fällt in verschiedenartigen Anwendungsbereichen an und kann in Unternehmen sämtliche Abteilungen betreffen.

Herausforderungen der Dark Data

Im Zusammenhang mit Big Data zeigt sich die Problematik einer auseinanderklaffenden Schere zwischen der Datenmenge auf der einen Seite und den Verarbeitungs- und Analysemöglichkeiten auf der anderen. Datenmengen wachsen geradezu exponentiell an. So schätzt das IDC-Institut ein Wachstum des Datenschatzes weltweit zwischen 2010 und 2020 um das etwa Fünfzigfache.

Sinnvolle und nutzbare Analysen dieser Datenmengen stellen eine nicht immer zu leistende Aufgabe dar. Den meisten Unternehmen fehlen entscheidende Lösungen, die im eigenen Hause anfallenden Daten mehrheitlich zu nutzen. Ein wichtiger Schritt besteht in der Lokalisierung und Einordnung dieser Daten. Sie lassen sich unter anderem nach der Herkunft und ihren Bezugspunkten gruppieren.

Arten und Gruppen von Daten

Im Unternehmensbereich lassen sich grundsätzlich geschäftskritische Daten, ROT-Daten und Dark Data unterscheiden. Geschäftskritische Daten sind hierbei solche, die von zentraler Relevanz für den unternehmerischen Betrieb und die betriebliche Zielerreichung sind. Entgegen landläufiger Annahme machen geschäftskritische Daten nicht etwa den Löwenanteil aus. Doch werden diese Daten am häufigsten genutzt. Sie zeichnen sich dadurch aus, leicht zu erheben und zu messen zu sein. Sie entsprechen gemäß Databerg-Report von Veritas Technologies insgesamt einem Anteil von etwa 15 Prozent an der Gesamtdatenmenge.

Das Gegenteil der geschäftskritischen Daten sind die so genannten ROT-Daten (Redundant, Obsolet, Trivial – auf Deutsch: „redundant, veraltet, unbedeutend“). Sie haben keinen Geschäftswert, weshalb sie standardmäßig gelöscht werden. Dazu gehören etwa Spam- und Werbe-Mails. In Deutschland entsprechen etwa 19 Prozent der Daten den ROT-Daten.

Dark Data entsprechen der Mehrheit der sonstigen Daten, die sich weder als geschäftskritisch noch als ROT einstufen lassen. Dies hängt damit zusammen, dass sie noch nicht bekannt oder identifiziert ist. Es kann sich herauskristallisieren, dass sich geschäftskritische Daten darunter befinden.

Grundsätzlich können Dark Data überall auftauchen. Auf verschiedenen Geräten und an unterschiedlichen Stellen können wichtige betriebliche Informationen anfallen, die noch nicht zielführend analysiert wurden. Dazu gehören beispielsweise Log-Dateien auf Servern. Diese dienen dazu, im Zweifelsfall Server-Fehler analysieren und beheben zu können. Ebenso finden sie Einsatz in der Überprüfung der Wirksamkeit bestimmter Sicherheitsmaßnahmen.

Neues eBook

Speicher-Technologien im Vergleich

HDD, Flash & Hybrid: Der passende Speicher für jeden Einsatz

eBook HDD, Flash und Hybrid
eBook HDD, Flash & Hybrid
(Bildquelle: Storage-Insider)

In diesem eBook lesen Sie, welche verschiedenen Speicher es gibt und welche Vor- und Nachteile diese haben. Inhalt:

# Der passende Speicher für jeden Einsatz - HDD, SSD und Tape
# HDDs: Heimvorteil und neue Technologien - Festplatten
# Flash-SSDs & Co.: wie ein geölter Blitz - Flash-Speicher
# Storage-Arrays unter die Haube geschaut - SSD, HDD und Hybrid
# Tape: die Kunst der Langzeitarchivierung - Bandlaufwerke


>>> eBook „HDD, Flash & Hybrid: Der passende Speicher für jeden Einsatz“ downloaden

(ID:47506909)