Mobile-Menu

Unstrukturierte Daten – Herausforderung und Chance Was Unternehmen über den „exzentrischen Cousin“ strukturierter Datenformate wissen müssen

Ein Gastbeitrag von Fabrice Gourlay*

Anbieter zum Thema

Die meisten modernen Innovationen und Dienstleistungen sind heute digital. Sie beginnen, sie entwickeln sich und sie enden mit Rohdaten. Unstrukturierte Daten stellen dabei die treibende Kraft der digitalen Transformation dar.

80 Prozent aller Unternehmensdaten liegen heute unstrukturiert vor – und werden noch viel zu selten genutzt.
80 Prozent aller Unternehmensdaten liegen heute unstrukturiert vor – und werden noch viel zu selten genutzt.
(Bild: rolffimages - stock.adobe.com)

Um allerdings neue Medikamente herzustellen, Krankheiten zu behandeln, Kommunikationsmöglichkeiten auf das nächste Level zu heben sowie intelligente Maschinen zu entwickeln, die es ermöglichen, schneller, intelligenter und nachhaltiger zu arbeiten, ist es zunächst erforderlich, unstrukturierte Daten nicht nur zu sammeln, sondern sie auch bestmöglich in nutzbaren Wert umzuwandeln.

Ist die Welt bereit für den unstrukturierten Datenberg?

Unstrukturierte Daten bilden die Grundlage von Innovationen in unzähligen Lebensbereichen. Die Genkartierung etwa wurde für die Impfstofferstellung verwendet. Kartierte Gendaten werden in einem unstrukturierten Format gespeichert. Filme von Mobiltelefonen sowie Sicherheitsaufnahmen von Kameras werden zunehmend in hoher 8K-Qualität aufgenommen – genau wie die neuesten Blockbuster, die es auf die Kinoleinwand schaffen. Die Speicherung von Videodateien erfolgt ebenfalls in einem unstrukturierten Format. Datensätze, die Einsatz beim Training von Maschinen finden, sei es im Kontext autonomen Fahrens oder auch zur Bestimmung des optimalen Ortes bei Ölbohrungen, nutzen riesige Mengen unstrukturierter Daten als Teil ihrer Trainingssätze.

Gut verwaltet und transformiert, können unstrukturierte Daten bei der Gestaltung unserer modernen Welt von entscheidender Bedeutung sein. Die Krux: Die meisten modernen Technologien wurden nicht mit Blick auf die Nutzung unstrukturierter Daten entwickelt. Als direkte Folge werden unstrukturierte Daten bislang nicht nur viel zu wenig genutzt, sie müssen auch im Zusammenhang mit zahlreichen Herausforderungen betrachtet werden. Moderne Unternehmen allerdings, die das Potential unstrukturierter Daten bereits heute besser ausschöpfen können, sind nicht nur hochgradig innovativ, sie arbeiten auch optimiert mit Blick auf Kosten und Zeit.

Eine Frage der Definition: Nicht alle Daten sind gleich

Wenn Menschen an Daten denken, haben sie normalerweise automatisch strukturierte Daten im Sinn. In Wirklichkeit erzeugen Unternehmen, Kunden und Privatmenschen aber weitaus mehr unstrukturierte Daten.

Sowohl strukturierte als auch unstrukturierte Daten sind von unschätzbarem Wert. Allerdings unterscheiden sie sich deutlich. Als eine Gemeinsamkeit bergen beide Cloud-Potential.

Laut Fintech Futures machen unstrukturierte Daten etwa 80 Prozent aller Datenbanken aus. Wenn es darum geht, den Wert unstrukturierter Daten freizusetzen, nutzen allerdings bislang nur sehr wenige Unternehmen vollumfänglich die gesammelten Informationen. In einem Beitrag auf Fintech Futures stellt Ryan Stewart, Financial Services Lead bei Cloud Technology Solutions, fest: „Das größte Hindernis beispielsweise mit Blick auf den Bankensektor ist eine umfangreiche und veraltete IT-Infrastruktur, da 92 Prozent der 100 führenden Banken weltweit immer noch auf Legacy-Systeme angewiesen sind.“

Strukturierte und unstrukturierte Daten im Vergleich

Strukturierte Daten liegen in standardisierter Form vor, folgen einer vorab definierten Struktur, sind insgesamt einfach zugänglich und vergleichsweise relativ leicht zu analysieren. Sie können in Zeilen, Spalten, Tabellen, Tabellenkalkulationen und Datenbanken gespeichert werden. Nahezu die gesamte Datentechnologie der letzten Dekade wurde entwickelt, um sie zu verwalten.

Bei unstrukturierten Daten handelt es sich um ein natives Dateiformat und damit quasi um den „exzentrischen Cousin“ strukturierter Daten. 80 Prozent aller Unternehmensdaten sind heute unstrukturiert. Die Speicherung in Data Lakes bietet sich an. Unstrukturierte Daten stellen die Substanz des globalen Wandels, der Innovation, der Zusammenarbeit sowie der Transformation dar.

Unstrukturierte Daten als Motor der Zukunft

In allen Branchen nehmen unstrukturierte Daten explosionsartig zu. Laut führenden Analysten werden Unternehmen bis 2024 ihre unstrukturierten Daten (On-Premises, Edge- oder Cloud-gespeichert) verdreifachen. In einer Welt, in der Remote-Arbeit zu einer nicht mehr wegzudenkenden Realität geworden ist, ist die Cloud zudem nicht mehr optional.

Die Nutzung und Verwaltung unstrukturierter Daten steckt allerdings noch in den Kinderschuhen. Und wie unzählige Organisationen, die Daten mit veralteten Systemen verwalten und speichern, festgestellt haben, ist die Datentransformation leichter gesagt als getan.

Eine Herkulesaufgabe meistern: Bewusstmachung der Problemfelder

Nachfolgend sind sieben der häufigsten Gründe aufgezeigt, die veranschaulichen, weshalb viele Unternehmen das Potential unstrukturierter Daten nicht voll ausschöpfen können.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

1. Unternehmen straucheln mit Speicherkapazität und Datenzugänglichkeit

Rohdaten – oft von Sensoren, Kameras, Sequenzern, Autos oder Maschinen erfasst – sind zunächst von nachgeordneter Bedeutung. Die Umwandlung dieser Daten in Erkenntnisse, welche direkt Innovationen befördern, erfordert die präzise Zusammenarbeit über riesige Datenmengen hinweg. Dateninnovation setzt aber in erster Linie Datenzugänglichkeit voraus. Unternehmen sammeln oft Hunderte Terabyte oder gar ein Petabyte an Daten, die sie auf unbestimmte Zeit speichern müssen. Nur zum Vergleich: Dabei handelt es sich um das Speicheräquivalent von 1.000 Laptops. Weil die Datenmenge wächst, muss entsprechend auch der Speicherplatz dynamisch mitwachsen, ohne dass die Datenzugänglichkeit leidet.

2. Legacy-Systeme wurden nicht für moderne Workloads oder die Cloud entwickelt

Die alte Garde der Scale-Out- und Scale-Up-Lösungen war nie darauf ausgelegt, die heutigen Anwendungen, Dateitypen, Workloads und Volumen zu bewältigen. Mit Blick auf die beiden Hauptmethoden zum Speichern und Verwalten unstrukturierter Daten – Objektspeicher und Dateispeicher – sind nur Dateisysteme darauf ausgelegt, Daten in ihrem nativen Dateiformat zu bearbeiten. Legacy- und Objektspeichersysteme können nicht die Leistung, Sichtbarkeit, Portabilität, Kontrolle oder Skalierbarkeit bieten, die modernes Datenmanagement sowie die Cloud-Migration erfordern.

3. Legacy-Architektur schränkt die Skalierbarkeit ein

Legacy-Architekturen sind oft On-Premises und Hardware-gebunden. Speicher unterliegt demnach der Größe einer Rechenzentrumsarchitektur. Wenn die Rechenleistung skaliert wird, muss auch der Speicher skaliert werden. Aber Rechenzentrumsimmobilien sind kostenintensiv. Diese Grenzen können die Kreativität und die Erforschung neuer Möglichkeiten im Kontext unstrukturierter Daten direkt im Keim ersticken.

4. Datensilos verhindern Zugriff und Zusammenarbeit

Um Herausforderungen bei der Skalierbarkeit zu bewältigen, haben sich einige Unternehmen auf Speicher-Arrays oder aber mehrere Rechenzentren konzentriert. Während diese Lösungsansätze vorübergehend Speicherprobleme beheben können, erschweren Datensilos und unterschiedliche Speicher-Arrays im Umkehrschluss den Echtzeitzugriff sowie die Zusammenarbeit. Um Dateneinblicke zu optimieren und nutzbar zu machen, sind konsolidierte Daten ideal.

5. Konsolidierte Daten schränken die Speicheroptionen ein

Allerdings bergen auch konsolidierte Daten im Kontext von Aggregation, Datenbereinigung und Datenanreicherung Einschränkungen, vor allem mit Blick auf Speicheroptionen und Speicherkapazitäten. Weder Rechenzentren noch öffentliche Clouds bieten mehr als eine Handvoll begrenzter Speicheroptionen.

6. Die Konkurrenz migriert flugs in die Cloud

Führende Analysten prognostizieren, dass öffentliche Cloud-Dienste für 90 Prozent der Daten- und Analyseinnovationen bald unerlässlich sein werden. Zukunftsorientierte Unternehmen und Wettbewerber haben diese Prognose verinnerlicht. Sie verlagern Workflows in die Public Cloud. Unstrukturierte Daten beschleunigen diese Migration. Je schneller Unternehmen zur Public Cloud gelangen, desto mehr Wettbewerbsvorteile erzielen sie.

7. Top-Talente favorisieren häufig Remote-Work

Im Homeoffice fehlt es oft noch an ausreichender Infrastruktur, um mit großen Datenmengen produktiv zu sein. Top-Talente der Industrie favorisieren allerdings häufig Cloud-basierte Arbeitsplätze, die für Remote-Arbeit ausgelegt sind und die Zusammenarbeit erleichtern.

Ausblick auf morgen: Wer hat Angst vor unstrukturierten Daten?

Die Verwaltung, Speicherung und Umwandlung unstrukturierter Daten in großem Maßstab, um Innovationen voranzutreiben, mag für viele Unternehmen entmutigend erscheinen. Im Folgenden seien drei Ratschläge beleuchtet:

1. Bedachtsamkeit im Kontext der Zukunft ist Trumpf

Die Cloud ist heute nicht mehr wegzudenken. Mit AWS, Azure sowie Google Cloud Platform bestehen zahlreiche öffentliche Optionen. Aber was heute im Fokus steht, ist vielleicht morgen schon Teil einer größeren Transformation. IT-Entscheidungsträger tun gut daran, Bedachtsamkeit beim Blick auf die Zukunft walten zu lassen. Ideal ist der Fokus auf eine Infrastrukturstrategie, die zukünftige Flexibilität bietet.

2. Unternehmen müssen sich klar sein, worauf sie sich einlassen

IT-Entscheidungsträger müssen fokussiert und selektiv im Kontext ihrer individuellen Strategien vorgehen. Das Augenmerk sollte auf Anwendungen liegen, die einen Mehrwert für die jeweiligen Endnutzer schaffen. Infrastruktur-Software, mit der Praktiken standardisiert werden können und Komplexität zugleich reduziert erscheint, stellt immer einen Gewinn dar. Unternehmen sollten ferner eine stabile Dateidatenplattform wählen, die mit unstrukturierten Daten in ihrem nativen Dateiformat umgehen kann. Flexibler, kostengünstiger Speicher, der die Beschränkungen von Hardware, Rechenzentrum und Cloud überwindet, sollte im Mittelpunkt der Überlegungen stehen. Skepsis ist ferner geboten gegenüber Anbietern und Plattformen mit Lösungen, die diese Flexibilität missbrauchen.

3. Beim Wechsel in die Cloud zahlt sich in erster Linie Strategie aus

Wenn ein Unternehmen den Schritt in die Cloud wagt, hilft ein dreistufiges Framework:

  • 1. Konsolidieren unstrukturierter Daten und Workloads an einem Ort. Dadurch werden die Kosten sowie die Komplexität der Verwaltung mehrerer Systeme reduziert.
  • 2. Erweitern der Infrastruktur in die Public Cloud im Kontext unstrukturierter Daten. Dies kann durch Cloud-Bursts oder aber durch den Aufbau individueller Workloads erzielt werden.
  • 3. Das Transformieren von Workflows und insgesamt das Verfolgen einer nachhaltigen digitalen Transformation nimmt Zeit in Anspruch. Unternehmen sollten geduldig sein, strategische Schritte mit kühlem Kopf planen und darauf achten, nicht direkt zur Transformationsphase überzugehen.

IT-Entscheidungsträger, die bereit sind, ihre jeweiligen Infrastrukturstrategien bescheiden und bewusst anzugehen, und die darüber hinaus den Willen zeigen, strategische Maßnahmen zu ergreifen, um in die Cloud zu wechseln, können Zeit und Geld sparen und zugleich Top-Talente halten. Mit der richtigen Lösung können Unternehmen Schritt für Schritt die volle Kontrolle über ihre Daten erlangen und zugleich den Wert und die Freiheit unstrukturierter Daten nutzen, um Innovationen im Wortsinn voranzutreiben.

Aktuelles eBook

Alle Daten im Griff – der Weg zum passenden Data-Management

eBook Data-Management
eBook „Data-Management“
(Bild: Storage-Insider)

Daten nur zum Selbstzweck zu speichern, kann sich heute praktisch kein Unternehmen mehr leisten. Um den Überblick zu behalten und Nutzen aus den gespeicherten Daten zu ziehen, wird ein entsprechendes Datenmanagement benötigt. Unser neues eBook erläutert detailliert, worauf es dabei ankommt, welche Ansätze es gibt und wo Potenziale zur Verbesserung liegen.

Die Themen im Überblick:

  • Data-Management lokal und in der Private Cloud
  • Data-Management in der Cloud
  • Globales Data-Management

* Der Autor: Fabrice Gourlay, VP of Sales EMEA, Qumulo

(ID:48573041)