Die meisten modernen Innovationen und Dienstleistungen sind heute digital. Sie beginnen, sie entwickeln sich und sie enden mit Rohdaten. Unstrukturierte Daten stellen dabei die treibende Kraft der digitalen Transformation dar.
80 Prozent aller Unternehmensdaten liegen heute unstrukturiert vor – und werden noch viel zu selten genutzt.
(Bild: rolffimages - stock.adobe.com)
Um allerdings neue Medikamente herzustellen, Krankheiten zu behandeln, Kommunikationsmöglichkeiten auf das nächste Level zu heben sowie intelligente Maschinen zu entwickeln, die es ermöglichen, schneller, intelligenter und nachhaltiger zu arbeiten, ist es zunächst erforderlich, unstrukturierte Daten nicht nur zu sammeln, sondern sie auch bestmöglich in nutzbaren Wert umzuwandeln.
Ist die Welt bereit für den unstrukturierten Datenberg?
Unstrukturierte Daten bilden die Grundlage von Innovationen in unzähligen Lebensbereichen. Die Genkartierung etwa wurde für die Impfstofferstellung verwendet. Kartierte Gendaten werden in einem unstrukturierten Format gespeichert. Filme von Mobiltelefonen sowie Sicherheitsaufnahmen von Kameras werden zunehmend in hoher 8K-Qualität aufgenommen – genau wie die neuesten Blockbuster, die es auf die Kinoleinwand schaffen. Die Speicherung von Videodateien erfolgt ebenfalls in einem unstrukturierten Format. Datensätze, die Einsatz beim Training von Maschinen finden, sei es im Kontext autonomen Fahrens oder auch zur Bestimmung des optimalen Ortes bei Ölbohrungen, nutzen riesige Mengen unstrukturierter Daten als Teil ihrer Trainingssätze.
Gut verwaltet und transformiert, können unstrukturierte Daten bei der Gestaltung unserer modernen Welt von entscheidender Bedeutung sein. Die Krux: Die meisten modernen Technologien wurden nicht mit Blick auf die Nutzung unstrukturierter Daten entwickelt. Als direkte Folge werden unstrukturierte Daten bislang nicht nur viel zu wenig genutzt, sie müssen auch im Zusammenhang mit zahlreichen Herausforderungen betrachtet werden. Moderne Unternehmen allerdings, die das Potential unstrukturierter Daten bereits heute besser ausschöpfen können, sind nicht nur hochgradig innovativ, sie arbeiten auch optimiert mit Blick auf Kosten und Zeit.
Eine Frage der Definition: Nicht alle Daten sind gleich
Wenn Menschen an Daten denken, haben sie normalerweise automatisch strukturierte Daten im Sinn. In Wirklichkeit erzeugen Unternehmen, Kunden und Privatmenschen aber weitaus mehr unstrukturierte Daten.
Sowohl strukturierte als auch unstrukturierte Daten sind von unschätzbarem Wert. Allerdings unterscheiden sie sich deutlich. Als eine Gemeinsamkeit bergen beide Cloud-Potential.
Laut Fintech Futures machen unstrukturierte Daten etwa 80 Prozent aller Datenbanken aus. Wenn es darum geht, den Wert unstrukturierter Daten freizusetzen, nutzen allerdings bislang nur sehr wenige Unternehmen vollumfänglich die gesammelten Informationen. In einem Beitrag auf Fintech Futures stellt Ryan Stewart, Financial Services Lead bei Cloud Technology Solutions, fest: „Das größte Hindernis beispielsweise mit Blick auf den Bankensektor ist eine umfangreiche und veraltete IT-Infrastruktur, da 92 Prozent der 100 führenden Banken weltweit immer noch auf Legacy-Systeme angewiesen sind.“
Strukturierte und unstrukturierte Daten im Vergleich
Strukturierte Daten liegen in standardisierter Form vor, folgen einer vorab definierten Struktur, sind insgesamt einfach zugänglich und vergleichsweise relativ leicht zu analysieren. Sie können in Zeilen, Spalten, Tabellen, Tabellenkalkulationen und Datenbanken gespeichert werden. Nahezu die gesamte Datentechnologie der letzten Dekade wurde entwickelt, um sie zu verwalten.
Bei unstrukturierten Daten handelt es sich um ein natives Dateiformat und damit quasi um den „exzentrischen Cousin“ strukturierter Daten. 80 Prozent aller Unternehmensdaten sind heute unstrukturiert. Die Speicherung in Data Lakes bietet sich an. Unstrukturierte Daten stellen die Substanz des globalen Wandels, der Innovation, der Zusammenarbeit sowie der Transformation dar.
Unstrukturierte Daten als Motor der Zukunft
In allen Branchen nehmen unstrukturierte Daten explosionsartig zu. Laut führenden Analysten werden Unternehmen bis 2024 ihre unstrukturierten Daten (On-Premises, Edge- oder Cloud-gespeichert) verdreifachen. In einer Welt, in der Remote-Arbeit zu einer nicht mehr wegzudenkenden Realität geworden ist, ist die Cloud zudem nicht mehr optional.
Die Nutzung und Verwaltung unstrukturierter Daten steckt allerdings noch in den Kinderschuhen. Und wie unzählige Organisationen, die Daten mit veralteten Systemen verwalten und speichern, festgestellt haben, ist die Datentransformation leichter gesagt als getan.
Eine Herkulesaufgabe meistern: Bewusstmachung der Problemfelder
Nachfolgend sind sieben der häufigsten Gründe aufgezeigt, die veranschaulichen, weshalb viele Unternehmen das Potential unstrukturierter Daten nicht voll ausschöpfen können.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
1. Unternehmen straucheln mit Speicherkapazität und Datenzugänglichkeit
Rohdaten – oft von Sensoren, Kameras, Sequenzern, Autos oder Maschinen erfasst – sind zunächst von nachgeordneter Bedeutung. Die Umwandlung dieser Daten in Erkenntnisse, welche direkt Innovationen befördern, erfordert die präzise Zusammenarbeit über riesige Datenmengen hinweg. Dateninnovation setzt aber in erster Linie Datenzugänglichkeit voraus. Unternehmen sammeln oft Hunderte Terabyte oder gar ein Petabyte an Daten, die sie auf unbestimmte Zeit speichern müssen. Nur zum Vergleich: Dabei handelt es sich um das Speicheräquivalent von 1.000 Laptops. Weil die Datenmenge wächst, muss entsprechend auch der Speicherplatz dynamisch mitwachsen, ohne dass die Datenzugänglichkeit leidet.
2. Legacy-Systeme wurden nicht für moderne Workloads oder die Cloud entwickelt
Die alte Garde der Scale-Out- und Scale-Up-Lösungen war nie darauf ausgelegt, die heutigen Anwendungen, Dateitypen, Workloads und Volumen zu bewältigen. Mit Blick auf die beiden Hauptmethoden zum Speichern und Verwalten unstrukturierter Daten – Objektspeicher und Dateispeicher – sind nur Dateisysteme darauf ausgelegt, Daten in ihrem nativen Dateiformat zu bearbeiten. Legacy- und Objektspeichersysteme können nicht die Leistung, Sichtbarkeit, Portabilität, Kontrolle oder Skalierbarkeit bieten, die modernes Datenmanagement sowie die Cloud-Migration erfordern.
3. Legacy-Architektur schränkt die Skalierbarkeit ein
Legacy-Architekturen sind oft On-Premises und Hardware-gebunden. Speicher unterliegt demnach der Größe einer Rechenzentrumsarchitektur. Wenn die Rechenleistung skaliert wird, muss auch der Speicher skaliert werden. Aber Rechenzentrumsimmobilien sind kostenintensiv. Diese Grenzen können die Kreativität und die Erforschung neuer Möglichkeiten im Kontext unstrukturierter Daten direkt im Keim ersticken.
4. Datensilos verhindern Zugriff und Zusammenarbeit
Um Herausforderungen bei der Skalierbarkeit zu bewältigen, haben sich einige Unternehmen auf Speicher-Arrays oder aber mehrere Rechenzentren konzentriert. Während diese Lösungsansätze vorübergehend Speicherprobleme beheben können, erschweren Datensilos und unterschiedliche Speicher-Arrays im Umkehrschluss den Echtzeitzugriff sowie die Zusammenarbeit. Um Dateneinblicke zu optimieren und nutzbar zu machen, sind konsolidierte Daten ideal.
5. Konsolidierte Daten schränken die Speicheroptionen ein
Allerdings bergen auch konsolidierte Daten im Kontext von Aggregation, Datenbereinigung und Datenanreicherung Einschränkungen, vor allem mit Blick auf Speicheroptionen und Speicherkapazitäten. Weder Rechenzentren noch öffentliche Clouds bieten mehr als eine Handvoll begrenzter Speicheroptionen.
6. Die Konkurrenz migriert flugs in die Cloud
Führende Analysten prognostizieren, dass öffentliche Cloud-Dienste für 90 Prozent der Daten- und Analyseinnovationen bald unerlässlich sein werden. Zukunftsorientierte Unternehmen und Wettbewerber haben diese Prognose verinnerlicht. Sie verlagern Workflows in die Public Cloud. Unstrukturierte Daten beschleunigen diese Migration. Je schneller Unternehmen zur Public Cloud gelangen, desto mehr Wettbewerbsvorteile erzielen sie.
7. Top-Talente favorisieren häufig Remote-Work
Im Homeoffice fehlt es oft noch an ausreichender Infrastruktur, um mit großen Datenmengen produktiv zu sein. Top-Talente der Industrie favorisieren allerdings häufig Cloud-basierte Arbeitsplätze, die für Remote-Arbeit ausgelegt sind und die Zusammenarbeit erleichtern.
Ausblick auf morgen: Wer hat Angst vor unstrukturierten Daten?
Die Verwaltung, Speicherung und Umwandlung unstrukturierter Daten in großem Maßstab, um Innovationen voranzutreiben, mag für viele Unternehmen entmutigend erscheinen. Im Folgenden seien drei Ratschläge beleuchtet:
1. Bedachtsamkeit im Kontext der Zukunft ist Trumpf
Die Cloud ist heute nicht mehr wegzudenken. Mit AWS, Azure sowie Google Cloud Platform bestehen zahlreiche öffentliche Optionen. Aber was heute im Fokus steht, ist vielleicht morgen schon Teil einer größeren Transformation. IT-Entscheidungsträger tun gut daran, Bedachtsamkeit beim Blick auf die Zukunft walten zu lassen. Ideal ist der Fokus auf eine Infrastrukturstrategie, die zukünftige Flexibilität bietet.
2. Unternehmen müssen sich klar sein, worauf sie sich einlassen
IT-Entscheidungsträger müssen fokussiert und selektiv im Kontext ihrer individuellen Strategien vorgehen. Das Augenmerk sollte auf Anwendungen liegen, die einen Mehrwert für die jeweiligen Endnutzer schaffen. Infrastruktur-Software, mit der Praktiken standardisiert werden können und Komplexität zugleich reduziert erscheint, stellt immer einen Gewinn dar. Unternehmen sollten ferner eine stabile Dateidatenplattform wählen, die mit unstrukturierten Daten in ihrem nativen Dateiformat umgehen kann. Flexibler, kostengünstiger Speicher, der die Beschränkungen von Hardware, Rechenzentrum und Cloud überwindet, sollte im Mittelpunkt der Überlegungen stehen. Skepsis ist ferner geboten gegenüber Anbietern und Plattformen mit Lösungen, die diese Flexibilität missbrauchen.
3. Beim Wechsel in die Cloud zahlt sich in erster Linie Strategie aus
Wenn ein Unternehmen den Schritt in die Cloud wagt, hilft ein dreistufiges Framework:
1. Konsolidieren unstrukturierter Daten und Workloads an einem Ort. Dadurch werden die Kosten sowie die Komplexität der Verwaltung mehrerer Systeme reduziert.
2. Erweitern der Infrastruktur in die Public Cloud im Kontext unstrukturierter Daten. Dies kann durch Cloud-Bursts oder aber durch den Aufbau individueller Workloads erzielt werden.
3. Das Transformieren von Workflows und insgesamt das Verfolgen einer nachhaltigen digitalen Transformation nimmt Zeit in Anspruch. Unternehmen sollten geduldig sein, strategische Schritte mit kühlem Kopf planen und darauf achten, nicht direkt zur Transformationsphase überzugehen.
IT-Entscheidungsträger, die bereit sind, ihre jeweiligen Infrastrukturstrategien bescheiden und bewusst anzugehen, und die darüber hinaus den Willen zeigen, strategische Maßnahmen zu ergreifen, um in die Cloud zu wechseln, können Zeit und Geld sparen und zugleich Top-Talente halten. Mit der richtigen Lösung können Unternehmen Schritt für Schritt die volle Kontrolle über ihre Daten erlangen und zugleich den Wert und die Freiheit unstrukturierter Daten nutzen, um Innovationen im Wortsinn voranzutreiben.
Aktuelles eBook
Alle Daten im Griff – der Weg zum passenden Data-Management
eBook „Data-Management“
(Bild: Storage-Insider)
Daten nur zum Selbstzweck zu speichern, kann sich heute praktisch kein Unternehmen mehr leisten. Um den Überblick zu behalten und Nutzen aus den gespeicherten Daten zu ziehen, wird ein entsprechendes Datenmanagement benötigt. Unser neues eBook erläutert detailliert, worauf es dabei ankommt, welche Ansätze es gibt und wo Potenziale zur Verbesserung liegen.