Eine aktuelle Studie von Cloudera zeigt: Anwender speichern ihre Daten diverser denn je. Umso dringender sind für gelingende AI-Projekte Lösungen, die den Zugriff auf die Daten unabhängig von ihrem Speicherort gestatten.
„Wir sind Spezialisten dafür, Datensilos aufzubrechen und Daten da zu analysieren, wo sie sich befinden“: Benjamin Bohne, Vertriebsleiter Zentraleuropa bei Cloudera.
(Bild: Cloudera)
Cloudera, Anbieter einer Plattform für das Management des gesamten Daten-Lebenszyklus, präsentiert aktuell eine Studie, die belegt, wie unterschiedlich die Speicherorte sind, an denen Anwender ihre geschäftlichen Daten ablegen. Das ist besonders deshalb relevant, weil 97 Prozent der Befragten angaben, AI in realen Geschäftsprozessen zu nutzen und sie mit geschäftlichen Daten zu betreiben. Das ist die Grundlage für einen erfolgreichen AI-Einsatz.
An der Untersuchung, die von Research Scape im Auftrag von Cloudera durchgeführt wurde, nahmen 1.547 IT-Entscheider aus den USA, EMEA und der asiatisch-pazifischen Region teil. 118 von ihnen stammten aus Deutschland. Die befragten Unternehmen hatten mehr als 1.000 Beschäftigte. Über die Branchenverteilung macht Cloudera keine Angaben.
70 Prozent nutzen AI im Kerngeschäft
So speichern die deutschen Befragten ihre Daten.
(Bild: Cloudera)
Der Befragung zufolge haben 70 Prozent der Umfrageteilnehmer AI vollständig in ihr Kerngeschäft integriert, 27 Prozent nur teilweise. Diese Daten klingen gegenüber anderen Untersuchungen sehr positiv.
So meldete eine ebenfalls aktuelle Studie von Abbyy zwar einen ähnlich hohen KI-Nutzungsgrad (98 Prozent), aber nur bei 21 Prozent der Befragten wird damit die persönliche Produktivität gesteigert, und nur bei 36 Prozent ist AI in mehreren Abteilungen im Einsatz. Das kann daran liegen, dass bei dieser Untersuchung auch viele kleinere Firmen zum Zug kamen. Eine aktuelle Bitkom-Studie ergab eine AI-Nutzungsrate von 36 Prozent.
Die Hälfte der AI-Nutzer generiert damit Wertsteigerungen
Wie dem auch sei: Bei der Cloudera-Umfrage sagten die Hälfte der Antwortenden, dass sie signifikante Wertbeiträge durch ihre AI-Initiativen erwirtschaften konnten. 15 Prozent waren erfolgreich hinsichtlich einer Transformation ihrer Geschäftsprozesse.
Anwender nutzen diverse AI-Algorithmen: Deep Learning (53 %), generative AI (51 %), prognostische (47 %) und agentische AI (40 %), Klassifikation (37%), Regression (35 %) und überwachtes Lernen (34 %). 80 Prozent sagten, sie seien mehr oder weniger gut auf agentische AI vorbereitet, die wohl die nächste Welle der AI-Implementierung prägen wird.
Datenarchitekturen: sehr divers
Aus Clouderas Perspektive besonders interessant ist natürlich, welche Datenarchitekturen den Anwendungen zugrunde liegen. Hier zeigt sich, dass die Anwender ihre Daten grundsätzlich an mehreren unterschiedlichen Orten speichern, und dies mit national durchaus unterschiedlichen Vorlieben.
Beispielsweise ist in Brasilien bei 90 Prozent eine Private Cloud an der Dateninfrastruktur beteiligt, in Singapur nur bei 44 Prozent der Befragten. In den Vereinigten Arabischen Emiraten sind das Data Warehouse und die Public Cloud mit jeweils über 70 Prozent besonders beliebt, aber verteilte Datenspeicher On-Premises nennen immerhin 61 Prozent der Befragten. Für Data Lakes kann man sich am ehesten in Singapur begeistern, genau wie für andere physische Speichermedien (jeweils 44 Prozent).
Die Werte für Deutschland sehen wie folgt aus: 67 Prozent speichern in einer Private Cloud, 55 Prozent in einer Public Cloud. 31 Prozent nutzen ein Data Warehouse. Immerhin 27 Prozent haben einen On-Premises-Mainframe mit Speicher im Haus. 43 Prozent speichern mit verteilten Lösungen on Premises, aber nur 23 Prozent auf anderen physischen Medien. Immerhin 36 Prozent verwenden einen Data Lake und 17 Prozent ein Data Lakehouse.
In dieser Situation sieht Benjamin Bohne, Vertriebsleiter Zentraleuropa, einen großen Vorteil für sein Unternehmen: „Wir sind Spezialisten darin, die Silos aufzubrechen, indem wir die Daten da analysieren, wo sie sich befinden.“
Manko: unvollständiger Datenzugriff
Denn: Nur neun Prozent der Befragten haben vollständigen Zugriff auf die Daten ihrer Organisation, um sie zu analysieren. Das ist schlecht, wenn immerhin 69 Prozent der Befragten ihre Organisation entweder für datengetrieben oder sehr datengetrieben halten. 23 Prozent sagten, dass sie beinahe alle Daten nutzen könnten.
Auch das Vertrauen in die Daten steigt: 80 Prozent der Befragten gaben an, dass sie ihren Daten etwas mehr vertrauen als 2024. Nur 16 Prozent dagegen vertrauten ihnen sehr viel mehr.
Altbekannte Gründe hemmen AI
Das größte Hindernis für erfolgreiche AI-Projekte ist mangelhafte Datenintegration.
(Bild: Cloudera)
Die Gründe, warum Anwender bei der AI-Implementierung zögern, überraschen nicht: 37 Prozent erwähnten Compliance-Risiken, bei 35 Prozent fehlten Training und Spezialisten für das Management der AI-Tools und immerhin 32 beklagten sich darüber, dass ihre Dateninfrastruktur AI nicht ausreichend unterstützt.
Noch wichtiger sind aber Kostenrisiken. Hier wiegt am schwersten, dass wichtige Daten das Unternehmen verlassen könnten (41 %), die Speicherkosten als solches (41 %), Integrationskosten (49 %) und die Kosten von Einzellösungen (33 %).
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Open Source und Zukäufe
Cloudera löst Zugriffs- und Verfügbarkeitsprobleme weitgehend mit Hilfe von Open-Source-Technologie wie Apache Iceberg. Neben dem Datenmanagement und der Speicherung selbst befasst sich der Anbieter auch mit der Weiterverarbeitung von Daten.
„Auf Cloudera liegen immerhin 27 Exabyte“, sagt Bohne. Und diese Daten könnten dank der Cloudera-Technologie relativ reibungslos die Plattform wechseln.
Die Cloudera-Plattform wird ständig ausgebaut – auch durch Akquisen. Die letzten waren der Aufkauf von Octopai, einem Spezialisten für Data-Lineage. Das Produkt, das ausnahmsweise nicht der Open-Source-Welt entstammt, erzeugt hoch automatisiert eine Data-Lineage im Datenpool.
Es liefert also Informationen darüber, wie sich eine bestimmte Datei durchs Unternehmen bewegt hat, wer sie erzeugt oder verändert hat und wie. Diese Informationen sind insbesondere für Compliance und Daten-Governance bedeutsam.
Investition in Kubernetes
Auch Taikun kam hinzu. Die Kubernetes-Distribution soll Cloudera helfen, seine Lösung schnell auf wirklich allen Plattformen ausliefern zu können.
Die tschechische Firma bringt auch ein Entwicklungszentrum in Tschechien mit zu Cloudera, das erhalten bleiben soll. Weitere 200 der rund 3.000 Beschäftigten des Unternehmens arbeiten in einem ungarischen Entwicklungszentrum. In Deutschland beschäftigt Cloudera vor allem Vertriebsspezialisten.
Jetzt auch AI-Services
Ebenfalls ein Aufkauf ist Verta, das im Juni 24 dem Cloudera-Imperium einverleibt wurde. Das MLOps-Tool verwaltet im Unternehmensumfeld unterschiedliche AI-Modelle.
Zudem schickt sich der Anbieter an, seine Plattform zur Basis neuer AI-Services zu machen. Beispielsweise bietet er jetzt einen KI-Inferenzservice an. Er ist erst seit diesem Jahr breit verfügbar.
Aktuelles eBook
Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)
Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?
Die Themen im Überblick:
Aktuelle Trends in der Künstlichen Intelligenz
High-Performance Computing – Explosion der Innovationen