Mobile-Menu

AI-Storage Diverse Datenspeicher – Cloudera baut Softwaredach

Von lic.rer.publ. Ariane Rüdiger 4 min Lesedauer

Anbieter zum Thema

Eine aktuelle Studie von Cloudera zeigt: Anwender speichern ihre Daten diverser denn je. Umso dringender sind für gelingende AI-Projekte Lösungen, die den Zugriff auf die Daten unabhängig von ihrem Speicherort gestatten.

„Wir sind Spezialisten dafür, Datensilos aufzubrechen und Daten da zu analysieren, wo sie sich befinden“: Benjamin Bohne, Vertriebsleiter Zentraleuropa bei Cloudera.(Bild:  Cloudera)
„Wir sind Spezialisten dafür, Datensilos aufzubrechen und Daten da zu analysieren, wo sie sich befinden“: Benjamin Bohne, Vertriebsleiter Zentraleuropa bei Cloudera.
(Bild: Cloudera)

Cloudera, Anbieter einer Plattform für das Management des gesamten Daten-Lebenszyklus, präsentiert aktuell eine Studie, die belegt, wie unterschiedlich die Speicherorte sind, an denen Anwender ihre geschäftlichen Daten ablegen. Das ist besonders deshalb relevant, weil 97 Prozent der Befragten angaben, AI in realen Geschäftsprozessen zu nutzen und sie mit geschäftlichen Daten zu betreiben. Das ist die Grundlage für einen erfolgreichen AI-Einsatz.

An der Untersuchung, die von Research Scape im Auftrag von Cloudera durchgeführt wurde, nahmen 1.547 IT-Entscheider aus den USA, EMEA und der asiatisch-pazifischen Region teil. 118 von ihnen stammten aus Deutschland. Die befragten Unternehmen hatten mehr als 1.000 Beschäftigte. Über die Branchenverteilung macht Cloudera keine Angaben.

70 Prozent nutzen AI im Kerngeschäft

So speichern die deutschen Befragten ihre Daten.(Bild:  Cloudera)
So speichern die deutschen Befragten ihre Daten.
(Bild: Cloudera)

Der Befragung zufolge haben 70 Prozent der Umfrageteilnehmer AI vollständig in ihr Kerngeschäft integriert, 27 Prozent nur teilweise. Diese Daten klingen gegenüber anderen Untersuchungen sehr positiv.

So meldete eine ebenfalls aktuelle Studie von Abbyy zwar einen ähnlich hohen KI-Nutzungsgrad (98 Prozent), aber nur bei 21 Prozent der Befragten wird damit die persönliche Produktivität gesteigert, und nur bei 36 Prozent ist AI in mehreren Abteilungen im Einsatz. Das kann daran liegen, dass bei dieser Untersuchung auch viele kleinere Firmen zum Zug kamen. Eine aktuelle Bitkom-Studie ergab eine AI-Nutzungsrate von 36 Prozent.

Die Hälfte der AI-Nutzer generiert damit Wertsteigerungen

Wie dem auch sei: Bei der Cloudera-Umfrage sagten die Hälfte der Antwortenden, dass sie signifikante Wertbeiträge durch ihre AI-Initiativen erwirtschaften konnten. 15 Prozent waren erfolgreich hinsichtlich einer Transformation ihrer Geschäftsprozesse.

Anwender nutzen diverse AI-Algorithmen: Deep Learning (53 %), generative AI (51 %), prognostische (47 %) und agentische AI (40 %), Klassifikation (37%), Regression (35 %) und überwachtes Lernen (34 %). 80 Prozent sagten, sie seien mehr oder weniger gut auf agentische AI vorbereitet, die wohl die nächste Welle der AI-Implementierung prägen wird.

Datenarchitekturen: sehr divers

Aus Clouderas Perspektive besonders interessant ist natürlich, welche Datenarchitekturen den Anwendungen zugrunde liegen. Hier zeigt sich, dass die Anwender ihre Daten grundsätzlich an mehreren unterschiedlichen Orten speichern, und dies mit national durchaus unterschiedlichen Vorlieben.

Beispielsweise ist in Brasilien bei 90 Prozent eine Private Cloud an der Dateninfrastruktur beteiligt, in Singapur nur bei 44 Prozent der Befragten. In den Vereinigten Arabischen Emiraten sind das Data Warehouse und die Public Cloud mit jeweils über 70 Prozent besonders beliebt, aber verteilte Datenspeicher On-Premises nennen immerhin 61 Prozent der Befragten. Für Data Lakes kann man sich am ehesten in Singapur begeistern, genau wie für andere physische Speichermedien (jeweils 44 Prozent).

Datenarchitekturen in Deutschland

Die Werte für Deutschland sehen wie folgt aus: 67 Prozent speichern in einer Private Cloud, 55 Prozent in einer Public Cloud. 31 Prozent nutzen ein Data Warehouse. Immerhin 27 Prozent haben einen On-Premises-Mainframe mit Speicher im Haus. 43 Prozent speichern mit verteilten Lösungen on Premises, aber nur 23 Prozent auf anderen physischen Medien. Immerhin 36 Prozent verwenden einen Data Lake und 17 Prozent ein Data Lakehouse.

In dieser Situation sieht Benjamin Bohne, Vertriebsleiter Zentraleuropa, einen großen Vorteil für sein Unternehmen: „Wir sind Spezialisten darin, die Silos aufzubrechen, indem wir die Daten da analysieren, wo sie sich befinden.“

Manko: unvollständiger Datenzugriff

Denn: Nur neun Prozent der Befragten haben vollständigen Zugriff auf die Daten ihrer Organisation, um sie zu analysieren. Das ist schlecht, wenn immerhin 69 Prozent der Befragten ihre Organisation entweder für datengetrieben oder sehr datengetrieben halten. 23 Prozent sagten, dass sie beinahe alle Daten nutzen könnten.

Auch das Vertrauen in die Daten steigt: 80 Prozent der Befragten gaben an, dass sie ihren Daten etwas mehr vertrauen als 2024. Nur 16 Prozent dagegen vertrauten ihnen sehr viel mehr.

Altbekannte Gründe hemmen AI

Das größte Hindernis für erfolgreiche AI-Projekte ist mangelhafte Datenintegration.(Bild:  Cloudera)
Das größte Hindernis für erfolgreiche AI-Projekte ist mangelhafte Datenintegration.
(Bild: Cloudera)

Die Gründe, warum Anwender bei der AI-Implementierung zögern, überraschen nicht: 37 Prozent erwähnten Compliance-Risiken, bei 35 Prozent fehlten Training und Spezialisten für das Management der AI-Tools und immerhin 32 beklagten sich darüber, dass ihre Dateninfrastruktur AI nicht ausreichend unterstützt.

Noch wichtiger sind aber Kostenrisiken. Hier wiegt am schwersten, dass wichtige Daten das Unternehmen verlassen könnten (41 %), die Speicherkosten als solches (41 %), Integrationskosten (49 %) und die Kosten von Einzellösungen (33 %).

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Open Source und Zukäufe

Cloudera löst Zugriffs- und Verfügbarkeitsprobleme weitgehend mit Hilfe von Open-Source-Technologie wie Apache Iceberg. Neben dem Datenmanagement und der Speicherung selbst befasst sich der Anbieter auch mit der Weiterverarbeitung von Daten.

„Auf Cloudera liegen immerhin 27 Exabyte“, sagt Bohne. Und diese Daten könnten dank der Cloudera-Technologie relativ reibungslos die Plattform wechseln.

Die Cloudera-Plattform wird ständig ausgebaut – auch durch Akquisen. Die letzten waren der Aufkauf von Octopai, einem Spezialisten für Data-Lineage. Das Produkt, das ausnahmsweise nicht der Open-Source-Welt entstammt, erzeugt hoch automatisiert eine Data-Lineage im Datenpool.

Es liefert also Informationen darüber, wie sich eine bestimmte Datei durchs Unternehmen bewegt hat, wer sie erzeugt oder verändert hat und wie. Diese Informationen sind insbesondere für Compliance und Daten-Governance bedeutsam.

Investition in Kubernetes

Auch Taikun kam hinzu. Die Kubernetes-Distribution soll Cloudera helfen, seine Lösung schnell auf wirklich allen Plattformen ausliefern zu können.

Die tschechische Firma bringt auch ein Entwicklungszentrum in Tschechien mit zu Cloudera, das erhalten bleiben soll. Weitere 200 der rund 3.000 Beschäftigten des Unternehmens arbeiten in einem ungarischen Entwicklungszentrum. In Deutschland beschäftigt Cloudera vor allem Vertriebsspezialisten.

Jetzt auch AI-Services

Ebenfalls ein Aufkauf ist Verta, das im Juni 24 dem Cloudera-Imperium einverleibt wurde. Das MLOps-Tool verwaltet im Unternehmensumfeld unterschiedliche AI-Modelle.

Zudem schickt sich der Anbieter an, seine Plattform zur Basis neuer AI-Services zu machen. Beispielsweise bietet er jetzt einen KI-Inferenzservice an. Er ist erst seit diesem Jahr breit verfügbar.

Aktuelles eBook

Storage für HPC & KI

eBook Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)

Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?

Die Themen im Überblick:

  • Aktuelle Trends in der Künstlichen Intelligenz
  • High-Performance Computing – Explosion der Innovationen
  • Künstliche Intelligenz – nahezu Echtzeit-Datenverarbeitung

(ID:50582995)