Cohesity hat mit Gaia einen Suchassistenten vorgestellt, mit dessen Hilfe Anwender sprachgesteuert große Datenbestände durchforsten können sollen. Auf der Grundlage der Cohesity Data Cloud und Cohesity Turing nutzt Gaia erstmals Retrieval Augmented Generation (RAG) und LLMs von Google, um auch die sekundären Backup-Daten in Cohesity-Umgebungen suchbar zu machen. Verfügbar wird Gaia Mitte März.
Der KI-Assistent Cohesity Gaia macht die Datensuche „menschlicher“: Er empfängt Fragen in natürlicher Sprache und antwortet.
Anwender können dem KI-Assistenten Cohesity Gaia in natürlicher Sprache Fragen stellen und Antworten erhalten. Dazu greift Gaia auf die umfangreichen Datenbestände des Unternehmens zu und analysiert diese. In Verbindung mit der Cohesity Data Cloud soll er Daten in Wissen verwandeln. Dies soll Firmen helfen, ihre Ziele schneller zu erreichen und gleichzeitig die Sicherheit und Compliance ihrer Daten zu gewährleisten, beispielsweise wenn es um Gesundheits- oder Justizdaten geht. Cohesity plant nach CEO Sanjay Poonens Worten zudem, die LLM-Services der drei größten Public-Cloud-Anbieter mit Cohesity Gaia zu verbinden, also Google Vertex/Gemini, Azure AI und AWS Bedrock/Titan.
Die zugrunde liegende Architektur basiert auf der Cohesity Data Cloud, in der Unternehmensdaten als Backups gesichert und verwaltet werden. Da die RAG-KI-Lösung auf der Multi-Cloud-Plattform von Cohesity aufbaut, soll die Suchfunktion über Cloud- und Hybrid-Umgebungen hinweg arbeiten. So können Unternehmen künftig tiefere, weiter reichende Einblicke in ihre Daten gewinnen und schneller fundierte Entscheidungen treffen, unabhängig davon, wo sich ihre Daten befinden.
Cohesity werde eine vollständig indizierte Datenbank aller Dateien erstellen, die über alle Workloads hinweg jeden Zeitpunkt erfasst. Diese Indizierungsfunktion unterstütze die Erstellung KI-fähiger Indizes (durch RAG, s. u.) für schnelle Suche und Antworten in natürlicher Sprache, die Unternehmen sofortige und treffsichere Ergebnisse liefern. Zunächst will Cohesity Daten von Microsoft 365 und OneDrive unterstützen, weitere Workloads sollen folgen. Cohesity arbeitet auf vielen Ebenen eng mit Microsoft zusammen.
Über RAG
Retrieval Augmented Generation (RAG) ist eine Technik zur Verarbeitung natürlicher Sprache, welche die Vorteile Retrieval-basierter und generativer Ansätze kombiniert, um die Qualität der Texterstellung zu verbessern. Dazu gehören die Beantwortung von Fragen, Zusammenfassungen und Konversations-KI.
RAG-Modelle kombinieren die Stärken von LLMs mit der Fähigkeit, Informationen aus mehreren Quellen abzurufen. RAG ermöglicht es LLMs, fundiertere, vielfältigere und relevantere Antworten zu erzeugen, und bietet einen effizienteren Ansatz zur Feinabstimmung dieser Modelle.
Data Lake für Analytics
Die Architektur von Cohesity Gaia stelle sicher, so Cohesity, dass alle indizierten Daten sofort zum Lesen verfügbar sind, ohne dass Backups rekonstruiert werden müssen. Dadurch kann die Cohesity Data Cloud wie ein Data Lake funktionieren und Unternehmen einen Echtzeitzugang zu ihren Daten für Analysen und Entscheidungen bieten. Die Latenzzeit bis zum Lesen der Daten soll minimal sein.
Responsible AI
Das Herzstück der KI-Technologien von Cohesity ist Cohesity Turing (Storage-Insider berichtete), eine Sammlung von KI-Funktionen und -Technologien, die in die Multi-Cloud-Datenmanagement- und Sicherheitsplattform von Cohesity integriert sind sowie Einblicke in Betrieb und Daten liefern. Die Grundlage für diese KI-Innovationen bildet das Konzept der „verantwortungsvollen KI“. Geeignete Funktionen und Frameworks sollen es Kunden ermöglichen, KI für den Daten-Backup sicher und skalierbar einzusetzen.
Die Cohesity Data Cloud verwendet granulare rollenbasierte Zugriffskontrollen und einen Zero-Trust-Ansatz, damit nur autorisierte Nutzer und Modelle Zugang zu den Daten erhalten. Dies schütze nicht nur sensible Informationen, sondern helfe Unternehmen auch bei der Einhaltung gesetzlicher Vorgaben.
Alle Lösungen von Cohesity Turing entsprechen laut Hersteller den Prinzipien der verantwortungsvollen KI; zunächst Transparenz, also dem Schutz des Datenzugangs durch rollenbasierte Zugriffskontrollen. Dies biete höhere Transparenz und Verantwortlichkeit in Bezug auf Zugriff und Richtlinien. Zweitens Governance: Sie gewährleiste Datenschutz und -sicherheit für die von KI-Modellen und Mitarbeitern verwendeten Informationen. So seien die richtigen Daten nur den richtigen Personen (und Modellen) mit den richtigen Berechtigungen zugänglich. Drittens der gesicherte Zugriff, also die sichere und einfache Integration indizierter und durchsuchbarer Daten. Diese seien zudem unveränderlich und resilient.
Keine 08/15-Query Engine
In einer Präsentation vor der Presse sagte Greg Stratton, der das Amt des CTO bei Cohesity innehat: „Es ist wichtig zu verstehen, dass Cohesity Gaia nicht wie eine Suchmaschine Daten abruft, sondern Fragen beantwortet. Wer zum Beispiel einen Kostenanstieg in einer Region bemerkt, würde normalerweise Dutzende von Rechnungen suchen, überprüfen und vergleichen, um den Grund dafür herauszufinden. Die Klärung kann Stunden, Tage oder Wochen dauern. Mit Gaia fragen Sie einfach: Warum sind die Kosten in dieser Region gestiegen? Gaia zieht die relevanten Informationen aus den gespeicherten Daten, analysiert sie und beantwortet Ihre Frage. So einfach ist das.“
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Wenn Unternehmen LLMs nutzen wollen, müssen sie mehrere Herausforderungen meistern. Entwickler müssen zunächst mehrere Kopien der Daten erstellen, wodurch die Gefahr für Angriffe steigt. Außerdem können die Daten unvollständig oder veraltet sein. Schließlich erfordert dieser Ansatz hohen Zeit- und Ressourcenaufwand und belastet die Systemleistung. Stratton erläutert: „Cohesity Gaia vermeidet diese Herausforderungen durch die Integration von KI-Funktionen in die Backup-Umgebung des Kunden.“ Die Logik kommt also zu den Daten statt umgekehrt.
Use Cases
Cohesity Gaia soll, wie gesagt, Unternehmen helfen, bessere und schnellere Entscheidungen in einer Vielzahl von Anwendungsfällen zu treffen, zum Beispiel:
Bewerten der Cyber-Resilienz einer Organisation,
schnelle Finanz- und Compliance-Prüfungen,
Beantworten komplexer rechtlicher Fragen,
Wissensbasis für die Schulung neuer Mitarbeiter.
Sekundäre Daten
„Unternehmen wollen die Kraft generativer KI nutzen, hatten aber Probleme, Wissen aus ihren sekundären Daten zu ziehen, seien es die Backups oder archivierte Daten“, sagt Sanjay Poonen, CEO und President von Cohesity. „Denn bei jedem Ansatz müssen die Daten rekonstruiert werden. Es dauert oft wochenlang, bis die Daten für Analysen und Einblicke zur Verfügung stehen.“ Insbesondere dann, wenn die Daten in Archiv-Services vom Typ „AWS S3 Glacier“ abgelegt sind. Auch die Egress-Gebühr schlägt mit Kosten zu Buche.
Poonen weiter: „Cohesity Gaia vereinfacht diesen Prozess mit unserem zum Patent angemeldeten Ansatz auf Basis der Retrieval Augmented Generation (RAG) deutlich. Mit Cohesity Gaia werden Unternehmen erstmals generative KI nutzen, um ihre Daten praktisch nahtlos abzufragen. Unsere Lösung liefert schnelle, aufschlussreiche Ergebnisse ohne die Nachteile manueller und risikoreicher Ansätze. Kurz gesagt, sie verwandelt Daten innerhalb von Sekunden und Minuten in Wissen.“
In der erwähnten Präsentation kam ein Anwender von einigem Gewicht und Ansehen zu Wort. „Wir sind ein internationales Unternehmen für Materialforschung und -herstellung mit Forschungszentren an vielen Standorten, wo unsere Forscher verschiedene Sprachen nutzen“, so Ryan Reed, Head of IT der JSR Corporation.
„Wir möchten mit Hilfe generativer KI schnell herausfinden, ob sich die an einem Standort geleistete Arbeit auf andere Projekte anwenden lässt. Mit Cohesity Gaia können wir unseren umfangreichen Bestand an Forschungsdaten abfragen und schnell relevante Arbeiten finden, wobei unsere Forscher das System in ihrer jeweiligen Muttersprache verwenden. Dies könnte sich als unglaublich wertvoll erweisen, um unsere Forschung zu beschleunigen.“
Analystenstimme
„Cohesity ist der erste Anbieter von Datensicherheit und -management, der mit dem KI-Suchassistenten Cohesity Gaia die Leistungsfähigkeit der KI-Suche für Unternehmen nutzbar macht“, sagt Russ Fellows, Vice President, The Futurum Group Labs.
„Gaia nutzt generative KI mit den neuesten RAG-Erweiterungen, um eine dialogorientierte Suche in sekundären, geschützten Daten zu ermöglichen. Mit Gaia können Unternehmen ihre vorhandenen gespeicherten Daten mit der Leistung generativer KI schnell nutzen sowie gleichzeitig Datensicherheit und Compliance wahren. Dank Cohesity Gaia wandeln Kunden schnell Daten in Erkenntnisse um, ohne selbst eine KI-Anwendung erstellen oder sich um Schutz und Sicherheit ihrer Daten sorgen zu müssen.“
Ein Effekt, den alle drei Zitatgeber nicht nennen, ist die Nachhaltigkeit der Lösung: Je weniger Zeit und Rechenleistung auf langwierige Suchvorgänge verschwendet wird, desto geringer dürften auch der CO2-Ausstoß und der Kühlungsbedarf der beteiligten Rechner sein. Der Effekt würde indes eine genaue ESG-Berechnung erfordern.
Verfügbarkeit
Cohesity Gaia ist ab 15. März für Cohesity-Kunden verfügbar.
Aktuelles eBook
Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)
Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?
Die Themen im Überblick:
Aktuelle Trends in der Künstlichen Intelligenz
High-Performance Computing – Explosion der Innovationen