Mobile-Menu

Cohesity Gaia Neuer Suchassistent für sekundäre Firmendaten mit generativer KI

Von Michael Matzer 6 min Lesedauer

Anbieter zum Thema

Cohesity hat mit Gaia einen Suchassistenten vorgestellt, mit dessen Hilfe Anwender sprachgesteuert große Datenbestände durchforsten können sollen. Auf der Grundlage der Cohesity Data Cloud und Cohesity Turing nutzt Gaia erstmals Retrieval Augmented Generation (RAG) und LLMs von Google, um auch die sekundären Backup-Daten in Cohesity-Umgebungen suchbar zu machen. Verfügbar wird Gaia Mitte März.

Der KI-Assistent Cohesity Gaia macht die Datensuche „menschlicher“: Er empfängt Fragen in natürlicher Sprache und antwortet.(Bild:  ©Just_Super, Getty Images Signature via Canva.com)
Der KI-Assistent Cohesity Gaia macht die Datensuche „menschlicher“: Er empfängt Fragen in natürlicher Sprache und antwortet.
(Bild: ©Just_Super, Getty Images Signature via Canva.com)

Anwender können dem KI-Assistenten Cohesity Gaia in natürlicher Sprache Fragen stellen und Antworten erhalten. Dazu greift Gaia auf die umfangreichen Datenbestände des Unternehmens zu und analysiert diese. In Verbindung mit der Cohesity Data Cloud soll er Daten in Wissen verwandeln. Dies soll Firmen helfen, ihre Ziele schneller zu erreichen und gleichzeitig die Sicherheit und Compliance ihrer Daten zu gewährleisten, beispielsweise wenn es um Gesundheits- oder Justizdaten geht. Cohesity plant nach CEO Sanjay Poonens Worten zudem, die LLM-Services der drei größten Public-Cloud-Anbieter mit Cohesity Gaia zu verbinden, also Google Vertex/Gemini, Azure AI und AWS Bedrock/Titan.

Bildergalerie
Bildergalerie mit 8 Bildern

Die zugrunde liegende Architektur basiert auf der Cohesity Data Cloud, in der Unternehmensdaten als Backups gesichert und verwaltet werden. Da die RAG-KI-Lösung auf der Multi-Cloud-Plattform von Cohesity aufbaut, soll die Suchfunktion über Cloud- und Hybrid-Umgebungen hinweg arbeiten. So können Unternehmen künftig tiefere, weiter reichende Einblicke in ihre Daten gewinnen und schneller fundierte Entscheidungen treffen, unabhängig davon, wo sich ihre Daten befinden.

Cohesity werde eine vollständig indizierte Datenbank aller Dateien erstellen, die über alle Workloads hinweg jeden Zeitpunkt erfasst. Diese Indizierungsfunktion unterstütze die Erstellung KI-fähiger Indizes (durch RAG, s. u.) für schnelle Suche und Antworten in natürlicher Sprache, die Unternehmen sofortige und treffsichere Ergebnisse liefern. Zunächst will Cohesity Daten von Microsoft 365 und OneDrive unterstützen, weitere Workloads sollen folgen. Cohesity arbeitet auf vielen Ebenen eng mit Microsoft zusammen.

Über RAG

Retrieval Augmented Generation (RAG) ist eine Technik zur Verarbeitung natürlicher Sprache, welche die Vorteile Retrieval-basierter und generativer Ansätze kombiniert, um die Qualität der Texterstellung zu verbessern. Dazu gehören die Beantwortung von Fragen, Zusammenfassungen und Konversations-KI.

RAG-Modelle kombinieren die Stärken von LLMs mit der Fähigkeit, Informationen aus mehreren Quellen abzurufen. RAG ermöglicht es LLMs, fundiertere, vielfältigere und relevantere Antworten zu erzeugen, und bietet einen effizienteren Ansatz zur Feinabstimmung dieser Modelle.

Data Lake für Analytics

Die Architektur von Cohesity Gaia stelle sicher, so Cohesity, dass alle indizierten Daten sofort zum Lesen verfügbar sind, ohne dass Backups rekonstruiert werden müssen. Dadurch kann die Cohesity Data Cloud wie ein Data Lake funktionieren und Unternehmen einen Echtzeitzugang zu ihren Daten für Analysen und Entscheidungen bieten. Die Latenzzeit bis zum Lesen der Daten soll minimal sein.

Responsible AI

Das Herzstück der KI-Technologien von Cohesity ist Cohesity Turing (Storage-Insider berichtete), eine Sammlung von KI-Funktionen und -Technologien, die in die Multi-Cloud-Datenmanagement- und Sicherheitsplattform von Cohesity integriert sind sowie Einblicke in Betrieb und Daten liefern. Die Grundlage für diese KI-Innovationen bildet das Konzept der „verantwortungsvollen KI“. Geeignete Funktionen und Frameworks sollen es Kunden ermöglichen, KI für den Daten-Backup sicher und skalierbar einzusetzen.

Die Cohesity Data Cloud verwendet granulare rollenbasierte Zugriffskontrollen und einen Zero-Trust-Ansatz, damit nur autorisierte Nutzer und Modelle Zugang zu den Daten erhalten. Dies schütze nicht nur sensible Informationen, sondern helfe Unternehmen auch bei der Einhaltung gesetzlicher Vorgaben.

Alle Lösungen von Cohesity Turing entsprechen laut Hersteller den Prinzipien der verantwortungsvollen KI; zunächst Transparenz, also dem Schutz des Datenzugangs durch rollenbasierte Zugriffskontrollen. Dies biete höhere Transparenz und Verantwortlichkeit in Bezug auf Zugriff und Richtlinien. Zweitens Governance: Sie gewährleiste Datenschutz und -sicherheit für die von KI-Modellen und Mitarbeitern verwendeten Informationen. So seien die richtigen Daten nur den richtigen Personen (und Modellen) mit den richtigen Berechtigungen zugänglich. Drittens der gesicherte Zugriff, also die sichere und einfache Integration indizierter und durchsuchbarer Daten. Diese seien zudem unveränderlich und resilient.

Keine 08/15-Query Engine

In einer Präsentation vor der Presse sagte Greg Stratton, der das Amt des CTO bei Cohesity innehat: „Es ist wichtig zu verstehen, dass Cohesity Gaia nicht wie eine Suchmaschine Daten abruft, sondern Fragen beantwortet. Wer zum Beispiel einen Kostenanstieg in einer Region bemerkt, würde normalerweise Dutzende von Rechnungen suchen, überprüfen und vergleichen, um den Grund dafür herauszufinden. Die Klärung kann Stunden, Tage oder Wochen dauern. Mit Gaia fragen Sie einfach: Warum sind die Kosten in dieser Region gestiegen? Gaia zieht die relevanten Informationen aus den gespeicherten Daten, analysiert sie und beantwortet Ihre Frage. So einfach ist das.“

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Verwendung von LLMs

Wenn Unternehmen LLMs nutzen wollen, müssen sie mehrere Herausforderungen meistern. Entwickler müssen zunächst mehrere Kopien der Daten erstellen, wodurch die Gefahr für Angriffe steigt. Außerdem können die Daten unvollständig oder veraltet sein. Schließlich erfordert dieser Ansatz hohen Zeit- und Ressourcenaufwand und belastet die Systemleistung. Stratton erläutert: „Cohesity Gaia vermeidet diese Herausforderungen durch die Integration von KI-Funktionen in die Backup-Umgebung des Kunden.“ Die Logik kommt also zu den Daten statt umgekehrt.

Use Cases

Cohesity Gaia soll, wie gesagt, Unternehmen helfen, bessere und schnellere Entscheidungen in einer Vielzahl von Anwendungsfällen zu treffen, zum Beispiel:

  • Bewerten der Cyber-Resilienz einer Organisation,
  • schnelle Finanz- und Compliance-Prüfungen,
  • Beantworten komplexer rechtlicher Fragen,
  • Wissensbasis für die Schulung neuer Mitarbeiter.

Sekundäre Daten

„Unternehmen wollen die Kraft generativer KI nutzen, hatten aber Probleme, Wissen aus ihren sekundären Daten zu ziehen, seien es die Backups oder archivierte Daten“, sagt Sanjay Poonen, CEO und President von Cohesity. „Denn bei jedem Ansatz müssen die Daten rekonstruiert werden. Es dauert oft wochenlang, bis die Daten für Analysen und Einblicke zur Verfügung stehen.“ Insbesondere dann, wenn die Daten in Archiv-Services vom Typ „AWS S3 Glacier“ abgelegt sind. Auch die Egress-Gebühr schlägt mit Kosten zu Buche.

Poonen weiter: „Cohesity Gaia vereinfacht diesen Prozess mit unserem zum Patent angemeldeten Ansatz auf Basis der Retrieval Augmented Generation (RAG) deutlich. Mit Cohesity Gaia werden Unternehmen erstmals generative KI nutzen, um ihre Daten praktisch nahtlos abzufragen. Unsere Lösung liefert schnelle, aufschlussreiche Ergebnisse ohne die Nachteile manueller und risikoreicher Ansätze. Kurz gesagt, sie verwandelt Daten innerhalb von Sekunden und Minuten in Wissen.“

Bildergalerie
Bildergalerie mit 8 Bildern

Anwenderstimme

In der erwähnten Präsentation kam ein Anwender von einigem Gewicht und Ansehen zu Wort. „Wir sind ein internationales Unternehmen für Materialforschung und -herstellung mit Forschungszentren an vielen Standorten, wo unsere Forscher verschiedene Sprachen nutzen“, so Ryan Reed, Head of IT der JSR Corporation.

„Wir möchten mit Hilfe generativer KI schnell herausfinden, ob sich die an einem Standort geleistete Arbeit auf andere Projekte anwenden lässt. Mit Cohesity Gaia können wir unseren umfangreichen Bestand an Forschungsdaten abfragen und schnell relevante Arbeiten finden, wobei unsere Forscher das System in ihrer jeweiligen Muttersprache verwenden. Dies könnte sich als unglaublich wertvoll erweisen, um unsere Forschung zu beschleunigen.“

Analystenstimme

„Cohesity ist der erste Anbieter von Datensicherheit und -management, der mit dem KI-Suchassistenten Cohesity Gaia die Leistungsfähigkeit der KI-Suche für Unternehmen nutzbar macht“, sagt Russ Fellows, Vice President, The Futurum Group Labs.

„Gaia nutzt generative KI mit den neuesten RAG-Erweiterungen, um eine dialogorientierte Suche in sekundären, geschützten Daten zu ermöglichen. Mit Gaia können Unternehmen ihre vorhandenen gespeicherten Daten mit der Leistung generativer KI schnell nutzen sowie gleichzeitig Datensicherheit und Compliance wahren. Dank Cohesity Gaia wandeln Kunden schnell Daten in Erkenntnisse um, ohne selbst eine KI-Anwendung erstellen oder sich um Schutz und Sicherheit ihrer Daten sorgen zu müssen.“

Ein Effekt, den alle drei Zitatgeber nicht nennen, ist die Nachhaltigkeit der Lösung: Je weniger Zeit und Rechenleistung auf langwierige Suchvorgänge verschwendet wird, desto geringer dürften auch der CO2-Ausstoß und der Kühlungsbedarf der beteiligten Rechner sein. Der Effekt würde indes eine genaue ESG-Berechnung erfordern.

Verfügbarkeit

Cohesity Gaia ist ab 15. März für Cohesity-Kunden verfügbar.

Aktuelles eBook

Storage für HPC & KI

eBook Storage für HPC & KI
eBook „Storage für HPC & KI“
(Bild: Storage-Insider)

Speichersysteme für das HPC und für die verschiedenen Disziplinen der KI sind hohen Anforderungen ausgesetzt. Denn sie müssen enorme Datenmengen in kürzester Zeit bereitstellen oder sammeln. Wie können diese Herausforderungen gemeistert werden?

Die Themen im Überblick:

  • Aktuelle Trends in der Künstlichen Intelligenz
  • High-Performance Computing – Explosion der Innovationen
  • Künstliche Intelligenz – nahezu Echtzeit-Datenverarbeitung

(ID:49945432)