Mobile-Menu

Kioxia-AiSAQ-Software Balance bei Vektordatenbank-Suche in RAGs

Von Barbara Gribl 2 min Lesedauer

Anbieter zum Thema

Mit seiner optimierten Softwareversion will Kioxia eine Open-Source-Lösung für skalierbare, KI-gestützte Anwendungen bieten. Die optimierte SSD-Nutzung ermöglicht ein gutes Gleichgewicht zwischen Suchleistung und Vektoranzahl, ohne Hardwareänderungen.

Kioxia meistert den Balanceakt zwischen Leistung und Zugänglichkeit, indem es seine SSD-zentrierten Architekturen als Open-Source-Version zur Unterstützung der KI-Community bereitstellt.(Bild: ©  Happyphotons - stock.adobe.com)
Kioxia meistert den Balanceakt zwischen Leistung und Zugänglichkeit, indem es seine SSD-zentrierten Architekturen als Open-Source-Version zur Unterstützung der KI-Community bereitstellt.
(Bild: © Happyphotons - stock.adobe.com)

Kioxia hat die Open-Source-Version seiner AiSAQ-Software (All-in-Storage-ANNS with Product Quantization) weiterentwickelt. Dabei liegt der Fokus des Unternehmens auf der Verbesserung der Benutzerfreundlichkeit der KI-gestützten Vektordatenbanksuche in RAG-Systemen (Retrieval Augmented Generation). Diese soll durch eine optimierte Nutzung von Solid-State-Laufwerken (SSDs) erreicht werden.

Dank neuer Steuerungsfunktionen sollen Systemarchitekten nun einfacher das Verhältnis zwischen Suchleistung und der Menge an Vektoren festlegen können, die bei gleichbleibender SSD-Speicherkapazität im System konkurrieren. Dadurch sollen Architekten von RAG-Systemen die Möglichkeit haben, ohne Änderungen an der Hardware die ideale Balance zwischen spezifischen Workloads und deren Anforderungen herzustellen.

Kioxias AiSAQ-Software optimiert Vektordatenbanksuche auf SSDs

Die AiSAQ-Software von Kioxia, die erstmals im Januar 2025 vorgestellt wurde, nutzt einen innovativen ANNS-Algorithmus (Approximate Nearest Neighbor Search), der speziell für SSDs optimiert wurde und das Speichern von Indexdaten im DRAM überflüssig machen soll. Das ermöglicht die Vektorsuche direkt auf SSDs und reduziert den Speicherbedarf auf dem Host. Diese Technologie gestattet die Skalierung von Vektordatenbanken, ohne durch die begrenzte DRAM-Kapazität eingeschränkt zu sein.

Bei einer festen SSD-Kapazität im System führt eine höhere Suchleistung (Abfragen pro Sekunde) zu einem höheren SSD-Kapazitätsverbrauch pro Vektor, was die Anzahl der Vektoren verringert. Umgekehrt muss der Kapazitätsverbrauch pro Vektor gesenkt werden, um die Vektoranzahl zu maximieren, was jedoch Leistungsabstriche bedeutet. Das optimale Gleichgewicht zwischen diesen gegensätzlichen Faktoren hängt von den spezifischen Arbeitslasten ab.

Lösung für skalierbare KI-Dienste und semantische Suche

Mit der neuesten Version soll die AiSAQ-Technologie nicht nur zu einer optimalen SSD-basierten ANNS-Lösung für RAG-Anwendungen werden, sondern auch ihre Bedeutung für andere Anwendungen erhöhen, die viele Vektoren nutzen, wie die semantische Offline-Suche.

Angesichts des steigenden Bedarfs an skalierbaren KI-Diensten sind SSDs eine praktikable Alternative zu DRAM, um den hohen Durchsatz und die geringe Latenz bereitzustellen, die von RAG-Systemen verlangt werden. Die AiSAQ-Software von Kioxia soll diese Anforderungen erfüllen, indem sie GenAI im großen Maßstab ermöglicht, ohne durch begrenzte Speicherressourcen eingeschränkt zu sein.

Aktuelles eBook

Storage-Software als Effizienzbooster

eBook Storage-Software als Effizienzbooster
eBook „Storage-Software als Effizienzbooster“
(Bild: Storage-Insider)

Mit der geeigneten Storage-Software kann sich ein Unternehmen einen Effizienzbooster ins Haus holen oder in der Cloud abonnieren. Dieser Booster steigert nicht nur die Performance der geschäftskritischen Anwendungen, sondern optimiert auch die Kosten der bereits installierten Speichersysteme.

Die Themen im Überblick:

  • Herausforderungen eines modernen Speichersystems
  • Methoden und Technologien effizienter Speichersysteme
  • Effizienter Speicher mit Pure Storage, AWS, Cohesity und Dell

(ID:50489481)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung