Mobile-Menu

Cloud-Objektspeicher für KI-Workloads Amazon S3 Vectors soll KI-Kosten erheblich senken

Von Michael Matzer 5 min Lesedauer

Anbieter zum Thema

Amazon hat kürzlich S3 Vectors für seinen Object-Storage-Dienst Simple Storage Service (S3) vorgestellt. Mit S3 Vectors soll dieser Objektspeicher nun KI-Workloads native Unterstützung für Vektordaten bieten. Das soll die Kosten, die Kunden durch die Speicherung und semantische Abfrage von Vektordaten mithilfe konventioneller Methoden entstehen, um bis zu 90 Prozent reduzieren.

AWS-Manager Swami Sivasubramanian stellte S3 Vectors vor.(Bild:  AWS)
AWS-Manager Swami Sivasubramanian stellte S3 Vectors vor.
(Bild: AWS)

AWS führt mit S3 Vectors eine neue Klasse von S3-Buckets ein, also Objektspeicher in der Cloud. Schon S3 Tables und S3 Metadaten erweiterten die Einsatzmöglichkeiten von S3-Buckets beträchtlich, insbesondere im Hinblick auf die Anforderungen von KI-Modellen. Daher verwundert es nicht, dass S3 Vectors mit Amazon Bedrock Knowledge Bases und dem OpenSearch-Service integriert ist.

Bildergalerie
Bildergalerie mit 9 Bildern

So soll das neue Leistungsmerkmal helfen, die Kosten RAG- und vektorbasierter Suchvorgänge mit großen Vektordatenmengen zu senken und die Workflows zu beschleunigen. Swami Sivasubramanian, der Vice President für Agentic AI bei AWS, stellte S3 Vectors kürzlich vor. Dabei unterstrich er besonders den Aspekt der Skalierbarkeit des Features und wandte sich damit offenbar an größere S3-Kunden, die große Datenmengen effizient und performant verarbeiten und abfragen wollen. Die Antwortzeit für eine solche Abfrage soll unter einer Sekunde liegen.

Technische Grundlagen

Für Applikationen in Generativer KI (GenAI) ist die Vektorsuche zunehmend von Bedeutung, um ähnliche Datenpunkte in einer gegebenen Datenmenge zu finden, indem deren Darstellungen als (dreidimensionale) Vektoren mithilfe der Parameter Distanz oder Ähnlichkeit verglichen werden. Vektoren sind numerische Darstellungen unstrukturierter Daten, die von Embedding-Modellen erzeugt werden. Programme können solche Zahlen viel schneller verarbeiten als etwa alphanumerischen Text. Man verwendet also Embedding-Modelle, um Vektor-Einbettungen der Kundendaten zu erzeugen und sie dann in S3 Vectors Buckets zu speichern, bevor man semantische Suchabfragen ausführt.

Limits

Mit S3 Vectors werden Vectors Buckets eingeführt. Dieser neue Bucket-Typ ist mit einem spezifischen Satz von APIs versehen, um Vektordaten aufzunehmen, darauf zuzugreifen und abzufragen, ohne eine gesonderte Infrastruktur zu erfordern. Legt der Nutzer einen S3 Vector Bucket an, organisiert er seine Vektordaten innerhalb von Vektorindizes. Das erleichtert es, eine Datenmenge mithilfe von Ähnlichkeitssuchen abzufragen. Jeder Vector Bucket kann bis zu 10.000 Vektorindizes aufnehmen, und jeder Vektorindex kann mehr als zehn Millionen Vektoren umfassen.

Optionen

Nach der Verknüpfung von Vektordaten mit einem Vektor-Index besteht die Möglichkeit, jedem Vektor ein Schlüsselwertpaar als Metadaten beizufügen. Damit können künftige Abfragen anhand einer Reihe von Kriterien arbeiten, so etwa anhand von Datum, Kategorie oder User-Präferenz.

Im Lauf der Zeit werden Vektoren geschrieben, aktualisiert und gelöscht. S3 Vectors optimiert diese Vektordaten automatisch, um das bestmögliche Preis-Leistungs-Verhältnis für Vektorspeicher zu bieten, selbst wenn sich Datenmengen weiterentwickeln und vergrößern.

Integration

S3 Vectors ist von Haus aus mit Amazon Bedrock Knowledge Bases integriert, ebenso mit Amazon SageMaker Unified Studio, damit Nutzer kosteneffiziente RAG-Applikationen (Retrieval-Augmented Generation) erstellen können.

Eine weitere Integration besteht mit dem OpenSearch-Service. Nutzer sollen Speicherkosten sparen können, indem sie selten abgefragte Vektordaten in S3 Vectors halten und sie dann schnell zu OpenSearch für Suchabfragen bewegen, wenn die Nachfrage plötzlich steigt oder um Echtzeit-Suchabfragen mit geringer Latenzzeit zu unterstützen.

In Vektor-Einbettungsmodellen lassen sich große Mengen unstrukturierter Daten unterbringen, so etwa Dokumente, Grafiken und Video- und Tondaten. Diese lassen sich mit Vektordaten in S3 Vectors wirtschaftlich speichern und verwalten. So sollen sich skalierbare GenAI-Apps erstellen lassen, die RAG, semantische Suche und Ähnlichkeitssuche ermöglichen sowie die Basis für das „Gedächtnis“ von KI-Agenten aufbauen.

Ein Rechenbeispiel

Ökonomisch gesehen ist der Knackpunkt der Einsatz von OpenSearch. AWS ist ja unter Druck, sich erstens gegen On-Premises-Vektordatenbanken und zweitens gegen Cloudians neues Cloud-Angebot auf der Milvus-Vektordatenbank durchzusetzen. Da spielen Kosten mitunter eine entscheidende Rolle.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Andrew Warfield, ein Vice President und Distinguished Storage Engineer bei AWS, spielte ein aufschlussreiches Kostenbeispiel durch: „S3 Vectors verankern Kosten im Storage und nehmen dabei an, dass der Abfragebedarf im Lauf der Zeit schwankt; das heißt, dass der Nutzer nicht permanent maximale Ressourcen benötigt. Wenn wir uns also die Kosten mal anschauen, gehen wir davon aus, dass die Kosten für Storage die meiste Zeit anfallen, aber die Kosten für Abfrage und Einfügen (Insert) nur dann, wenn der Nutzer mit den Daten interagiert.“

Warfield fährt fort: „Wir haben uns die Workloads unserer Kunden angeschaut und herausgefunden, dass die große Mehrheit der Vektorindizes keine provisionierte Rechenleistung permanent benötigte, sei es im RAM oder auf SSD. Der Betrieb einer konventionellen Vektordatenbank mit 10 Millionen Vektordaten kann nun aber auf einer dedizierten r7g.2xlarge-Instanz 300 US-Dollar pro Monat kosten, und das, noch bevor irgendwelche Kosten für das Management der Vektordatenbank angefallen sind, ganz gleich, wie viele Abfragen sie bedient.“

Nun könnte man durchaus zu der Ansicht gelangen, dass 300 US-Dollar pro Monat etwas happig sind. Deshalb präsentiert Warfield sein Gegenbeispiel: „Das Hosting einer solchen Datenmenge kostet bei 250.000 Abfragen und dem monatlichen Überschreiben von 50 Prozent der Vektoren in S3 nur ein wenig über 30 US-Dollar pro Monat.“ Daraus ergibt sich: „Kunden, die Workloads haben, die sich quasi aufheizen, können ihren Vektorindex zeitweilig in einen herkömmlichen Vektorspeicher wie OpenSearch verschieben, wodurch sie Instanz-ähnliche Preise nur für diejenige Zeit bezahlen, in der diese Datenbank Vektordaten verarbeitet“, sonst aber nicht. So erklärt sich das erhebliche Einsparungspotenzial, das S3 Vectors schon in kleinem Maßstab bietet.

Bildergalerie
Bildergalerie mit 9 Bildern

Anschauliche Implementierung

In ihrem Blog erklärt AWS-Mitarbeiterin Channy Yun detailliert, wie S3 Vectors implementiert wird. Zahlreiche Screenshots machen diese Darstellung sehr anschaulich. „Zusätzlich zu den genannten Apps lassen sich damit branchenspezifische Anwendungen erstellen, um eine breite Palette von Anwendungsfällen zu unterstützen, so etwa personalisierte Empfehlungen, automatisierte Inhaltsanalysen sowie die ,intelligente‘ Dokumentenverarbeitung. Dabei lassen sich die Kosten und die Komplexität, die aus der Verwaltung von Vektordatenbanken resultieren, praktisch komplett einsparen.“

Verfügbarkeit

Die Preview von S3 Vectors ist verfügbar in drei US-Regionen, in der Region Sydney und in Frankfurt am Main (Central-Europe). Die S3-Preisliste gibt es hier.

Aktuelles eBook

Datenmigration – so funktioniert der Storage-Umzug

eBook Datenmigration
eBook „Datenmigration“
(Bild: Storage-Insider)

Im Zuge der Digitalisierung ändern sich die Anforderungen an Storage-Systeme. Sie müssen leistungsfähiger, skalierbarer und insgesamt flexibler sein. Unternehmen führen neue Systeme wie etwa All-Flash-Arrays ein, verlagern Dienstleistungen der IT-Abteilung in die Public- oder Hybrid-Cloud, ziehen sogar das Rechenzentrum um und erkennen möglicherweise die Chance oder die Notwendigkeit, IT-Services und Storage-Infrastruktur zu konsolidieren.

Die Themen im Überblick:

  • Operation am offenen Herzen – Einleitung
  • Wann eine Datenmigration nötig und sinnvoll ist
  • Was bei der Datenmigration zu beachten ist
  • Die konkrete Umsetzung der Datenmigration
  • Sonderfälle und Fallstricke

(ID:50497241)