Amazon S3 Vectors soll KI-Kosten erheblich senken

Cloud-Objektspeicher für KI-Workloads Amazon S3 Vectors soll KI-Kosten erheblich senken

11.08.2025 Von Michael Matzer 5 min Lesedauer

Anbieter zum Thema

Amazon hat kürzlich S3 Vectors für seinen Object-Storage-Dienst Simple Storage Service (S3) vorgestellt. Mit S3 Vectors soll dieser Objektspeicher nun KI-Workloads native Unterstützung für Vektordaten bieten. Das soll die Kosten, die Kunden durch die Speicherung und semantische Abfrage von Vektordaten mithilfe konventioneller Methoden entstehen, um bis zu 90 Prozent reduzieren.

AWS-Manager Swami Sivasubramanian stellte S3 Vectors vor.(Bild: AWS) — AWS-Manager Swami Sivasubramanian stellte S3 Vectors vor.
(Bild: AWS)

AWS führt mit S3 Vectors eine neue Klasse von S3-Buckets ein, also Objektspeicher in der Cloud. Schon S3 Tables und S3 Metadaten erweiterten die Einsatzmöglichkeiten von S3-Buckets beträchtlich, insbesondere im Hinblick auf die Anforderungen von KI-Modellen. Daher verwundert es nicht, dass S3 Vectors mit Amazon Bedrock Knowledge Bases und dem OpenSearch-Service integriert ist.

Bildergalerie

Die Begriffe, die ein großes Sprachmodell wie Anthropic Claude verwendet, lassen sich in Vektordaten umwandeln, die für ein Suchprogramm sehr viel schneller zu lesen und auszuwerten sind als Text. Diese Vektordaten werden in S3 Vectors Buckets gespeichert und mit Index-Metadaten versehen. Eine semantische Suche braucht nur den Index zu durchsuchen, um Vektordaten zu finden.(Bild: AWS)

Die so erzeugten Vektordaten im Index füttern entweder eine Wissendatenbank für Amazon Bedrock und Amazon SageMaker Unified Studio, um RAG-Apps zu erstellen, oder eine Collection, die Amazon OpenSearch für Echtzeitabfragen nutzen kann.(Bild: AWS)

Bei der Implementierung wird zunächst ein S3 Vectors Bucket angelegt und mit Eigenschaften versehen. Standardmäßig ist die Verschlüsselung auf dem Server aktiviert.(Bild: AWS)

Der fertige Vector Bucket in einer Preview.(Bild: AWS)

Bildergalerie mit 9 Bildern

So soll das neue Leistungsmerkmal helfen, die Kosten RAG- und vektorbasierter Suchvorgänge mit großen Vektordatenmengen zu senken und die Workflows zu beschleunigen. Swami Sivasubramanian, der Vice President für Agentic AI bei AWS, stellte S3 Vectors kürzlich vor. Dabei unterstrich er besonders den Aspekt der Skalierbarkeit des Features und wandte sich damit offenbar an größere S3-Kunden, die große Datenmengen effizient und performant verarbeiten und abfragen wollen. Die Antwortzeit für eine solche Abfrage soll unter einer Sekunde liegen.

Technische Grundlagen

Für Applikationen in Generativer KI (GenAI) ist die Vektorsuche zunehmend von Bedeutung, um ähnliche Datenpunkte in einer gegebenen Datenmenge zu finden, indem deren Darstellungen als (dreidimensionale) Vektoren mithilfe der Parameter Distanz oder Ähnlichkeit verglichen werden. Vektoren sind numerische Darstellungen unstrukturierter Daten, die von Embedding-Modellen erzeugt werden. Programme können solche Zahlen viel schneller verarbeiten als etwa alphanumerischen Text. Man verwendet also Embedding-Modelle, um Vektor-Einbettungen der Kundendaten zu erzeugen und sie dann in S3 Vectors Buckets zu speichern, bevor man semantische Suchabfragen ausführt.

Limits

Mit S3 Vectors werden Vectors Buckets eingeführt. Dieser neue Bucket-Typ ist mit einem spezifischen Satz von APIs versehen, um Vektordaten aufzunehmen, darauf zuzugreifen und abzufragen, ohne eine gesonderte Infrastruktur zu erfordern. Legt der Nutzer einen S3 Vector Bucket an, organisiert er seine Vektordaten innerhalb von Vektorindizes. Das erleichtert es, eine Datenmenge mithilfe von Ähnlichkeitssuchen abzufragen. Jeder Vector Bucket kann bis zu 10.000 Vektorindizes aufnehmen, und jeder Vektorindex kann mehr als zehn Millionen Vektoren umfassen.

Optionen

Nach der Verknüpfung von Vektordaten mit einem Vektor-Index besteht die Möglichkeit, jedem Vektor ein Schlüsselwertpaar als Metadaten beizufügen. Damit können künftige Abfragen anhand einer Reihe von Kriterien arbeiten, so etwa anhand von Datum, Kategorie oder User-Präferenz.

Im Lauf der Zeit werden Vektoren geschrieben, aktualisiert und gelöscht. S3 Vectors optimiert diese Vektordaten automatisch, um das bestmögliche Preis-Leistungs-Verhältnis für Vektorspeicher zu bieten, selbst wenn sich Datenmengen weiterentwickeln und vergrößern.

Im „Speicherhungrig“-Podcast hat Chefredakteur Dr. Jürgen Ehneß dieses Mal Markus Grau, Enterprise Architect – Office of the CTO, vor dem Mikrofon. (Bild: Vogel IT-Medien)

Integration

S3 Vectors ist von Haus aus mit Amazon Bedrock Knowledge Bases integriert, ebenso mit Amazon SageMaker Unified Studio, damit Nutzer kosteneffiziente RAG-Applikationen (Retrieval-Augmented Generation) erstellen können.

Eine weitere Integration besteht mit dem OpenSearch-Service. Nutzer sollen Speicherkosten sparen können, indem sie selten abgefragte Vektordaten in S3 Vectors halten und sie dann schnell zu OpenSearch für Suchabfragen bewegen, wenn die Nachfrage plötzlich steigt oder um Echtzeit-Suchabfragen mit geringer Latenzzeit zu unterstützen.

In Vektor-Einbettungsmodellen lassen sich große Mengen unstrukturierter Daten unterbringen, so etwa Dokumente, Grafiken und Video- und Tondaten. Diese lassen sich mit Vektordaten in S3 Vectors wirtschaftlich speichern und verwalten. So sollen sich skalierbare GenAI-Apps erstellen lassen, die RAG, semantische Suche und Ähnlichkeitssuche ermöglichen sowie die Basis für das „Gedächtnis“ von KI-Agenten aufbauen.

Ein Rechenbeispiel

Ökonomisch gesehen ist der Knackpunkt der Einsatz von OpenSearch. AWS ist ja unter Druck, sich erstens gegen On-Premises-Vektordatenbanken und zweitens gegen Cloudians neues Cloud-Angebot auf der Milvus-Vektordatenbank durchzusetzen. Da spielen Kosten mitunter eine entscheidende Rolle.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Andrew Warfield, ein Vice President und Distinguished Storage Engineer bei AWS, spielte ein aufschlussreiches Kostenbeispiel durch: „S3 Vectors verankern Kosten im Storage und nehmen dabei an, dass der Abfragebedarf im Lauf der Zeit schwankt; das heißt, dass der Nutzer nicht permanent maximale Ressourcen benötigt. Wenn wir uns also die Kosten mal anschauen, gehen wir davon aus, dass die Kosten für Storage die meiste Zeit anfallen, aber die Kosten für Abfrage und Einfügen (Insert) nur dann, wenn der Nutzer mit den Daten interagiert.“

Warfield fährt fort: „Wir haben uns die Workloads unserer Kunden angeschaut und herausgefunden, dass die große Mehrheit der Vektorindizes keine provisionierte Rechenleistung permanent benötigte, sei es im RAM oder auf SSD. Der Betrieb einer konventionellen Vektordatenbank mit 10 Millionen Vektordaten kann nun aber auf einer dedizierten r7g.2xlarge-Instanz 300 US-Dollar pro Monat kosten, und das, noch bevor irgendwelche Kosten für das Management der Vektordatenbank angefallen sind, ganz gleich, wie viele Abfragen sie bedient.“

Nun könnte man durchaus zu der Ansicht gelangen, dass 300 US-Dollar pro Monat etwas happig sind. Deshalb präsentiert Warfield sein Gegenbeispiel: „Das Hosting einer solchen Datenmenge kostet bei 250.000 Abfragen und dem monatlichen Überschreiben von 50 Prozent der Vektoren in S3 nur ein wenig über 30 US-Dollar pro Monat.“ Daraus ergibt sich: „Kunden, die Workloads haben, die sich quasi aufheizen, können ihren Vektorindex zeitweilig in einen herkömmlichen Vektorspeicher wie OpenSearch verschieben, wodurch sie Instanz-ähnliche Preise nur für diejenige Zeit bezahlen, in der diese Datenbank Vektordaten verarbeitet“, sonst aber nicht. So erklärt sich das erhebliche Einsparungspotenzial, das S3 Vectors schon in kleinem Maßstab bietet.

Bildergalerie

Bildergalerie mit 9 Bildern

Anschauliche Implementierung

In ihrem Blog erklärt AWS-Mitarbeiterin Channy Yun detailliert, wie S3 Vectors implementiert wird. Zahlreiche Screenshots machen diese Darstellung sehr anschaulich. „Zusätzlich zu den genannten Apps lassen sich damit branchenspezifische Anwendungen erstellen, um eine breite Palette von Anwendungsfällen zu unterstützen, so etwa personalisierte Empfehlungen, automatisierte Inhaltsanalysen sowie die ,intelligente‘ Dokumentenverarbeitung. Dabei lassen sich die Kosten und die Komplexität, die aus der Verwaltung von Vektordatenbanken resultieren, praktisch komplett einsparen.“

Verfügbarkeit

Die Preview von S3 Vectors ist verfügbar in drei US-Regionen, in der Region Sydney und in Frankfurt am Main (Central-Europe). Die S3-Preisliste gibt es hier.

Aktuelles eBook

Datenmigration – so funktioniert der Storage-Umzug

eBook Datenmigration — eBook „Datenmigration“
(Bild: Storage-Insider)

Im Zuge der Digitalisierung ändern sich die Anforderungen an Storage-Systeme. Sie müssen leistungsfähiger, skalierbarer und insgesamt flexibler sein. Unternehmen führen neue Systeme wie etwa All-Flash-Arrays ein, verlagern Dienstleistungen der IT-Abteilung in die Public- oder Hybrid-Cloud, ziehen sogar das Rechenzentrum um und erkennen möglicherweise die Chance oder die Notwendigkeit, IT-Services und Storage-Infrastruktur zu konsolidieren.

Die Themen im Überblick:

Operation am offenen Herzen – Einleitung
Wann eine Datenmigration nötig und sinnvoll ist
Was bei der Datenmigration zu beachten ist
Die konkrete Umsetzung der Datenmigration
Sonderfälle und Fallstricke

eBook „Datenmigration“ kostenlos downloaden

(ID:50497241)