Amazon hat kürzlich S3 Vectors für seinen Object-Storage-Dienst Simple Storage Service (S3) vorgestellt. Mit S3 Vectors soll dieser Objektspeicher nun KI-Workloads native Unterstützung für Vektordaten bieten. Das soll die Kosten, die Kunden durch die Speicherung und semantische Abfrage von Vektordaten mithilfe konventioneller Methoden entstehen, um bis zu 90 Prozent reduzieren.
AWS-Manager Swami Sivasubramanian stellte S3 Vectors vor.
(Bild: AWS)
AWS führt mit S3 Vectors eine neue Klasse von S3-Buckets ein, also Objektspeicher in der Cloud. Schon S3 Tables und S3 Metadaten erweiterten die Einsatzmöglichkeiten von S3-Buckets beträchtlich, insbesondere im Hinblick auf die Anforderungen von KI-Modellen. Daher verwundert es nicht, dass S3 Vectors mit Amazon Bedrock Knowledge Bases und dem OpenSearch-Service integriert ist.
So soll das neue Leistungsmerkmal helfen, die Kosten RAG- und vektorbasierter Suchvorgänge mit großen Vektordatenmengen zu senken und die Workflows zu beschleunigen. Swami Sivasubramanian, der Vice President für Agentic AI bei AWS, stellte S3 Vectors kürzlich vor. Dabei unterstrich er besonders den Aspekt der Skalierbarkeit des Features und wandte sich damit offenbar an größere S3-Kunden, die große Datenmengen effizient und performant verarbeiten und abfragen wollen. Die Antwortzeit für eine solche Abfrage soll unter einer Sekunde liegen.
Technische Grundlagen
Für Applikationen in Generativer KI (GenAI) ist die Vektorsuche zunehmend von Bedeutung, um ähnliche Datenpunkte in einer gegebenen Datenmenge zu finden, indem deren Darstellungen als (dreidimensionale) Vektoren mithilfe der Parameter Distanz oder Ähnlichkeit verglichen werden. Vektoren sind numerische Darstellungen unstrukturierter Daten, die von Embedding-Modellen erzeugt werden. Programme können solche Zahlen viel schneller verarbeiten als etwa alphanumerischen Text. Man verwendet also Embedding-Modelle, um Vektor-Einbettungen der Kundendaten zu erzeugen und sie dann in S3 Vectors Buckets zu speichern, bevor man semantische Suchabfragen ausführt.
Limits
Mit S3 Vectors werden Vectors Buckets eingeführt. Dieser neue Bucket-Typ ist mit einem spezifischen Satz von APIs versehen, um Vektordaten aufzunehmen, darauf zuzugreifen und abzufragen, ohne eine gesonderte Infrastruktur zu erfordern. Legt der Nutzer einen S3 Vector Bucket an, organisiert er seine Vektordaten innerhalb von Vektorindizes. Das erleichtert es, eine Datenmenge mithilfe von Ähnlichkeitssuchen abzufragen. Jeder Vector Bucket kann bis zu 10.000 Vektorindizes aufnehmen, und jeder Vektorindex kann mehr als zehn Millionen Vektoren umfassen.
Optionen
Nach der Verknüpfung von Vektordaten mit einem Vektor-Index besteht die Möglichkeit, jedem Vektor ein Schlüsselwertpaar als Metadaten beizufügen. Damit können künftige Abfragen anhand einer Reihe von Kriterien arbeiten, so etwa anhand von Datum, Kategorie oder User-Präferenz.
Im Lauf der Zeit werden Vektoren geschrieben, aktualisiert und gelöscht. S3 Vectors optimiert diese Vektordaten automatisch, um das bestmögliche Preis-Leistungs-Verhältnis für Vektorspeicher zu bieten, selbst wenn sich Datenmengen weiterentwickeln und vergrößern.
Eine weitere Integration besteht mit dem OpenSearch-Service. Nutzer sollen Speicherkosten sparen können, indem sie selten abgefragte Vektordaten in S3 Vectors halten und sie dann schnell zu OpenSearch für Suchabfragen bewegen, wenn die Nachfrage plötzlich steigt oder um Echtzeit-Suchabfragen mit geringer Latenzzeit zu unterstützen.
In Vektor-Einbettungsmodellen lassen sich große Mengen unstrukturierter Daten unterbringen, so etwa Dokumente, Grafiken und Video- und Tondaten. Diese lassen sich mit Vektordaten in S3 Vectors wirtschaftlich speichern und verwalten. So sollen sich skalierbare GenAI-Apps erstellen lassen, die RAG, semantische Suche und Ähnlichkeitssuche ermöglichen sowie die Basis für das „Gedächtnis“ von KI-Agenten aufbauen.
Ein Rechenbeispiel
Ökonomisch gesehen ist der Knackpunkt der Einsatz von OpenSearch. AWS ist ja unter Druck, sich erstens gegen On-Premises-Vektordatenbanken und zweitens gegen Cloudians neues Cloud-Angebot auf der Milvus-Vektordatenbank durchzusetzen. Da spielen Kosten mitunter eine entscheidende Rolle.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Andrew Warfield, ein Vice President und Distinguished Storage Engineer bei AWS, spielte ein aufschlussreiches Kostenbeispiel durch: „S3 Vectors verankern Kosten im Storage und nehmen dabei an, dass der Abfragebedarf im Lauf der Zeit schwankt; das heißt, dass der Nutzer nicht permanent maximale Ressourcen benötigt. Wenn wir uns also die Kosten mal anschauen, gehen wir davon aus, dass die Kosten für Storage die meiste Zeit anfallen, aber die Kosten für Abfrage und Einfügen (Insert) nur dann, wenn der Nutzer mit den Daten interagiert.“
Warfield fährt fort: „Wir haben uns die Workloads unserer Kunden angeschaut und herausgefunden, dass die große Mehrheit der Vektorindizes keine provisionierte Rechenleistung permanent benötigte, sei es im RAM oder auf SSD. Der Betrieb einer konventionellen Vektordatenbank mit 10 Millionen Vektordaten kann nun aber auf einer dedizierten r7g.2xlarge-Instanz 300 US-Dollar pro Monat kosten, und das, noch bevor irgendwelche Kosten für das Management der Vektordatenbank angefallen sind, ganz gleich, wie viele Abfragen sie bedient.“
Nun könnte man durchaus zu der Ansicht gelangen, dass 300 US-Dollar pro Monat etwas happig sind. Deshalb präsentiert Warfield sein Gegenbeispiel: „Das Hosting einer solchen Datenmenge kostet bei 250.000 Abfragen und dem monatlichen Überschreiben von 50 Prozent der Vektoren in S3 nur ein wenig über 30 US-Dollar pro Monat.“ Daraus ergibt sich: „Kunden, die Workloads haben, die sich quasi aufheizen, können ihren Vektorindex zeitweilig in einen herkömmlichen Vektorspeicher wie OpenSearch verschieben, wodurch sie Instanz-ähnliche Preise nur für diejenige Zeit bezahlen, in der diese Datenbank Vektordaten verarbeitet“, sonst aber nicht. So erklärt sich das erhebliche Einsparungspotenzial, das S3 Vectors schon in kleinem Maßstab bietet.
In ihrem Blog erklärt AWS-Mitarbeiterin Channy Yun detailliert, wie S3 Vectors implementiert wird. Zahlreiche Screenshots machen diese Darstellung sehr anschaulich. „Zusätzlich zu den genannten Apps lassen sich damit branchenspezifische Anwendungen erstellen, um eine breite Palette von Anwendungsfällen zu unterstützen, so etwa personalisierte Empfehlungen, automatisierte Inhaltsanalysen sowie die ,intelligente‘ Dokumentenverarbeitung. Dabei lassen sich die Kosten und die Komplexität, die aus der Verwaltung von Vektordatenbanken resultieren, praktisch komplett einsparen.“
Verfügbarkeit
Die Preview von S3 Vectors ist verfügbar in drei US-Regionen, in der Region Sydney und in Frankfurt am Main (Central-Europe). Die S3-Preisliste gibt es hier.
Aktuelles eBook
Datenmigration – so funktioniert der Storage-Umzug
eBook „Datenmigration“
(Bild: Storage-Insider)
Im Zuge der Digitalisierung ändern sich die Anforderungen an Storage-Systeme. Sie müssen leistungsfähiger, skalierbarer und insgesamt flexibler sein. Unternehmen führen neue Systeme wie etwa All-Flash-Arrays ein, verlagern Dienstleistungen der IT-Abteilung in die Public- oder Hybrid-Cloud, ziehen sogar das Rechenzentrum um und erkennen möglicherweise die Chance oder die Notwendigkeit, IT-Services und Storage-Infrastruktur zu konsolidieren.