Microsoft hat den Quellcode von DocumentDB, der Engine der vCore-basierten Azure Cosmos DB für MongoDB, als Open Source freigegeben. Die neue Dokumentendatenbank basiert auf PostgreSQL und ermöglicht CRUD-Operationen auf BSON-Daten. Neben den grundlegenden Datenbankfunktionen unterstützt sie auch komplexe Abfragen, darunter Volltextsuche, geospatiales Querying und Vektoreinbettungen.
Mit DocumentDB erhalten Unternehmen die volle Kontrolle über ihre Daten.
Die Open-Source-Veröffentlichung erfolgt unter der MIT-Lizenz, was Entwicklern vollständige Freiheit in der Nutzung und Weitergabe gewährt – ohne kommerzielle Gebühren oder Einschränkungen. Microsoft verfolgt mit DocumentDB die Vision einer standardisierten NoSQL-Sprache, ähnlich dem ANSI-SQL-Standard für relationale Datenbanken, um Interoperabilität zwischen verschiedenen dokumentenorientierten Datenbanken zu fördern.
Die Einführung eines Standards für dokumentenorientierte Datenbanken soll zudem die Migration zwischen verschiedenen NoSQL-Datenbanken erleichtern. Durch die Offenlegung des Quellcodes erhalten Entwickler vollen Einblick in die Architektur und können eigene Erweiterungen oder Optimierungen vornehmen.
Die technische Architektur von DocumentDB
Die Grundlage von DocumentDB bildet eine PostgreSQL-Erweiterung zur Unterstützung des BSON-Datentyps. Ergänzt wird sie durch eine API-Schicht, die CRUD-Operationen, Abfragen und Indexverwaltung bereitstellt. Durch diese Architektur integriert sich DocumentDB nahtlos in bestehende PostgreSQL-Ökosysteme und unterstützt Erweiterungen wie PostGIS für geographische Datenverarbeitung sowie „pg_vector“ für KI-gestützte Suchanfragen. Das macht die Datenbank besonders flexibel für unterschiedliche Anwendungsszenarien.
Installation und Einrichtung für Administratoren und Entwickler
Installieren von DocumentDB als Docker-Container.
(Bild: Joos)
Administratoren und Entwickler können DocumentDB unkompliziert über Docker installieren und in Betrieb nehmen. Zunächst muss Docker installiert sein. Anschließend kann das Repository geklont werden:
Der nächste Schritt ist das Starten des Containers:
docker run -v $(pwd):/home/documentdb/code -it documentdb /bin/bash
Nach dem Start des Containers müssen die Binaries kompiliert und installiert werden:
cd codemakesudo make install
Der DocumentDB-Server kann anschließend initialisiert werden:
./scripts/start_oss_server.sh -t documentdb
Um eine Verbindung zur Datenbank herzustellen, wird die psql-Shell genutzt:
psql -p 9712 -h localhost -d postgres
Sobald DocumentDB läuft, stehen Entwicklern alle gewohnten Funktionen einer dokumentenorientierten Datenbank zur Verfügung. Neue Sammlungen können erstellt, Dokumente eingefügt, bearbeitet und gelöscht werden. Abfragen lassen sich flexibel gestalten, wobei auch komplexe Suchmuster unterstützt werden. Durch die enge Integration mit PostgreSQL profitieren Nutzer von der ausgereiften Infrastruktur und den fortgeschrittenen Features der relationalen Datenbank.
Erste Schritte mit DocumentDB
Nach der erfolgreichen Einrichtung können Entwickler mit der Datenbank arbeiten. Neue Sammlungen lassen sich zum Beispiel mit folgenden Anweisungen erstellen:
Microsoft verfolgt mit DocumentDB das Ziel, einen offenen Standard für dokumentenorientierte Datenbanken zu etablieren. Ähnlich dem ANSI-SQL-Standard für relationale Systeme könnten eine einheitliche API und Engine-Fundamentals die Interoperabilität und Portabilität von NoSQL-Datenbanken in Zukunft erheblich verbessern. Die Idee ist es, Entwicklern einen einfachen Wechsel zwischen verschiedenen NoSQL-Technologien zu ermöglichen, ohne tiefgreifende Anpassungen vornehmen zu müssen.
Erweiterte Funktionen und Integrationen
Neben den grundlegenden CRUD-Operationen bietet DocumentDB noch weitere Funktionen. Durch die Unterstützung für die PostgreSQL-Erweiterung „pg_vector“ lassen sich vektorbasierte Suchabfragen durchführen, was vor allem für Anwendungen im Bereich der künstlichen Intelligenz von Bedeutung ist. Unternehmen, die auf Geodaten angewiesen sind, profitieren von der PostGIS-Integration, die eine effiziente Verarbeitung und Abfrage geospatialer Daten ermöglicht. Diese Erweiterungen machen DocumentDB attraktiv für moderne datengetriebene Anwendungen, die sowohl relationale als auch dokumentenorientierte Datenmodelle erfordern.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Ein zentraler Vorteil von DocumentDB ist die enge Integration mit FerretDB, das eine MongoDB-kompatible Schnittstelle bereitstellt und DocumentDB als Backend nutzt. Für Authentifizierungsmechanismen setzt Microsoft auf SCRAM-Authentifizierung, um Benutzerkonten sicher zu verwalten. Erweiterte Indexierungsoptionen erlauben die Erstellung von Einzel-, Multi-Key-, Compound-, Text- und Geospatial-Indizes, die für komplexe Abfragen optimiert sind. Neben klassischen Abfragen unterstützt DocumentDB auch Aggregationsfunktionen über „aggregate_cursor_first_page“, wodurch sich beispielsweise Patienten nach Registrierungsjahr gruppieren lassen. Join-Operationen über mehrere Collections sind ebenfalls möglich. Automatisierte Verwaltungsaufgaben wie TTL-Indexierung werden über „pg_cron“ gesteuert, wodurch Dokumente nach einer bestimmten Zeit automatisch gelöscht werden können.
Zukunftsperspektiven und Bedeutung für Unternehmen
Mit der Open-Source-Veröffentlichung stärkt Microsoft die Position von PostgreSQL als vielseitige Datenbankplattform. Entwickler profitieren von einer flexiblen, skalierbaren Lösung für dokumentenorientierte Datenhaltung, und Unternehmen erhalten volle Kontrolle über ihre Daten. Die Möglichkeit zur On-Premises-Nutzung bietet eine Alternative zur reinen Cloud-Abhängigkeit. Durch die Unterstützung eines wachsenden Open-Source-Ökosystems könnte DocumentDB zu einer attraktiven Alternative zu proprietären NoSQL-Lösungen werden.
Aktuelles eBook
Storage-Software als Effizienzbooster
eBook „Storage-Software als Effizienzbooster“
(Bild: Storage-Insider)
Mit der geeigneten Storage-Software kann sich ein Unternehmen einen Effizienzbooster ins Haus holen oder in der Cloud abonnieren. Dieser Booster steigert nicht nur die Performance der geschäftskritischen Anwendungen, sondern optimiert auch die Kosten der bereits installierten Speichersysteme.
Die Themen im Überblick:
Herausforderungen eines modernen Speichersystems
Methoden und Technologien effizienter Speichersysteme
Effizienter Speicher mit Pure Storage, AWS, Cohesity und Dell