Anbieter zum Thema
Der Triple Store ist aus dem Resource Description Framework (RDF) abgeleitet, das als ein System für logische Aussagen über beliebige Dinge konzipiert wurde. RDF gilt als grundlegender Baustein des semantischen Webs, erläutert Wikipedia.
Das Prinzip erklärt David Gorbet, Vice President Engineering bei Marklogic in zwei einfachen Sätzen: „John Smith lebt in London“; „London ist in England“. Die beiden Triple bestehend aus Subjekt, Prädikat und Objekt lassen sich dann miteinander kombinieren zu der Aussage: „John Smith lebt in England“.
Viele Datentypen werden unterstützt
Die zugrundeliegende Semantik, die beliebige Mengen von Dokumenten in eine Hadoop-Datenbank integrieren kann, unterscheidet nach Worten, Sätzen, Abstammung, Struktur, Werte, Kategorien und Sicherheitsstufen.
Ein Text wird, und das ist wesentlich bei dieser Vorgehensweise, nicht in vordefinierte Schemata gezwungen, sondern kann über seine diversen Kategorien in Triples organisiert werden. Durch die Baumstruktur der Datenbank wiederum lässt sich die Suchlast auf standardisierte Hardware verteilen und in kürzesten Zeitspannen zu sinnvollen Abfrageergebnissen zusammenstellen.
NoSQL-Datenbanken sind nicht auf XML- und Textdokumente beschränkt. Bild-, Audio- und Videodateien lassen sich ebenfalls durchsuchen, indem ihnen mit Bilderkennungsverfahren und anderen automatisierten Vorgehensweisen spezifische Metadaten zugeordnet werden.
Für die Enterprise-Tauglichkeit der Marklogic-Datenbank spricht die Integrierbarkeit von Zugriffsrechten auf Dokumente und Geräte sowie die Umsetzung von Aufbewahrungsvorschriften in die Datenbank selbst.
(ID:42666109)