Arbeiten mit der Data Stewardship Console der Talend Data Quality Enterprise Edition

Im Test: Talend Data Quality v4 (Teil 2)

Seite: 3/3

Firmen zum Thema

Die Icons, die die Matching-Funktionen bereitstellen, bieten den Anwendern eine große Zahl unterschiedlicher Vergleichsalgorithmen. Dazu gehören „genaue Übereinstimmung“, „genaue Übereinstimmung ohne Berücksichtigung von Groß- und Kleinschreibung“, „Soundex“, „Soundex FR“, „Jaro“, „Jaro-Winkler“, „Metaphone“, „Double Metaphone“, „Levenshtein“ und „q-grams“. Diese sind jeweils über den Menüpunkt „Einstellungen“ selektierbar.

Zum Vergleichen von Einträgen stehen verschiedene Matching-Algorithmen zur Verfügung, wie „genaue Übereinstimmung“ und „Levenshtein“. (Archiv: Vogel Business Media)

Um beim Erstellen von Jobs für eine bestmögliche Übersichtlichkeit zu sorgen, wurde die Palette übrigens in verschiedene Rubriken unterteilt, die die jeweils dazugehörigen Icons umfassen. Dabei handelt es sich um „Dateien“, „Datenbanken“, „Eigener Code“, „Internet“, „System“ und ähnliches. Die Rubrik „Eigner Code“ kommt zum Einsatz, um eigene Funktionen zu erzeugen, wenn die genannten Icons für irgendwelche Aufgabenstellungen nicht ausreichen.

Bildergalerie
Bildergalerie mit 7 Bildern

Im Test fanden wir den Icon-basierten Ansatz zum Generieren von Jobs sehr überzeugend. In den meisten Fällen werden wohl auch Mitarbeiter, die von Softwareentwicklung keine Ahnung haben, dazu in der Lage sein, mit Hilfe von Talend Data Quality die Tasks anzulegen, die sie für ihre Arbeit brauchen.

Am unteren Rand des Arbeitsbereichs befinden sich diverse Reiter, die Jobinformationen wie Version, Logdateien und ähnliches sowie Kontexte wie Variablen und Werte umfassen. Dazu kommen außerdem noch Subjobs, der bereits erwähnte Reiter zum Starten der Tasks (mit Debugläufen), ein Bereich mit Fehlern, Warnungen und Informationen, ein Scheduler sowie ein Reiter, der sich mit Modulen befasst. Über den letzten Eintrag „Job Hierarchie“ lassen sich Child-Prozesse erkennen, hier ist es also möglich, zu sehen, wo sich der aktuelle Job in Bezug auf den gesamten Arbeitsablauf befindet.

Abgesehen von den Job Designs umfasst das Repository auch noch weitere Einträge wie Code Routinen, SQL Templates, Metadaten - wie SAP-Verbindungen, LDAP, Excel-Files, etc. - und die generierte Dokumentation. Darunter finden sich dann die Gliederung des jeweiligen Jobs und ein Code Viewer.

Zusätzlich zum Repository bietet Talend Data Quality den Benutzern einen so genannten Navigator. Dieser ermöglicht es ihnen, direkt auf Projektkomponenten wie Code, Dokumentation und Libraries zuzugreifen.

Ausblick auf den dritten und letzten Teil der Reihe

Der dritte und letzte Teil der Reihe befasst sich mit dem Data Profiler und weiteren Funktionen wie Matching und Record Consolidation von Talend Data Quality.

(ID:2051898)