Ein Webinarbericht
Im BARC-Webinar stellten sich 6 Anbieter dem direkten Vergleich – hier kommt der zweite Teil des Webinarberichts unseres Data-Management-Experten Timm Grosser.
Nachdem wir im ersten Teil des Webinars auf die drei Data-Catalog-Marktführer – Alation, Collibra und Informatica – geblickt haben, haben wir die Performance der drei Marktherausforderer dataspot., Synabi und Zeenea verglichen.
Wie auch die drei Marktführer zeigten diese Anbieter innerhalb von 20 Minuten anhand des vorgegebenen Szenarios – einer Lösung für Data Democracy – ihr Können.
So haben sich die drei Marktherausforderer präsentiert
Synabi
Die Synabi-Technologie D-Quantum bietet eine offene Plattform für Data Cataloging und kann mit einem Schweizer Taschenmesser verglichen werden. Für alle, die Confluence und Wikipedia gewohnt ist, bietet das Werkzeug einen schnellen Einstieg durch ein ähnliches „Look & Feel“.
Synabi zeigte anhand der drei vorgegeben Rollen allerlei Funktionalität wie Lineage-Analysen, Suchfunktionen, Freigabeprozesse und mehr. Als einziger Anbieter zeigte Synabi eine Funktion zum Vergleich unterschiedlicher Versionen von Metadaten. Aus der direkten Gegenüberstellung von Versionen wurden Änderungen visuell hervorgehoben und waren schnell ersichtlich. Ein Schwerpunkt lag auf den Lineage-Funktionen, die Technische Lineage und Business Lineage unterstützen und es ermöglichen, weitere Kontextinformationen entlang der Lineage anzuschauen, wie etwa Data Owner.
Der Datenzugriff erfolgte auch hier durch einen Request Access Button, der einen weiteren Prozess triggert, in diesem Fall eine Mail. Im Zuge der Präsentation wurde die Erweiterbarkeit des Werkzeuges betont und die Möglichkeiten zur Individualisierung der Oberflächen aufgezeigt. Eingangs wurden auch kurz auf D-Quantum Connect eingegangen, Synabis Produkt zur Integration von Metadaten nebst eigenem Software Development Kit (SDK) zur Entwicklung von Metadatenscannern.
dataspot.
dataspot. hat sein Produkt aufgerüstet und nun ein neben den bekannten KPI Catalog, DQ Catalog und weiteren einen ‚Data Product Catalog‘ integriert. Der neue Catalog bot auch den Einstieg in die Softwaredemonstration.
Informationen aus dem Werkzeug können über dataspot. Anywhere aufgerufen werden, einer API, die einen Echtzeit-Zugriff auf die Metadaten ermöglicht. Auch bei dataspot. lag ein großes Augenmerk auf der Business Lineage, in der auch weitere Kontextinformationen visualisiert werden konnten, wie zum Beispiel importierte DQ-Metriken. Für die einfachere Pflege von Metadaten wurde die Importfähigkeit von Excel-Tabellen hervorgehoben.
Interessant war die Erwähnung von dataspot. zur Unterstützung von Data Warehouse Automation (DWA), welche in den Q&A noch vertieft worden ist.
Die Idee dahinter ist, das Business Data Model in dataspot. ähnlich dem Data Warehouse Model zu halten. Unter dieser Prämisse können Informationsobjekte bereits im dataspot.tool im Business Data Model verlinkt werden und auch Transformationlogiken hinzugefügt werden.
Diese Metadaten können exportiert und von bspw. DWA Spezialwerkzeuge wie WhereScape eingelesen und gleich auf das Data Warehouse Model angewendet werden. Und dies nutzen Kunden von dataspot. bereits.
Dies zeigt zudem einen wichtigen Aspekt: Die Inhalte wie Konzepte & Blueprints, Standards, das Business Model wird in Projekten gemeinsam entwickelt. Das Tool ergänzt und unterstützt die Methodik der Data-Governance-Expertinnen von dataspot. und macht die Ergebnisse daraus nachvollziehbar und durchgängig wiederverwendbar. Und das gelingt zu verschiedenen Zeitpunkten dank der verfügbaren „time-travel“ Funktion.
Zeenea
Die Nutzerbewertung für Zeenea hat mich überrascht. Wenn man sich den Funktionsumfang und die Marktreife ansieht, hätte ich erwartet, dass andere Anbieter von den Nutzer:innen besser bewertet werden. Aber am Ende hat Zeenea hier wirklich gute Arbeit geleistet.
Zeenea ist ein reiner cloudbasierter Datenkatalog auf Basis eines Knowledge Graphen mit einem Fokus auf Metadaten. Für weitere Funktionalitäten – wie Datenqualität – wird auf die Integration mit Third-Party-Systemen verwiesen via offener API. Ein klares Statement.
In der Präsentation wurde meiner Ansicht nach die einfache Erweiterung des Metadatenmodells hervorgehoben. So wurde gezeigt, wie einfach sich neue „Properties“ zu einem Datenobjekt hinzufügen lassen und diese dann fortan in Analysen, Suchen usw. verfügbar sind, ohne das Metadatenmodell und oder die Applikation neu überarbeiten zu müssen.
Zeenea nennt dieses Konzept den „organischen Datenkatalog“, ein Begriff, den ich selbst in ähnlicher Interpretation verwende. Optisches Highlight waren die Discovery-Funktionen für Objekte und deren Abhängigkeiten. Auf die Analysen entlang der Graphstrukturen wurde nicht weiter eingegangen, dafür aber betont, dass aufgrund des Graphen gezieltere Suchen möglich seien.
Im Vergleich zu den anderen wurde keine klare „Anywhere“ Funktion gezeigt, d.h. wie Informationen aus dem Katalog aus anderen Applikationen heraus aufgerufen werden können. Die Wettbewerber referenzierten regelmäßig auf Hotkeys, die meist in einem Webfenster Informationen bereitstellten.
In der Q&A wurde unter anderem auf die Vorteile eines Knowledge-Graphen eingegangen.
Im nächsten Beitrag dieser dreiteiligen Blogserie zeigen wir, welcher Anbieter die Live-Zuschauer:innen am meisten überzeugen konnte.