Suche
Close this search box.

Der Data Catalog als Gelbe Seiten unternehmensrelevanter Daten

Ein heiß diskutierter technologischer Ansatz, Wissen über verteilte Daten verfügbar zu machen ist der Data Catalog, die „Gelben Seiten“ für unternehmensrelevante Daten. Er speichert Informationen über Daten in Form von Metadaten, strukturiert diese und macht sie durchsuchbar.

Daten sind essenziell für Unternehmen, um im Zeitalter der Digitalisierung Schritt zu halten. Das weiß mittlerweile jeder. Es ist allerdings nicht einfach, den erwünschten Wert aus den Daten zu schöpfen und mit innovativen, datengetriebenen Geschäftsanwendungen zu glänzen. Vielmehr sehen wir ein über Jahre wachsendes Datenchaos in Form von fragmentierten Datenlandschaften und verteiltem Expertenwissen.

Ein heiß diskutierter technologischer Ansatz Wissen über verteilte Daten verfügbar zu machen ist der Datenkatalog, die „Gelben Seiten“ für unternehmensrelevante Daten. Er speichert Informationen über Daten in Form von Metadaten, strukturiert diese und macht diese durchsuchbar.

Ein Datenkatalog-Werkzeug erzielt seinen Nutzen vor allem durch drei wesentliche Punkte:

  • Informationsbedarfe schnell und einfach decken
  • Metadaten (Wissen) möglichst effizient (automatisiert) erfassen
  • Plattform zum Wissensaustausch für „Alle“ bieten

Ergänzend sind Funktionen für Data Governance oder den Datenzugriff wertvoll.

Das richtige Werkzeug zu finden, kann sich als komplizierter erweisen als gedacht. Denn der Markt für Datenkataloge ist alles andere als durchsichtig. Wie bei anderen Trendthemen explodiert das Angebot und so sehen wir, dass derweil mehr als 90 Lösungen mit Data-Cataloging-Funktionen weltweit agieren.

Doch Data Cataloging ist nicht gleich Data Cataloging. Die Angebote variieren im Fokus, im Inhalt, den Funktionen und in den unterstützten Anwendungsfällen. Die folgende Tabelle zeigt eine Übersicht der grundsätzlichen Werkzeugtypen für Data Cataloging.

Grundsätzliche gibt es Angebote für den speziellen Anwendungsfall (als Teil eines BI- oder Analytics-Anwenderwerkzeuges, als Teil einer Umgebung) und Angebote, die eine übergreifende, unabhängige Lösung anbieten (Spezialisten, als Teil einer Data Governance (DG)/Datenmanagement(DM)-Plattform).

Werkzeugtypen für Data Cataloging:

Katalog-SzenarioCharakteristikaTool-Beispiele
…selbst gebautrudimentäre KatalogfunktionenExcel, Confluence, Wiki, …
…als Teil eines BI-/Analytics-ToolsKatalogfunktionen bezogen auf die Daten/Artefakte in der eigenen UmgebungAlteryx, Qlik, Tableau, …
…als Teil einer UmgebungKatalogfunktionen bezogen auf technische Daten/Artefakte in der eigenen UmgebungAmazon, Cloudera, Google, …
…als SpezialistUmfassende Katalogfunktionen bezogen auf Daten und teils Artefakten aus unterschiedlichen Werkzeugen/Umgebungen, ergänzende Funktionen, bspw. für Data GovernanceAlation, Waterline, Zeenea, …
…als Bestandteil einer Data Governance/DM-PlattformUmfassende Katalogfunktionen bezogen auf Daten und teils Artefakten aus unterschiedlichen Werkzeugen/Umgebungen. Zusätzliche Funktionalität aus dem Portfolio, bspw. Workflows, Datenqualität, …ASG, Collibra, Infogix, Informatica, SAP, …

Achten Sie vor allem bei der Auswahl des Datenkatalogs auf Schnittstellen und transparente, offene Metadatenmodelle für den Metadatenaustausch mit anderen Katalogen und Systemen. Dies ermöglicht Ihnen eine Reihe von Vorteilen:

  • Sie entgehen dem Vendor-LockIn und können die Fähigkeiten des Werkzeuges gezielt einsetzen
  • Sie können Kataloge aus unterschiedlichen Bereichen oder Umgebungen einfacher in einen übergeordneten Katalog überführen
  • Es ermöglicht eine einfachere Migration oder Integration mit leistungsstärkeren Werkzeugen oder Werkzeuge mit einem anderen Schwerpunkt

Bei der Auswahl eines Datenkatalogs sollten die Funktionen sorgfältig geprüft werden. Zu prüfen sind:

  • Adapter und Funktionen für die Metadatenintegration und -austausch
  • Unterstützte Inhalte, bspw. unterstützte Metadatentypen, Offenheit und Erweiterbarkeit des Metadatenmodells
  • Funktionen und maschinelle Unterstützung für die Pflege (Kuration) von Metadaten
  • Funktionen und maschinelle Unterstützung für die Nutzung des Kataloges und Suche/Navigation/Analyse von Metadaten
  • Einfachheit in der Anwendung
  • die Unterstützung von Kollaboration
  • weitere Datenmanagementfunktionen für bspw. Data Governance, Data Preparation, Datenqualität oder Datenschutz

Bei der Softwareauswahl unterstützen wir auch gerne direkt mit unseren Best-Practice-Erfahrungen, etablierten Vorgehensmodellen und zahlreichen Templates durch den kompletten Prozess von der Anforderungsaufnahme, über die Erstellung einer Short List, PoC-Begleitung bis hin zur Werkzeugentscheidung.

Dadurch gewinnen Sie an Entscheidungssicherheit, sparen spürbar Zeit und Ressourcen und gewinnen einen Partner, der Ihnen hilft, das Ergebnis akzeptiert in das Unternehmen zu tragen. Kontaktieren Sie uns.

Gefällt Ihnen dieser Beitrag?
Wir haben noch viel mehr davon! Schließen Sie sich über 25.775 Data & Analytics Professionals an, um der Konkurrenz einen Schritt voraus zu bleiben.

Weitere Inhalte entdecken

Ein Beitrag von:

Sie wollen mit Ihrem Datenprojekt durchstarten, aber wissen nicht so recht, wie? Hier geht's zu unseren SmartStart Workshops zu verschiedenen Themen.