31. August 2017

Die neun Grundsätze für nachhaltige Datenqualität

Heute sind Daten wesentlicher Gegenstand operativer Prozesse und dispositiver Entscheidungen, sowie neuer Produkte und Dienstleistungen. Datengesteuerte Unternehmen müssen sich Gedanken darüber machen, diesen Produktionsfaktor zu pflegen und weiterzuentwickeln.

Datengesteuerte Unternehmen brauchen verlässliche Daten

In dem Maße wie Unternehmen die Relevanz von Daten für ihr Geschäft erkennen, führt dies zu neuen Stakeholdern und Erwartungen sowie zu einem Wandel im Umgang mit Daten und Analytik.

Künftige analytische Landschaften weisen eine zunehmende Heterogenität auf: Einerseits durch die Sammlung, Aufbereitung, Analyse und Visualisierung von unterschiedlich strukturierten Daten aus verschiedenen internen und externen Quellen, aber auch andererseits durch zusätzliche analytische Lösungen, die auf und neben dem Data Warehouse oder direkt in den operativen Systemen laufen.

Es liegt auf der Hand, dass mit dieser Entwicklung die Bedeutung verlässlicher Nutzdaten und konsistenter Stammdaten wächst, da die Notwendigkeit zur Abbildung einer einheitlichen und verlässlichen Basis für analytische Anforderungen zur Optimierung der bestehenden Prozesse oder Innovation des Geschäfts nicht nur weiterbesteht, sondern immer wichtiger wird.

Ein institutionalisiertes Datenqualitäts- und Stammdatenmanagement sind wesentliche Voraussetzungen für jedes datengesteuerte Unternehmen.

Die Grundsätze für das Datenqualitätsmanagement

BARC führt regelmäßig Marktbefragungen durch und betreut Unternehmen in ihren Digitalisierungsprojekten. Die folgenden Grundsätze für das Datenqualitätsmanagement fassen die dabei ermittelten wesentlichen Erkenntnisse zum Status Quo der Datenqualität in Unternehmen zusammen.

Mittels dieser Grundsätze können sich Unternehmen für die Relevanz verlässlicher Daten sensibilisieren und Initiativen zur Optimierung ihrer Datenqualität starten:

1. Daten haben aus diversen Gründen immer Fehler

Fehler in Daten entstehend durch Eingabefehler von Menschen (ca. fünf Prozent aller manuellen Eingaben sind durchschnittlich fehlerhaft), Verarbeitungsfehler (Rechen-, Übertragungs-, Datenformatfehler), bewusste Falscheingabe/Betrug (z. B. Mitarbeiter-Bonus-Systeme mit Prämien für Neukunden führen zu mehr Dubletten).

Zudem ändert sich die Wirklichkeit, die durch die Daten abgebildet werden soll (z. B. bei einem Umzug wird die Adressinformation in der Datenbank in diesem Moment falsch). Daneben kann die fachliche Aussagekraft durch die Art der technischen Modellierung, Ablage, Nutzung oder Anzeige der Daten mangelhaft sein.

2. Die Güte der Daten/ Datenqualität definiert sich aus dem Verwendungskontext

Die benötigte Güte von Daten ergibt sich nicht aus absolut gültigen Qualitätsmaßstäben, sondern aus dem Verwendungskontext (z. B. Kundendaten, die einerseits für die Berechnung einer Kundenbonität und andererseits zur Kundensegmentierung im Zielkundenmarketing genutzt werden. Im ersten Fall müssen strengere Regeln für die Datenqualität gelten, weil der Kunde direkt (negativ) betroffen sein kann. Im letzteren Fall halten sich die Auswirkungen mangelnder Datenqualität in Grenzen, da die Konsequenzen wahrscheinlich nicht direkt spürbar sind.

3. Daten brauchen Öffentlichkeit, um die Qualitätsmängel zu identifizieren

Datenfehler im ERP-System werden z. B. dort nicht immer entdeckt, da nicht alle Daten in diesem System verarbeitungsrelevant sind; sie zeigen sich erst in der Anzeige, z. B. in einem Bericht. Gerade referentielle Fehler werden erst offensichtlich, wenn alle Daten gemeinsam verarbeitet oder angezeigt werden.

4. Die Bereinigung der Fehler sollte immer so nah wie möglich am Entstehungsort der Daten erfolgen

Fehler sollten lieber bei der Eingabe entdeckt werden als später nach der Verarbeitung (z. B. indem man Vorkehrungen trifft, dass nur gültige Werte erfasst werden durch Dublettenprüfungen, Prüfung von Geschäftsregeln, vordefinierte Auswahlwerte etc.)

Gefällt Ihnen dieser Beitrag?

Wir haben noch viel mehr davon! Schließen Sie sich über 25.775 Data & Analytics Professionals an, um der Konkurrenz einen Schritt voraus zu bleiben.

5. Datenqualitätsmanagement erfolgt primär in den Dimensionen Organisation, Prozesse und Technologie

Datenqualitätsmanagement erfolgt in der Organisation z. B. durch Verantwortlichkeiten, Organisationeinheiten, Anforderungsmanagement; in Prozessen z. B. durch Richtlinien, Anwenderprofile, Anwendungsfälle; in Technologie z. B. in der Architektur, Software, durch Konzepte und Einsatzprinzipien.

6. Organisation und Prozesse sind wichtiger als Technologie

Organisatorische Aspekte haben einen größeren Einfluss auf die Datenqualität als technische. Prozesse sind mindestens so wichtig wie Tools.

7. Verantwortung für Daten muss im Fachbereich liegen und geklärt werden

Datenqualitätsmanagement ist keine IT-Aufgabe. Bewährt haben sich die Management-Rolle „Data Owner“, der die Qualitätskriterien, ggfs. aufgrund gesetzlicher Anforderungen (Aufbewahrungsfristen, Datenschutz) u. Ä. definiert und kontrolliert; sowie die operative Rolle eines „Data Steward“ zur laufenden Überwachung und Bereinigung von Daten.

8. Datenqualitätsmanagement muss alle Daten umfassen

Datenqualitätsmanagement muss transaktionale Geschäftsdaten, Stammdaten, Maschinendaten und von Menschen generierte Daten umfassen.

9. Datenqualität wird automatisch schlechter und muss daher ständig überwacht und verbessert werden

Daten „altern“ und müssen ständig gepflegt werden. Datenqualitätsmetriken helfen, den Qualitätsstand zu überwachen.

Nicht nur datengesteuerten Unternehmen erkennen schmerzlich, dass der Produktionsfaktor „Daten“ genauso wie die anderen Produktionsfaktoren „Arbeit“, „Boden“ und „Kapital“ nicht per se in der richtigen Quantität und Qualität zur Verfügung steht, sondern verwaltet, gepflegt und weiterentwickelt werden muss.

Nach der Ermittlung des Status Quo der innerbetrieblichen Datenqualität, können Unternehmen mit mittels Justierung der Organisation, Optimierung der Prozesse und Verbesserung der technologischen Unterstützung die Datenqualität effizient und nachhaltig steigern, sowie langfristig sichern.

The Data Management Survey

Nutzen Sie Software für Data Intelligence, Data Catalogs & Marketplaces, Cloud Data Platforms, Data Observability & Quality, Data Warehouse Automation oder Data Product Engineering? Dann würden wir gerne Ihre Erfahrungen dazu hören!

Nehmen Sie jetzt an der weltweit größten Umfrage zum Thema Data Management teil:

Weitere Inhalte entdecken

Artikel

19. Dezember 2025

Wir wünschen schöne Feiertage!

Artikel

10. Dezember 2025

End of Maintenance SAP BW: Was nun?

Artikel

25. November 2025

Data Culture: Definition, Herausforderungen & Maßnahmen

Artikel

24. November 2025

Die fünf Prioritäten für Data Leader 2026

Artikel

24. November 2025

AI in Data Management: A Reality Check on the „Agent Wonderland“ [EN]

Infografik

19. November 2025

Infografik: BARC Data, BI and Analytics Trend Monitor 2026

Artikel

10. Oktober 2025

BI-Frontends im Wandel: Neue Funktionen, alte Lücken

Artikel

18. September 2025

Navigating AI and IP: A Guide to Copyright & Ownership [EN]

Artikel

2. September 2025

The Discipline of Data Disposal: A Strategic Guide [EN]

Artikel

7. August 2025

Putting Data Sovereignty into Practice [EN]

Artikel

7. August 2025

Hybride Cloud: Warum Unternehmen ihre IT-Strategie neu ausrichten

Artikel

5. August 2025

Key Trends in Data Monetization: An Analysis [EN]

Ein Beitrag von:

Timm Grosser

Senior Analyst Data & Analytics

Timm Grosser ist Senior Analyst Data & Analytics am Business Application Research Center (BARC) mit den Schwerpunkten auf Datenstrategie, Data Governance und Datenmanagement. Seine Kernkompetenzen liegen in der Definition und Umsetzung ihrer Data & Analytics Strategie, Organisation, Architektur und Werkzeugauswahl.

Er ist ein gefragter Redner auf Konferenzen und Seminaren sowie Autor zahlreicher BARC-Marktstudien und Fachartikel.

Die neun Grundsätze für nachhaltige Datenqualität

Datengesteuerte Unternehmen brauchen verlässliche Daten

Die Grundsätze für das Datenqualitätsmanagement

1. Daten haben aus diversen Gründen immer Fehler

2. Die Güte der Daten/ Datenqualität definiert sich aus dem Verwendungskontext

3. Daten brauchen Öffentlichkeit, um die Qualitätsmängel zu identifizieren

4. Die Bereinigung der Fehler sollte immer so nah wie möglich am Entstehungsort der Daten erfolgen

5. Datenqualitätsmanagement erfolgt primär in den Dimensionen Organisation, Prozesse und Technologie

6. Organisation und Prozesse sind wichtiger als Technologie

7. Verantwortung für Daten muss im Fachbereich liegen und geklärt werden

8. Datenqualitätsmanagement muss alle Daten umfassen

9. Datenqualität wird automatisch schlechter und muss daher ständig überwacht und verbessert werden

Weitere Inhalte entdecken

Wir wünschen schöne Feiertage!

End of Maintenance SAP BW: Was nun?

Data Culture: Definition, Herausforderungen & Maßnahmen

Die fünf Prioritäten für Data Leader 2026

AI in Data Management: A Reality Check on the „Agent Wonderland“ [EN]

Infografik: BARC Data, BI and Analytics Trend Monitor 2026

BI-Frontends im Wandel: Neue Funktionen, alte Lücken

Navigating AI and IP: A Guide to Copyright & Ownership [EN]

The Discipline of Data Disposal: A Strategic Guide [EN]

Putting Data Sovereignty into Practice [EN]

Hybride Cloud: Warum Unternehmen ihre IT-Strategie neu ausrichten

Key Trends in Data Monetization: An Analysis [EN]

Ein Beitrag von:

Bereit für das datengetriebene Unternehmen von morgen?

Dann lassen Sie es uns gemeinsam zum Leben erwecken