Meine Kollegen aus dem Bereich Business Processes haben ein Reifegradmodell zur Bewertung der unternehmensweiten Datenqualität entwickelt. Dieser Modell-Ansatz bietet anhand eines Fragebogens die Möglichkeit, den Reifegrad für die verschiedenen Dimensionen des Data Quality Management (DQM) zu ermitteln. Auf dieser Basis lassen sich dann individuelle Lösungsansätze zur Verbesserung der Datenqualität erarbeiten.

Was ist Datenqualität?

Bevor wir uns darauf stürzen, die Datenqualität anhand des von uns entwickelten Reifegradmodells einzuschätzen, gilt es zunächst, ein einheitliches Verständnis des Begriffes „Datenqualität“ zu schaffen.

In Bezug auf die Datenqualität hinterfragen wir, inwieweit sich Daten bzw. Stammdaten zur Erfüllung eines bestimmten Zweckes eignen. Dazu bewerten wir sie über eindeutige Kriterien, wie bspw. ihre Genauigkeit oder ihre Aktualität. Eine ausführliche Definition findet ihr in diesem Online-Lexikon.

In der Praxis stellt sich die Situation so dar, dass nahezu alle Geschäftsprozesse Stammdaten benötigen, um zum Beispiel Transaktionen auszuführen oder betrieblicher Aktivitäten zu unterstützen. Dabei gilt natürlich auch hier, je höher die Qualität der Daten, umso bessere Ergebnisse erzielen die Prozess und desto geringer die Fehlerquote. Etwas verallgemeinert können wir also feststellen, dass qualitativ hochwertige Daten eine grundsätzliche Voraussetzung dafür sind, das Unternehmen ihre monetären sowie nicht monetären Geschäftsziele verwirklichen oder gar übertreffen.

Je mehr informationsverarbeitende Systeme ein Unternehmen einsetzt und je mehr Daten es sammelt, desto wichtiger wird die Qualität dieser Daten. Unternehmen schaffen sich heute Wettbewerbsvorteile, indem sie qualitativ hochwertige Informationen vorhalten bzw. diese besser insbesondere für Management-Entscheidungen schneller zur Verfügung zu stellen.
Steffen Pietsch, Vice President Geschäftsprozesse bei IBsolution

Data Quality Management unterstützt Unternehmen, ihre Daten aufzuwerten und konsistent vorzuhalten. Es überwacht und steuert die Qualität der Daten und ermöglicht, dass Unregelmäßigkeiten so früh wie möglich identifiziert und behoben werden können.

Auswirkungen von schlechter Datenqualität

Generell unterscheiden wir 4 verschiedenen Kategorien der Auswirkungen von schlechter Datenqualität.

1. Finanzielle Auswirkungen
2. Auswirkungen auf Zuversicht und Zufriedenheit
3. Auswirkungen auf die Produktivität
4. Auswirkungen auf Risiko und Zustimmung

Vor allem vor dem Hintergrund einer wachsenden Informationstechnologie und dem Thema Big Data werden sich die daraus resultierenden Begleiterscheinungen noch potenzieren. Studien aus dem Jahr 2002 zeigten, dass bereits zur Jahrtausendwende zahlreiche Top-Banken Defizite im Bereich des Datenmanagements aufwiesen. Zwar sind Ausmaß und Bedeutung von schlechter Datenqualität in den Unternehmen mehr oder weniger bekannt. Dennoch tendieren die meisten dazu, die Lösung des Problems darauf zu beschränken, die Dokumentation zu hinterfragen oder an der ausgewählten Software zu zweifeln. Doch wie verhalten sich Daten in einem Unternehmen und wie kann man schlechter Datenqualität aktiv entgegen wirken?

Aus unserer Erfahrung zeigt sich, Unternehmen sehen sich hier in der Regel mit einem Dilemma biblischen Ausmaßes konfrontiert, da die Auswirkungen von schlechter Datenqualität meist zu umfassend sind, um sie in einem einzigen Projekt zu beseitigen. Daher empfehlen wir eine schrittweise Vorgehensweise, zum Beispiel anhand der folgenden Fragen:

  • Welche Daten fehlen oder sind unbrauchbar?
  • Welche Daten stehen im Konflikt?
  • Welche Aufzeichnungen sind Duplikate?
  • Welche Kopplungen fehlen?
  • In welchem Ausmaß beeinträchtigen fehlerhafte Daten meine Organisation?

Ihr solltet nicht davor zurückschrecken, die notwendigen Prozesse im Bereich Datenqualität und Enterprise Data Management einzuführen. Und natürlich müssen innerhalb dieser Prozesse die Rollen und Kompetenzen der Beteiligten sinnvoll definiert sein.

Reifegradmodell

Reifegradmodell für Stammdatenqualität

Das von uns entwickelte Reifegradmodell bietet hier eine Art ad hoc Standortbestimmung in Bezug auf die Qualität und die etablierten Prozesse eurer Stammdaten. Es liefert verlässliche Anhaltspunkte zum tatsächlichen Qualitätsniveau der Stammdaten und trägt dadurch maßgeblich dazu bei, reaktive Problemlösungen zu vermeiden.

Auf Basis unserer Projekterfahrung und diverser Modellansätze haben wir sogenannte Qualitätsdimensionen definiert, die der Klassifizierung der vielfältigen Aspekte in Bezug auf die Datenqualität dienen:

  • Richtlinien
  • Maßnahmen
  • Verwaltung
  • Standards
  • Technologie
  • Performance Management

Jeder dieser Dimensionen haben wir spezifische Anforderungen und individuelle Maßnahmen zugeordnet. Die individuellen Ausprägungen dieser Qualitätsdimensionen werden anhand eines Fragebogens erfasst und ausgewertet.
screenshot1

Hinsichtlich der Ergebnisbewertung unterscheiden wir je nach Komplexität der Dimension vier verschiedene Reifegrade:

1. Intial:

  • Datenqualitätsaktivitäten sind reaktiv
  • Erwartungen nicht dokumentiert
  • Fähigkeiten zur Identifikation von Erwartungen an Datenqualität vorhanden

2. Defined:

  • Dimensionen von Datenqualität sind identifiziert und dokumentiert
  • Erwartungswerte assoziieren mit den Dimensionen, Format sowie Semantik sind in Regeln für Datenqualität festgelegt
  • Methoden um Auswirkungen auf das Unternehmen zu erkennen sind erforscht

3. Managed:

  • Validität von Daten wird prozessgestützt inspiziert sowie überwacht
  • Analyse der Auswirkungen von Datenfehlern auf das Unternehmen sind üblich
  • Datenassessments werden zyklisch durchgeführt

4. Optimized:

  • Benchmarks in Bezug auf Datenqualität sind definiert
  • Überwachung von Anforderungen an Datenqualität in Bezug auf individuelle Performanceziele
  • Kontrolle der Datenvalidierung sind in Geschäftsprozesse integriert

Die einzelnen Dimensionen werden anhand der o.g. Reifegrade bewertet und die Ergebnisse in einem Netzdiagramm dargestellt. Anhand dieser Darstellung lässt sich auf einen Blick feststellen, in welchen Bereichen der Datenqualität und der Enterprise Data Management Prozesse noch nachgebessert werden muss. Da jeder Qualitätsdimension konkrete Maßnahmen zugeordnet sind, lassen sich ad hoc Lösungsansätze ermitteln, die zur Verbesserung der Datenqualität beitragen und die vorhandenen Herausforderungen angehen.
screenshot2

Welche Maßnahmen das im Einzelnen sind, ist sowohl vom Reifegrad der jeweiligen Dimension als auch vom Unternehmen selbst individuell abhängig.

Zusammenfassung & Ausblick

Abschließend lässt sich zusammenfassen, dass die Kollegen ein wirklich umfangreiches Rahmenwerk zur Messung des Reifegrades der Stammdatenqualität erstellt haben. Viele derart umfangreiche Methoden wirken überladen und geben keine konkreten Handlungsempfehlungen. Hier haben es die Kollegen geschafft, konkrete und praxisnahe Maßnahmen zu definieren, welche sich in anderen Projekten bereits bewährt haben!

Wir freuen uns auf Euer Feedback.