#7 Datendomänen – eine Strukturierung des Datenuniversums

In einer Organisation gibt es sehr viele, sehr unterschiedliche Arten von Daten. Stammdaten wie Kunden und Mitarbeiter, Bewegungsdaten wie Rechnungen und Aufträge oder Referenzdaten wie die Standorte-Liste oder das Postleitzahlen-Verzeichnis. Diese Vielzahl von Datenarten zu beherrschen und effizient und effektiv zu verwalten kann sehr herausfordernd sein. Um die Komplexität des Daten-Universums meistern zu können, strukturieren wir Daten in so genannten „Domänen“. Eine Datendomäne ist dabei ein inhaltliche Zusammenfassung gleichartiger Datenelemente.

Was bedeutet das genau? Wie definiert man Datendomänen und was ist der Nutzen der Strukturierung in Datendomänen?

Charakteristiken einer Datendomäne

Eine Datendomäne ist eine logische Gruppierung von Datenobjekten, die einen engen inhaltlichen Bezug zueinander haben. Eine Datendomäne ist dabei nach drei Dimensionen definiert:

  • Struktur: Welche Geschäftsobjekte und Attribute (der Geschäftsobjekte) gehören zu einer Datendomäne? Beispiel: Die Geschäftsobjekte „Kundenadresse“ und „Debitoren-Steuernummern“ werden (neben anderen Geschäftsobjekten) zu einer Datendomäne „Kunde“ zusammengefasst. Im Geschäftsobjekt „Kundenadresse“ sind u. a. Attribute wie „Name“, „Straße“, „PLZ“ und „Ort“ definiert.
  • Verhalten: Datenobjekte der Datendomäne und deren Inhalte werden angelegt, geändert und genutzt. Für die Datendomäne müssen die Verwaltungs- und die Nutzungsprozesse definiert sein. Die Nutzungsprozesse bestimmen die Anforderungen an die Daten, während die Verwaltungsprozesse sicherstellen, dass diese Anforderungen durch die Daten auch erfüllt werden. Beispiel: Der Nutzungsprozess „E-Mail Marketing“ benötigt zu jedem Kunden eine E-Mail-Adresse. Dies muss der Verwaltungsprozess in der Kundenstamm-Pflege entsprechend sicherstellen, Lücken ggf. schließen sowie fehlerhafte E-Mail-Adressen erkennen und korrigieren.
  • Inhalt: Festlegungen, welche Inhalte in den Objekten der Datendomäne gespeichert werden. Je Datenobjekt und je einzelnem Attribut bzw. Feld eines Datenobjekts muss eine solche Festlegung erfolgen. Dies betrifft sowohl Syntax (Länge eines Textfeldes, Anzahl Nachkommastellen einer Dezimalzahl) als auch die Werte an sich, wie bspw. erlaubte Werte, Wertebereich (größte und kleinste zugelassene Zahl oder erlaubter Datumsbereiche. Diese inhaltlichen Festlegungen können dann auch genutzt werden, um Datenqualitätsregeln bzw. Datenqualitäts-Kennzahlen zu definieren und zu messen. Näheres hierzu schreibe ich in einem späteren Blog-Beitrag.

Verantwortung wird Datendomänen zugeordnet

Jede Datendomäne hat spezifische Eigenschaften und an sie gestellte Anforderungen. Damit ist die Ebene der Datendomäne die richtige Stelle, um Verantwortlichkeiten für Daten festzulegen und zuzuordnen.

Somit hat jede Datendomäne eine verantwortliche Entscheiderin oder einen verantwortlichen Entscheider, nämlich die oder den Data Owner. Weiterhin braucht jede Datendomäne eine inhaltliche Verantwortung, die der oder die Data Steward übernimmt. Diese Rollen habe ich in meinem Blog-Beitrag #4 – Rollen und Verantwortlichkeiten in Data Governance ausführlich erläutert. Data Owner und Data Steward werden somit je Datendomäne definiert. Eine Datendomäne ist das „Konstrukt“, auf dem oder bzgl. dem wir Richtlinien definieren, Standards etablieren und Datenqualität messen.

Typische Datendomänen

In jeder Organisation gibt es unterschiedliche Datendomänen. Es kommt auch vor, dass inhaltlich gleiche Datendomänen in einer Organisation anders bezeichnet werden als in einer anderen Organisation.

In Versicherungsunternehmen ist beispielsweise der Begriff „Partner“ für die Daten von Kunden und anderen Geschäftspartnern etabliert, während andere Organisationen dafür vielleicht den Begriff „Kunde“ verwenden. Wirtschaftsunternehmen verwalten Daten zu Produkten und/oder Dienstleistungen sowie zu Kunden und Lieferanten, während Behörden möglicherweise nicht von „Kunden“, sondern von „Bürgern“ sprechen.

Im Folgenden liste ich einige Datendomänen auf, die unter dem angegebenen oder einem anderen Titel in Organisationen vorkommen:

  • Kunde: Daten zu den Kunden einer Organisation mit Informationen wie Name, Adresse, Steuernummern, Bankverbindung, Branche, Umsatz des Kunden, Anzahl Mitarbeiter, Ansprechpartner
  • Material oder Produkt: Daten zu den „Dingen“, die ein Unternehmen verkauft oder auch einkauft mit Attributen wie Name, Beschreibung, Gewicht, Maße, Material, Gruppierung
  • Mitarbeiter: Informationen zu den Mitarbeiterinnen und Mitarbeiter einer Organisation mit Attributen wie Name, Eintrittsdatum, Adresse, Bankverbindung, Geschlecht, Religion, Geburtsdatum oder Arbeitsort

Mit dem Fokus auf seine bzw. ihre Datendomäne können Data Owner und Data Stewards strukturiert und fokussiert ihre Datenwelt strukturieren, steuern und verbessern. Ohne eine solche Einteilung in Bereiche – also Datendomänen – ist das große „Universum der Daten“ kaum handhabbar. Ferner wird das Zuweisen von klaren Verantwortlichkeiten schwierig, wenn der Verantwortungsbereich nicht benannt und abgegrenzt werden kann.

Für eine Datendomäne können nun Data Owner und Data Stewards erste Aktivitäten starten. Dies kann bspw. die Befüllung eines Glossar von Begrifflichkeiten sein, die für die Datendomäne relevant sind. Warum das sinnvoll und wichtig ist, wie man dazu vorgehen kann und welchen Nutzen das hat, darauf gehe ich in meinem nächsten Blog-Beitrag ein.