Unter „Datenpflege“ versteht man die kontinuierliche Aktualisierung, Korrektur, Ergänzung und Konsolidierung von Datenbeständen in Softwaresystemen. Ziel der Datenpflege ist es, die Datenqualität langfristig zu sichern, redundante oder fehlerhafte Einträge zu vermeiden und eine verlässliche Informationsbasis für Geschäftsprozesse und Analysen zu schaffen. Datenpflege ist ein zentraler Bestandteil des Datenmanagements und betrifft sowohl strukturierte Daten (z. B. Kundendaten, Produktinformationen) als auch unstrukturierte Daten (z. B. Dokumente).
Dublettenerkennung und -bereinigung: Identifikation und Zusammenführung doppelter Datensätze (z. B. doppelte Kunden- oder Artikelnummern).
Validierung und Plausibilitätsprüfungen: Automatische Überprüfung von Datenformaten, Pflichtfeldern und Wertebereichen.
Automatische Vervollständigung: Ergänzung fehlender Daten mithilfe von Regeln, Vorlagen oder externen Datenquellen.
Versionierung und Änderungsprotokollierung: Dokumentation von Datenänderungen zur Nachverfolgbarkeit und Qualitätssicherung.
Massendatenbearbeitung: Gleichzeitige Aktualisierung oder Korrektur großer Datenmengen (z. B. per Import oder Batch-Funktion).
Workflows für Datenfreigabe: Genehmigungsprozesse zur Sicherstellung, dass Änderungen nur durch autorisierte Personen erfolgen.
Rechtschreib- und Formatkorrekturen: Vereinheitlichung von Schreibweisen und Einhaltung von unternehmensweiten Formatstandards.
Integration externer Datenquellen: Abgleich und Anreicherung interner Daten mit externen Informationen (z. B. Adressverzeichnisse, Branchendaten).
Ein Handelsunternehmen bereinigt doppelte Lieferanteneinträge im ERP-System.
Ein Vertriebsmitarbeiter aktualisiert veraltete E-Mail-Adressen im CRM-System.
Ein Data Steward ergänzt fehlende Umsatzdaten durch den Import aus einem Buchhaltungstool.
Ein Unternehmen überprüft regelmäßig die Formatierung von Telefonnummern nach einem einheitlichen Standard.
Ein Marketing-Team nutzt einen Workflow zur Freigabe neuer Produktbeschreibungen in der Produktdatenbank.