Der Begriff „Datensubstitution“ bezeichnet den gezielten Austausch von Datenfeldern oder Dateninhalten innerhalb eines Systems oder Datenbestands durch andere Werte. Ziel ist es, Daten aus Datenschutzgründen zu anonymisieren oder pseudonymisieren, fehlerhafte oder unvollständige Daten zu korrigieren oder die Datenqualität zu verbessern. Datensubstitution kann sowohl manuell als auch automatisiert erfolgen und wird häufig im Rahmen von Datenmigration, Data Masking, Testing oder bei der Einhaltung von Compliance-Vorgaben eingesetzt.
Regelbasierter Datenersatz: Austausch von Datenfeldern nach vordefinierten Regeln (z. B. Ersetzen aller Telefonnummern durch eine Platzhalternummer).
Datenmaskierung (Data Masking): Substitution sensibler Daten mit strukturell ähnlichen, aber fiktiven Werten, z. B. für Testzwecke.
Anonymisierung und Pseudonymisierung: Entfernung oder Umwandlung personenbezogener Daten zum Schutz der Privatsphäre gemäß DSGVO.
Automatisierter Datenabgleich: Erkennung und Substitution veralteter oder fehlerhafter Daten durch aktuelle oder korrekte Werte.
Kontextsensitive Substitution: Austausch von Daten basierend auf dem Verwendungszusammenhang (z. B. Ersetzen einer Lieferadresse nur im Rahmen von Testaufträgen).
Substitutionsprotokollierung: Nachvollziehbare Dokumentation aller vorgenommenen Ersetzungen zur Einhaltung von Compliance-Standards.
Ein Testsystem ersetzt alle echten Kundennamen durch fiktive Namen, um Datenschutzrichtlinien einzuhalten.
In einer Datenmigration werden veraltete Produktnummern durch aktuelle Artikelnummern ersetzt.
Ein Unternehmen ersetzt reale IBANs in einer Datenbank durch synthetisch erzeugte Test-IBANs für ein internes Schulungssystem.
Eine Marketingdatenbank wird bereinigt, indem fehlerhafte E-Mail-Adressen durch gültige Platzhalter ersetzt werden.
Im Rahmen der DSGVO wird bei der Archivierung von Kundendaten der Name durch ein anonymes Token ersetzt.