Gut gepflegte Adresslisten und Kundenstammdaten sind die Basis für erfolgreiche Marketing- und Vertriebsaktionen. Darüber hinaus ist eine fehlerfreie Adressdatenbank entscheidend für aussagekräftige Analysen und Statistiken und grundlegend für gezieltes Campaign Management. Bei einem unserer Kunden gab es die Anforderung die Qualität von Kundendaten zu erhöhen um besser gezielte Marketingkampagnen umzusetzen. Deshalb ist es wichtig, regelmäßig eine Dubletten-Prüfung durchzuführen, um Duplikate zu finden und die Adressen zu bereinigen.

Als Tool bot sich hier Tolerant Match von Tolerant Software an, das für diese Anwendungszwecke entworfen wurde und den Grad der Ähnlichkeit von Datensätzen mittels eines stark konfigurierbaren Scores darstellen kann.

Identifikations-Typen

Statische Identifikation

Beim Laden von Kundendaten wird gegen den Bestand geprüft, ob die Kunden identifiziert werden können.

Dynamische Identifikation

Innerhalb der aktuellen Datenlieferung wird auf Duplikate oder zusammengehörige Datensätze geprüft.

Identifikation via Tolerant Match

Tolerant Match ist ein GUI-Tool von Tolerant Software, das sich mit Datenbanken verbinden kann und bei der Erkennung von Datensatz-Duplikaten oder ähnlichen Datensätzen hilft. Die bereinigten Daten können in die Datenbank zurückgeschrieben werden.

Tolerant Match ermöglicht unscharfe Identifizierungskriterien. Dies bedeutet, dass es Lösungen bietet, um eine Identifizierung zu ermöglichen, selbst wenn es Rechtschreibprobleme oder unvollständige Informationen in den bereitgestellten Identifizierungsdaten gibt.

Tolerant Match findet Adressdaten und Kunden, auch wenn nur bruchstückhafte Informationen vorliegen. Die spezielle Technologie in Tolerant Match erlaubt es auch, verschiedene Optionen zur Suche zu kombinieren.

Ein Kontakt kann über verschiedene Kombinationen von Feldern identifiziert werden. Im Beispiel wird dies mittels FIRSTNAME, LASTNAME und Adresse versucht.

Erstellung von Regeln für Referenzdaten

Der Regelsatz für tolerante Übereinstimmung wird in kundenspezifischen Profilen verwaltet, die in XML-Dateien niedergelegt werden. Die Regeln sind ziemlich komplex und in der Regel nicht sehr volatil. Sie lassen sich in der Regel am einfachsten über die GUI anpassen und in einem XML-Profil speichern.

Aufgrund der Komplexität der XML-Profile empfiehlt es sich, diese in einem Versions-Kontroll-Tool zu verwalten, um etwaige Änderungen gut nachvollziehen zu können.

Ein Beispiel für ein Tolerant Match Profil:
Der Grad an Übereinstimmung zweier Records wird über einen Score angegeben, auf dessen Errechnung man in den Regeln Einfluss nehmen kann:

Tolerant Match durchsucht die Daten nach Übereinstimmungen (hier ein Beispiel-Log):

Im Beispiel ist die Bedingung für ein Match, dass der Score einen vorgegebenen Minimal-Wert überschreitet: Erreicht der Score für die Übereinstimmung wie hier den vorgegebenen Wert (im Beispiel in Spalte 2 ist der Score 95)…

…gilt der Kontakt als identifiziert und kann mit der gefundenen ID in den Datenbestand zurückgeschrieben werden: