Record Linkage Log

Das Record Linkage Log ist das Modul, das alle Ergebnisse des Record-Linkage-Prozesses speichert. Hier kannst du nachvollziehen, welche Datensätze verglichen wurden, wie hoch ihre Ähnlichkeit ist und welche Aktionen durchgeführt wurden.

Einführung

Dieses Modul speichert die Ergebnisse der Record-Linkage-Berechnungen. Jeder Eintrag im Log repräsentiert einen Quell-Datensatz, der verarbeitet wurde. Wenn derselbe Datensatz mehrfach erscheint, bedeutet das, dass er in mehreren Änderungen berücksichtigt wurde.

Für jede Änderung speichert das System:

  • Den höchsten Ähnlichkeitswert zwischen Quelle und Ziel.
  • Feldbasierte Unterschiede gemäß der Mapping-Konfiguration.

Falls du auf Fehler stoßen sollten, kannst du hier nachschauen, was die Fehler Codes bedeuten.

Struktur und Spalten

Die wichtigsten Spalten im Log:

  • Source Module / Source Record: Ursprungsdatensatz.
  • Target Module / Target Record: Vergleichsdatensatz.
  • Similarity Score: Höchster berechneter Wert.
  • Linkage Details: Zusammenfassung der Unterschiede.
  • Status: Match (automatisch verknüpft – Score ≥ oberer Schwellenwert), Potenzielles Match (muss manuell geprüft werden) oder No Match (keine Verknüpfung).

Nutzer können die Ergebnisse nach Ausführungsdatum oder Runner filtern.

Automatisierte Aktionen

Ein automatisierter Prozess (Mass Transfer Scheduler) führt die in der Spalte „Action Taken“ definierten Aktionen aus:

  • Link: Erstellt automatisch eine Verknüpfung zwischen Quelle und Ziel.
  • Do Nothing: Keine Änderungen – ideal für Tests.

Überprüfung potenzieller Matches

Potenzielle Matches müssen von einem Datenverantwortlichen geprüft werden. Dieser stellt sicher, dass der Quell- und Zieldatensatz dieselbe Entität (z.B. Person) repräsentieren. Mögliche Aktionen:

  • Link: Verknüpft die Datensätze.
  • Do Nothing: Keine Änderung.
  • Create as Target Record: Erstellt einen neuen Ziel-Datensatz basierend auf dem Quell-Datensatz.

Diese Option stellt sicher, dass einzigartige Datensätze korrekt hinzugefügt werden, ohne die Datenqualität zu gefährden.

Potenzielle Matches

Präkonfigurierte Workflows

Um eine korrekte Ausführungsreihenfolge sicherzustellen, müssen bestimmte Workflows eingerichtet werden. Diese Workflows steuern, wann Runner erstellt, gestartet oder gestoppt werden. Alle Workflows sollten als „Only on save“ und für wiederholte Ausführungen konfiguriert sein.

Workflows

Create a new runner for the first time

Dieser Workflow erstellt einen neuen Runner mit dem Status queued, sobald eine aktive Konfiguration gespeichert wird und noch kein Runner existiert.

Workflow: Create Runner

Trigger signal to create a new Record Linkage Runner

Dieser Workflow erstellt einen neuen Runner mit Status queued, wenn:

  • Die Konfiguration aktiv ist und gespeichert wird
  • Kein Runner mit Status queued oder running existiert.

Hinweis: Es wird nur eine neue Ausführung erstellt, wenn aktuell keine andere Ausführung läuft oder verarbeitet wird.

Workflow: Trigger Signal to create new Runner

Trigger request when status is queue

Dieser Workflow wird ausgelöst, sobald ein Runner den Status queue hat. Er sendet die Runner-ID per POST-Request an den Record-Linkage-Prozess, um die vollständige Konfiguration abzurufen und die Ausführung zu starten.

Hinweis: Die Aktivierung muss sofort erfolgen, um sicherzustellen, dass die richtige Runner-ID gesendet wird. Andernfalls könnte eine andere ID verarbeitet werden, was den Ablauf stört.

Trigger the next configuration when runner status is Done

Dieser Workflow sendet einen POST-Request (ohne Runner-ID) an den Record-Linkage-Prozess, sobald ein Runner den Status Done erreicht. Damit wird der nächste Runner in der Warteschlange gestartet.

Logik: Der Prozess ruft den ältesten Runner mit Status queued ab und führt ihn aus. So wird sichergestellt, dass alle Runner in der Reihenfolge ihres Erstellungsdatums verarbeitet werden.

Set stopped status and trigger stop action

Dieser Workflow sendet einen POST-Request an den Record-Linkage-Server mit dem Endpunkt /stop/, wenn die Stop-Checkbox auf „Yes“ gesetzt wird. Dadurch wird die aktuelle Ausführung gestoppt.

Hinweis: Es erfolgt kein Rollback. Bereits erstellte Log-Einträge bleiben bestehen, nicht verarbeitete Datensätze werden verworfen.

Marini Systems GmbH | Website | Datenschutz­erklärung | Impressum