Process Mining beschreibt die systematische Analyse, Validierung, Modellierung und Visualisierung von Prozessen mithilfe von gespeicherten Log-Einträgen. Ursprünglich wurde Process Mining erdacht, um die Effizienz von Prozessen zu optimieren. Durchlaufzeiten sollten optimiert werden sowie Bottlenecks und Dead Ends (nicht vorgesehene und definierte Prozessenden) identifiziert werden. Process Mining bedient sich dabei statistischer und mathematischer Verfahren.
Wir identifizieren drei Anwendungsbereiche von Process Mining: Analyse, Validierung und Visualisierung.
Ein Prozess Beispiel
Für die Modellierung von Prozessen nutzen wir die lizenzsfreie und standardisierte Notationssprache BPMN. Dies ermöglicht es, Prozesse über Systeme hinweg zu gestalten und Engstellen sowie Bruchstellen zu identifizieren. Dies geschieht a priori. Daher sind die Engstellen und Bruchstellen lediglich hypothetisiert. Process Mining hilft, Prozesse zu analysieren, validieren, modellieren und zu visualisieren. Nachfolgend illustrieren wir die unterschiedlichen Aspekte von Process Mining anhand des folgenden frei erdachten Prozesses.
Erläuterung des Prozesses
Der obige frei erdachte und simplifizierte Prozess der Entwicklung einer Verkaufschance im Sales Funnel dient folgend als Illustration. Eine Opportunity wird erstellt und in Schritt 1 mit Lead-Nurturing entwickelt. Dies ist ein sogenannter collapsed task, sprich dieser beinhaltet einen Sub-Prozess. Dieser könnte aus mehreren automatisierten E-Mails oder Werbebriefen bestehen. Ist der Lead mit entsprechender Verkaufschance entwickelt (engl. nurturing), wird der Status der Verkaufschance auf „Qualifying“ gesetzt (2). Anschließend findet ein Follow-up-Call (3) statt. Besteht kein Interesse mehr, geht der Prozess zu Schritt 8 über und die Verkaufschance wird geschlossen mit dem Status „Closed Lost“. Besteht dahingegen weiter Interesse wird der Status auf „Needs Analysis“ gesetzt (4). Nachdem eine bestimmte Zeit verstrichen (t = 14 Tage) ist, findet ein weiterer Follow-Up-Call statt (5). Danach folgt eine weitere Verzweigung (engl. Gateway). Besteht kein Interesse mehr, folgt Schritt 8. Andererseits wird ein Angebot erstellt und versendet. Das Angebot kann entweder angenommen werden (Schritt 7) oder abgelehnt werden (Schritt 8).
Auf Feedback-Schleifen oder Verhandlungsrunden und weitere Komplexität wurde verzichtet. Der simplifizierte Prozess dient der Illustration.
Data Mining für Prozesse
Prozesse validieren
Mithilfe von Process Mining können Prozesse validiert werden. Das bedeutet, die Realität kann mit der Modellierung verglichen und Diskrepanzen identifiziert werden. Laufen Prozesse tatsächlich so ab, wie sie modelliert sind? In unserem Beispiel könnte beispielsweise herauskommen, dass viele Instanzen (Verkaufschancen) auf dem Status „Qualyfing“ oder „Needs Analysis“ bleiben, ohne jemals das Prozess-Ende zu erreichen. Das nennt sich Dead Ends. Oder Verkaufschancen werden direkt als „Closed Lost“ oder „Closed Won“ eingetragen. Die Validierung ergäbe, ob die Vertriebler in unserem Falle, das System wie es laut Prozess zu erwarten wäre, auch tatsächlich nutzen. Nach der Validierung mithilfe von Process Mining könnte der Prozess entsprechend angepasst werden oder das Verhalten der Prozessbeteiligten verändert werden. Zusammenfassend, gleicht Process Mining zur Prozess-Validierung die Realität mit der Modellierung ab.
- Wie sieht der Prozessablauf tatsächlich aus?
- Wo gibt es sogennante Dead Ends?
- Welche Pfade werden nicht genutzt?
Die Grafik unten zeigt zwei simulierte Beispiel-Prozesse A und B. Prozess A beschreibt den modellierten Prozess, wohingegen Prozess B die Realität abbildet. In Prozess A ist ersichtlich, dass der Prozess nicht vorsieht, dass Stufen (A,B,C,D) rückwärts gegangen werden. Dahingegen zeigt Prozess B, dass in der Realität von C zu A oder von B zu A gegangen wird. Solche Visualisierungen zeigen demnach sehr anschaulich Diskrepanzen auf. Auch können nicht-modellierte Prozesse visualisiert werden.
Prozesse auswerten
Prozesse liefern Daten. Und zwar jede Menge Daten. Häufig werden diese Daten nur sehr reduziert betrachtet, d.h. die wichtigsten Zustände werden herausgenommen und als Daten festgehalten. In unserem Prozess würden meistens wohl der aktuelle Zustand gespeichert oder finale Zustand gespeichert. Oftmals werden Interaktionen zwischen Vertrieblern und Kunden wie hier die Follow-Up-Calls erfasst. Generell werden oftmals Zustände gespeichert, jedoch keine Veränderungen. Jedoch sind Fragen wie: „Wie viele Verkaufschancen enden in Closed Lost kommend aus den verschiedenen Sales Stages?“, sehr relevante Informationen. Aus solchen Informationen ließen sich Prozessanpassungen ableiten. Oftmals ist eine Analyse von Durchlaufzeiten ebenso interessant. Wie lange sind die Durchlaufzeiten der verschiedenen Prozessabschnitte? All diese Informationen können genutzt werden, um Erkenntnisse über Prozessabläufe zu generieren und Prozesse effizienter zu gestalten. Darauf basierend können Prozesse angepasst werden.
- Welche Prozesspfade werden am häufigsten genutzt? Welche gar nicht?
- Wie sind die Durchlaufzeiten? In einzelnen Prozessabschnitten?
- Gibt es Bottlenecks?
Prozesse visualisieren
Die dynamische Visualisierung von Prozessen (wie statisch in BPMN) ermöglicht eine Ergänzung zu herkömmlichen Dashboards und Grafiken wie Säulendiagrammen oder Liniengraphen. Einzelne Prozess-Instanzen (=Durchläufe, in unserem Falle Verkaufschancen) können visualisiert werden und es ist erkenntlich, in welchem Abschnitt des Prozesses sie sich befinden. Auf aggregierter Ebene ließe sich in unserem Fall der Sales Funnel alternativ visualisieren und wäre direkt ersichtlich, wie viele Instanzen (Verkaufschancen) sich in welchem Prozess-Schritt befänden. Die Visualisierung von Prozessen ermöglicht eine Darstellung von komplexen Zusammenhängen, welche in herkömmlichen Diagrammen und Graphen nicht möglich wäre. Zudem ist deutlich mehr Information auf einen Blick sichtbar. Eine gut Visualisierung der Diskrepanz findet sich auf TowardsDataScience.
- Wo befindet sich eine Prozess-Instanz?
- Wo befinden sich alle Prozess-Instanzen (aggregiert)?
- Welche Prozesspfade werden häufig benutzt?
- Wie sieht der übliche Prozessdurchlauf aus?
- Wie sind durchschnittliche Durchlaufzeiten für verschiedene Prozessabschnitte?
- Wie viele Durchläufe von Prozess-Instanzen gab es insgesamt in den unterschiedlichen Pfaden (im Zeitraum XY)?
Event-Logs als Basis
Event-Sourcing ist die absolut notwendige Basis für Process Mining. Unter Event-Sourcing versteht man das Erfassen der Veränderungen von Zuständen. Auf Daten bezogen, bedeutet dies, dass die Veränderung innerhalb der Daten erfasst, auch genannt geloggt werden (Event-Logs). Damit ist die Veränderungshistorie klar ersichtlich. Bezogen auf unseren Prozess, würde dies bedeuten, dass jede Veränderung der Sales Stage erfasst und in einem Event-Log gespeichert wird.