Lineare Regression

Die Lineare Regression ist eine der meist verwendeten Analysemethode aus der Statistik und dem Machine Learning. Sie untersucht den linearen Wirkungszusammenhang zwischen einer zu erklärenden (abhängigen) Zielvariable (Y) und einer oder mehreren unabhängigen Variablen (X). Genauer gesagt, versucht man mit Hilfe der linearen Regression den Einfluss von X auf Y zu schätzen. Für jeden Regressor werden, i.d.R. mithilfe der Ordinary Least Squares (OLS), Koeffizienten βi geschätzt, welche die Einflussstärke (Höhe des Koeffizienten) und Einflussrichtung (Vorzeichen des Koeffizienten) beschreiben.

Übertragen auf den Marketing- und Vertriebskontext kann man anhand der linearen Regression z.B. den potenziellen Wert von Leads (gemessen in erwartetem Absatz in EUR) objektiv schätzen. Der dadurch ermittelte Wert kann wiederum für die Lead-Priorisierung von den Vertriebsmitarbeitern verwendet werden und somit eine möglichst umsatzmaximierende Lead-Bearbeitung systematisch unterstützen. Grundlage sind hierfür zum einen Absatzzahlen (in EUR) der vergangenen Perioden sowie die zugehörigen Kennzahlen (X) wie z.B. Größe des Kundenunternehmens, Adresse des Unternehmens, Anzahl der Mitarbeiter sowie Umsatz.

Code Snippet

from sklearn.linear_model import LinearRegression

reg = LinearRegression().fit(X_train, y_train)

reg.coef

Der Code Snippet ist in der Programmiersprache Python geschrieben und basiert auf dem Modul scikit-learn.

Anwendungsfall

Gleichung:

Potenzieller Wert des Leads (in EUR) = β0 + β1*Unternehmensgröße + β2*Umsatz des Unternehmens – β3*Entfernung zum Unternehmen

Je größer das Unternehmen und je höher der Umsatz des Unternehmens, desto höher der potenzielle Wert des Leads, da größere Unternehmen in der Regel eine höhere Nachfrage haben als kleinere Unternehmen. Im produzierenden Gewerbe kann die Entfernung zum Unternehmen einen negativen Einfluss auf den potenziellen Wert des Leads haben, da mit steigender Entfernung auch die Transportkosten steigen und die erwartete Nachfrage wiederum negativ beeinflusst werden kann.

Mit Hilfe der linearen Regression kann nun die Einflussstärke bzw. die Gewichtung der jeweiligen Faktoren (X) auf den potenziellen Wert des Leads (Y) ermittelt und in Form von Regressionskoeffizienten errechnet werden. Nach Berechnung der entsprechenden Regressionskoeffizienten basierend auf Vergangenheitsdaten können diese Informationen nun für die Prognose verwendet werden. Füllt nun beispielsweise ein potenzieller Kunde auf Ihrer Website ein Formular aus und gibt die entsprechenden Informationen ein, kann im Hintergrund für den Vertriebsmitarbeiter direkt der erwartete Wert des Leads errechnet und bereitgestellt werden. In vielen Fällen reicht auch schon der Unternehmensname und die restlichen Informationen können aus externen Quellen zugespielt werden.

Zu beachten ist hierbei, dass die lineare Regression geeignet ist, um metrisch skalierte Zielvariablen zu schätzen. Für binäre Zielvariable, wie Kauf vs. Nicht-Kauf oder Click vs. Nicht-Click wird die beispielsweise die Logistische Regression oder ein Entscheidungsbaum verwendet.

Erklärvideo

Regression Plot

Linear regression grouped by binary variable
This plot shows two linear regression lines that are grouped by an arbitrary binary variable. The light area indicates the confidence intervals.

Die obige Regressionsgrafik könnte die lineare Beziehung zwischen zwei Variablen darstellen, zum Beispiel den potenziellen Wert des Leads (Y-Achse) und die Unternehmensgröße (X-Achse), wobei die Farben eine kategorische Variable wie das Land beschreiben können.

Weiterführende Ressourcen zu Machine Learning

Datenintegration

Wie Machine Learning von Datenintegration profitiert
Die Kausalkette „Datenintegration-Datenqualität-Modellperformance“ beschreibt die Notwendigkeit von effektiver Datenintegration für einfacher und schneller umsetzbares sowie erfolgreicheres Machine Learning. Kurzum: aus guter Datenintegration folgt bessere Vorhersagekraft der Machine Learning Modelle wegen höherer Datenqualität.

Betriebswirtschaftlich liegen sowohl kostensenkende als auch umsatzsteigernde Einflüsse vor. Kostensenkend ist die Entwicklung der Modelle (weniger Custom Code, damit weniger Wartung etc.). Umsatzsteigernd ist die bessere Vorhersagekraft der Modelle, was präziseres Targeting, Cross- und Upselling und ein genaueres Bewerten von Leads und Opportunities betrifft – sowohl im B2B- als auch im B2C-Bereich. Hier findest du einen detaillierten Artikel zu dem Thema:

Plattform

Wie du Machine Learning mit der Integration Platform verwendest
Du kannst die Daten deiner zentralen Marini Integration Platform externen Machine Learning Services und Applikationen zur Verfügung stellen. Die Anbindung funktioniert nahtlos durch die HubEngine oder direkten Zugang zur Plattform, abhängig von den Anforderungen des Drittanbieters. Ein Anbieter für Standardanwendungen des Machine Learnings im Vertrieb ist z.B. Omikron. Du kannst aber auch Standardanwendungen auf AWS oder in der Google Cloud nutzen. Eine Anbindung an deine eigenen Server ist ebenso problemlos möglich, wenn du dort deine eigenen Modelle programmieren möchtest.

Wenn du Unterstützung dabei brauchst, wie du Machine Learning Modelle in deine Plattform einbinden kannst, dann kontaktiere unseren Vertrieb. Wir helfen dir gerne weiter!

Anwendungsbeispiele

Häufige Anwendungsszenarien von Machine Learning im Vertrieb
Machine Learning kann auf vielfältige Weise den Vertrieb unterstützen. Es können zum Beispiel Abschlusswahrscheinlichkeiten berechnet, Cross- und Up-Selling-Potenziale geschätzt oder Empfehlungen vorhergesagt werden. Wichtig dabei ist, dass der Vertriebler unterstützt wird und eine weitere Entscheidungshilfe erhält, anhand derer er sich besser auf seine eigentliche Tätigkeit, nämlich das Verkaufen, konzentrieren kann. So kann der Vertriebler zum Beispiel schneller erkennen, welche Leads, Opportunities oder Kunden am vielversprechendsten momentan sind und diese kontaktieren. Es bleibt jedoch klar, dass der Vertriebler die letztendliche Entscheidung trifft und durch das Machine Learning letztlich nur Erleichterungen erfährt. Schlussendlich verkauft kein Modell, sondern immer noch der Mensch.

Hier findest du eine kurze Einführung in das Thema Machine Learning und die häufigsten Anwendungsmöglichkeiten im Vertrieb.

Weitere Glossar Beiträge