Variance-Bias-Trade-Off (Machine Learning)

Der Variance-Bias-Trade-off lässt sich im Bereich des Machine Learnings anschaulich mit den Begriffen Overfitting und Underfitting erklären. Generell ist es der Fall, dass wenn die Varianz (Variance) hoch ist, der Fehler (Bias) niedrig ist, sowie umgekehrt. Varianz bezieht sich auf den Wert, um den sich eine Vorhersage ändern würde, falls das gleiche Modell auf einem anderen Datensatz trainiert werden würde.

Variance

Eine hohe Varianz bedeutet, dass kleine Änderungen am Datensatz eine große Änderung in der Prognose bewirken würde (Overfitting). Das Modell tendiert dazu, sich stark an die Daten anzugleichen. Dadurch werden zufällige Abweichungen (random noise) tendenziell als wichtig eingestuft und fließen somit ins Modell ein.

Bias

Dahingegen beschreibt der Bias die Fehler, die entstehen, wenn mit einem Modell Vorhersagen getroffen werden (Underfitting). Ein hoher Bias sagt aus, dass das Modell zu allgemein ist, um genaue Prognosen zu treffen. Beispielsweise, würde ein nicht-linearer Zusammenhang mit einer linearen Regression geschätzt, würde diese keine zuverlässigen Prognosen liefern. Das Modell wäre somit „underfitted“, besäße jedoch eine niedrige Varianz. Kleine Änderungen in den Daten würden die lineare Schätzung wenig beeinflussen.

Fazit

Damit wird deutlich, dass der Variance-Bias-Trade-off bei jeder Modellschätzung auftritt. Das Modell sollte so präzise die Daten beschreiben, dass eine Generalisierung auf ungesehene Daten immer noch möglich ist. Die Modellevaluation im Machine Learning ist bestrebt, diesen Trade-Off auszubalancieren.

Einen anschaulichen Blogbeitrag (englisch) findet ihr auf TowardsDataScience.

Weiterführende Ressourcen zu Machine Learning

Datenintegration

Wie Machine Learning von Datenintegration profitiert
Die Kausalkette „Datenintegration-Datenqualität-Modellperformance“ beschreibt die Notwendigkeit von effektiver Datenintegration für einfacher und schneller umsetzbares sowie erfolgreicheres Machine Learning. Kurzum: aus guter Datenintegration folgt bessere Vorhersagekraft der Machine Learning Modelle wegen höherer Datenqualität.

Betriebswirtschaftlich liegen sowohl kostensenkende als auch umsatzsteigernde Einflüsse vor. Kostensenkend ist die Entwicklung der Modelle (weniger Custom Code, damit weniger Wartung etc.). Umsatzsteigernd ist die bessere Vorhersagekraft der Modelle, was präziseres Targeting, Cross- und Upselling und ein genaueres Bewerten von Leads und Opportunities betrifft – sowohl im B2B- als auch im B2C-Bereich. Hier findest du einen detaillierten Artikel zu dem Thema:

Plattform

Wie du Machine Learning mit der Integration Platform verwendest
Du kannst die Daten deiner zentralen Marini Integration Platform externen Machine Learning Services und Applikationen zur Verfügung stellen. Die Anbindung funktioniert nahtlos durch die HubEngine oder direkten Zugang zur Plattform, abhängig von den Anforderungen des Drittanbieters. Ein Anbieter für Standardanwendungen des Machine Learnings im Vertrieb ist z.B. Omikron. Du kannst aber auch Standardanwendungen auf AWS oder in der Google Cloud nutzen. Eine Anbindung an deine eigenen Server ist ebenso problemlos möglich, wenn du dort deine eigenen Modelle programmieren möchtest.

Wenn du Unterstützung dabei brauchst, wie du Machine Learning Modelle in deine Plattform einbinden kannst, dann kontaktiere unseren Vertrieb. Wir helfen dir gerne weiter!

Anwendungsbeispiele

Häufige Anwendungsszenarien von Machine Learning im Vertrieb
Machine Learning kann auf vielfältige Weise den Vertrieb unterstützen. Es können zum Beispiel Abschlusswahrscheinlichkeiten berechnet, Cross- und Up-Selling-Potenziale geschätzt oder Empfehlungen vorhergesagt werden. Wichtig dabei ist, dass der Vertriebler unterstützt wird und eine weitere Entscheidungshilfe erhält, anhand derer er sich besser auf seine eigentliche Tätigkeit, nämlich das Verkaufen, konzentrieren kann. So kann der Vertriebler zum Beispiel schneller erkennen, welche Leads, Opportunities oder Kunden am vielversprechendsten momentan sind und diese kontaktieren. Es bleibt jedoch klar, dass der Vertriebler die letztendliche Entscheidung trifft und durch das Machine Learning letztlich nur Erleichterungen erfährt. Schlussendlich verkauft kein Modell, sondern immer noch der Mensch.

Hier findest du eine kurze Einführung in das Thema Machine Learning und die häufigsten Anwendungsmöglichkeiten im Vertrieb.

Weitere Glossar Beiträge