Alle Artikel
Ein Bild von Polizisten, die einige Statistiken analysieren, während sie einen Kriminellen verhaften.

Predictive Analytics — mehr Erfolg mit Statistik

9. April 2015

Big Data, Data Mining, Predictive Analytics.
Diese Schlagworte sind seit einiger Zeit in den Wirtschafts- und IT-Nachrichten allgegenwärtig.
Die Idee hinter diesen Worten: Nutzung von Statistik, Mathematik und moderner Computertechnologie, um automatisch eine riesige Menge an Daten zu analysieren, Muster zu erkennen und zukünftige Ereignisse vorherzusagen.

Warum schreibe ich einen ganzen Beitrag über dieses Thema?

Weil diese Entwicklung sehr spannend ist und ich mit meinem früheren Startup Placedise diese Techniken genutzt habe, um Werbewirkungen zu simulieren und ihre Auswirkungen vorherzusagen.
Aus diesem Grund möchte ich dir im Folgenden mehr über Predictive Analytics erzählen.

Definition

Predictive Analytics ist ein sehr breiter Begriff, der keine spezifische Technologie beschreibt, sondern eher die oben skizzierte Idee.
Die Idee, zukünftige Ereignisse und Verhaltensweisen mit historischen Daten aus verschiedenen Bereichen vorherzusagen oder zu simulieren, ist nichts Neues.

Versicherungsunternehmen und Banken nutzen seit Jahrzehnten Statistik, um Kreditrisiken oder die Kreditwürdigkeit von Einzelpersonen zu bestimmen.
Angesichts der Komplexität dieser Themen reicht es nicht aus, einfach die letzten 30 Banküberweisungen eines Kreditbewerbers zu betrachten. Neben dem Wohnort oder Alter werden zahlreiche ergänzende Statistiken verwendet. Zum Beispiel, ob die Person kürzlich erfolgreich einen ähnlichen Antrag gestellt hat und wie wahrscheinlich es ist, dass der Kreditbetrag in solchen Fällen zurückgezahlt wird.
Ähnlich verhält es sich mit Werbewirkungen, die nicht einfach durch Scoring-Modelle mit 7 Parametern bestimmt werden können.

Die Basis für solche Datenanalysemodelle wird immer auf historischen Daten aufgebaut.
Diese können aus Studien oder direkt von den jeweiligen Unternehmen abgeleitet werden. Am Ende ist es einfach wichtig, dass die Anzahl der Daten so groß wie möglich ist, da mit jeder zusätzlichen Information die Aussagekraft der Ergebnisse steigt.
So können diese prädiktiven Modelle am Ende sogar aussagekräftiger sein als ein kleines „echtes“ Experiment, das quasi „live“ und direkt im Zusammenspiel mit dem interessierenden Objekt stattfindet.

Dementsprechend haben beispielsweise Einzelhandelsunternehmen großes Potenzial für solche Techniken, da sie aufgrund ihres großen Handelsumsatzes in der Regel viele Daten aufgezeichnet haben.
Aber auch in anderen Bereichen können Statistiken wertvolle Ergebnisse liefern.

Vielleicht hast du schon von „Predictive Policing“ gehört.
Dies beschreibt die Idee, Verbrechen mit Big Data vorherzusagen und zu verhindern.
Falls du dich jetzt auch an den Film „Minority Report“ mit Tom Cruise erinnerst, liegst du richtig. Schau dir diesen Artikel des Economist (hier klicken) und das folgende Video an.

Wie ist das überhaupt möglich?

Um das Thema wirklich zu verstehen, müssen wir uns zunächst von dem häufigen Missverständnis befreien, dass das Leben hauptsächlich aus Chaos besteht und Entscheidungen völlig frei von jeglichem Einfluss und unvorhersehbar sind.
Das Leben bewegt sich vielmehr auf sehr klaren (wenn auch komplexen) Bahnen. Dies liegt teilweise daran, dass viele Entscheidungen ziemlich stark von äußeren Umständen diktiert werden.

Ein Beispiel

Stell dir eine Kreuzung vor.
Eine Person geht auf die Kreuzung zu.
Wir wollen herausfinden, welche Straße die Person zuerst überqueren wird.
Viele würden jetzt annehmen, dass dies einer Art „freien Willens“ unterliegt und ja, am Ende ist es irgendwie so.
Die Entscheidung wird jedoch von vielen Parametern beeinflusst.
Das beginnt damit, welche Ampel gerade grün geworden ist.
Historische Daten zeigen zum Beispiel, dass Menschen dann in 90% der Fälle zuerst diese Straße überqueren — zumindest wenn sie ein ähnliches Bildungsniveau und einen ähnlichen sozialen Hintergrund haben.
Unsere beobachtete Person könnte dies natürlich einfach wissen und absichtlich gegen diese „Regel“ verstoßen.
Ein umfassendes Modell berücksichtigt jedoch auch diese Wahrscheinlichkeit.
Meistens ist dies auch ein Muster im Sinne, dass Menschen, die absichtlich Regeln an anderer Stelle verletzen, dies auch an Kreuzungen tun.
Dementsprechend würden wir einfach die Wahrscheinlichkeiten anpassen.
Nach Berücksichtigung vieler anderer Faktoren kommen wir zu einem Ergebnis, das ziemlich genau vorhersagen kann, welche Straße die Person zuerst überquert.
Ein Straßenverkäufer könnte diese Informationen nun nutzen, um seine Position ideal anzupassen.

Kritiker würden argumentieren, dass es am Ende immer noch keine absolute Aussage gibt, sondern lediglich eine Wahrscheinlichkeit.
Das ist korrekt, aber am Ende ist dies immer noch eine enorme Verbesserung im Vergleich zur Alternative.
In unserem Beispiel weißt du jetzt, dass die Person mit einer Wahrscheinlichkeit von 88% Straße A überquert. Das ist deutlich (!) besser als die Alternative, einfach mit einer 50:50-Chance zu raten! Und ist es nicht viel besser, nur 12 von 100 Kunden zu verlieren, als 50 oder mehr?!

Fazit

So funktioniert Predictive Analytics, und es ist auf praktisch alle Lebensbereiche anwendbar. Die einzige große Herausforderung am Ende besteht darin, die richtigen Daten zu sammeln und aufzubereiten und automatisierte Analyseprozesse zu entwerfen. Leider sind viele bestehende Dienste derzeit so komplex und voller statistischer Fachbegriffe, dass es schwierig ist, sie ohne entsprechende Experten für das Geschäft zu nutzen. Aber dies wird sich in den nächsten Jahren aufgrund vieler innovativer Unternehmen ebenfalls ändern.

Du bist noch nicht von den Möglichkeiten der modernen Datenanalyse überzeugt?

Hast du die Fußball-Weltmeisterschaft 2014 in Brasilien verfolgt?
(Lange her, ich weiß; aber immer noch ein gutes Beispiel!)
Hast du darauf gewettet (zumindest für dich selbst), wer gewinnen würde?
Hast du jedes Spiel richtig vorhergesagt?
Nein?
Microsoft hat es getan (außer dem Spiel um den dritten Platz), indem es die beschriebenen Methoden verwendete (siehe hier)!

Artikel teilen: