Soccer Analytics

Fußballl ist ein sehr einfacher Sport – Wie Sepp Herberger schon sagte: „Das Runde muss ins Eckige.“
______________________________________________________________________________________________

Mittlerweile setzen TOP-Klubs dreistellige Millionenbeträge um. Investoren und Sponsoren, TV-Gelder und Prämien in nationalen Ligen und Champions League. Mittlerweile ist nicht nur der Titel wichtig, sondern wieviel Umsatz und Gewinn ein „mittelständisches Fußballunternehmen“ erzielt. Denn es hat z.B. Gehaltskosten, Transferkosten, allgemeine Klubkosten. Alles muss bezahlt werden. Die Technische Entwicklung führte dazu, das auch im Sport, nämlich primär in den USA, Wert auf Daten gelegt wurde. Im Basketball, Baseball und Football.
Im Fußball ist es mittlerweile gut vorangekommen, sämtliche Daten zu erfassen.

 

Der Begriff „Soccer Analytics“ bzw „Data Analytics“ bezeichnet die Datenanalyse im Fußball. Dazu zählt insbesondere die Auswertung verschiedener Daten und Statistiken zur Entscheidungsfindung sowie für Vorhersagemodelle. Analysiert werden dabei vor allem Wettbewerbsspiele, aber auch sonstige Spiele oder Trainings. Der Analyseprozess basiert grundlegend auf dem KDD-Prozess.
Mit der zunehmenden Verfügbarkeit technischer Werkzeuge gewinnt die Datenanalyse zunehmend im Profi-Sport an Bedeutung und wird bereits von einigen Vereinen zur Entscheidungsfindung eingesetzt.  (Source:wikipedia)

BIG DATA – Der kurze Begriff für den digitalen Zauber (?) – Die Digitalisierung macht seit einigen Jahren (Trend nach oben) auch vor dem Fußball nicht halt. Dank neuwertiger Tracking-Systemen und Sensoren zur Datensammlung ist der Begriff Big Data im Fußball kein Fremdwort mehr. Aber bei Fans noch längst nicht angekommen. Ebenso bei Team jenseits der Profiligen (Kostenfrage). Topklubs wie Bayern München, Manchester City oder Real Madrid wissen quasi ALLES über Team und Spieler des eigenen Vereins sowie über sämtliche potenziellen Spieler sowie den Talentbereich (Scouting). Beispiel: https://soccerment.com/wp-content/uploads/2020/07/handbook_fa.pdf (Weitere Studien als pdf sind im Internet abrufbar)

Ich selbst bin ein Kind von Big Data. Bereits 2001 habe ich mich zum ersten Mal mit Fußballstatistiken beschäftigt, 2002 die ersten Spiele live mitnotiert. Heute erstelle ich eigene Analysen aus BIG DATA-Daten und eigenen Notizen aus LIVE-Spielen. Allein für ein Spiel erfasse ich rund 100 Daten plus 40 pro Spieler. Insgesamt komme ich pro Spieltag auf etwa 600 Ereignisse, die erfasst und erklärt werden müssen. Doch dies ist lediglich nur ein kleiner Teil von BIG DATA. Denn es gibt nach Hauptlieferant OPTA Sports viele Zweitanbieter wie Sportec (DFL-Partner) mit unzähligem Datenmaterial, das aufgrund modernster Technik mittlerweile möglich ist (Sensorentechnik, Satellitenübertragung etc.). Anbieter wie SAP unterstützen Cloud-und Softwarenutzung wie Sports One. Diese umfasst Themen wie Leistungsoptimierung, Trainingsplanung, Fitness, Scouting, sätmliche individuelle Performance-Analysen. Die Daten werden mit der Programmiersprache Python (*.py) sowie im XML-Format abgespeichert. BIG DATA hat sehr viel mit Mathematik (Analysis), Physik, Biologie und Informatik zutun. Die py-Dateien sind teilweise 300 MB groß und benötigen sehr viel Rechenleistung.

Die Frage aber stellt sich: WAS brauche ich für Daten ? Jedes Spiel die gleichen Informationen ? Im Gegenteil. Der Trainer hat nicht allzuviel Zeit, outsourced den Analysebereich an 1-2 Mitarbeiter (teilweise bis sogar 12) aus. Diese erstellen z.B. nach einem speziellen Meeting sämtliche Daten und Videoclips für den Trainer, damit er sich später entscheiden kann für 1 oder 2 Matchpläne.

Das Volumen an Daten beträgt bis zu ca. 60 Mio PRO SPIEL. Es werden via Trackingsysteme (z.B.spielerspezifische Daten, wie Koordinaten, Laufstrecke, Zweikampfbilanz oder Ballkontakte gezählt, außerdem werden Mannschaftsdaten Lauf-und Passwege erfasst. In Echtzeit. Die Daten liegen also während der 90 Minuten ständig parat. (Siehe z.B. die Co-Trainer beim Sichten der Daten auf dem Tablet).

Zum genauen Ablauf der Verarbeitung sämtlicher Daten mit Python und Datenanalyse allgemein und im Fußball gibt es im Internet ebenfalls interessantes zu finden. Achtung: Teilweise echt für Nerds.

Die Interpretation dieser Datenmenge ist eine echte Herausforderung. Heatmaps, Diagramme, Zahlenkolonnen. Um die Aussagekraft zu stärken, müssen alle Mitarbeiter und der Trainer wissen, WAS sie auswerten müssen JETZT. Es zeigt sich bei BIG DATA Fußball oder Soccer Analytics, das der Fußball, wenn man ihn zerlegt und transparenter aufzeigt, eine ungeheure Komplexität. Anbieter wie whoscored, fbref oder sofascore bieten bereits gut sortierte Daten. Statsbomb ist z.B. einer der führenden Zweitverwerter.

Effektivität von Analysen, diese Frage wird oft gestellt. Ein Fehlpass, der eigentlich nicht ins Schema des besten IVs passt, führt zu einem Punktverlust. Da hilft keine Analyse, es ist der Zufall, der 10-15% des Spiels noch ausmacht. Man kann ein Spiel mit 30 Torschüssen und 900 Pässen sowie Ballbesitz 75% dominieren, 40 Attacken Richtung Strafraum erreichen, am Ende steht doch ein 0:1. Pro Top-Team kommt es zwar alle 50 Spiele max. 3x vor, aber diese Spiele können gerade bei K-O-Phasen tragisch sein. Bayern München hatte in beiden CL-Spielen gegen Villarreal 45:16 Torschüsse. Endbilanz: 1:2 Tore, das Ausscheiden im Viertelfinale und somit ein Verlust der kompletten Einnahmen vom Halbfinale (12 Mio), bis evtl. Finale (15 Mio plus 4 Mio bei Sieg). 31 Mio Euro verloren trotz 45 Torschüssen und unzähligen Datenpunkten.

„Das Runde muss ins Eckige.“