Totgesagte leben länger: Ein bisschen Tour-de-France-Statistik

Nach langer Abwesenheit hab ich das Blog mal wieder reaktiviert. Im letzten Jahr hat mir entweder Motivation, Zeit oder das Gefühl gefehlt, etwas Interessantes zu sagen zu haben. Aber jetzt hab ich wieder was gefunden…

Und zwar geht es um die Tour de France. Wie ich hier vielleicht schon mal erwähnt habe (oder auch nicht) bin ich ein großer Freund des Radsports und finde die komplizierten Interaktionen in einem Peloton höchst faszinierend. Jeden Tag hat man knapp 200 verschiedene Sportler, die jeweils abhängig vom Kurs ihr Rennen gestalten. Jeder hat verschiedene Rollen in der Mannschaft und individuelle Ziele. Es gibt mehrere Sonderwertungen und das Ergebnis im Gesamten vorherzusagen ist beinahe unmöglich.

Und einen Aspekt dieses Radrennens habe ich mir mal heraus gegriffen: Und zwar habe ich mir die Frage gestellt, ob es so ist, dass jeder einzelne Fahrer auf irgendeiner Etappe mal vor jedem anderen Fahrer platziert ist. Klar, es gibt bessere und schlechtere Fahrer, aber dadurch das es 21 Etappen gibt, ist zumindest die Chance da, das es sich ein paar Mal komplett durchmischt. Und das wollte ich mir eben mal näher anschauen und quasi live mitverfolgen, wie es sich während einer gesamten Tour de France entwickelt.

Dazu nehmen wir zunächst mal an, dass alle Fahrer genau gleich gut sind und die Reihenfolge jeder Etappe im Ziel rein vom Zufall abhängt. Wir nehmen der Einfachheit halber auch an, dass alle 198 Fahrer ihr Rennen beenden. Dann gibt es 198 mal 197, also 39006 Zweierkonstellationen, die wir uns anschauen müssen. Klarerweise gibt es schon  auf der ersten Etappe einen besser platzierten Fahrer in jeder Konstellation. Die Wahrscheinlichkeit, dass in derselben Konstellantion auf der nächsten Etappe derselbe Fahrer vorne liegt ist 0.5. Und auf der nächsten wieder. Da es 21 Etappen gibt, ist die Wahrscheinlichkeit, das in einer bestimmten Konstellation immer derselbe vorne liegt 0.5 hoch 20, das ist 9.54 mal 10 hoch minus 7, etwa ein Millionstel. Die Wahrscheinlichkeit des Gegenereignisses, also das jeder der beiden mindestens einmal vorne ist, ist also 99.9999046%. Diese Wahrscheinlichkeit nehmen wir jetzt hoch 39006, damit wir rausbekommen, wie wahrscheinlich es ist, das diese Konstellation bei jeder Zweierkombination eintritt. Das Ergebnis sind 96.348%, es ist also unter den gamachten Annahmen recht unwahrscheinlich, aber nicht unmöglich, dass es am Ende der Tour de France ein Fahrerpärchen gibt, bei dem einer immer vor dem anderen im Ziel war.

Anmerkung: Der hier gezeigte Ansatz für die Rechnung ist nicht ganz richtig, da die Ereignisse „A ist vor B“, „A ist vor C“ und „B ist vor C“ nicht unabhängig sind. Mir fällt auf die Schnelle keine Möglichkeit ein, wie dieser Aspekt berücksichtigt werden kann, aber tendenziell wird die für Wahrscheinlichkeit am Ende eher ein höherer Wert als 96.348% rauskommen. (Bitte korrigieren falls ich da falsch liege.)

Jetzt schauen wir uns aber die echten Daten an! Mittlerweile ist knapp die Hälfte der Tour rum und wir können auf jeden Fall schon mal ein bisschen vergleichen. Ich habe mich entschlossen, dass ich Fahrer, die auf dem Weg nach Paris aufgeben, komplett aus der Rechnung rauszustreichen, wodurch die Wahrscheinlichkeit für eine komplett „durchmischte Tour“ nochmal ansteigt.

Von den 36672 Zweierkonstellationen (es sind noch 192 Fahrer im Rennen) waren nach 10 Etappen bereits 34339 ausgeglichen, 2333 fehlen noch, etwa 6%. Bei der zufälligen Konstellation sollten bei jeder Etappe etwa 50% wegfallen, da sollten jetzt also unter 100 übrig sein. Hier sieht man schon deutlich, dass die Annahme eines zufälligen Zieleinlaufs natürlich weit von der Realität entfernt ist.

Es gibt natürlich jetzt schon viele Fahrer, die jetzt schon jeden mindestens einmal geschlagen haben. Und auch solche, die von jedem schon mindestens einmal geschlagen wurden. Da gehören klarerweise die Etappensieger und Etappenletzten jedes Abschnitts dazu. Aber dröseln wir es ruhig mal ein bisschen auf:

Die, die jeden schon geschlagen haben lassen sich in vier Gruppen aufteilen:

1. Die Sprinter:

auf den Flachetappen vor allen anderen, dadurch, dass es schon vier reine Massensprints gab, ist da auch gut durchgemischt. Hier die Liste (in Klammern beste Etappenplatzierungen):

Marc Cavendish (1)

Marcel Kittel (1)

Peter Sagan (1)

Bryan Coquard (2)

André Greipel (2)

Dylan Groenewegen (4)

Alexander Kristoff (4)

Christophe Laporte (5)

Edward Theuns (5)

Sondre Holst Enger (6)

 

2. Die Favoriten:

Sie müssen natürlich auf jeder Etappe gut platziert sein und auf Bergetappen sind sie oft ganz vorne (Einige hier genannte sind im Laufe der Tour auch schon zurückgefallen Entscheidend für die Listung hier ist, dass sie das Besiegen aller anderen durch stetige Platzierungen im Vorderfeld erreichten):

Christopher Froome (1)

Julien Alaphilippe (2)

Daniel Martin (2)

Joaquim Rodriguez (3)

Alejandro Valverde (3)

Romain Bardet (4)

Roman Kreuziger (5)

Fabio Aru (6)

Wilco Kelderman (6)

Adam Yates (7)

Bauke Mollema (9)

Nairo Quintana (11)

Pierre Rolland (11)

Warren Barguil (13)

 

3. Die Ausreißer:

Einmal (oder mehrmals) mit einer Spitzengruppe durchgekommen und eine gute Platzierung gemacht, ggf. die restlichen Fluchtkollegen irgendwann anders geschlagen:

Steven Cummings (1)

Tom Dumoulin (1)

Michael Matthews (1)

Greg van Avermaet (1)

Rui Costa (2)

Thomas de Gendt (2)

Daryl Impey (2)

Edvald Boasson Hagen (3)

Rafal Majka (3)

Daniel Navarro (3)

Vincenzo Nibali (4)

Winner Anacona (5)

Samuel Dumoulin (5)

Luis Angel Mate (6)

Thibaut Pinot (6)

George Bennett (7)

Tony Gallopin (7)

Damiano Caruso (8)

Diego Rosa (8)

Mathias Frank (9)

Gorka Izaguirre (9)

Sylvain Chavanel (12)

Mikel Landa (13)

 

4. Die „Unsichtbaren“

Das sind die überraschendsten Einträge hier. Fahrer, die vielleicht mal 15. bei einer Sprinetappe geworden sind und auf einer anderen Etappe dann vor den Sprintern landeten. Diese Gruppe finde ich am coolsten, weil man sie halt einfach nicht erwartet.

Geraint Thomas (7)

Wouter Poels (8)

Simon Gerrans (10)

Jasper Stuyven (12)

Lawson Craddock (13)

John Degenkolb (13)

Fabio Sabatini (17)

Gregory Rast (18)

Michael Valgren (18)

Jacopo Guarnieri (19)

Tony Martin (19)

Ramon Sinkeldam (21)

Matti Breschel (22)

Immanol Erviti (23)

Luis Leon Sanchez (23)

 

67 Fahrer insgesamt also. Die Einteilung ist auf keinen Fall eindeutig. Ich hätte Alaphilippe auch zu den Sprintern, Sagan zu den Ausreißern oder Thomas zu den Favoriten hauen können.

Jetzt die andere Seite der Medaille. Da waren lange Zeit nicht viele vertreten, weil drei Fahrer, Michal Mörkov, Sam Bennett und Lars Ytting Bak in der ersten Woche relativ zuverlässig auf den letzten Plätzen lagen. Mörkov hat mittlerweile aufgegeben, Bennett und Bak gehts etwas besser, also gibt es nun auch etwas mehr Fahrer, die schon von jedem geschlagen wurden. Es sind:

Shane Archbold

Lars Ytting Bak

Sam Bennett

Natael Berhane

Maciej Bodnar

Borut Bozic

Vegard Breen

Marc Cavendish

Davide Cimolai

Steven Cummings

Jens Debusschere

John Degenkolb

Bernhard Eisel

Armido Fonseca

Alexis Gougeard

Jacopo Guarnieri

Marco Haller

Greg Henderson

Leigh Howard

Christopher Juul-Jensen

Christophe Laporte

Cyril Lemoine

Rafal Majka

Adrien Petit

Jurgen Roelandts

Timo Roosen

Marcel Sieberg

Geoffrey Soupe

Ian Stannard

Albert Timmer

Angelo Tulik

Florian Vachon

Petr Vakoc

Sep Vanmarcke

Julien Vermote

Paul Voss

Marten Wynants

37 Fahrer insgesamt also. Wenn man mit oben vergleicht, stellt man fest, dass Cavendish, Cummings, Degenkolb, Guarnieri und Laporte und Majka in beiden Listen vorkommen. Sie haben alle schon mal geschlagen und wurden von allen schon mal geschlagen. Ihre weiteren Platzierungen im Verlauf dieser Tour sind also für diese Erfassung nicht mehr relevant. Einige andere Fahrer stehen kurz davor: De Gendt, Debusschere, George Bennett, Groenewegen, Henderson, Navarro, Poels, Sinkledam fehlt jeweils noch ein gewonnenes bzw. verlorenes Duell.

Welche Fahrer haben im Gegensatz dazu noch am meisten zu tun? Die meisten nocht nicht verlorenen Duelle haben:

Christopher Froome: 108

Nairo Quintana: 101

Alejandro Valverde: 101

Roman Kreuziger: 85

Daniel Martin: 84

Pierre Rolland: 84

Fabio Aru: 82

Warren Barguil: 69

Romain Bardet:67

Tejay van Garderen: 67

Jurgen van den Broeck: 63

Sergio Henao: 62

Ich finde es faszinierend, dass man mit dieser Methode, bei der Zeitabstände überhaupt nicht eingehen, doch einen ziemlich guten Eindruck von der Gesamtwertung bekommt.

Die meisten noch nicht gewonnenen Duelle haben:

Sam Bennett: 135

Lars Ytting Bak: 101

Leigh Howard: 77

Bernhard Eisel: 72

Iljo Kiesse: 67

Marco Haller: 66

Andreas Schillinger: 64

Vegard Breen: 63

Marten Wynants: 61

Jerome Cousin: 60

Zu guter Letzt suchen wir uns noch die langweiligsten Fahrer raus, das heißt die, die möglichst zuverlässig im Mittelfeld platziert waren und ein ausgeglichenes Verhältnis zwischen zu gewinnenden und zu verlierenden Duellen haben (erstere zuerst genannt):

Tanel Kangert: 13/25

Alberto Losada: 17/12

Luka Pibernik: 12/13

Ben Gastauer: 16/11

Peter Stetina: 21/9

Paolo Tiralongo:9/16

Serge Pauwels: 9/15

Brice Feillu: 14/9

Fabrice Jeandesboz: 14/9

Daniel Moreno: 13/9

Alexis Vuillermoz: 8/30

Haimar Zubeldia: 8/28

Domenico Pozzovivo: 8/19

Simon Geschke: 18/8

Chris Anker Sörensen: 16/8

Frank Schleck: 8/13

Jetzt fällt mir erstmal nichts mehr Weiteres ein. Mir macht es Spaß solche Zusammenhänge rauszusuchen, ob sie nun was bedeuten oder nicht. Wenn jemand Infos über einen bestimmten Fahrer will, schreibt mir einen Kommentar oder auch auf Twitter (@alfazantauri). Ich werde zum Ende der Tour auf jeden Fall ein Update machen, vielleicht auch schon früher. Ansonsten hoffe ich, dass ich das Blog auch bald wieder mit anderen Themen beleben kann.

 

Advertisements

Ein Gedanke zu „Totgesagte leben länger: Ein bisschen Tour-de-France-Statistik“

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s