Ingezonden persbericht
P E R S B E R I C H T
1 juni 2006
In voetbal zit toeval
door Guido Schmeits
Tot 9 juli, de dag van de finale van het WK 2006, berekent de Werkgroep Voetbal Statistiek welk land de meeste kans heeft op de wereldbeker. Deze voorspellingen zullen ondermeer zijn te volgen via de wiskundepagina van de populair-wetenschappelijke website Kennislink (www.kennislink.nl).
"Ren-sen-brínk!... tegen de paal!! Rénsenbrink, tegen de paal! In de slotfase van deze wedstrijd... tsjongesjonge, wat was dat...bíjna de wereldbeker voor Nederland!" Volgens velen is dit het meest gedenkwaardige WK-moment ooit: Rensenbrink schiet in de laatste 30 seconden reguliere speeltijd tegen de paal. Na verlenging wordt Argentinië wereldkampioen.
Het is 1978 en we balen ervan. Had de wind uit een andere hoek gewaaid, was de bal iets harder opgepompt, had het publiek iets luider geschreeuwd, ongetwijfeld zouden we dan Argentinië in de laatste dertig seconden van de reguliere speeltijd hebben verslagen. Wat een pech!
Zeker, toeval speelt een grote rol op een wereldkampioenschap voetbal. En dat is maar goed ook, want wat zou het saai zijn als we de uitslag van tevoren konden voorspellen. En toch zijn er genoeg mensen die dat proberen: zestien miljoen voetbalprofeten in Nederland, bookmakers over de hele wereld en, niet in de laatste plaats, de Werkgroep Voetbal Statistiek.
Voor het WK van 1994 ontwikkelde de Werkgroep Voetbal Statistiek een statistisch model dat de grootste kanshebber op de wereldbeker moest selecteren. Een van de leden van de werkgroep is Ruud Koning, hoogleraar sporteconomie aan de Rijksuniversiteit Groningen. Ook voor het wereldkampioenschap 2006 haalt hij het model uit de kast en berekent hij de kansen voor Oranje. Tijdens het WK worden de voorspellingen nog verder aangescherpt, door het model te voorzien van de laatste wedstrijduitslagen. Volg van dag tot dag tot aan de finale op 9 juli de laatste voorspellingen op Kennislink.
Waarop is dit model gebaseerd? En werkt het? Hoe werkt het precies? In dit artikel de wiskunde achter voetbalstatistiek.
De data
Het model van de Werkgroep Voetbal Statistiek is een statistisch model en heeft input nodig om mee aan de slag te gaan. Die input bestaat uitsluitend uit wedstrijduitslagen uit het verleden. Als een land in het verleden goed presteerde, zal het model aan dit land een grote kans toekennen om het WK 2006 te winnen.
Niet alle wedstrijduitslagen uit het verleden zijn interessant. Hoe ouder de gegevens zijn, hoe minder ze zeggen over de kwaliteit van de huidige nationale elftallen. Daarom worden alleen de uitslagen van voetbalwedstrijden gebruikt die niet ouder zijn dan 2 jaar. Dit kunnen uitslagen zijn van vriendschappelijke wedstrijden, van kwalificatiewedstrijden of van wedstrijden die tijdens het komende WK nog gespeeld moeten worden.
Scoringsintensiteit
De Werkgroep Voetbal Statistiek heeft uiteraard een database met de uitslagen van oude wedstrijden. Deze schat aan gegevens moet geschikt gemaakt worden voor het model. Dat gebeurt aan de hand van het begrip scoringsintensiteit. De scoringsintensiteit is het verwachte aantal doelpunten dat een land scoort tegen een ander land. Als bijvoorbeeld de scoringsintensiteit van Nederland tegen België 1,9 is, dan verwachten we dat Nederland in een groot aantal wedstrijden tegen België gemiddeld 1,9 doelpunten zal scoren. Als omgekeerd de scoringsintensiteit van België tegen Nederland 2,3 is, dan verwachten we dat België gemiddeld genomen zo'n 2,3 goals scoort in een wedstrijd tegen Nederland. Hoewel het vooraf niet vaststaat wie de wedstrijd zal winnen, heeft België wel de grootste kans om te winnen.
De simulatie is gebaseerd op de zogenaamde Poissonverdeling. Dat is een kansverdeling die een grote kans toekent aan resultaten die dicht bij de scoringsintensiteit liggen. Het staafdiagram hieronder is een Poissonverdeling die bij een scoringsintensiteit van 1,5 hoort. Het meest waarschijnlijk is dat een voetbalteam met deze scoringsintensiteit één doelpunt scoort. De kans daarop is namelijk 33%. Nul, twee of drie doelpunten zullen eveneens vaak voorkomen. Een groter aantal doelpunten is ook mogelijk, zij het met een kleine kans.
Poissonverdeling met gemiddelde 1,5. De kans op nul, één, twee of drie doelpunten is groot. Meer dan drie doelpunten is niet zo waarschijnlijk.
De Poissonverdeling komt in het dagelijks leven veel voor. Het aantal mensen dat in één minuut een winkel binnenloopt bijvoorbeeld, beschrijft men vaak met een Poissonverdeling. Ook het model van de Werkgroep Voetbal Statistiek berust op de aanname dat het aantal doelpunten Poissonverdeeld is.
Resultaten en voorspellingen
Zondagmiddag 17 juli '94 in Los Angeles. Voor het eerst in de geschiedenis moeten strafschoppen een WK-finale beslissen. Italiaan Baggio is aan de beurt en schiet... over het doel! De stand is 3-2 en de wereldbeker is voor Brazilië. De leden van de Werkgroep Voetbal Statistiek moeten gejuicht hebben bij deze eindstand. Hun model, dat Brazilië de grootste kans gaf om te winnen, lijkt goed te werken.
Twaalf jaar later is er veel meer ervaring met het model en de resultaten zijn nog steeds positief. In onderstaande tabel staan voor verschillende toernooien de door het model getipte winnaars, en de echte winnaars.
Bron: A simulation model for football championships, Ruud H. Koning e.a.
Het model lijkt goed te werken. Niet iedere voorspelling is uitgekomen, maar dat zou ook een behoorlijke overschatting van statistische resultaten zijn. De output van het model is tenslotte een kans, en geen zekerheid. Frankrijk had in 2000 18% kans om het EK te winnen. De kans dat Frankrijk niet zou winnen was dus 82%. Dat Frankrijk het EK toch gewonnen heeft mag daarom gerust toeval heten.
Is het model dan onbruikbaar? Zeker niet! Als iemand in 2000 gevraagd had welk land het EK zou winnen, dan was Frankrijk de beste gok geweest. Hoewel Frankrijk maar 18% kans had om het EK te winnen, was het van alle landen wel de grootste kanshebber. Frankrijk aanwijzen als winnaar was om statistische redenen de beste voorspelling. Wie nog van plan is deel te nemen aan een voetbalpool, doet er daarom goed aan de kansberekeningen van de Werkgroep Voetbal Statistiek nauwkeurig in de gaten te houden.
===
Ingezonden persbericht