bijna driekwart van de wedstrijden
11 juni 2010
TNO vergelijkt alle spelers van Oranje ooit in interactieve website
Met de Grote Vier opgesteld won Oranje in bijna driekwart van de wedstrijden
Hoe vaak won Oranje in wedstrijden waarin "De Grote Vier" speelden? Dit
soort gegevens is nu met een paar muisklikken te vinden op de site
www.tno.nl/oranje van TNO. Het antwoord: inclusief de wedstrijd tegen
Hongarije hebben Van der Vaart, Sneijder, Robben en Van Persie
11 keer samengespeeld waarvan 8 gewonnen, 2 gelijk gespeeld en slechts
1 keer verloren.
Niet alleen van huidige spelers van Oranje, maar van alle spelers sinds
1905 is op de site te vinden hoeveel minuten ze hebben gespeeld, het
aantal goals, aantal gespeelde wedstrijden en de afloop daarvan, aantal
kaarten en of ze (ge)wissel(de) speler waren. Ook zijn alle spelers in
automatische animaties te sorteren op veel van die aspecten waarbij de
grootte van hun shirt wordt bepaald door het aantal goals, aantal
wedstrijden of aantal kaarten.
De gegevens voor de site komen van www.voetbalstats.nl. Het ontsluiten
van de gegevens van het Nederlands Elftal is maar een eenvoudig
voorbeeld van wat media mining kan betekenen voor het inhoudelijk en
visueel toegankelijk maken van de complexe informatie vanuit
verschillende bronnen.
Andere Oranje-weetjes
De speler die de meeste medespelers heeft gehad in het Nederlands
elftal is Harry Dénis. Hij speelde met 117 internationals samen. De
kans dat een international nooit heeft gescoord voor het Nederlands
Elftal is gelijk aan 63 procent. Van alle spelers die twintig of meer
interlands hebben gespeeld, scoorde Beb Bakhuys per negentig minuten
speeltijd gemiddeld het meeste doelpunten, namelijk 1,22. De speler met
gemiddeld de kortste afstand tot alle overige spelers in het Nederlands
elftal is Roel Wiersma.
Media mining om complexe en diverse info te ontsluiten
Het ontsluiten van de gegevens van het Nederlands Elftal is maar een
eenvoudig voorbeeld van wat media mining kan betekenen voor het
inhoudelijk en visueel toegankelijk maken van de complexe informatie
vanuit verschillende bronnen. Bronnen van informatie die bij media
mining gebruikt kunnen worden, zijn eindeloos: kranten, tijdschriften,
radio- en tv-uitzendingen, het world wide web, e-mails, maar ook al dan
niet publieke databases.
De TNO-toolbox Novalist kan met elke vorm van informatie overweg die
digitaal beschikbaar is. Met behulp van onder meer zelf ontwikkelde
algoritmes wordt bepaald welke informatie voor het onderwerp relevant
is en vervolgens wordt deze geclusterd.
Dan zijn ook alle verbanden tussen personen, gebeurtenissen en
tijdstippen te leggen. Aan alle verkregen informatie wordt automatisch
metadata toegekend. Daarmee heeft de klant de beschikking over een
uitgebreide database waarin makkelijk en snel verbanden zijn te leggen
tussen gerelateerde feiten.
Meer informatie maakt intelligente zoeksystemen noodzakelijk
In een internationale vergelijking van dergelijke systemen bleek
Novalist als een van de beste te scoren. Het systeem is in de praktijk
uitgeprobeerd bij de politie Amsterdam-Amstelland. Daar bleek het
flinke toegevoegde waarde te hebben, omdat rechercheurs veel sneller,
veel uitgebreider en relevanter informatie uit de database wisten te
halen. Politie- en veiligheidsdiensten zijn met de TNO-methode
bijvoorbeeld in staat netwerken van personen in kaart te brengen. Ook
zijn hiermee veiligheidsrisico's in kaart te brengen. Andere sectoren
waar het zijn waarde kan bewijzen, zijn uitgevers, rtv-bedrijven,
advies- en onderzoeksbureaus. Novalist maakt bovendien gebruik van
spraakherkenning en optische tekenherkenning. De hoeveelheid informatie
die de wereld overspoelt, wordt alleen maar groter en daarmee de
noodzaak intelligente zoeksystemen te gebruiken.
bericht 2010-32
TNO