Opsporing verzocht
26 september 2008
Computerprogramma zoekt juiste persoon in organisaties en netwerken
NWO-onderzoeker Krisztian Balog heeft een computerprogramma ontwikkeld
om in het netwerk van een organisatie sneller de juiste persoon te
vinden. Deze techniek kan het ook makkelijker maken om op internet
gericht te zoeken naar personen. Krisztian Balog promoveert op 30
september aan de Universiteit van Amsterdam.
Steeds meer informatie staat tegenwoordig online. Maar is al die
informatie wel te vinden? Zoekmachines kunnen al effectief zoeken naar
documenten, maar het zoeken naar entiteiten, zoals personen, werkt nog
niet optimaal. Krisztian Balog introduceert in zijn proefschrift twee
nieuwe modellen om sneller en beter de juiste personen te vinden.
Balog richt zich specifiek op het zoeken en vinden van personen binnen
bedrijven en organisaties. Juist in de zakelijke wereld kan een
effectief zoeksysteem van groot nut zijn. Zo zou een manager
bijvoorbeeld snel kunnen vinden wie eerder aan een bepaald project
heeft gewerkt, zonder dat die manager een hoop papierwerk moet
doornemen.
Zo'n zoeksysteem is niet alleen van nut binnen bedrijven maar kan ook
zorgen voor een betere uitwisseling van informatie tussen bedrijven en
pers of tussen bedrijven en uitzendbureaus. Een afdeling
personeelszaken kan het zoeksysteem gebruiken om meer te weten te
komen over sollicitanten.
Vinden en profileren
Het proefschrift richt zich op twee manieren van
informatieontsluiting. Enerzijds het maken van een lijst van experts
bij een onderwerp. Anderzijds het maken van een lijst van onderwerpen
bij een expert.
Het probleem van zoeken naar personen is dat een persoon geen
verzameling woorden is. Een tekst is dat wel. Wanneer je een tekst
zoekt voer je een aantal woorden in. Je vindt dan teksten waar die
woorden in staan. Zo'n zoekopdracht is tamelijk ongecompliceerd. Een
persoon is niet op dezelfde manier te vinden. Wel laat die persoon
digitale sporen na doordat zijn naam in teksten te vinden is. Het
programma van Balog koppelt de informatie in die teksten automatisch
aan een persoon. Balog ontwikkelde een methode om op basis van die
digitale sporen een lijst van onderwerpen bij een persoon te maken.
Het programma selecteert zo de persoon die aan een zoekvraag kan
voldoen.
Balog combineert zogenaamde generatieve taalmodellen met lerende
algoritmen. De taalmodellen leggen patronen bloot in het taalgebruik
rondom personen en onderwerpen. De lerende algoritmen herkennen
personen en organisaties in teksten. Balogs methoden zijn uitvoerig
getest, onder andere op het intranet van grote organisaties met mensen
op verschillende vestigingen, zoals W3C en CSIRO. Ook is de methode
getest op het intranet van een Nederlandse universiteit.
Breed inzetbaar
De ontwikkelde methode is vooralsnog alleen gebruikt binnen
organisaties, maar dezelfde technologie kan ook gebruikt worden voor
het vinden van personen op internet. Ook kan het model veel
verschillende soorten zoekopdrachten verwerken. Het is namelijk erg
flexibel. Een journalist kan het systeem zelfs gebruiken om na te gaan
hoe hoog het milieu op de agenda van een politieke partij staat.
Krisztian Balog is een promovendus in de onderzoeksgroep van Maarten
de Rijke. De Rijke kreeg in 2001 een Pionier-subsidie van NWO en heeft
hiermee het project 'Computing with Meaning' opgezet. Tussen 1989 tot
2002 kregen meer dan honderd zeer ervaren, professorabele onderzoekers
een Pionier-subsidie. Deze is te vergelijken met de huidige
Vici-subidie van NWO. De onderzoeksgroep kwam eerder in het nieuws met
MoodViews, een programma om het humeur van internet te meten (zie
persbericht 4 april 2006,
http://www.nwo.nl/nwohome.nsf/pages/nwoa_6njj78). Balog is de laatste
promovendus van het Pionier-project van Maarten de Rijke.
..............................
Meer informatie bij:
* Krisztian Balog (Universiteit van Amsterdam)
* t.: +31(0)20 525 53 59, k.balog@uva.nl
* Promotie: 30 september
* Promotor: prof. dr. Maarten de Rijke
Nederlandse Organisatie voor Wetenschappelijk Onderzoek