Nederlandse Organisatie voor Wetenschappelijk Onderzoek

Opsporing verzocht

26 september 2008

Computerprogramma zoekt juiste persoon in organisaties en netwerken

NWO-onderzoeker Krisztian Balog heeft een computerprogramma ontwikkeld om in het netwerk van een organisatie sneller de juiste persoon te vinden. Deze techniek kan het ook makkelijker maken om op internet gericht te zoeken naar personen. Krisztian Balog promoveert op 30 september aan de Universiteit van Amsterdam.

Steeds meer informatie staat tegenwoordig online. Maar is al die informatie wel te vinden? Zoekmachines kunnen al effectief zoeken naar documenten, maar het zoeken naar entiteiten, zoals personen, werkt nog niet optimaal. Krisztian Balog introduceert in zijn proefschrift twee nieuwe modellen om sneller en beter de juiste personen te vinden.

Balog richt zich specifiek op het zoeken en vinden van personen binnen bedrijven en organisaties. Juist in de zakelijke wereld kan een effectief zoeksysteem van groot nut zijn. Zo zou een manager bijvoorbeeld snel kunnen vinden wie eerder aan een bepaald project heeft gewerkt, zonder dat die manager een hoop papierwerk moet doornemen.

Zo'n zoeksysteem is niet alleen van nut binnen bedrijven maar kan ook zorgen voor een betere uitwisseling van informatie tussen bedrijven en pers of tussen bedrijven en uitzendbureaus. Een afdeling personeelszaken kan het zoeksysteem gebruiken om meer te weten te komen over sollicitanten.

Vinden en profileren

Het proefschrift richt zich op twee manieren van informatieontsluiting. Enerzijds het maken van een lijst van experts bij een onderwerp. Anderzijds het maken van een lijst van onderwerpen bij een expert.

Het probleem van zoeken naar personen is dat een persoon geen verzameling woorden is. Een tekst is dat wel. Wanneer je een tekst zoekt voer je een aantal woorden in. Je vindt dan teksten waar die woorden in staan. Zo'n zoekopdracht is tamelijk ongecompliceerd. Een persoon is niet op dezelfde manier te vinden. Wel laat die persoon digitale sporen na doordat zijn naam in teksten te vinden is. Het programma van Balog koppelt de informatie in die teksten automatisch aan een persoon. Balog ontwikkelde een methode om op basis van die digitale sporen een lijst van onderwerpen bij een persoon te maken. Het programma selecteert zo de persoon die aan een zoekvraag kan voldoen.

Balog combineert zogenaamde generatieve taalmodellen met lerende algoritmen. De taalmodellen leggen patronen bloot in het taalgebruik rondom personen en onderwerpen. De lerende algoritmen herkennen personen en organisaties in teksten. Balogs methoden zijn uitvoerig getest, onder andere op het intranet van grote organisaties met mensen op verschillende vestigingen, zoals W3C en CSIRO. Ook is de methode getest op het intranet van een Nederlandse universiteit.

Breed inzetbaar

De ontwikkelde methode is vooralsnog alleen gebruikt binnen organisaties, maar dezelfde technologie kan ook gebruikt worden voor het vinden van personen op internet. Ook kan het model veel verschillende soorten zoekopdrachten verwerken. Het is namelijk erg flexibel. Een journalist kan het systeem zelfs gebruiken om na te gaan hoe hoog het milieu op de agenda van een politieke partij staat.

Krisztian Balog is een promovendus in de onderzoeksgroep van Maarten de Rijke. De Rijke kreeg in 2001 een Pionier-subsidie van NWO en heeft hiermee het project 'Computing with Meaning' opgezet. Tussen 1989 tot 2002 kregen meer dan honderd zeer ervaren, professorabele onderzoekers een Pionier-subsidie. Deze is te vergelijken met de huidige Vici-subidie van NWO. De onderzoeksgroep kwam eerder in het nieuws met MoodViews, een programma om het humeur van internet te meten (zie persbericht 4 april 2006,
http://www.nwo.nl/nwohome.nsf/pages/nwoa_6njj78). Balog is de laatste promovendus van het Pionier-project van Maarten de Rijke.

..............................

Meer informatie bij:

* Krisztian Balog (Universiteit van Amsterdam)
* t.: +31(0)20 525 53 59, k.balog@uva.nl

* Promotie: 30 september

* Promotor: prof. dr. Maarten de Rijke