Promotie
Spraakherkenner Openbaar Vervoer weegt de vraag mee
Het spoorboekje is al lang niet meer de enige informatiebron voor de
reiziger die wil weten hoe laat de treinen vertrekken. De moderne mens
grijpt de telefoon, gaat de strijd aan met een interactieve
voiceresponder en worstelt zich door het woud van keuzetoetsen.
Misschien zou het gemakkelijker zijn als hij een computer aan de lijn
kon krijgen die gesproken taal verstaat. In het prioriteitsprogramma
van de NWO wordt een Openbaar Vervoer Informatie Systeem (OVIS)
ontwikkeld. Automatische spraakherkenning is daar een onderdeel van.
De spraakherkenner die wordt gebruikt, produceert niet een of enkele
woorden, maar geeft een aantal hypotheses door aan de rest van het
systeem. Uit de hypotheses moet een keus gemaakt worden, voordat het
systeem verder kan. Zegt degene die ik aan de telefoon heb nu 'nee
hoor', 'mee hoor' of 'nee hoorn', vraagt de computer zich bijvoorbeeld
af. Via taalkundige analyse en een statisch model valt de optie 'mee
hoor' snel af, maar kiezen tussen 'nee hoor' en 'nee hoorn' is
moeilijker. Weten welke vraag vooraf gesteld is, kan dan de doorslag
geven. Is het een ja/nee vraag of wordt er naar een plaatsnaam
gevraagd? In het eerste geval is het 'nee hoor', in het tweede 'nee,
Hoorn'. Rob Koeling onderzocht hoe de context van de vraag een rol kan
spelen bij de beslissing en hoe aan die informatie gewicht kan worden
toegekend. Daar zijn verschillende statistische methoden voor die meer
of minder geschikt zijn. Een statistische methode, Maximum Entropy
Modeling genaamd, uitgebreid met zeer lokale taalkundige informatie
leidde tot een systeem dat praktisch foutloos werkt. De methode is
niet specifiek voor deze toepassing, maar kan in principe toegepast
worden in elk dialoogsysteem./JS
Rob Koeling (Emmen, 1968) studeerde alfa-informatica in Groningen. Het
onderzoek werd uitgevoerd bij de afdeling Informatiekunde van de
faculteit Letteren van de RUG en gefinancierd door NWO. Momenteel is
Koeling werkzaam bij Fluency Voice Technology Limited in
Groot-Brittannië.
Datum en tijd
vrijdag 25 januari 2002, 14.15 uur
Promovendus
R.W. Koeling, tel. 00 44 1223 45 48 18, fax 00 44 1223 45 48 01,
e-mail: rob.koeling@fluencyvoice.com (werk)
Proefschrift
Dialogue-based disambiguation: using dialogue status to improve speech
understanding
Promotor
prof.dr.ir. J. Nerbonne
Faculteit
wiskunde en natuurwetenschappen
Plaats
Aula Academiegebouw, Broerstraat 5, Groningen