Rijksuniversiteit Groningen

Promotie

Spraakherkenner Openbaar Vervoer weegt de vraag mee

Het spoorboekje is al lang niet meer de enige informatiebron voor de reiziger die wil weten hoe laat de treinen vertrekken. De moderne mens grijpt de telefoon, gaat de strijd aan met een interactieve voiceresponder en worstelt zich door het woud van keuzetoetsen. Misschien zou het gemakkelijker zijn als hij een computer aan de lijn kon krijgen die gesproken taal verstaat. In het prioriteitsprogramma van de NWO wordt een Openbaar Vervoer Informatie Systeem (OVIS) ontwikkeld. Automatische spraakherkenning is daar een onderdeel van. De spraakherkenner die wordt gebruikt, produceert niet een of enkele woorden, maar geeft een aantal hypotheses door aan de rest van het systeem. Uit de hypotheses moet een keus gemaakt worden, voordat het systeem verder kan. Zegt degene die ik aan de telefoon heb nu 'nee hoor', 'mee hoor' of 'nee hoorn', vraagt de computer zich bijvoorbeeld af. Via taalkundige analyse en een statisch model valt de optie 'mee hoor' snel af, maar kiezen tussen 'nee hoor' en 'nee hoorn' is moeilijker. Weten welke vraag vooraf gesteld is, kan dan de doorslag geven. Is het een ja/nee vraag of wordt er naar een plaatsnaam gevraagd? In het eerste geval is het 'nee hoor', in het tweede 'nee, Hoorn'. Rob Koeling onderzocht hoe de context van de vraag een rol kan spelen bij de beslissing en hoe aan die informatie gewicht kan worden toegekend. Daar zijn verschillende statistische methoden voor die meer of minder geschikt zijn. Een statistische methode, Maximum Entropy Modeling genaamd, uitgebreid met zeer lokale taalkundige informatie leidde tot een systeem dat praktisch foutloos werkt. De methode is niet specifiek voor deze toepassing, maar kan in principe toegepast worden in elk dialoogsysteem./JS

Rob Koeling (Emmen, 1968) studeerde alfa-informatica in Groningen. Het onderzoek werd uitgevoerd bij de afdeling Informatiekunde van de faculteit Letteren van de RUG en gefinancierd door NWO. Momenteel is Koeling werkzaam bij Fluency Voice Technology Limited in Groot-Brittannië.

Datum en tijd

vrijdag 25 januari 2002, 14.15 uur

Promovendus

R.W. Koeling, tel. 00 44 1223 45 48 18, fax 00 44 1223 45 48 01, e-mail: rob.koeling@fluencyvoice.com (werk)

Proefschrift

Dialogue-based disambiguation: using dialogue status to improve speech understanding

Promotor

prof.dr.ir. J. Nerbonne

Faculteit

wiskunde en natuurwetenschappen

Plaats

Aula Academiegebouw, Broerstraat 5, Groningen