Rijksuniversiteit Groningen

Ruisrobuuste spraakherkenner is cocktail party bestendig

Het valt niet altijd mee om je gesprekspartner te verstaan op een drukke receptie, maar mensen beschikken tot op zekere hoogte wel over het vermogen om informatie te selecteren tegen een achtergrond met veel geruis. De huidige generatie automatische spraakherkenningssystemen ontbeert dit vermogen bijna volledig. In veel gevallen zijn die systemen al volstrekt onbruikbaar wanneer er ook maar een beetje achtergrondgeluid is. Tjeerd Andringa ontwikkelde een systeem dat dit probleem grotendeels kan oplossen. Hij promoveert hierop vrijdag 22 februari 2002 aan de Rijksuniversiteit Groningen. Een dag eerder is er een symposium gewijd aan Andringa's vinding.

Spraakherkenningssystemen zijn niet ruisrobuust, er is als het ware sprake van een cocktail-party probleem. De markt vraagt echter om flexibele en betrouwbare spraakherkenningssystemen die van dit probleem geen last hebben. Om dit op te lossen nam Tjeerd Andringa het principe van behoud van continuiteit, een tot nu toe onderbelicht aspect van hetde menselijke auditieve systeem, als uitgangspunt van een nieuwe vorm van signaalanalyse.

Ruizig

Dit principe houdt in dat bij het herkennen van spraak alleen signaalcomponenten mogen worden gecombineerd als ze samenhang vertonen met karakteristieke eigenschappen van geluidsbronnen, zoals sprekers. Dit leidde tot de formulering van Continuity Preserving Signal Processing (CPSP). Daarmee is het mogelijk om een ruizig signaal op te delen in signaalcomponenten die elk met grote waarschijnlijkheid van een enkele bron komen. Ook kan CPSP signaalcomponenten die van eenzelfde bron, zoals een spreker, komen, combineren tot lettergrepen. Met behulp van op CPSP gebaseerde signaalanalyse zal het in de nabije toekomst mogelijk zijn om het cocktail-party probleem op te lossen, verwacht Andringa. De ontwikkelde technieken leiden tot topscores op belangrijke delen van de Aurora test, een internationale benchmark op het gebied van ruisrobuuste spraakherkenning./JS

Tjeerd Andringa (Leeuwarden, 1969) studeerde natuurkunde in Groningen. Het onderzoek werd uitgevoerd bij de onderzoekschool BCN van de RUG. Tijdens het onderzoek heeft Andringa het bedrijf Human Quality Speech Technologies (HuQ) opgericht. Bij dat bedrijf, waarvan hij nu directeur is, wordt het onderzoek voortgezet.

Meer informatie over deze promotie

Ter gelegenheid van de promotie van Andringa is er een symposium op donderdag 21 februari 2002.