Rijksuniversiteit Groningen
Ruisrobuuste spraakherkenner is cocktail party bestendig
Het valt niet altijd mee om je gesprekspartner te verstaan op een
drukke receptie, maar mensen beschikken tot op zekere hoogte wel
over het vermogen om informatie te selecteren tegen een achtergrond
met veel geruis. De huidige generatie automatische
spraakherkenningssystemen ontbeert dit vermogen bijna volledig. In
veel gevallen zijn die systemen al volstrekt onbruikbaar wanneer er
ook maar een beetje achtergrondgeluid is. Tjeerd Andringa
ontwikkelde een systeem dat dit probleem grotendeels kan oplossen.
Hij promoveert hierop vrijdag 22 februari 2002 aan de
Rijksuniversiteit Groningen. Een dag eerder is er een symposium
gewijd aan Andringa's vinding.
Spraakherkenningssystemen zijn niet ruisrobuust, er is als het ware
sprake van een cocktail-party probleem. De markt vraagt echter om
flexibele en betrouwbare spraakherkenningssystemen die van dit
probleem geen last hebben. Om dit op te lossen nam Tjeerd Andringa
het principe van behoud van continuiteit, een tot nu toe
onderbelicht aspect van hetde menselijke auditieve systeem, als
uitgangspunt van een nieuwe vorm van signaalanalyse.
Ruizig
Dit principe houdt in dat bij het herkennen van spraak alleen
signaalcomponenten mogen worden gecombineerd als ze samenhang
vertonen met karakteristieke eigenschappen van geluidsbronnen,
zoals sprekers. Dit leidde tot de formulering van Continuity
Preserving Signal Processing (CPSP). Daarmee is het mogelijk om een
ruizig signaal op te delen in signaalcomponenten die elk met grote
waarschijnlijkheid van een enkele bron komen. Ook kan CPSP
signaalcomponenten die van eenzelfde bron, zoals een spreker,
komen, combineren tot lettergrepen. Met behulp van op CPSP
gebaseerde signaalanalyse zal het in de nabije toekomst mogelijk
zijn om het cocktail-party probleem op te lossen, verwacht
Andringa. De ontwikkelde technieken leiden tot topscores op
belangrijke delen van de Aurora test, een internationale benchmark
op het gebied van ruisrobuuste spraakherkenning./JS
Tjeerd Andringa (Leeuwarden, 1969) studeerde natuurkunde in Groningen. Het onderzoek werd uitgevoerd bij de onderzoekschool BCN van de RUG. Tijdens het onderzoek heeft Andringa het bedrijf Human Quality Speech Technologies (HuQ) opgericht. Bij dat bedrijf, waarvan hij nu directeur is, wordt het onderzoek voortgezet.
Meer informatie over deze promotie
Ter gelegenheid van de promotie van Andringa is er een symposium op
donderdag 21 februari 2002.