Catching words in a stream of speech. Computational simulations of segmenting
transcribed child-directed speech
Datum: 08 december 2011
Promotie: dhr. C. Çöltekin, 14.30 uur, Aula Academiegebouw, Broerstraat
5, Groningen
Proefschrift: Catching words in a stream of speech. Computational
simulations of segmenting transcribed child-directed speech
Promotor(s): prof.dr.ir. J. Nerbonne
Faculteit: Letteren
Onderzoek naar segmentatie van spraak met nieuwe modellen
De segmentatie van continue spraak in lexicale eenheden is een van de
eerste vaardigheden die een kind moet leren gedurende de
taalverwerving. Promovendus Çagri Çöltekin onderzocht segmentatie met
behulp van computationeel modelleren en computationele simulaties.
Segmentatie is moeilijker dan het op het eerste gezicht lijkt. Kinderen
moeten woorden vinden in een continue stroom van spraak, zonder kennis
van woorden te hebben. Gelukkig laten experimentele studies zien dat
kinderen en volwassen een aantal aanwijzingen uit de invoer gebruiken,
alsmede simpele strategieën die gebruik maken van deze aanwijzingen, om
spraak te segmenteren. Nog interessanter is dat een aantal van deze
aanwijzingen taal-onafhankelijk zijn, waardoor een taalverwerver
continue input kan segmenteren voordat het een enkel woord kent.
De modellen die Çöltekin in zijn proefschrift voorstelt, verschillen op
twee belangrijke vlakken van modellen uit de literatuur. Ten eerste
gebruiken ze lokale strategieën, in tegenstelling tot globale
optimalisatie, die gebruikmaken van aanwijzingen waarvan bekend is dat
kinderen ze gebruiken, namelijk voorspelbaarheidsstatistieken,
fonotactiek en lexicale beklemtoning. Ten tweede worden deze
aanwijzingen gecombineerd met behulp van een expliciet
aanwijzing-combinatie model, dat eenvoudig uitgebreid kan worden met
meer aanwijzingen.
Deze modellen zijn getest met behulp van reële getranscribeerde
kindgerichte spraak. De resultaten van de simulaties laten zien dat de
prestaties van de individuele strategieën vergelijkbaar zijn met
state-of-the-art computationele modellen voor segmentatie. Daarnaast
levert het combineren van individuele aanwijzingen een consistente
verbetering in prestaties op. Het gecombineerde model presteert even
goed als het state-of-the-art model dat als referentie gebruikt wordt,
terwijl het alleen gebruik maakt van mechanismen die beter
vergelijkbaar zijn met mechanismen die voorhanden zijn voor mensen die
dezelfde taak verrichten.
Çagri Çöltekin (Turkije, 1972) studeerde Cognitive Science aan de
Middle East Technical University te Ankara. Hij verrichtte zijn
onderzoek bij het Center for Language and Cognition Groningen van de
RUG, waar hij werkt bij de afdeling alfa-informatica.
Laatst gewijzigd: 29 november 2011 11:36
Rijksuniversiteit Groningen