Universiteit Leiden

De computer als assistent-taalkundige

In het pre-computertijdperk was tekstanalyse vaak monnikenwerk. Tegenwoordig fungeert de computer als assistent-onderzoeker. Dankzij computerlinguïstiek is het mogelijk om een grootschalige en consistente analyse te maken van een corpus, een grote verzameling teksten. Dirk Bakker zette deze techniek in voor zijn promotieonderzoek naar een oude Syrische tekst.


Bakkers onderzoek is onderdeel van âTurgamaâ, een project van het Instituut Godsdienstwetenschappen, waarin de Syrische vertaling van de Hebreeuwse Bijbel grondig wordt geanalyseerd. Het project is een vervolg op het gelijknamige Vidi-onderzoeksproject, dat liep van 2005 tot 2010. âTurgamaâ betekent zowel âinterpretatieâ als âvertalingâ in het Syrisch.

IJkpunt voor Bijbelteksten

Bakker is een van de Leidse wetenschappers die de computer inschakelt bij zijn onderzoek. Hij promoveert op 20 april op zijn analyse van âHet Boek van de Wetten van de Landenâ van de derde-eeuwse Syrische filosoof en theoloog Bardaisan. Deze oorspronkelijke Syrische tekst fungeert binnen het Turgama-onderzoek als ijkpunt waaraan de in het Syrisch vertaalde Bijbelteksten worden getoetst.

Interactief proces

âHet Boek van de Wetten van de Landenâ, in het Syrisch

âHet Boek van de Wetten van de Landenâ, in het Syrisch

Computerlinguïstiek binnen het Turgama-project is nadrukkelijk een interactief proces. De computer maakt niet zelfstandig een analyse, hoewel er wel toepassingen zijn waarin dit nu al mogelijk is. Bakker: âOok al doet de computer een groot deel van het werk, het is voor de onderzoeker toch een heel intensief traject. De computer doet suggesties op grond van eerder gemaakte keuzes. Maar als wetenschapper blijf je zelf verantwoordelijk voor die keuzes binnen het proces.â

Consistente analyse

Het computerprogramma bouwt een database op vier taalkundige niveaus op. Daarbinnen vallen woorden, woordgroepen, zinnen en stukken tekst. Met behulp van die database kunnen alle mogelijke patronen binnen de tekst opgevraagd en geanalyseerd worden. Het grote voordeel: analyse door het computerbrein is consistenter dan analyse door een mensenbrein.

Verschillen opsporen

Zoân database lijkt misschien abstract, maar de resultaten zijn heel concreet. Bakker: âWe kunnen verschillen in verschillende versies van Bijbelteksten opsporen en vergelijken. Zo dragen we bij aan de interpretatie en studie van die teksten.â Dat is belangrijk, benadrukt hij, âwant een gedegen taalkundige analyse is essentieel. Je kunt pas beginnen met interpreteren als je zeker weet wat er staat.â

Wiskundig gedrag

Het Turgama-project richt zich op oude Bijbelteksten, maar de gebruikte methode is toepasbaar op alle soorten tekst, en zelfs op muziekstukken. Taal gedraagt zich immers uitermate wiskundig. De structuren, syntaxis, woordbouw zijn meestal heel consistent. Hetzelfde geldt voor muziek. De inzichten van de computerlinguïstiek zijn daarom niet gebonden aan eeuwenoude teksten. Ook moderne software om plagiaat op te sporen is gebaseerd op diezelfde inzichten. Net als vertaalprogrammaâs en zoekmachines.

En er is nog veel meer mogelijk. Bakker: âNu gebruiken we de computer als assistent. We kunnen hem echter ook inzetten als onderzoeker en de eerste analyse van een corpus uit laten voeren. Maar in de vervolgfasen kun je vooralsnog niet zonder mens.â
Â
Dirk Bakker hoopt op 20 april te promoveren bij prof. dr. A. van der Kooij, hoogleraar Oude Testament.