De computer als assistent-taalkundige
In het pre-computertijdperk was tekstanalyse vaak monnikenwerk.
Tegenwoordig fungeert de computer als assistent-onderzoeker. Dankzij
computerlinguïstiek is het mogelijk om een grootschalige en
consistente analyse te maken van een corpus, een grote verzameling
teksten. Dirk Bakker zette deze techniek in voor zijn promotieonderzoek
naar een oude Syrische tekst.
Bakkers onderzoek is onderdeel van âTurgamaâ, een project van het
Instituut Godsdienstwetenschappen, waarin de Syrische vertaling van de
Hebreeuwse Bijbel grondig wordt geanalyseerd. Het project is een
vervolg op het gelijknamige Vidi-onderzoeksproject, dat liep van 2005
tot 2010. âTurgamaâ betekent zowel âinterpretatieâ als âvertalingâ in
het Syrisch.
IJkpunt voor Bijbelteksten
Bakker is een van de Leidse wetenschappers die de computer inschakelt
bij zijn onderzoek. Hij promoveert op 20 april op zijn analyse van âHet
Boek van de Wetten van de Landenâ van de derde-eeuwse Syrische filosoof
en theoloog Bardaisan. Deze oorspronkelijke Syrische tekst fungeert
binnen het Turgama-onderzoek als ijkpunt waaraan de in het Syrisch
vertaalde Bijbelteksten worden getoetst.
Interactief proces
âHet Boek van de Wetten van de Landenâ, in het Syrisch
âHet Boek van de Wetten van de Landenâ, in het Syrisch
Computerlinguïstiek binnen het Turgama-project is nadrukkelijk een
interactief proces. De computer maakt niet zelfstandig een analyse,
hoewel er wel toepassingen zijn waarin dit nu al mogelijk is. Bakker:
âOok al doet de computer een groot deel van het werk, het is voor de
onderzoeker toch een heel intensief traject. De computer doet
suggesties op grond van eerder gemaakte keuzes. Maar als wetenschapper
blijf je zelf verantwoordelijk voor die keuzes binnen het proces.â
Consistente analyse
Het computerprogramma bouwt een database op vier taalkundige niveaus
op. Daarbinnen vallen woorden, woordgroepen, zinnen en stukken tekst.
Met behulp van die database kunnen alle mogelijke patronen binnen de
tekst opgevraagd en geanalyseerd worden. Het grote voordeel: analyse
door het computerbrein is consistenter dan analyse door een
mensenbrein.
Verschillen opsporen
Zoân database lijkt misschien abstract, maar de resultaten zijn heel
concreet. Bakker: âWe kunnen verschillen in verschillende versies van
Bijbelteksten opsporen en vergelijken. Zo dragen we bij aan de
interpretatie en studie van die teksten.â Dat is belangrijk, benadrukt
hij, âwant een gedegen taalkundige analyse is essentieel. Je kunt pas
beginnen met interpreteren als je zeker weet wat er staat.â
Wiskundig gedrag
Het Turgama-project richt zich op oude Bijbelteksten, maar de gebruikte
methode is toepasbaar op alle soorten tekst, en zelfs op muziekstukken.
Taal gedraagt zich immers uitermate wiskundig. De structuren, syntaxis,
woordbouw zijn meestal heel consistent. Hetzelfde geldt voor muziek. De
inzichten van de computerlinguïstiek zijn daarom niet gebonden aan
eeuwenoude teksten. Ook moderne software om plagiaat op te sporen is
gebaseerd op diezelfde inzichten. Net als vertaalprogrammaâs en
zoekmachines.
En er is nog veel meer mogelijk. Bakker: âNu gebruiken we de computer
als assistent. We kunnen hem echter ook inzetten als onderzoeker en de
eerste analyse van een corpus uit laten voeren. Maar in de vervolgfasen
kun je vooralsnog niet zonder mens.â
Â
Dirk Bakker hoopt op 20 april te promoveren bij prof. dr. A. van der
Kooij, hoogleraar Oude Testament.
Universiteit Leiden