Hoe oud is de oertaal van alle mensen?

Taalwetenschap

In de wereld worden duizenden talen gesproken. Hoe lang heeft het geduurd voor er zo’n grote diversiteit was? In Nijmegen reconstrueren ze de stamboom van talen met de computer.

Het ‘gemiddelde gezicht’ is een project van blogger Colin Spears. Met software van faceresearch.org heeft hij telkens een paar honderd foto’s van internet bewerkt. Colin Spears

De duizenden talen die wereldwijd gesproken worden, verschillen enorm van elkaar. „Hoe is die diversiteit ontstaan?,” vraagt Stephen Levinson hardop in zijn kamer in het Max Planck Instituut voor Psycholinguïstiek in Nijmegen.

„Hoeveel millennia zijn er bijvoorbeeld voor nodig geweest om de huidige diversiteit buiten Afrika te laten ontstaan? Het gangbare idee is: zestigduizend jaar. Eerlijk gezegd betwijfel ik dat. Ik vermoed dat het veel langer geduurd heeft. Misschien kom je wel uit op driehonderdduizend jaar.” Een revolutionair idee, want lange tijd was de consensus dat de expansie van de mens buiten Afrika pas rond 60.000 geleden echt op gang kwam. Maar de laatste jaren zijn er ook archeologisch aanwijzingen dat dat al veel eerder gebeurde.

Levinson verwacht dat het binnen tien jaar mogelijk wordt om die berekening te maken. Hij en zijn collega’s hebben inmiddels al de nodige ervaring met het berekenen van het verleden van talen. Ze doen dat door de woorden en grammaticale eigenschappen van talen met elkaar te vergelijken. Op zichzelf een oude en vertrouwde methode. Al in de negentiende eeuw deed men dat. Zó heeft men ontdekt dat bijna alle Europese talen familie van elkaar zijn, en te herleiden zijn tot een taal die de moeder van alle Indo-Europese talen is, en die waarschijnlijk ooit in de buurt van de Zwarte Zee gesproken werd. Dat oer-Indo-Europees zou zich van daaruit verspreid hebben, zich hebben opgesplitst in verschillende talen, en die zouden zich ook weer verspreid hebben, en verder opgesplitst. Zo’n taalfamilie wordt vaak afgebeeld als een boom die zich steeds verder vertakt.

Taal-DNA

In de 19de eeuw gebeurde dit gepuzzel met pen en papier. Tegenwoordig wordt daar de computer voor gebruikt. De methode is nu: je verzamelt van de talen die je wilt onderzoeken meer dan honderd basiswoorden, of meer dan honderd grammaticale eigenschappen. Je stelt vast in hoeverre de talen die woorden of eigenschappen met elkaar gemeen hebben. Die informatie codeer je voor elke taal in een voor die taal unieke opeenvolging van nullen en enen. Deze cijfercodes kun je vervolgens als een soort DNA behandelen, je kunt er phylogenetische software uit de evolutionaire biologie op loslaten. Die kan dan berekenen wat ‘de meest waarschijnlijke’ stamboom is van die talen.

Het ‘gemiddelde gezicht’ van Samoa. Colin Spears.

In Nijmegen hebben ze in het verleden al laten zien dat het niet veel uitmaakt of je die analyses baseert op de woordenschat van talen, of op de grammaticale eigenschappen: daar komt meestal dezelfde stamboom uit. Afgelopen jaar is deze methode ook gebruikt om iets te onderzoeken wat in de 19de eeuw niet kon. De computer kreeg als opdracht: bereken hoe snel de woordenschat en de grammatica veranderd zijn in de vierduizend jaar lange geschiedenis van de Austronesische taalfamilie.

De Austronesische talen vormen, met 1.250 stuks, de op één na grootste taalfamilie. En de meest overzichtelijke: de familie weerspiegelt een gemakkelijk te reconstrueren migratie-geschiedenis. Vierduizend jaar geleden begon het met één taal in Zuidoost-China. Die heeft zich vandaar geleidelijk verspreid (en opgesplitst) over een immens gebied: Taiwan, de Filipijnen, Indonesië, Nieuw-Guinea, en de vele eilanden in de Grote Oceaan (Polynesië). In een deel van dit gebied kwamen die talen in aanraking met talen van mensen die daar al tientallen duizenden jaren woonden, in een ander deel van het gebied kwamen ze terecht op eilanden die tot dan toe onbewoond waren geweest.

De computerberekeningen laten zien dat de Austronesische talen in het verleden soms heel snel veranderden en soms heel langzaam. Bovendien gingen snelle veranderingen in de woordenschat lang niet altijd gepaard met snelle grammaticale veranderingen, of omgekeerd.

Stephen Levinson is erg ingenomen met dit onderzoeksresultaat. „We zien dat de woordenschat vooral snel verandert als een taal zich opsplitst, bijvoorbeeld doordat een groepje mensen naar een ander eiland vertrekt en daar onder elkaar een nieuwe taalvariant ontwikkelt. Sterke grammaticale veranderingen tref je vooral aan in gebieden waar mensen langdurig in contact zijn geweest met mensen die een heel andere taal spraken, zoals in Nieuw-Guinea gebeurd is.”

Welke grammaticale eigenschappen zijn veranderlijker, welke stabieler? „Hoe abstracter een eigenschap, hoe stabieler”, zegt Levinson.

Daar is een verklaring voor. Mensen zijn voortdurend bezig met marking sameness and difference. In de manier waarop ze spreken laten ze, zowel bewust als onbewust, doorschemeren bij welke groep ze horen of willen horen, en bij welke groep ze niet horen. Dat doen ze door bepaalde taaleigenaardigheden van hun eigen groep te overdrijven. Meestal zijn dat grammaticale verschijnselen waar ze zich bewust van zijn. Zoals bijvoorbeeld een dubbele ontkenning: iedere Nederlander is zich bewust van het verschil tussen ‘Hij heeft nooit geld’ en ‘Hij heeft nooit geen geld’.

Wijn of twitter

Maar er zijn ook grammaticale eigenschappen waar mensen zich niet bewust van zijn. Bijvoorbeeld, de ingewikkelde woordvolgorderegels van het Nederlands. Zoiets verandert minder gemakkelijk.

De computer kan niet alleen de geschiedenis van talen berekenen, maar ook de geschiedenis van één woord of van één grammaticale eigenschap. Een woord ontstaat in één taal en kan zich daarna verspreiden over andere talen. Dat geldt voor een modern woord als twitter, maar evengoed voor oude, vertrouwde woorden als ‘wijn’ of ‘wiel’. Voor grammaticale eigenschappen werkt het net zo, denkt Levinson. Ook die ontstaan ergens, verbreiden zich, en kunnen ook weer afsterven, verdwijnen.

Het ‘gemiddelde gezicht’ van Nederland. Colin Spears.

„Ik denk dat veel collega-taalkundigen dat nog een vreemd idee vinden, hoor. De meeste van hen zien talen als ingewikkelde, mooi uitgebalanceerde systemen, waarin alles met elkaar samenhangt en samenwerkt. De grammaticale eigenschappen zouden daarin als tandwieltjes zijn die precies in elkaar passen. Het idee dat je daar lukraak wat uit zou kunnen halen of veranderen, is voor veel taalkundigen geen fijne gedachte.”

„Waarschijnlijk zijn sommige grammaticale eigenschappen gemakkelijker te veranderen dan andere. Ze lijken daarin op genen. Die vormen met elkaar netwerken, gene regulatory networks, waarbinnen het ene gen het andere gen aanstuurt, en dat gen stuurt weer een ander gen aan, en zo verder. Sommige genen vormen het middelpunt van zo’n netwerk, andere behoren meer tot de periferie. Die laatste kunnen gemakkelijk muteren zonder dat er grote rampen gebeuren. Voor de centrale genen is dat veel lastiger.”

„Zo werkt het in de grammatica van een taal misschien ook. Sommige eigenschappen zijn heel centraal en dus minder vatbaar voor verandering. Bijvoorbeeld, de manier waarop je in een zin aangeeft of iets het onderwerp dan wel het lijdend voorwerp is. Andere eigenschappen bevinden zich in de periferie en kunnen gemakkelijk veranderd worden. Bijwoordelijke bepalingen bijvoorbeeld.”

Nog onopgehelderd

‘Gemiddelde’ vrouw uit Ethiopië. Colin Spears.

Levinson hoopt dat het uiteindelijk ook mogelijk wordt de geschiedenis van ‘taal’ te berekenen. Bijvoorbeeld van de talen die buiten Afrika gesproken worden. Levinson: „De standaard-hypothese is dat het ontstaan van taal samenvalt met het ontstaan van de ‘anatomisch moderne mens’. Die zou zich 60.000 jaar geleden vanuit Afrika over de andere continenten verspreid hebben. Maar ik betwijfel of je de enorme diversiteit die je nu buiten Afrika vindt, in 60.000 jaar ontstaan kan zijn.”

„Ik kan me ook voorstellen dat andere mensachtigen ook al zoiets hadden als taal. En dat hun taalsystemen van invloed zijn geweest op hoe taal zich in de loop der millenia ontwikkeld heeft. Dus dat contacten tussen de anatomisch moderne mens en andere mensachtigen, zoals neandertalers en denivosa-mensen, ook talige gevolgen hebben gehad. Kortom, dat folks we now might think were not quite us ook een bijdrage hebben geleverd aan de ontwikkeling van taal.”

    Hoe bereken je de geschiedenis van talen?

    1. Klanken vergelijken

      Deze traditionele methode, die in de negentiende eeuw werd ontwikkeld, is gebaseerd op ‘cognaten’: woorden uit verschillende talen, die op elkaar lijken omdat ze afstammen van hetzelfde woord uit een vroegere taal. De woorden ‘vijf’ en ‘cinq’ bijvoorbeeld, stammen, hoe verschillend ze ook klinken, allebei af van hetzelfde Indo-Europese oerwoord ‘penkwe’. Daar kom je achter door ze te vergelijken met woorden voor ‘vijf’ in zoveel mogelijk andere Indo-Europese talen: ‘five’, ‘Fünf’, ‘fem’, ‘cinque’, ‘cinci’, ‘penki’, ‘pjat’, ‘pieci’, ‘pum’, ‘pente’…

      Vanuit al die verschillende klankvormen kan er, met veel kunst-en-vliegwerk, teruggerekend worden naar het Indo-Europese proto-woord.

    2. Woorden vergelijken

      Als je eenmaal een heleboel cognaten gevonden hebt, kun je daar ook de computer op loslaten. Je neemt een heleboel talen waarvan je vermoedt dat ze met elkaar verwant zijn. Je kunt voor iedere taal turven welke cognaten nog wel, of niet meer, in die taal aanwezig zijn. Niet aanwezig resulteert in een nul, wel aanwezig in een één. Zo krijg je voor iedere taal een reeks van enen en nullen, die je door de computer kunt laten vergelijken.

      Bijvoorbeeld: ‘broer’, het Russische ‘brat’ en het Franse ‘frère’ zijn cognaten. Maar in het Spaans is broer ‘hermano’, en dat woord heeft een heel andere herkomst.

      Talen die nauw verwant zijn, zullen veel cognaten met elkaar gemeen hebben. Talen die verre familie van elkaar zijn, zullen minder overlap van cognaten vertonen.

    3. Grammaticale eigenschappen vergelijken

      Je stelt hondervijftig grammaticale vragen aan de talen die je wilt onderzoeken. Of het lijdend voorwerp voor of na het werkwoord staat, of het werkwoord een aparte meervoudsvorm heeft, of die taal veel met voorzetsels werkt, etc. De antwoorden, ‘ja’ of ‘nee’, geef je ook hier weer als nullen en enen. Dat resulteert voor iedere taal in een reeks van 150 nullen en enen: een ‘grammaticaal profiel’. De computer kan dat vergelijken.

    • Berthold van Maris