Het is een enorme database met taal – dood en levend. Daarin verborgen ligt het antwoord op de vraag waar taalkundigen al twee eeuwen mee worstelen: waar en wanneer ontstond de vroegste voorouder van talen als het Latijn, Hettitisch en Sanskriet (alle dood), en het Nederlands, Russisch, Bengaals en de tientallen andere Indo-Europese talen die nu nog door zo’n drie miljard mensen worden gesproken?

Om dit mysterie op te lossen verzamelden onderzoekers onder leiding van linguïst Paul Heggarty van het het Max Planck Instituut voor Evolutionaire Antropologie in Leipzig 25.918 woorden uit 109 moderne en 52 uitgestorven talen die behoren tot de Indo-Europese familie. Een computeranalyse van dit corpus leidde tot de conclusie dat de oertaal Proto-Indo-Europees ongeveer 8.120 jaar geleden ontstond in een gebied ten zuiden van de Kaukasus. De onderzoekers publiceerden deze resultaten vorige week in het wetenschappelijk tijdschrift Science.

Hun bevindingen zijn meteen omstreden, omdat ze de diepste wortels van het Indo-Europees duizenden jaren verder in de geschiedenis leggen dan tot nu toe wordt aangenomen. Guus Kroonen, docent Indo-Europese talen aan de Universiteit Leiden en hoogleraar taal en prehistorie aan de universiteit van Kopenhagen, noemt de database „prachtig” maar de conclusies die eruit getrokken worden „lariekoek”.

Vruchtbare Halvemaan

Over het ontstaan en de verspreiding van de vroegste voorouder van alle Indo-Europese talen bestaan twee theorieën. De populairste hypothese is dat het Proto-Indo-Europees ontstond op de steppe van wat nu Rusland en Oekraïne is. Zo’n 5.000 jaar geleden gingen de steppebewoners, die Yamnaya worden genoemd, te paard op pad en namen hun taal met zich mee.

Een andere, minder gangbare theorie is dat de Indo-Europese oertaal ontstond in Anatolië (het huidige Turkije) en zich daar vandaan vanaf ongeveer 9.000 jaar geleden met de eerste landbouwers over Europa en Azië verspreidde.

Heggarty en de zijnen komen nu met een derde hypothese, die in feite een synthese is van de ‘steppe-’ en ‘boeren’-theorie: de wieg van het Proto-Indo-Europees stond in de Vruchtbare Halvemaan, het gebied ten zuiden van de hooglanden van Turkije, Rusland en Iran waar de landbouw ontstond. Van daaruit migreerde een groep mensen richting Anatolië en vervolgens verder naar Griekenland, terwijl andere sprekers van een vorm van het Proto-Indo-Europees de Kaukasus over trokken en op de Euraziatische steppe belandden. Hier vandaan vond duizenden jaren later de tweede grote migratie van het Indo-Europees plaats.

De auteurs van het Science-artikel komen tot deze conclusie door gebruik te maken van computermodellen uit de biologie waarmee stambomen van de evolutie van soorten worden gemaakt. Deze modellen vulden ze met woorden uit levende en uitgestorven talen over concepten die zo fundamenteel zijn dat ze overal voorkomen – denk aan zaken als cijfers en woorden voor ‘water’, ‘zwart’ en ‘mond’.

Deze data combineerden de onderzoekers met bekende gegevens over het ontstaan van geschreven taal en het uitsterven van bepaalde talen. Met behulp van al deze feiten maakte de computer een boom met talrijke takken die uiteindelijk leiden naar één begin: het Proto-Indo-Europees zoals dat (met 95 procent zekerheid) rond 8.120 jaar geleden ontstond onder de mensen ten zuiden van de Kaukasus die ook de landbouw uitvonden.

Taalkundige Guus Kroonen schuift deze conclusie terzijde, zegt hij. „En ik heb er met meerdere collega’s over gesproken die er net zo over denken.” Met de database is niks mis, benadrukt hij. „Omdat die open source is kan iedereen ermee aan de slag, dat is waardevol. Maar de bevindingen deugen niet op taalkundig, archeologisch en genetisch gebied.”

Zo gaat het fout bij de afsplitsing van de Indo-Iraanse talen, aldus Kroonen. Die zouden zich volgens Heggarty al ongeveer 6.980 jaar geleden hebben losgemaakt van de andere Indo-Europese talen en direct vanuit Anatolië naar Zuid-Azië zijn gemigreerd. „Dat kan niet, want bij genetisch onderzoek aan botten uit deze tijd is helemaal geen Anatolisch dna aangetroffen in dit gebied. En nog belangrijker: moderne Indiërs hebben steppe-dna, namelijk van de Europese touwbekercultuur, die pas rond 3000 voor Christus ontstond. Dit betekent dat de Indo-Iraniërs rond die tijd nog in Europa waren, en niet al eerder met de landbouw naar Zuid-Azië konden zijn vertrokken.”

Niet goed gekalibreerd

Ook taalkundig gaat het mis met de vroege datering van het Indo-Europees, aldus Kroonen. „Oude Indo-Europese talen als het Hettitisch, Grieks en Indisch zijn pas vanaf het tweede millennium voor Christus overgeleverd. Maar dan zijn er volgens Heggarty al meer dan vier millennia verstreken sinds het uiteenvallen van de oertaal, een tijd waarin deze talen wonderlijk langzaam evolueerden.”

Het is een goede regel in de historische taalkunde dat je het ontstaan van een taal niet verder naar achter duwt dan strikt noodzakelijk, zegt Kroonen. „Het lijkt me onmogelijk dat het Proto-Indo-Europees al 8.000 jaar geleden ontstond, en gedurende de eerste millennia daarna min of meer geen ontwikkeling kende.”

Kroonen vermoedt dat de in zijn ogen foute conclusies te wijten zijn aan het gebruik van het uit de evolutiebiologie afkomstige computermodel. „Ik denk dat dit model niet goed gekalibreerd is voordat de auteurs van het artikel ermee aan de slag zijn gegaan. Talen ontwikkelen zich anders dan genen. Daarmee is onvoldoende rekening gehouden.”