In het taalkundige hol van de leeuw toont een geneticus zijn kunsten. Aldus geschiedde begin september op een grote conferentie over Indo-Europese talen in Leiden. „Ik heb 48 uur niet geslapen”, excuseert geneticus David Reich zich aan het begin van zijn keynote-lecture in het Academiegebouw – een voormalige katholieke kapel die al sinds 1581 het centrum vormt van de Leidse Universiteit. Amper een dag eerder was Reich aangekomen uit Boston, waar hij doceert aan Harvard University. De laatste jaren hebben zijn genetische onderzoeken veel problemen uit de geschiedenis van talen opgehelderd. Dankzij opgegraven botten. En dankzij de technieken van Reichs leermeester, paleogeneticus Svante Pääbo, die voor zijn pionierswerk de Nobelprijs krijgt, zo werd later op 3 oktober bekend.

David Reich Foto Jon Chase

De zaal zit vol met taalkundigen die kijken naar woorden en grammaticale patronen in de Indo-Europese talen van de afgelopen 5.000 jaar. Indo-Europees in al zijn vertakkingen wordt nu gesproken door ongeveer drie miljard mensen, van het Engels tot het Hindi, van het Litouws tot het Farsi. Reich kijkt juist niet naar taalpatronen, maar naar patronen in het dna uit oude botten – van neanderthalers maar ook van Angelsaksen. Het gaat niet om patronen in overerfbare eigenschappen. Reich kijkt naar patronen in een miljoen enkelvoudige mutaties waarbij maar één letter in het dna veranderd is (single nucleotide polymorphisms, SNP’s). Alleen met computers zijn al die patronen te onderzoeken en nergens kan Reich in het dna ontcijferen welke taal die mensen ooit spraken. Maar hij ziet wél van wie ze afstamden.

De crux is: als de oude botten goed gedateerd zijn en er is genoeg dna van verschillende individuen in kaart gebracht, dan worden allerlei migraties tot in het verre verleden ineens verrassend helder zichtbaar. Daarom wordt gesproken over een ‘a-dna-revolutie’ in de archeologie en de taalkunde, ancient dna. Migratie als verklaring voor cultuurveranderingen in de prehistorie is dan ook weer helemaal terug van weggeweest, nadat decennialang culturele beïnvloeding, zonder grootschalige verplaatsing van mensen en volkeren, de favoriete verklaringsmethode is geweest. Want hoe kon je eigenlijk zeker weten of met de verspreiding van een bepaalde nieuwe cultuur ook ménsen meekwamen? In Europa drinken we nu ook Coca cola, zonder dat er direct overal Amerikanen in onze huizen wonen.

Menselijke schedel uit de Yamnaya-cultuur uit de Bronstijd, beschilderd met rode oker. Foto Rasmussen et al.

Maar mede dankzij Reich zijn nu bijvoorbeeld in West-Europese botten uit het derde millennium voor Christus op grote schaal dna-patronen ontdekt die verder alleen bekend zijn uit de steppes van Oekraïne en Zuid-Rusland. En dat kwam perfect uit, want die ‘Yamnaya’-steppevolkeren waren al kandidaat-sprekers van oer-Indo-Europees. De Yamnaya leefden in de juiste periode en bovendien zijn er in het (gereconstureerde) proto-Indo-Europees erg veel woorden voor paarden en nomadische veeteelt, maar vrijwel bijna niks voor akkerbouw. Daardoor waren de landbouwvolkeren van West-Europa of het Midden-Oosten sowieso al veel minder waarschijnlijke kandidaten. Dáárom staat Reich nu in het Leidse academiegebouw tussen de taalkundigen.

Twee totaal verschillende wetenschapsdomeinen kunnen nu elkaars hypotheses testen, dat is wat het dna uit oude botten de laatste tien jaar tot stand heeft gebracht. Guus Kroonen, taalkundige uit Leiden en organisator van de conferentie bekent dat taalkundigen zelfs heel blij zijn met deze nieuwe bondgenoot. „Want wij taalkundigen zijn wél altijd in de mobiliteit-stand blijven staan! Bij archeologen kregen we daarvoor vroeger nooit gehoor. En kijk nu eens! In de afgelopen vijf jaar heeft de genetica met onderzoek van migraties taalkwesties opgehelderd waar taalkundigen en óók sprekers van die talen zelf soms al honderden jaar mee worstelden: waar komt deze taal vandaan?” En, voegt Kroonen toe: „Het mooie is dat de genetische conclusies, op een paar uitzonderingen na, héél goed matchen met de taalkundige ideeën. Veel beter dan wat de archeologen ons tot voor kort altijd voorhielden.”

Geduldig uitpluizen

Een belangrijk verschil met oude, vaak vooroorlogse migratieverklaringen in de archeologie – en taalkunde – is dat die oude theorieën vaak uitgingen van een soort stabiel ‘volkseigen’ identiteit. Bij Reich en de zijnen ontbreekt die stabiliteit echter totaal. In zijn onderzoeken blijkt iedere bevolking altijd weer een mengsel van ándere oudere bevolkingen. De kunst van Reich is dat hij al die mengsels geduldig uit elkaar pluist. Alles stroomt, niets blijft. Ook dat typerende SNP’s-patroon bij de Yamnaya, dat steppe-dna dat overal opduikt, bestaat weer uit een tijdelijk samenvloeien van allerlei patronen van hún uiteenlopende voorouders uit de millennia daarvoor, zoals Oost-Europese jager-verzamelaars en jager-verzamelaars uit de Kaukasus. Bij hun honderden jaren durende verspreiding door Europa gaan de Yamnaya, al mengend met de lokale ‘Neolitische’ boeren, bijvoorbeeld weer op in een nieuwe mix: het ‘continentale Beker-complex’. Dat is genoemd naar de dan dominant wordende klokbekercultuur. Ironisch is dat dat ‘Beker-complex’, met ongeveer 50 procent afstamming van Yamnaya, in Engeland de daar wonende Neolithische boeren (in feite hun achterachterneven) bijna helemaal zullen verdringen – daar wordt kennelijk niet zo heel veel meer gemengd. In de afstamming van de mens loopt alles door elkaar.

Dna uit deze 7.000 jaar oude kaak uit La Braña ‑Aritero (Leon, Spanje) werd in 2019 gebruikt bij een groot onderzoek door David Reich naar de bevolking in Spanje in laatste 8.000 jaar. Foto Alberto Tapia

En nu dus staat Reich in Leiden tussen de taalkundigen. Vol vuur zegt hij: „Ik heb op deze taal-conferentie al zoveel verwijzingen naar genetisch onderzoek gehoord dat ik mijn voorbereide lezing vannacht helemaal omgegooid heb. Ik wil laten zien hoe ik werk: hoe we zoeken in de archeologische en taalkundige literatuur naar hypotheses en theorieën waar wij wat mee kunnen.” In een razend tempo jaagt Reich langs bijna al zijn taalkundig relevante onderzoeken uit de laatste tien jaar.

Neem dat oude strijdpunt in de studie van het Indo-Europees. Leefden de sprekers van het proto-Indo-Europees, zo’n 3.000 jaar voor christus wérkelijk op de steppen van Oekraïne en omstreken? Of ligt de oorsprong toch bij een óuder Indo-Europeessprekend volk dat leefde in Anatolië en op de Kaukasus, aan wie dan dus misschien weer die latere steppevolkeren hun taal ontleenden? „Zou kunnen. Zonder ons dna-onderzoek zou ik zeggen dat de kans dat de Anatolië-theorie wáár is, twee keer zo groot is als die van de steppe”, houdt Reich de taalkundigen voor, van wie enkelen instemmend knikken. „Maar als ik kijk naar ons migratiekaartje van die steppe-Yamnaya, dan past dat echt verbluffend goed op de taalkundige stamboom van de Indo-Europese talen. Op grond dáárvan maakt de steppe-herkomst juist, eh, twintig keer zoveel kans als de Anatolië-hypothese!” En als een goochelaar die een konijn uit de hoge hoed tovert, rekent Reich razendsnel voor: „1:2 maal 20:1, samen maakt dat de kans op een steppe-herkomst tien keer zo groot.”

En hup, op naar het volgende hete hangijzer in de Indo-Europese taalkunde: hoe kwam ooit het Indo-Europese Sanskriet en Hindi in India terecht, via het westen – Iran en Afghanistan – of via de noordelijke steppen langs de Kaspische Zee? Die laatste herkomst was altijd al waarschijnlijker door bijzondere overeenkomsten tussen het Balto-Slavisch en het Indo-Iraans. Reich: „En die connectie is haast onmogelijk als je niet door de steppe gaat.” Maar ja, op grond van ándere taal-analyses zou je het Indo-Iraans ook wel weer helemaal kunnen lostrekken uit die stamboom, waardoor een herkomst voor de Indiaanse talen via Iran juist wél weer waarschijnlijker zou worden. De samenvatting van die taalkundige stand door Reich is uiteindelijk: „5 tegen 1 voor de steppe.”

Een grote analyse van Indiaas en andere oud dna door Reich en anderen uit 2019 bracht helderheid en leidde tot het vaststellen van een directe steppe-afstamming van de groepen die gelden als de oudste sprekers van het sanskriet in India. Nog steeds is in India nergens de steppe-afstamming zo groot als onder de Brahmanen, de hoogste kaste en de traditionele bewakers van de heilige sanskriet-geschriften. Einduitslag: 500 tegen 1 voor de steppe!

Omstreden kwestie

En zo gaat het door, wanneer verspreidde het Keltisch zich naar Engeland? En waar komt eigenlijk dat geheimzinnige Tochaars vandaan, de Indo-Europese taal die 1.200 jaar geleden in Xinjiang gesproken werd? Enzovoorts. En soms botsen taalkunde en genetica flink. Een echt omstreden kwestie is de herkomst van de sprekers van de oude Indo-Europese talen in Anatolië, twee- à drieduizend jaar voor Christus. Mede op grond van de woordenschat (vol verwijzingen naar het hoeden van vee, maar weinig over graan verbouwen) lijkt dat Hettitisch en zijn voorgangers perfecte nakomelingen van de taal van de steppevolkeren. Maar in oude botten op Anatolië is geen spoortje steppe-dna te vinden. Maar, denkt Reich, dan kunnen die Indo-Europeessprekers toch ook wel afstammen van vóórouders van de steppevolkeren die ooit leefden op de Kaukasus. Die zouden dan met een soort pré-próto-Indo-Europese taal al rond 4000 voor Christus naar Anatolie zijn getrokken. „Tien tegen één”, sluit Reich zijn lezing vrolijk af. Applaus – maar in de zaal schudden taalkundigen ook hun hoofd. Want op die Kaukasus was er toen allang akkerbouw, waarom heeft het Hettitisch dan zo weinig oerwoorden over graan?

„Hoe komt u aan die kansberekeningen over al die hypotheses?”, is daarna een vraag. „Dat is een experiment”, zegt de geneticus achteloos. Hij legt uit dat dit een trucje is uit de Bayesiaanse statistiek, om beter na te denken over de waarachtigheid van verschillende hypotheses. „Wat is je idee voorafgaand aan je onderzoek, en hoe verandert die inschatting door het nieuwe onderzoek? Dat druk je uit in een kansgetal.” En waar komen dan de kansgetallen vandaan? Reich: „Ha, ja! Dat is geen wetenschap, maar kunst, gut feeling. Die cijfers zijn de reflectie van mijn gevóel, van wat ik denk als ik alle argumenten over een kwestie heb bekeken. Een ander kan er best weer andere getallen aan geven, dat helpt de discussie alleen maar verder.”

Taalkunde is wetenschappelijk, maar de data zijn zo soft David Reich Paleogeneticus

Een paar weken later toont Reich zich – weer terug in Harvard – in een zoom-gesprek enthousiast over de afloop van dat provocerende experiment met Bayesiaanse getallen. „De volgende dag zag ik dat twee taalkundigen op het congres ook kansen hingen aan hun hypotheses! Zo leuk dat ze dat oppakken, het was een ingeving in mijn slapeloosheid! Taalkunde is wetenschappelijk, maar de data zijn zo soft. Het is echt geleerdenwerk, van mensen die zich helemaal ingraven in teksten. Met hele discussies over één woord, zoals ‘bijenhouden’. En is dan het woord voor ‘honing’ of ‘steker’ hetzelfde in een Indiase taal als in het Albanees? Dat kan heel belangrijk zijn. Want zo kun je bepalen of de sprekers van de voorloper van beide talen bijen hielden! Daaruit kan je soms afleiden waar ze woonden. Ik snap dat deze geleerden terugdeinzen voor een kwantitatieve argumenten. Maar toch: als zij een betoog opzetten, hebben ze wel degelijk een bepaald gevoel over hoe waarschijnlijk dat allemaal is. Ik vind dat wetenschappers daar explicieter over moeten zijn.”

U bent nu vrij populair bij taalkundigen, maar in de archeologie klinkt ook kritiek op uw genetische onderzoek, onder meer omdat uw definitie van bevolking aanleiding zou geven tot racistisch denken. Wat vindt u daarvan?

Reich: „In dat verwijt loopt van alles door elkaar. Praten over ras is totaal verouderd. Ras is een sociaal construct dat in de laatste paar honderd jaar is ontstaan. Het is slechts een percéptie van biologische verschillen, en de vraag is of er iets daarvan is terug te vinden in genetische informatie. Een heel andere vraag is hoe mensen in het verleden zich bewogen over de wereld en hoe ze met elkaar mengden. Ras heeft daar niks mee te maken.

„In mijn onderzoek heb ik wel te maken met hoe je mensen in groepen indeelt. Er is best vaak een klonterige variatie, in groepen die relatief homogeen zijn. Maar er zijn ook plaatsen met veel variatie in allerlei graduele verschuivingen en vaak ook groepen die heel erg aan het mixen zijn met andere. Op sommige moment zie je sterke discontinuïteiten, met heel snelle veranderingen. Maar in andere periodes zie je weer groepen die lángzaam overgaan in iets anders. Daarom gebruiken wij een praktische definitie van een populatie, vrij triviaal eigenlijk. We trekken een cirkel om groepen van mensen waarvan wij de afkomst en geschiedenis proberen te begrijpen. En dan kijk je daarbinnen hoeveel variatie of homogeniteit er is. Als je dat nodig hebt voor je onderzoek kan je dus een cirkel om een heel continent trekken! Of om een enkel dorp.”

Allemaal op basis van de stand van een miljoen ‘informatiepunten’ in het dna, die een miljoen SNP’s in de genomen uit botten van reeds lang overleden mensen ?

„Precies.”

Wat betekent het dan dat ik als gemiddelde West-Europeaan waarschijnlijk 50 procent Yamnaya-patroon in mijn dna heb?

„Daar is een vrij precieze definitie van. Als jij terug gaat naar 3.000 voor Christus, dan leeft op dat moment 50 procent van jouw voorouders op de steppes bij de Zwarte en Kaspische zee, bij de Yamnaya. Op die plaats, op dat moment, 170 generaties geleden.”

Honderdzeventig generaties is lang geleden. heeft mijn 50 procent verwantschap met de Yamnaya nog iets te maken met erfelijke eigenschappen?

„Nee, niks. We kunnen nu erg goed áfkomst aflezen uit dna. Maar we zijn heel slecht in het aflezen van erfelijke eigenschappen. Die informatie is er wel, in het dna, maar we hebben de code ervoor nog niet gebroken. Met meer kennis en meer wetenschappelijke ontwikkeling gaat ons dat waarschijnlijk ook nog wel een keer lukken.”

Dus die Yamnaya-cijfers zijn heel specifieke afstammingen, geldig voor die precieze periode?

„Ja, het is maar net waar je op wil letten, om welke groep je een cirkel trekt. We hebben nu net een onderzoek gepubliceerd over de Angelsaksen en hun migratie naar Britannië in de vroege Middeleeuwen. Dat was echt moeilijk, omdat die Angelsaksen en Britten écht heel erg op elkaar lijken. Allebei afstammelingen van de neolithische boeren én de Yamnaya. Het verschil tussen Britten en Angelsaksen is ongeveer honderd keer kleiner dan dat tussen Yamnaya en neolithische boeren 3.500 jaar eerder.”

Afstamming is vaak belangrijk voor de eigen identiteit, maar het is dus maar net waar je op wíl letten?

„Tja, ik vermijd eerlijk gezegd om direct met mensen te discussiëren over hun eigen identiteit. Ik geloof niet dat wetenschap erg relevant is voor die identiteit. Het staat iedereen vrij om verhalen over zichzelf te verzinnen. Dat doen we allemaal! Voor identiteit kunnen fictieve verhalen net zo belangrijk zijn als objectieve waarheden. Maar als je wil begrijpen wat er allemaal gebeurd is met je voorouders, dán gaat het wel om objectieve waarheid. Daar moet je wel over praten en discussiëren.”

Uw conclusies zijn niet altijd blijmoedig, zoals uw beroemde conclusie dat in het derde millenium voor Christus in Engeland het neolithische dna-patroon bijna helemaal vervangen werd door dna van afstammelingen van de Yamnaya, in een paar honderd jaar. Kan dat nog een vreedzame menging zijn geweest?

„Ik heb daar werkelijk geen antwoord op. In theorie kan de eerdere bevolking ingestort zijn zonder openlijk conflict, door ziektes, door verschillen in het geboortecijfer of om andere redenen. Maar goed, die gegevens zwemen absoluut naar conflict.”

