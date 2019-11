‘De contractanten [hebben] verklaard dat door hun buiten echt geproduceerd is een kind van het manlijk geslacht onder den naam van Willem op den zestienden february een duizend acht hondert en dertig ...’

Willem was al vijf jaar oud toen mijn over-over-over-grootvader trouwde met de moeder van Willem. Zij verklaren in het huwelijksregister dat mijn ‘grootvader’ zijn biologische vader is. Maar was hij dat ook?

Ik moest hieraan denken toen ik las over de recente genetische studie naar niet-biologisch vaderschap in de afgelopen 500 jaar. Onderzoekers vonden dat bij 1 tot 2 procent de vader in de stamboom niet de biologische vader was. Dit percentage was vier keer hoger voor vaders uit de lagere sociale klassen.

De resultaten sloten aan bij eerdere onderzoeken en bevestigden theoretische voorspellingen. De resultaten lijken daarmee valide, maar dat is niet vanzelfsprekend. Validiteit hangt af van hoe een onderzoek is opgezet, van de kwaliteit en representativiteit van de data. Hoe wisten de onderzoekers of een man eeuwen geleden wel of niet de biologische vader was? En tot welke sociale klasse hij behoorde?

De onderzoekers vergeleken het dna van 1.026 mannen die paarsgewijs een gemeenschappelijke voorvader hadden. De 513 stambomen spanden gemiddeld zo’n zes generaties met in totaal 6.818 voorvaders. Mannen die afstammen van dezelfde voorvader hebben hetzelfde Y-chromosoom als alle vaders in hun stamboomlijnen de biologische vaders zijn. Komen de Y-chromosomen niet overeen, dan is minimaal één vader niet de biologische vader.

Mijn ‘grootvader’

Een verschil tussen de Y-chromosomen wordt ook gevonden als de stamboom niet klopt. De nauwkeurigheid van de genealogische data is cruciaal. En een ware uitdaging. Oude geboorte-, huwelijks- en overlijdensregisters zijn handgeschreven, verbleekt door de tijd, incompleet en notoir vol fouten. Mijn ‘grootvader’ is geboren in de tijd van Napoleon als Francois Louis Janssens, trouwde als Francies Ludovicus en stierf als Francus Ludovicus. Stamboomonderzoek is monnikenwerk.

De onderzoekers vonden verschillende Y-chromosomen bij 96 dna-‘paren’, wat betekent dat tenminste 96 van de 6.818 voorvaders niet de biologische vaders waren, zo’n 1 tot 2 procent. Omdat ze (uiteraard) niet konden achterhalen wie de niet-biologische vaders waren restte een pragmatische oplossing: als één van de x vaders in een stamboom niet de biologische vader is, dan is voor elk van de vaders de kans daarop 1/x . Voor de vaders in de stambomen met de identieke Y-chromosomen is die kans nul. Preciezer waren hun data niet.

De sociale klasse van de vaders werd afgeleid aan de hand van hun beroep in het geboorteregister. Dit viel ook niet mee. De sociale klasse was onbekend voor 57 procent van alle vaders en voor 90 procent van de vaders van de kinderen die na 1930 waren geboren.

Nu zijn onderzoeksgegevens zelden perfect. Het verzamelen van data is altijd een afweging van kosten en baten, van hoe nauwkeurig en gedetailleerd de data moeten zijn voor wat je wilt onderzoeken. Maar daarmee omgekeerd: als de kwaliteit van de data vastligt, zoals bij historische gegevens, kun je sommige vragen wel beantwoorden en andere niet.

Hypothetische scenario’s

Een globale conclusie dat niet-biologisch vaderschap vaker voorkomt bij de lagere sociale klassen valt te onderzoeken. Als gegevens ontbreken kun je hypothetische scenario’s bedenken waarin je aannames maakt over die ontbrekende data. Bijvoorbeeld dat data alleen ontbreken voor de lagere sociale klassen of evenredig ontbreken voor alle klassen. Je kunt dan onderzoeken of de conclusie in uiteenlopende scenario’s overeind blijft.

Dat de data van de dna-donoren representatief zijn is te beredeneren, maar niet te bewijzen. Als de sociale klasse van de vader onbekend is voor 90 procent van de mannen geboren na 1930 kun je niet weten of de donoren een weerspiegeling zijn van de mannelijke bevolking van nu. Zouden, bijvoorbeeld, de lagere sociale klassen ondervertegenwoordigd zijn dan is 1 tot 2 procent niet-biologisch vaderschap mogelijk een onderschatting.

Maar dat in de lagere sociale klassen de kans op niet-biologisch vaderschap vier keer verhoogd was, nee, zulke precieze schattingen laat de kwaliteit van de data niet toe. Met betere data was die kans wellicht twee keer verhoogd of zes keer. Als je niet-biologisch vaderschap hebt moeten gissen en van 57 procent van de vaders de sociale klasse niet weet, dan kun je deze vraag niet beantwoorden.

Buitenechtelijk kind

Er zitten grenzen aan wat je als onderzoeker kunt met data en die grenzen worden bepaald door wat je ermee wilt doen, de onderzoeksvragen. Voor elke vraag is dat een afweging. Wetenschap is meer dan data-analyse.

Willem zou als buitenechtelijk kind uitgesloten zijn van deze studie. Maar was mijn ‘grootvader’ zijn vader? Dat is best aannemelijk. Het huwelijksregister vermeldt namelijk nog een bijlage, een “van eene door den Kolonel kommandeerende de 2e afdeeling Infanterie afgegeven permissie tot het aangaan van een wettig huwelijk.” Mijn grootvader was militair in een tijd waarin soldaten pas mochten trouwen als zij de dienstplicht hadden vervuld. En die duurde vijf jaar. Negen maanden na hun trouwdag werd mijn over-over-grootvader geboren.

Cecile Janssens is hoogleraar translationele epidemiologie aan Emory University in Atlanta.