Vier miljard jaar leven, één verhaal

Met computers moet je kunnen bepalen hoe leven is geëvolueerd. Berend Snel rekent aan eiwitten en DNA-volgordes.

Foto Merlijn Doomernik

In de werkkamer van Berend Snel (1975) staat een lidcactus te verpieteren naast een gieter. Dat past wel bij zijn werk. Hij en de elf collega’s in zijn vakgroep aan de Universiteit Utrecht bedrijven biologie zonder dat ze één dier of plant, of maar een cel in een labschaaltje in handen hebben. Snel hield eerder deze maand zijn oratie als hoogleraar in de ‘bio-informatica’. Bio-informatici zijn de codekrakers van de biologie, die met krachtige computers geheimen ontfutselen aan de steeds uitdijende brij van DNA-codes. Met als doel, voor Snel: bepalen hoe het leven op aarde is geëvolueerd. „Ik wil weten welk verhaal zich in de afgelopen 4 miljard jaar voltrokken heeft”, zei hij in zijn toespraak.

Berend Snel praat net zo geroutineerd over genen als p53, TOR of SOS7 als een ecoloog giraffen of olifanten bespreekt. Hij is een spraakwaterval, maar wel een met rotsen erin – vol openlijke twijfel en terzijdes. Hij had het in zijn oratie al gezegd: hij is een general purpose nerd. „Ik vind alles leuk.” Hij houdt van verhalen vertellen, zei hij in zijn oratie. Maar ook van „muziek, strips, wielrennen...”

Dat gebrek aan focus is relatief: hij heeft honderd artikelen op zijn naam. Bovenaan de lijst in Google Scholar staan twee stukken in Nature en Science die respectievelijk tweeduizend en duizend keer geciteerd zijn. Hij schrijft veel over hoe genen zich in de loop van miljoenen jaren ontwikkelden en nieuwe functies kregen – en over geautomatiseerde methoden om die analyses te doen. „Ik ben wel optimistisch”, zegt Snel. „Er zijn veel meer data, de algoritmen zijn beter en de computers zijn veel sneller. De boom van het leven is oplosbaar. Of laat ik zeggen: ik ben niet meer zo pessimistisch als tien of vijftien jaar geleden.”

Allerlei wetenschappers gebruiken vergelijkend DNA-onderzoek. Evolutiebiologen willen ontrafelen hoe de sponzen of de moderne vogels zijn ontstaan, epidemiologen hoe een infectie zich verspreidt, genoombiologen hoe ons DNA functioneert. Steeds geldt: de hoeveelheid geanalyseerd DNA wordt almaar groter en met het verwerken van méér data worden de conclusies soms diametraal anders. Neem honden. Die zijn in India en omstreken tam gemaakt, schreef een team deze week in PNAS. Daartoe hadden ze een DNA-stamboom van 5.200 honden opgesteld. Twee jaar geleden had een ander team in Science juist vastgesteld dat honden in Europa gedomesticeerd werden, op basis van DNA van 148 honden, wolven en wolfachtigen.

Hoe ontdek je patronen in die enorme hoeveelheid DNA-informatie – en hoe weet je dat dat patroon de werkelijkheid weergeeft? „Stel: je maakt een stamboom”, zegt Snel. „Dan gaat de software ervan uit dat de genen die je invoert, van elkaar afstammen. Als dat niet zo is, vertelt je programma dat niet. Die voert gewoon die analyse uit en maakt een heel rare boom. Maar veel onderzoekers zien dat proces niet meer. Die ‘pijplijn’ tussen de ruwe data en de conclusies staat alleen in de ‘supplementary materials’ bij een artikel. Dat zijn 100 tot 200 bladzijden. Probeer dat maar eens te snappen.”

Is de oplossing : beter lezen?

„Nee, de oplossing is om die analyses zelf na te doen. Maar je moet er ook een intuïtie voor ontwikkelen. Bij mij kwam die na twee of drie jaar. We waren bezig met de vraag hoe vaak in de evolutie genen zich splitsen, zodat ze in plaats van één groot eiwit twee kleine eiwitjes maken. Met de computerberekeningen vonden we heel veel voorbeelden – 90 procent daarvan bleken fouten in de data en 10 procent waren écht genen die uit elkaar gingen.”

Is dat nog steeds zo, dat 90 procent van de aanvankelijke uitkomsten fout blijkt?

„Dat ligt eraan waarnaar je op zoek bent. Als je naar uitzonderingen zoekt, is dat nog steeds zo.”

Hoe vaak komt er uit jouw eigen werk een echt mooi verhaal?

Hij denkt lang na, trommelt op tafel. „Er is nog niet heel veel waarvan we zeggen: ‘we snappen het’. Er was een gen dat hetzelfde doet in de mens, in gist en in fruitvliegen. Maar of ze een gemeenschappelijke voorouder hadden, daar kwam niemand uit. Uiteindelijk vonden wij de sleutelsoort waarmee we de link konden leggen. Het was een eikelworm. Je ziet ineens – bam! – het is hetzelfde gen.”

Is dat nou intuïtie?

„Nee, dat is puur geluk. Weet je, we doen de laatste tijd veel te veel kleine dingen. Mijn onderzoeksgroep, bedoel ik. Individuele eiwitten, individuele voorbeeldjes van evolutionaire processen. Dat soort dingen moeten we allemaal grootschalig testen.” Dan moet er wel iets veranderen in het vakgebied, zei hij in zijn oratie al.

Je zei dat we de functie van genen beter moeten vastleggen. Hoezo?

„Stel: je zoekt een alg om biobrandstoffen te maken. Dan moet je voorspellingen doen over de functie van al zijn genen. Het gen TOR, bijvoorbeeld, stimuleert bij mensen groei én het modelleert het cytoskelet, het celskelet. Die functies hangen af van ándere genen. Ontbreekt het gen RAPTOR, dan wordt celskelet modelleren ineens de énige functie van TOR. Een eenvoudig patroon, maar je komt er alleen achter door stapels artikelen te lezen. Ik wil dat soort patronen met bio-informatica op grote schaal ontdekken.

„Je kunt alleen voorspellingen doen over genen, of het van een eencellige is of van een plant, als je weet hoe die genen zijn geëvolueerd en wat de gevolgen zijn voor de hele machine. Als ik daar 5 procent aan kan bijdragen, ben ik extreem blij.”