Paulien Hogeweg: „In de jaren 70 ging het analyseren van zulke grote datasets nog allemaal handmatig.”

Foto Roger Cremers

Interview

Nu zien we hoe evolutie in zijn werk gaat

Paulien Hogeweg | grondlegger bio-informatica De bio-informatica begon in Leiden op een gigantische computer met amper rekenkracht. Het vak is nu niet meer weg te denken.

Het was eind jaren tachtig dat de Utrechtse bioloog Paulien Hogeweg (76) een e-mail kreeg van de Oxford English Dictionary. De samenstellers van het vermaarde woordenboek wilden een nieuw lemma opnemen en het bleek dat zij, samen met haar collega Ben Hesper, de bedenker was van de beoogde term.

Inmiddels is ‘bio-informatica’ een wereldwijd begrip. Bio-informatici zoals Hogeweg interpreteren met behulp van computers grote hoeveelheden biologische data en destilleren er wetmatigheden uit. Vooral in de genetica en in de evolutiebiologie is hun inbreng niet meer weg te denken. Van het ontrafelen van het menselijk genoom tot het in kaart brengen van de verspreiding van het nieuwe coronavirus: bio-informatica speelt een belangrijke rol.

„Ons uitgangspunt was, en is nog steeds, dat biologische systemen informatie verwerken”, vertelt Hogeweg via Skype vanuit haar huis in Utrecht. „Denk bijvoorbeeld aan de erfelijke informatie die ligt opgeslagen in je genen, en die via veel tussenprocessen leidt tot de vorm en eigenschappen van organismen. Omdat er binnen de biologie al wel vakgebieden als biochemie en biofysica bestonden leek bio-informatica Ben Hesper en mij een logische toevoeging.”

Afgelopen februari organiseerde de Universiteit Utrecht nog een groot symposium ter ere van een halve eeuw bio-informatica. Want zelfs al kwam de term pas later in het woordenboek, Hogeweg en Hesper bedachten het woord ‘bio-informatica’ al in 1970. „Ik was toen net afgestudeerd aan de Universiteit van Amsterdam, op een vergelijkend onderzoek tussen waterplanten in Nederland, India en Tsjechoslowakije en kwam dus met veel data thuis. In die tijd ging het analyseren van zulke grote datasets nog allemaal handmatig. Het was de gewoonte dat je er met een schuin oog naar keek, meer niet. Maar ik dacht: hier moet meer mee kunnen.”

Het gebruik van de computer werd per microseconde afgerekend

 

Daarvoor had u wel eerst een computer nodig.

„Ja, in Amsterdam was die er niet op de universiteit, maar in Leiden al wel. Een enorm ding was dat, hij stond in grote zaal, maar met minder kracht dan er nu in je wasmachine zit. Het gebruik ervan werd per microseconde afgerekend. We hebben toen een computerprogramma, Biopat, ontwikkeld voor het ontdekken en analyseren van patronen in biologische data. Toentertijd ging het om ecologische data, later betrof het genoomsequenties, waarmee bio-informatica mainstream is geworden.

„Vanaf het begin hebben we bestudeerd hoe een genotype, dus het totaal aan al je erfelijke informatie, wordt vertaald in een fenotype, dus hoe je eruitziet. Dat is nog steeds een belangrijk thema in bio-informatisch onderzoek. Als je uiterlijk veel op elkaar lijkt – als plant, als dier, als mens – dan zul je ook wel genetisch sterk op elkaar lijken, zou je verwachten. In grote lijnen is dat ook zo, maar niet altijd. Dat zagen we eerst door vertakkingspatronen te genereren op de computer met heel eenvoudige regels. Vrijwel dezelfde regels kunnen heel verschillende vertakkingen maken, en erg verschillende regels juist dezelfde. Veel later bleek dat ook uit andere biologische voorbeelden. Dat vind ik het mooie aan dit vakgebied: je ziet soms dingen waar je helemaal niet aan gedacht hebt.”

Bio-informatica speelt ook in de evolutiebiologie een belangrijke rol.

„Ja, en in dat deelgebied van de bio-informatica ligt nu mijn onderzoek. De toepassing binnen de genetica kan nuttig zijn,, maar met bio-informatica kun je ook fascinerende vragen beantwoorden, bijvoorbeeld in een poging om the origin of life te begrijpen.

„Natuurlijk hadden we ook voor de jaren zeventig wel basisideeën over evolutie en selectie, al sinds de tijd van Darwin. Maar nu kunnen we daadwerkelijk processen als selectie en mutatie nabootsen om te zien wat de consequenties zijn en hoe evolutie in zijn werk gaat.

Het wegvallen van genen heeft een belangrijke rol gespeeld bij het ontstaan van alle complexe soorten

 

„Een mooie recente toepassing vind ik bijvoorbeeld de reconstructie van het ontstaan van eukaryoten, dus organismen met een celkern, zoals wij. Na een miljard jaar waarin er alleen maar simpelere prokaryoten voorkwamen had je opeens een big bang van complexificering. Je zou denken dat we sinds die eerste eukaryoot, die we LECA noemen, Last Eukaryotic Common Ancestor, steeds complexer en complexer zijn geworden. Maar uit reconstructie van het genoom van die LECA blijkt dat die eiwitsgewijs juist al ontzettend complex was, en dat er sindsdien van alles is weggevallen.

„Eigenlijk hadden we dat al kunnen verwachten, blijkt uit simulaties van de evolutie van simpele kunstmatige cellen. Daarin vindt eenzelfde patroon van vroege genoomexpansie plaats, gevolgd door stroomlijning. Dus het wegvallen van genen heeft een belangrijke rol gespeeld bij het ontstaan van alle complexe soorten die we nu hebben.”

Hoe kun je een voorouder reconstrueren die miljarden jaren geleden leefde?

„Door te kijken naar organismen die nu leven. Door hun genomen met elkaar te vergelijken, kun je een fylogenetische stamboom opbouwen, een schematische weergave van de evolutionaire geschiedenis van verwante soorten. Simpel gezegd: als beest A en beest B allebei hetzelfde gen hebben, dan had hun voorouder dat ook. Als beest A een gen wel heeft, en beest B niet, maar beest C – dat verder van beide soorten afstaat – had het wel, dan kun je ervan uitgaan dat beest B het in de loop der tijd verloren is. Enzovoort. Zo kun je geleidelijk die hele stamboom reconstrueren.”

Het klinkt haast als detectivewerk.

„Ja, maar dat geldt voor de gehele wetenschap.”

In hoeverre overlapt bio-informatica met kunstmatige intelligentie?

„Zeker in de jaren zeventig, toen beide vakgebieden in opkomst kwamen, waren er veel overeenkomsten – allebei gebruikten ze de net beschikbaar gekomen computers om informatische processen te doorgronden. En nog altijd zijn er raakvlakken. Voor kunstmatige intelligentie kunnen biologische systemen als inspiratiebron dienen, bijvoorbeeld in de robotica. En de in KI ontwikkelde ‘deep learning’-technieken met neurale netwerken gebruiken we ook in de bio-informatica. Maar het zijn nu duidelijk aparte disciplines geworden.”

E-dna zal leiden tot de ontdekking van allerlei nieuwe soorten

 

Welke ontwikkelingen verwacht u in de komende vijftig jaar in het vakgebied?

„Heel veel meer inzicht in de evolutie en het functioneren van biologische systemen op alle niveaus! De geweldige vooruitgang in technieken en de beschikbaarheid van enorme hoeveelheden data vormen een bonanza voor de bio-informatica. Ik verwacht ook veel van de opkomst van e-dna: environmental dna. Daarmee kun je van een willekeurige plas water of zandkorrel achterhalen welke organismen erin of erop voorkomen. Dat zal leiden tot de ontdekking van allerlei nieuwe soorten, tot op microniveau. Er bestaan alleen al veel meer soorten virussen en bacteriën dan we ooit voor mogelijk hebben gehouden.”