Verstopt in de ruis van het genoom

Erfelijke ziekten ontstaan niet alleen door genmutaties, maar ook door te veel of te weinig verder goed-werkende eiwitten. Het humane genoom leert vooral hoe gecompliceerd genetica is.

illustratie roland blokhuizen

Twee wereldleiders staken in 2000 op een speciale persconferentie de loftrompet over het humane genoom. De hele erfelijke code van de mens was toen zo goed als vastgesteld. „De mensheid staat op het punt om immens nieuwe genezingskracht te verwerven”, zei de Amerikaanse president Bill Clinton. „De genoomwetenschap zal diagnose, preventie en behandeling van de meeste, zo niet alle ziekten revolutionair veranderen.” De Britse premier Tony Blair sloot zich daarbij aan.

Ruim tien jaar later is daar nog weinig van uitgekomen. „Het genoom is verkeerd in de markt gezet”, zegt bio-informaticus Lude Franke. Hij werkt bij het Universitair Medisch Centrum Groningen.

Het genoom is veel ingewikkelder dan de onderzoekers dachten, toen ze er nog weinig van wisten.

In de vorige eeuw, toen er nog tien jaar onderzoek nodig was om dat ene gen te vinden voor een erfelijke ziekte met een duidelijk overervingspatroon is het optimistische beeld van ‘één gen – één ziekte’ ontstaan. Later werd dat afgezwakt tot het idee dat bij ziekten die vaak in families voorkomen, maar geen duidelijk overervingspatroon hebben, een paar risicoverhogende genmutaties belangrijk zijn. Het gaat dan bijvoorbeeld om hart- en vaatziekten, kanker, diabetes, schizofrenie, depressie en allerlei allergieën. Het zijn ziekten die niet alleen door genen maar ook door leefstijl – door omgevingsinvloed – kunnen ontstaan.

Het humane genoom bevat veel minder genen (ruim 20.000) dan verwacht. Eerder liepen de schattingen wel op tot 100.000. Maar toch was het hondsmoeilijk om ziekten aan genen te koppelen. Er werd een methode voor bedacht, de genome wide association studies (GWAS-onderzoeken). Daarin wordt gebruik gemaakt van ongeveer een miljoen tweekleurige ‘vlaggetjes’ die over het DNA verspreid zijn. Die vlaggetjes staan op DNA-plaatsen waar van nature variatie is: twee verschillende basen komen er veel voor. De varianten bij mensen met een ziekte worden vergeleken met die van gezonde mensen. Daar rollen plaatsen op het genoom uit waar ‘iets’ is dat het risico op ziekte vergroot. Het eerste GWAS-onderzoek verscheen in 2006. Inmiddels zijn er meer dan 1500 publicaties over 250 ziekten. Soms wel uitgevoerd bij meer dan 100.000 mensen. Wat gevonden moest worden is intussen wel gevonden.

Hoogstandjes

Harvard-onderzoekers schrijven evaluerend over de GWAS-resultaten: „Bij de veel voorkomende ziekten is maar 5 tot 20 procent van de erfelijkheid verklaard” (Nature Genetics, 20 oktober online).

Die GWAS-onderzoeken zijn hoogstandjes van bio-informatica, maar ze wijzen zelf niet direct ziekmakende genen aan. Op de aangewezen plaats moeten moleculair biologen vervolgens op zoek naar de oorzaak.

„Ja, ze keken allereerst naar de genen die het dichtstbij liggen, naar de eiwitten waar ze voor coderen en of die met de onderzochte ziekte te maken hebben. Ik ken veel voorbeelden waarbij het gen dat het dichtstbij lag niks met de ziekte te maken had, maar een gen dat verder weg lag wel”, zegt bio-informaticus Peter-Bram ’t Hoen van het Leids Universitair Medisch Centrum. „Bij de GWAS-studies die nu nog de goede tijdschriften halen, worden altijd wel geslaagde voorbeelden genoemd van gevonden genen, maar dan resteren er nog veel hits waar niets bij gevonden is.”

Het inzicht na alle GWAS-onderzoeken is dat er maar weinig genen zijn die een ziektekans sterk kunnen verhogen en dat er heel veel genen zijn die de ziektekans een beetje verhogen. Zelfs het idee dat vooral DNA-mutaties ín genen de oorzaak van ziekten zijn wankelt. Meer dan 90 procent van de in GWAS-onderzoeken gevonden locaties wijzen naar plaatsen van het DNA waar géén genen liggen. „Veel genetische informatie zit voorlopig goed verstopt in de ruis”, zegt ’t Hoen.

Franke en ’t Hoen zijn bio-informatici die, in grote internationale onderzoeksgroepen, het afgelopen jaar op een nieuwe manier informatie uit die ruis haalden. Bij publicaties in Nature-bladen waren ze eerste of laatste auteur.

Franke: „Ik was goed in statistiek en programmeren, maar niet zo handig in het lab. Zo ben ik de bio-informatica ingerold”. Hij werkte in 2006, tijdens zijn promotieonderzoek, een tijd in Oxford. „We waren daar wereldwijd de derde groep die een GWAS-studie publiceerden. Allemaal prachtig, maar ik dacht toen al: hoe gaan we chocola maken van al die informatie?”

Eiwitsynthese

Daarom werpt de genoomwereld zich nu massaal op de genexpressie. Dat is waar ’t Hoen en Franke in hun internationale groepen aan werken. De genexpressie zegt hoe actief een bepaald gen is.

Een gen bevat de erfelijke informatie voor een eiwit. Als een eiwit nodig is in het lichaam krijgt het gen een signaal om een kopie van zichzelf in RNA te maken. Dit messenger-RNA (mRNA) is de mal voor de eiwitsynthese. De hoeveelheid mRNA in een cel is een maat voor de genexpressie.

Een gen met een mutatie die ziekte veroorzaakt kan een heel normale genexpressie hebben, maar een kreupel en onwerkzaam eiwit opleveren. Daardoor kan iemand ziek worden. Maar ziekte of gebrek kan ook ontstaan als er te veel, of te weinig wordt geproduceerd.

Het meten van genexpressie is buiten het genoomonderzoek ontwikkeld. De techniek wordt gebruikt om kankers te karakteriseren en om bij experimenten met medicijnen of voeding de genactiviteit in organen en weefsels te meten. Genen die tegelijkertijd actief zijn wijzen de weg naar reactiepaden binnen de cel, wat tegenwoordig een belangrijk onderzoeksonderwerp is (zie het artikel hiernaast).

Franke: „In Utrecht deden we een GWAS-onderzoek voor genen die de kans op glutenallergie – coeliakie – verhogen. Daar hebben we toen de genexpressie bij betrokken. Toen we dat bij 100 mensen deden, konden we voor één risicoverhogende plaats laten zien dat daar geen ziekmakende mutatie was, maar dat er heel specifiek de expressie van één gen veranderde. Dat was in 2008. Ook andere groepen lieten toen hun eerste resultaten zien. Twee jaar later hebben we in een veel grotere coeliakiestudie laten zien dat op meer dan de helft van de 40 genoomlocaties die de kans op coeliakie vergroten niet een eiwit verandert maar de genexpressie, dus de hoeveelheid eiwit die wordt gemaakt. Dat is leuk! Zo’n uitkomst zet het veld op scherp. Het betekent dat mensen met een andere blik naar aangeboren ziekten kijken.”

De genexpressiestudies worden nu groot aangepakt door bio-informatici. De methode is gebaseerd op het bepalen van de erfelijke code van het mRNA dat uit cellen (in dit geval bloedcellen) is gewonnen. Daarbij wordt ook gemeten hoeveel mRNA er is. Dat is een maat voor genexpressie. RNA-sequencen is nieuw, maar het kan tegenwoordig goed.

’t Hoen was de kwaliteitbewaker en bioinformaticus in de Geuvadis-studie. Er deden zeven Europese laboratoria aan mee, waaronder het Nederlandse Leiden Genome Technology Center. De Geuvadis-onderzoekers sequensten alle mRNA-moleculen van 462 mensen. Van die mensen was het hele genoom – dus het DNA – al tot in detail bepaald, in het kader van het 1000-genomenproject. In dat project is de afgelopen jaren het gedetailleerde genoom van ruim duizend mensen van over de hele wereld bepaald. Die informatie is voor onderzoek beschikbaar.

In het Geuvadis-project is van twee miljoen DNA-varianten gekeken of er een relatie is met veranderde expressie van genen die in de buurt liggen. Het was een selectie van DNA-varianten die in GWAS-onderzoeken vaak een verband met ziekte hadden. ’t Hoen: „Dat ‘in de buurt’ hebben we ruim genomen: we keken in een miljoen baseparen ter weerszijden van de variant. Iedere variant ga je associëren met de expressie van alle genen die in de buurt liggen.”

Zo’n DNA-variant die de expressie van één of meer genen daadwerkelijk verandert heet een expression quantitave trait locus (eQTL). ’t Hoen was betrokken bij de groep die genexpressieverandering in de buurt onderzocht. In vakkringen heten dat cis-eQTL’s (Nature, 26 september 2013). Er werden er duizenden gevonden. De onderzoekers schrijven in hun conclusie: „Variatie van genetische regulatie is eerder regel dan uitzondering.”

Franke was laatste auteur van een onderzoek waarin een veel onverwachter effect werd beschreven: een DNA-variant ergens op het genoom beïnvloedt soms de activiteit van een gen dat veel verder weg ligt. Zo’n variant heet een trans-eQTL. Soms ligt het beïnvloede gen zelfs op een ander chromosoom (Nature Genetics, oktober 2013). Om dat voor een miljoen veelvoorkomende DNA-varianten te doen was een te grote rekenklus. Franke en zijn promovendus Harm-Jan Westra beperkten hun analyse voorlopig tot ruim 4.000 DNA-varianten die als de invloedrijkste uit eerdere GWAS-onderzoeken waren gerold. Ze gebruikten uiteindelijk de gegevens van 8.000 mensen, waarvan de genexpressie- en genoomgegevens al in biodatabanken beschikbaar waren.

Databanken

Beide artikelen draaien om de methode en om het genereren van een stroom aan gegevens. Die zijn nu beschikbaar in databanken. Maar in beide artikelen staan ook weer, dat is inmiddels een traditie, een paar voorbeelden van detailkennis die het heeft opgeleverd. Over coeliakie, over diabetes en genoomactiviteit die het cholesterolgehalte beïnvloedt.

’t Hoen: „Mijn rol is die van bio-informaticus. Ik doe de grote datastudies. Er komen hypotheses uit waar anderen mee verder kunnen. In veel laboratoria weten onderzoekers nu waar ze moeten beginnen als ze de samenhang tussen genetische variatie en de ziekte waar zij aan werken willen verklaren.”

De database van de cis-QTL-uitkomsten is bijvoorbeeld al ruim een jaar voor onderzoekers beschikbaar. ‘t Hoen: „Er zijn al meer dan 2.000 mensen die de informatie hebben gedownload. Daar ben je wel even mee bezig, dus het zijn mensen die er serieus iets mee willen.”

Franke en ’t Hoen deden hun onderzoek aan bloedcellen – vooral witte bloedcellen of nakomelingen daarvan. Vooral omdat die makkelijk beschikbaar zijn. Maar is genexpressie in bloedcellen bepalend voor ziekten in andere organen?

Franke: „Als je iets wilt weten over een neurologische aandoening heb je vrij weinig aan bloed. Maar het is ondenkbaar om voor dit soort onderzoek biopten uit hersenweefsel – en voor andere ziekten uit andere organen – te nemen bij gezonde mensen. Het klinkt misschien een beetje luguber maar er is nu wel een onderzoek bezig waarbij onderzoekers monsters uit 30 verschillende weefsels nemen bij 900 net overleden mensen.”

Aan dit Amerikaanse onderzoek – het loopt tot 2015 – kunnen donoren meedoen van 21 tot 70 jaar, bij wie binnen een etmaal na de dood autopsie wordt uitgevoerd.

Er zijn inmiddels ook Nederlandse initiatieven. Binnen de biobanking and biomolecular research infrastructure (BBMRI-NL) wordt de genexpressie bepaald van de bloedcellen van 4.000 gezonde Nederlanders. Weer bloed.

’t Hoen: „Natuurlijk, je mist dan veel informatie uit andere organen, maar meer dan de helft van de genen kun je in bloed onderzoeken. Zoals je hebt gezien beginnen wij bio-informatici met grote hoeveelheden gegevens. We zijn voorlopig nog niet bang om aan het eind dingen te missen. Het onderzoek naar de chaos in het genoom levert veel op, altijd veel te veel. De mensen in het lab die naar aangrijpingspunten voor medicijnen zoeken, kunnen het echt niet bijhouden.”