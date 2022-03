Het is een groep van honderd internationale wetenschappers gelukt om de code van het menselijke dna in zijn geheel te ontcijferen, inclusief grote nog ontbrekende delen. Duizenden fouten in de bestaande versie zijn verbeterd. Daarmee is hun nieuwe beschrijving van het menselijke genoom (genaamd T2T-CHM13) veruit de meest complete en accurate tot nu toe.

Twee rivaliserende groepen wetenschappers maakten 21 jaar geleden (een beetje voorbarig) de voltooiing bekend van het volledige menselijke genoom: de volgorde van de ‘letters’ van al het dna in een menselijke cel. Dna is opgebouwd uit lange kettingen van vier chemische basen, afgekort met A, T, C en G. Het complete genoom is ruim drie miljard basen lang. Beide beschrijvingen, zowel de commerciële van het bedrijf van de Amerikaanse moleculair bioloog Craig Venter, Celera Genomics, als die van het door overheidssubsidies gefinancierde Human Genome Project, waren revolutionair en waardevol, maar verre van compleet. Grote ingewikkelde stukken misten nog en er zaten veel dubbelingen en fouten in.

In de jaren die volgden, vulden de onderzoekers van het Human Genome Project steeds meer gaten in, ook nog nadat ze hun beschrijving in 2004 met een publicatie in Nature nagenoeg compleet verklaarden. Maar zelfs hun laatste versie (GRCh38), was nog altijd niet compleet. Miljoenen basen waren daarin nog onbekend, pakweg 8 procent van het totale genoom. Van de 23 paar chromosomen die het dna van menselijke cellen herbergen, ontbraken belangrijke stukken, of ze waren niet correct of werden geschat.

200 miljoen

Sinds deze week is dat voorbij. Het zogenoemde Telomere-to-Telomere (T2T) consortium publiceerde donderdag zes artikelen in het wetenschappelijke tijdschrift Science – en in andere wetenschappelijke tijdschriften staan nog meer studies. Hun gezamenlijke inspanning voegt zo’n 200 miljoen basen van genetische informatie toe.

In een begeleidend commentaar in Science noemt de Amerikaanse geneticus Deanna Church de update een belangrijke stap voor het maken van modellen die gebruikt kunnen worden om een op de persoon afgestemde dna-analyse en medische behandeling te ondersteunen.

Chromosomen hebben tijdens het delen de vorm van een X. De ontbrekende gedeelten die nu in kaart zijn gebracht, zijn de korte bovenste delen van vijf chromosomen, lange stukken met veel herhalingen en de uiteinden (telomeren) en kruispunten (centromeren) van chromosomen.

„Mooi dat dit eindelijk is gebeurd”, zegt Johan den Dunnen, emeritus hoogleraar medische genoomtechnologie van het LUMC. „Die eerste versie werd destijds verkocht als compleet, maar nu is het pas echt af – op het Y-chromosoom na.”

De nieuw in kaart gebrachte stukken waren tot voor kort lastig te ontrafelen. Een stuk dna waarvan de volgorde bepaald moet worden, kon met de voorheen gebruikte technologie maximaal duizend basen lang zijn. Daarom knippen genoomonderzoekers het dna lukraak in stukken. Nadat ze de dna-volgorde hebben bepaald, puzzelen ze de delen weer aan elkaar. Maar sommige biologisch belangrijke elementen zijn honderd keer groter en bevatten zó veel herhalende stukken dat de puzzel niet gelegd kan worden. Met de modernste technieken, long-read en ultra-long read sequencing, konden in het T2T-project stukken van 20.000 en zelfs 100.000 basen accuraat worden gelezen.

Woekerende zaadcel

Een ander voordeel bood de bron van het dna dat de onderzoekers gebruikten. Een normale cel heeft van elk chromosoom twee kopieën, en die verschillen van elkaar, omdat elke kopie van één van de ouders komt. De T2T-wetenschappers gebruikten dna uit een cellijn die is ontstaan uit een woekerende zaadcel, waarin alle chromosomenparen identiek zijn. Dat maakt het makkelijker de dna-volgorde van elk chromosoom te bepalen.

Wel ontbreekt hierdoor in de nieuwe update nog het Y-chromosoom – de cellijn bevatte alleen het X-chromosoom van de vader (mannen bezitten een X en een Y-chromosoom, vrouwen twee X-chromosomen). Een ander nadeel: deze versie van het menselijk genoom is afkomstig van één individu. Maar hij vormt een fundament waaraan vervolgonderzoek nieuw gevonden variaties in genen kan toevoegen.

Voor wetenschappelijk onderzoek biedt de nieuwe versie een completere basis. „Dankzij de invulling van de ontbrekende delen is een serie nieuwe genen ontdekt, zeker vier daarvan zijn medisch relevant”, zegt Den Dunnen. Voor de behandelpraktijk kan de nieuwe databank uitkomst bieden voor patiënten voor wie nog geen verklaring is voor hun aandoening. „Tot nu toe zoeken we meestal in de versie hg19 uit 2009 naar afwijkingen in het dna van een patiënt. We zoeken dan met korte stukjes van 100 basen van de patiënt naar de plek waar genetische veranderingen zitten, en kijken of die tot gezondheidsproblemen kunnen leiden”, aldus Den Dunnen. „Maar in die oude versie ontbreken delen, dus die mis je, of het programma wijst de verkeerde plek aan.”

Puzzel

De versie daarna, hg38 uit 2013, bevatte al meer, zegt Den Dunnen. „Daarmee zijn enkele ziektes opgelost waarvan de genetische veranderingen precies op die missende plekken zaten.” Hij verwacht dat met de nieuwe genetische kaart opnieuw enkele ziektes zullen worden opgehelderd. „Met deze complete DNA volgorde kunnen alle 100-basen-stukjes van de puzzel beter op zijn plaats worden gelegd.”

Hij hoopt dat de moderne techniek waarmee langere stukken dna in kaart kunnen worden gebracht nu snel zo goedkoop wordt dat die standaard in de diagnostiek kan worden gebruikt. „Met langere sequenties van patiënten-dna kunnen we veel beter de juiste plek op het genoom vinden.”

De nieuwe databank van T2T zal niet direct de oude van het HGP vervangen. Den Dunnen: „Door alle toevoegingen zal het voorgaande werk eerst opnieuw genummerd moeten worden.”