Draaien aan de knoppen van de genexpressie

Het meten van de activiteit van genen – de genexpressie – kan veel onthullen over wat er in de cel gebeurt. In de computer kun je expressie van een gen verhogen en verlagen, om alle scenario’s te bekijken.

Genen coderen voor eiwitten. Een cel kan niet leven zonder steeds verse eiwitten. Onze ruim 20.000 genen kunnen – door knip- en plakwerk – voordat het eiwit echt wordt gesynthetiseerd 60.000 tot 80.000 verschillende eiwitten maken. Daarnaast zijn er veel genen die niet voor eiwitten coderen, maar voor RNA-moleculen die zelf actief zijn in de cel. Die RNA-wereld in ons, daar weten we pas twee decennia vanaf.

Duidelijk is dat de activiteit van genen – de genexpressie – veel vertelt over wat zich in de cel afspeelt. Daarom zijn genexpressie-profielen een belangrijke onderzoeksmethode.

Een gen werkt nooit alleen. De meeste celprocessen verlopen in kettingreacties, waarvoor 10, 20 of meer genen tegelijk actief zijn – tot expressie komen. Die genen liggen niet altijd allemaal bij elkaar op één chromosoom, maar verspreid. Ze worden wel tegelijk aangestuurd.

Gegevens van genexpressie-profielen die bij allerlei onderzoek worden gemaakt zijn openbaar. „Tijdschriftredacties hebben dat geëist toen de eerste grootschalige analyses van genactiviteiten verschenen”, zegt bio-informaticus Lude Franke.

Bio-informatici weten dat er in de bronnen van al gepubliceerd onderzoek nog veel informatie verborgen ligt. Vooral als je tot nu toe gescheiden bestanden combineert.

Franke „Wij hebben een bestand opgebouwd van 80.000 genexpressieprofielen. We hebben ze overal vandaan gehaald. Daar zijn we mee gaan rekenen.” Met de bedoeling om genen te vinden die bij bepaalde celprocessen samen aan het werk zijn.

„Van sommige genen weten we bij welk proces ze betrokken zijn. Maar niet alle genen van zo’n celproces zijn bekend. Als je in die 80.000 profielen alle genen zoekt die samen met bekende genen actief zijn, dan weet je dat die genen, waarvan we vaak niet weten wat ze doen, een enigszins vergelijkbare functie hebben. Heel simpel. We noemen het guilt by association.”

Samen met zijn collega Rudolf Fehrmann keek Franke in al die 80.000 bestanden hoe ieder gen met alle andere genen samenhangt. Er ontstaan dan clusters – groepen genen die vaak samen actief zijn. Principale componentenanalyse (PCA) heet de techniek.

„Als je die groepen eenmaal hebt kun je genexpressie ook gaan modelleren. Je zet al die relaties in de computer en dan kun je expressie van een gen verhogen en verlagen.”

Met een digitale draaiknop. Franke laat het programma op zijn laptop zien. Op het scherm verschijnen echte draaiknoppen. Een beetje retro vormgegeven, als de knoppen van een hifi-versterker uit de jaren zeventig. Het zijn er wel 800.

„Een paar zijn er heel belangrijk. Dat zijn biologische fenomenen die zo sterk zijn dat ze alle processen overschreeuwen die zich ook nog in een cel afspelen. Zolang die celprocessen – de basale energievoorziening bijvoorbeeld – aanstaan kun je de invloed van de subtielere processen nooit zien.” In de simulatie draait Franke de volumeknoppen van die overheersende processen moeiteloos naar nul.

De toeschouwer is in één klap overtuigd als hij de genexpressie-activiteit van Downpatiënten in die groep van 80.000 genexpressieprofielen laat zien.

Je wéét dat een Downpatiënt drie kopieën van chromosoom 21 heeft. Daardoor is de expressie van de genen op dat chromosoom anderhalf keer te hoog. Maar als het normale genexpressieplaatje van alle chromosomen op het scherm verschijnt, is daar niks van te zien.

Totdat Franke het ene na het andere grote celproces naar nul draait. Totdat de subtiele celprocessen zichtbaar zijn. Dán blijft er een overactief chromosoom 21 over. Ook kleine celprocessen hebben dus grote invloed.