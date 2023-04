‘Mijn liefste open data, ik hou van je, want je bent open. En ik wil je nog opener maken. Zodat iedereen je kan gebruiken. En hergebruiken. Voor altijd.” Deze woorden zette Ronald Pijnenburg (34) bij een wetenschapscommunicatieworkshop op papier in een liefdesbrief aan zijn vakgebied: open data in de aardwetenschappen. Zijn doel is om wetenschappelijke data zo makkelijk mogelijk herbruikbaar te maken voor iedereen.

Pijnenburg studeerde aardwetenschappen in Utrecht. „Dat leek me een leuke combinatie tussen bètavakken en de romantiek van de aarde. Scheikunde en natuurkunde kunnen soms wat droog zijn, maar vulkanen en aardbreuken zijn een stuk sprekender.” Hij was vooral geïnteresseerd in de processen diep in de aarde.

„Ik promoveerde op onderzoek naar de Groningse aardbevingen. Wat gebeurt daar nou precies? Daar was zeker na de aardbeving in 2012 in Huizinge veel belangstelling naar.” Die aardbeving had een magnitude van 3,6, de zwaarste ooit gemeten in Groningen. Dit leidde tot een groot onderzoek vanuit de gaswinner NAM. „Mijn project was daar een onderdeel van.”

Het aardgas in Groningen zit op drie kilometer diepte opgesloten in een laag zandsteen. Dat bestaat uit samengeklonterde zandkorreltjes, waar ruimte tussen zit. In die poriën zit aardgas. „Wanneer je dat gas omhoog pompt, zakt het zandsteen een stukje in. Mijn onderzoeksvraag was hoe dit zandsteen inzakt.”

In een lab bootste Pijnenburg de condities op die diepte na, zoals hoge druk en temperatuur. Hij keek wat er gebeurde als je gas uit zandsteen haalt. „Deels gebeurde het inzakken van zandsteen elastisch, dus net als een stijve springveer, en deels permanent, bijvoorbeeld doordat zandkorrels ten opzichte van elkaar verschuiven, breken of doordat klei tussen de korrels wordt samengedrukt.” Het elastisch inzakken gebeurt direct bij de gaswinning, maar de permanente inzakking kan mogelijk een tijd doorgaan, afhankelijk van wat er precies gebeurt. „We weten niet zeker of dat zo is. Als het zo is, wordt het steeds minder.”

De gaswinning in Groningen vindt al sinds 1963 plaats. „Maar je kan helaas geen experimenten uitvoeren die decennia duren, dus eventuele langetermijneffecten moeten gemodelleerd worden. Daar zijn andere onderzoekers mee bezig.”

Foto Annabel Oosteweeghel Foto Annabel Oosteweeghel Foto Annabel Oosteweeghel Foto Annabel Oosteweeghel Foto’s Annabel Oosteweeghel

Gewerkt in Mozambique, Kazachstan en Australië

Gedurende zijn gehele studie- en promotietijd zat Pijnenburg op de campus van Utrecht. „Tussendoor ben ik er wel een paar jaar tussenuit geweest. Toen heb ik in Mozambique, Kazachstan en Australië gewerkt in de mijnbouw.” Inmiddels is Pijnenburg weer terug op precies dezelfde plek: hij leidt nu een project om aardwetenschappelijke data breder beschikbaar te maken. „Ik heb vier jaar in detail gekeken naar één geologisch proces, daarna wilde ik weer uitzoomen.”

„Wetenschappers, onder wie ook geologen, produceren heel veel data. Grotendeels is die publiekelijk beschikbaar, voor transparantie van het eigen onderzoek en efficiëntie voor toekomstige onderzoeken. Maar het probleem is dat het onvindbaar is omdat het verspreid staat opgeslagen. In Nederland alleen al moet je op zes verschillende websites zoeken naar aardwetenschappelijke data. In het buitenland zijn dat er honderden.”

Pijnenburg legt uit dat bij het publiceren staat aangegeven waar een dataset over gaat: de zogeheten metadata. Denk aan de onderzoeker, locatie of onderzoeksmethode. „Daar kan van alles misgaan. Als een wetenschapper de term ‘illiet’, een kleisoort, aan de data heeft gekoppeld, kan iemand anders het niet vinden door op ‘klei’ te zoeken. Dat zou wel handig zijn, omdat je anders data mis kan lopen. Bovendien staan er ook regelmatig typefoutjes in.”

Eén grote datacatalogus

Beide problemen, verstrooiing van data en onvolledige metadata, lost Pijnenburg op door bij te dragen aan één grote Europese catalogus voor aardwetenschappelijke data. De data zelf blijft op de oorspronkelijke plek staan, maar is een stuk beter vindbaar door de gestroomlijnde metadata. „Het werkt eigenlijk zoals Funda: alle data is op één website te vinden en je kan filteren op wat je zoekt, bijvoorbeeld op vulkanologie als onderwerp of elektronenmicroscoop als methode. De data van mijn eigen onderzoek staat er natuurlijk ook tussen.” Het platform kwam afgelopen week online.

Het opzetten van deze catalogus was makkelijker gezegd dan gedaan, vertelt Pijnenburg. „Er zijn zo veel wetenschappers uit zo veel disciplines betrokken, die hun data allemaal anders aanleveren. Satellietplaatjes zijn makkelijk te hergebruiken. Maar voor labdata is dat een grotere uitdaging. Zelfs voor wetenschappers is dit vaak nog specialistisch en daardoor lastig te hergebruiken. Ons streven is uiteindelijk om de data aan te bieden als een soort Binas, een naslagwerk voor bètascholieren.”

„Het is goed dat wetenschappers vaak hun data openbaar maken, maar er moet nog een stap bij. Want als niemand het kan vinden, heb je er niets aan. Zo’n datacatalogus biedt een oplossing.”