Opinie

Data als nieuw journalistiek gereedschap om de macht te controleren

De journalistieke keuken

Het was nieuws en toch ook weer niet helemaal nieuws: de kwaliteit van Nederlandse wateren is slecht en verbetert bijna niet, kopte NRC maandag.

Bijna alle rivieren, meren en sloten in Nederland zijn te vies, ze voldoen niet aan de Europese kwaliteitsnormen, wat sancties als vergunningstops tot gevolg zou kunnen hebben, vergelijkbaar met de stikstofcrisis. De waterkwaliteit is tussen 2015 en 2021 op twee derde van de plekken ook nog eens achteruitgegaan. „Dat bleek uit data-onderzoek van NRC”, zo meldde het nieuwsbericht, maar in maart bleek het eigenlijk ook al, uit alarmerende uitspraken van deskundigen en rapportages van het Planbureau voor de Leefomgeving (PBL). „Nederland riskeert watercrisis in 2027”, schreef de wetenschapsredactie toen.

Wat was er in de tussentijd gebeurd? In elk geval dus dat data-onderzoek, van de nieuwe dataredactie die NRC dit voorjaar heeft ingesteld. Die bestaat uit vijf fulltime redacteuren, die zich volledig richten op journalistiek onderzoek met data als bron en programmeervaardigheden en Excel als gereedschap, vaak in samenwerking met in het onderwerp gespecialiseerde redacteuren van andere redacties. „De data van het PBL waren twee jaar oud, dus we vroegen ons af: hoe zit het nu?” vertelt Winny de Jong, chef van de dataredactie. „Je kunt wachten op de volgende rapportage, maar je kunt ook direct naar de bron gaan om te zien hoe het er nu voor staat. Dan heb je nieuws.”

Die bron was data – en die zijn openbaar toegankelijk, het Informatiehuis Water heeft ze gewoon online staan. Nu ja, gewoon: datajournalist Rik Wassens trof de informatie over de waterkwaliteit aan in een lange, schier ondoordringbare lijst van Excelfiles en databestanden. De waterkwaliteit wordt, gemeten op 745 punten door het hele land, vastgesteld op basis van meer dan tien indicatoren en concentraties van zo’n honderd chemische stoffen. Al viel het Wassens ook mee: „Het werd een bestand van 600.000 rijen, daar kán Excel nog mee werken.” De mensen van het Informatiehuis wilden hem als „geïnteresseerde leek” wel wegwijs maken, maar evengoed was hij „weken bezig” met het doorgronden van de dataset.

Meetpunt 130006

Maar dan heb je ook wat. Uit een combinatie van datasets bleek dat 460 van de 745 wateren in 2021 op één of meerdere criteria slechter scoorden dan in 2015, terwijl er juist verbetering zichtbaar zou moeten zijn, voordat Brussel in 2027 boetes gaat opleggen. Die vergelijking met eerdere jaren was in de berichtgeving van maart nog zo hard niet gemaakt, kón nog niet gemaakt worden – want op die manier waren de gegevens nog niet bekeken. Zo wil de dataredactie zelf „waarde toevoegen” door „eigen vragen te stellen aan de data”, zegt Wassens.

Dat eigen data-onderzoek leverde ook iets anders op dan harde cijfers of een grafiekje, wat toch nog wel het heersende beeld is van wat datajournalistiek brengt. Het maakte mogelijk dat het achtergrondverhaal van maandag kon beginnen bij „meetpunt 130006, in De Donge”, een Brabantse beek tussen Oosterhout en Waalwijk. „Door alle beoordelingen onder elkaar te zetten, bleek dat de waterkwaliteit daar op veel punten achteruitgegaan was. Hier was iets aan de hand. Door de lens van de data zagen we naar welke plek we toe moesten om achter de oorzaken van die achteruitgang te komen.”

Verdieping, dus, maar het is ook een kwestie van goed verhalen vertellen: „Je moet ervoor waken dat een datajournalistiek verhaal, met cijfers en normen en grafieken, niet de levertraan van de krant wordt”, zegt Wassens.

Wordt NRC zo een eigen data-onderzoeksinstituutje, dat het vuile werk opknapt dat overheidsinstanties laten liggen?

Chef Winny de Jong ziet het eenvoudiger: als een voortzetting van de journalistieke taak die NRC voor zich ziet weggelegd, hoogstens met nieuwe middelen. „Het verschil is het bronmateriaal, en de gereedschapskist.” Een ‘gewone’ journalist gaat eropuit, stelt vragen en informeert vervolgens het publiek – dat geldt evenzeer voor een datajournalist. „Steeds grotere delen van onze levens, van de wereld, worden zichtbaar in data, dus om daarover te kunnen informeren moet je datageletterd zijn.”

Pasgeboren baby’s

Daarbij moet de prioriteit wat haar betreft liggen bij het vinden van verhalen, niet zozeer bij de gegevens op zich, of de visualisaties die de data toegankelijk presenteren, waar de nadruk van veel datajournalistiek in het verleden lag. De Jong wil voorbij het „laaghangend fruit” gaan – ze noemt het wijdverbreide jaarlijkse bericht over de meest voorkomende jongens- en meisjesnamen bij pasgeboren baby’s. „Dat is datajournalistiek, maar leidt niet tot veel nieuwe inzichten.” Er is daarvoor nog een volgende stap nodig: er moeten vragen gesteld worden. „We hoeven het tempo van de planbureaus en instituten niet af te wachten. In het gasdossier wachtte de journalistiek ook niet af tot Den Haag sorry ging zeggen, maar trok zelf de conclusies.” Zo sluit datajournalistiek aan, zegt De Jong, bij het journalistieke ideaal van het controleren van de macht, van de functie van waakhond van de democratie.

Met het stikstofdossier in het achterhoofd is dat geen overbodige luxe. In een reactie op het NRC-onderzoek naar de waterkwaliteit zei het ministerie van Infrastructuur en Waterstaat (I&W) dat er al gekeken wordt naar een „uitzonderingsmogelijkheid” op de EU-brede normen, en dat van „feitelijke achteruitgang van de waterkwaliteit nauwelijks sprake” is. Die zou een kwestie zijn van veranderende normen en meetproblemen. „Maar uit de cijfers bleek dat veel wateren wel verslechteren én dat waterbeheerders zich daar zorgen over maken. Vijf procent van de wateren zal in 2027 aan de Europese normen kunnen voldoen, denken zij”, zegt Wassens. „Deze data zijn nota bene openbaar, dus waarom zou je ze dan niet gebruiken om de macht te controleren?”