Vandaag, kinderen, gaat het over gegevens. Pak jullie schriftjes en schrijf op de eerste bladzijde in grote letters ‘Data. Dubbele punt. Gegevens’. Daaronder in kleine letters ‘data, oftewel gegevens, zijn zo betrouwbaar als we ze zelf maken’. Aan het eind van deze les zullen jullie weten dat er veel foute, vervuilde en onbetrouwbare data zijn. Stoppen jullie die in je computertjes, dan krijg je daar veel foute, vervuilde en onbetrouwbare conclusies uit. Garbage in, garbage out, noemen de Engelsen dat. Laten we beginnen.

Jullie weten nog wel dat ik aan het verhuizen was. En dat toen allerlei gegevens fout in de officiële bestanden bleken te staan. Fout bouwjaar in het kadaster en zo. Nou, dat werd alleen maar erger. Na de verhuizing belde de gemeente X. „Je woont in onze gemeente.” „Nee, hoor”, zei ik. „O, nee”, zeiden ze een dag later. „Je hebt gelijk, je woont hier niet.”

Dat er rommel in de bestanden zit, is nog niet zo erg. Erger is het dat die rommel er ook weer uit komt. Ik heb het weleens met jullie gehad over het SyRI. Dat is een systeem waarmee de overheid kijkt of je gegevens lijken op bepaalde risico-indicatoren en of je dus waarschijnlijk in overtreding bent. Profilering, ja, precies. Pas je in een risicoprofiel, dan gaan ze strenger op je letten en je eerder beboeten. Dus hoe oppassend ik ook mocht zijn, ik was nog lang niet jarig als de overheid mij te boek had staan met een ongunstige achternaam en een ongunstige religie.

De telefoonprovider gaf me alvast een nieuw telefoonnummer met een verkeerd netnummer. De bank liet weten dat het rekeningnummer van de provider niet bestond. PostNL stuurde post van de bank niet door. „Dat is niet onze post, maar van de concurrent”, zei Post toen ik hierover belde. „Waarom staan jullie gegevens – naam en logo – er dan op?” vroeg ik. Dat vond ze zo’n stomme vraag dat ze zich niet verwaardigde te antwoorden.

Gegevens zijn niet alleen onbetrouwbaar uit slordigheid: soms hebben clubs ook belangen bij het vaststellen van je gegevens.

Buiten trokken goeroes rond die verkondigden dat data zomaar vanzelf zorgen voor superieur bestuur. Objectief. Feitelijk. Waardenneutraal. Maar voorlopig was het een rotzooitje met de gegevens. Niemand was wie hij zei te zijn en geen enkel getal klopte. In het ziekenhuis zaten de medische data van ene R. Februari, geboren 1947, in mijn dossier. De verpleegkundige probeerde intussen temperatuurgegevens te meten in mijn rechteroor. „O, dat is wel erg laag”, zei ze. „Even het andere oor proberen.” En ja hoor, in mijn linkeroor was ik een stuk gezonder.

Want, o ja, dat vergat ik jullie nog bijna te vertellen. Gegevens zijn niet alleen onbetrouwbaar uit slordigheid: soms hebben clubs ook belangen bij het vaststellen van je gegevens. Dan hebben ze geen zin in je rechteroor en nemen ze je linkeroor. In de krant stond het verhaal over een milieukundige die data publiceerde over de vervuiling van het Nederlandse oppervlaktewater. Omdat de universiteit van Leiden belang had bij hogere vervuilingscijfers en dus zelf hogere waarden mat, werd het ‘onrustig in de wereld van de waterdata’.

En deze gegevens dus, waarin iedereen zijn luiheid, morele vooringenomenheid en financiële belangen heeft gestopt, vergelijkt de overheid met profielen. Profielen die op hun beurt bestaan uit statistische bewerking van diezelfde gegevens. Let nu even goed op, want hier wordt het onderwerp hot. Jullie hebben vast wel gehoord dat de minister van Binnenlandse Zaken onlangs Thierry Baudet een gevaar heeft genoemd voor de kernwaarden van Nederland. Omdat hij vasthoudt aan ‘verschil in IQ’ tussen de volkeren en daarmee een taboe zou doorbreken. Maar die ministeriële klacht is, gelet op de geloofsijver waarmee de overheid zelf statistische profielen opstelt, raar.

Want dit is nu eenmaal hoe statistiek werkt. Je meet en vergelijkt het IQ van twee groepen, of volkeren, en dan is het ene IQ doorgaans hoger dan de andere. Het is intussen maar helemaal de vraag of dat resultaat ook iets betekent. Want is de intelligentie gemeten in het rechter- of het linkeroor? En wie heeft de tests opgesteld? De universiteit van Leiden? Maar het is allemaal onschuldig zolang je aan die op zich zinloze statistische gegevens geen gevolgen verbindt voor het individu.

En hier gaat de overheid zelf heel wat verder dan Thierry Baudet. De overheid kijkt immers niet alleen naar kenmerken van de groepen, ze verbindt er ook nog conclusies aan. Op basis van onbekende statistieken en ongecorrigeerde data onderneemt ze actie tegen het individu. Misschien zou een minister zich dus wat minder moeten opwinden over opvattingen van een oppositiepartijtje en wat meer over het overheidsbeleid. En dat is meteen onze eigen les van vandaag, kinderen, dat we zelf verantwoordelijk zijn voor de betrouwbaarheid van data.

Maxim Februari is jurist en schrijver, www.maximfebruari.nl.