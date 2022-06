In 1935 deed de beroemde Britse statisticus Ronald Fisher een experiment. Hij had een vriendin die beweerde te kunnen proeven of melk vóór of ná het inschenken van de thee was toegevoegd. Fisher liet haar acht keer proeven. Als dit onderzoekje een uitslag zou opleveren die erg onwaarschijnlijk is als de vriendin domweg zou gokken, zou hij besluiten dat ze écht in staat is het verschil te proeven.

De tekening op het omslag van het recent verschenen boek Kan dat geen toeval zijn? is een verwijzing naar Fishers ‘significantietoets’. Bij deze methode van statistische bewijsvoering wordt – kort door de bocht – een onderzoekshypothese als bewezen beschouwd als de verkregen data slecht passen bij het onwaar zijn van die hypothese. Fisher was niet dom en zag heus ook onvolkomenheden, maar in de praktijk verdwijnt in veel onderzoeken de broodnodige nuance. Correct gebruik van de significantietoets is daarbij het grootste slachtoffer.

Ronald Meester en Klaas Kan dat geen toeval zijn? Een kritische blik op statistische bewijsvoering Amsterdam University Press, 192 blz. €24,99

In hun boek leggen Ronald Meester en Klaas Slooten de tekortkomingen helder uit en ze breken een lans voor een ándere manier van statistische bewijsvoering: de ‘bayesiaanse’. Die bestaat uit het zoeken naar wat de beste verklaring is voor de data die je wilt duiden. De kernboodschap van Meester en Slooten: de bayesiaanse benadering staat dichter bij de realiteit dan de klassieke benadering van Fisher.

Het belangrijkste probleem van de klassieke aanpak – volgens de auteurs – is dat significantietoetsen de context negeren. Meester en Slooten geven uiteenlopende voorbeelden – over mondkapjes, elementaire deeltjes en rechtszaken. Soms zijn de gevolgen desastreus. Neem de zaak-Lucia de Berk, over de Haagse verpleegkundige die in 2003 op grond van dubieuze statistiek ten onrechte werd beschuldigd van moord op meerdere patiënten.

Kort gezegd komt het erop neer dat De Berk werd veroordeeld omdat, áls ze onschuldig zou zijn, de kans op zoveel natuurlijke sterfgevallen in haar bijzijn uiterst klein is. Conclusie: dan zal de aanname dat ze onschuldig is, vast fout zijn! Nee, zeggen de bayesianen, je moet ook de oorspronkelijke aannemelijkheid meewegen van de hypothese dat De Berk een moordenaar is. Deze zogeheten ‘a priori kans’ is óók uiterst klein. Hoe klein precies? Dat is moeilijk exact vast te stellen, maar in de bayesiaanse school is ruimte voor subjectiviteit – iets wat klassieke statistici vermijden.

Meester en Slooten geven aan dat er in de zaak-Lucia de Berk „van alles was misgegaan met de verzameling van de gegevens”. Het is een beetje vreemd dat ze dan met diezelfde gegevens aan de slag gaan om de analyse opnieuw te doen volgens de bayesiaanse methode. Dat geven ze ook toe: „Onze analyse hier is natuurlijk niet enorm nauwkeurig.” Het gaat hun er kennelijk om hóé je met data omgaat, ook als het om dubieus verkregen data gaat.

Dat het verzamelen van data geen speerpunt van het boek is, zal ermee te maken hebben dat Meester geen statisticus is maar hoogleraar kansrekening. Statistici analyseren data, kansrekenaars analyseren wiskundig geïdealiseerde modellen. In het boek komen speelkaarten, munten en vazen met gekleurde ballen dan ook veel voor. Ook is de tekst niet vrij van formules. „Van de lezer wordt wel enige inspanning vereist”, waarschuwen de auteurs in het voorwoord.

Maar ook wie over de breuken en integralen heen leest, leert de valkuilen kennen waar het pad van de statistiek vol mee zit. Nuttig voor onderzoekers die statistiek gebruiken maar zelf geen statisticus zijn. En interessant voor iedereen die een idee wil krijgen hoe je onzekerheid kunt kwantificeren.