Een schijn van kans

De zaak Lucia de B. is ook vanuit statistisch oogpunt hoogst interessant. Terwijl getuige-deskundigen dinsdag in het hoger beroep elkaar in de haren vlogen, rekenen Bayesianen voor dat de kans op onschuld hoger is dan menigeen denkt.

Wat is de kans dat Lucia de B. onschuldig is? Vorig jaar veroordeelde de Haagse rechtbank de verpleegkundige tot levenslang. Ze werd schuldig bevonden aan meervoudige moord en poging tot moord, tussen 1997 en 2001 gepleegd op patiënten in Haagse ziekenhuizen waar ze toen werkzaam was. Maar niemand heeft Lucia de B. betrapt en ieder direct bewijs ontbreekt. Lucia de B. zelf ontkent dat ze ook maar één patiënt een haar heeft gekrenkt. Toch achtte de rechtbank, altijd beducht een verdachte ten onrechte te veroordelen, zich voldoende zeker van haar zaak.

In haar oordeel baseerde de rechtbank zich mede op een statistisch argument dat door getuige-deskundige Henk Elffers naar voren was gebracht. Elffers, verbonden aan het Nederlands Studiecentrum Criminaliteit en Rechtshandhaving, rekende via de dienstroosters van Lucia de B. en haar collega-verpleegkundigen uit dat, in geval de verdachte onschuldig was, de kans dat de `incidenten' zich toevallig tijdens haar diensten afspeelden gelijk was aan 1 op de 342 miljoen. Dus verwierp Elffers de hypothese dat het om toeval ging. Er was, zo stelde hij, ``een samenhang' tussen het optreden van de incidenten en Lucia de B.'s aanwezigheid tijdens die incidenten. Wat die samenhang inhield, liet Elffers in het midden. Dat was aan de rechtbank om uit te maken.

Sinds enkele weken dient het hoger beroep. Dinsdag getuigden voor het hof twee Amsterdamse hoogleraren die de aanpak van Elffers onder vuur namen. De moeizame discussie had veel weg van een Babylonische spraakverwarring (zie kader). Statistici, zo bleek in het Paleis van Justitie, kunnen op fundamentele punten binnen hun vakgebied hemelsbreed van mening verschillen.

Degens

En dat terwijl de statistici die dinsdag in Den Haag de degens kruisten allen tot de zogeheten `klassieke school' behoren. Die is tussen 1930 en 1960 ontwikkeld, met als grote voorman de Amerikaan Ronald Fisher. Er is echter nóg een school: de Bayesiaanse statistiek, genoemd naar de Engelse dominee Thomas Bayes die als eerste langs die lijnen redeneerde – zijn Essays toward solving a Problem in the Doctrine of Chances verscheen postuum in 1763. De Bayesianen begonnen hun opmars in de jaren zestig van de vorige eeuw. Inmiddels trekken hun tweejaarlijkse internationale congressen ruim 600 deelnemers, die na gedane arbeid ketterse liederen zingen als `There's no Theorem like Bayes' Theorem'. Maar de groei verloopt traag. Op dit moment is 30 procent van de publicaties op het gebied van statistiek Bayesiaans.

Aart de Vos, econometrist aan de Vrije Universiteit en overtuigd Bayesiaan, wijt de terughoudende reacties van klassieke statistici aan het subjectieve element dat in de Bayesiaanse methode ligt besloten. Daar moet je van te voren schatten welke kansen je aan de mogelijkheden (zoals Lucia de B. is wel/niet schuldig) zou hebben gegeven, zonder kennis van de data. Die prior is dus subjectief, gestuurd door ervaring en gezond verstand, en dat valt verkeerd bij klassieke statistici. Volgens De Vos gaat het om een paradigmastrijd. ``De klassieke statistiek gaat uit van het bestaan van een vaste, zij het onbekende waarheid die zich manifesteert in waarnemingen met een toevalskarakter. De Bayesiaan hangt het kansbegrip op aan het feit dat mogelijke waarheden onzeker zijn en gebruikt waarschijnlijkheidsrekening om over deze kansen te leren. Het is een godsdienstoorlog en de tegenpartij wil gewoon geen ongelijk bekennen. Dat komt omdat statistiek in Nederland in handen is van mathematici. Het grote voordeel van Bayesiaanse statistiek is dat ze, in tegenstelling tot de klassieke aanpak, uit de voeten kan met praktische situaties waarin op basis van statistische informatie, dus onder onzekerheid, een beslissing genomen moet worden.'

Klassieke statistici beantwoorden systematisch de verkeerde vragen, aldus De Vos. ``Neem het geval van een gezin met zeven zonen dat graag een dochter wil. Stel dat in een klein aantal gezinnen een genetische factor veroorzaakt dat er alleen zonen komen, en dat het voor de rest fifty-fifty dochters en zonen is. Ons gezin vreest natuurlijk tot de eerste groep te horen. Immers, de kans op zeven zonen bij een kans van per keer bedraagt tot de macht 7 ofwel . Maar hoe groot is die kans op genetische aanleg voor zonen? Dat is de vraag waar het om draait – en die klassieke statistici uit de weg gaan. Vraagt het gezin: `Als we nog een kind nemen, hoe groot is dan de kans dat het een dochter is?' dan krijgen ze van die club als antwoord: `Als u, vóór u aan kinderen begon, besloten zou hebben na zeven zonen te stoppen, dan had u minder dan 1 procent kans gehad dat die beslissing ten onrechte was geweest, en dat u gewoon een kans van een half op een dochter had gehad.'

``De klassieke statisticus doet zo moeilijk omdat hij niet weet hoe vaak die genetische factor speelt. De Bayesiaan schat die kans. Hij stelt bijvoorbeeld de verhouding abnormaal op normaal gelijk aan 1:1000. Dat zijn de prior odds. De gevraagde kans krijg je door die prior odds te vermenigvuldigen met de aannemelijkheidsverhouding, de likelihood ratio. Dat is hier de verhouding van de kansen op zeven zonen in een `louter zonen'-gezin versus een normaal gezin, dus 128:1. De regel van Bayes zegt: posterior odds = prior odds likelihood ratio, ofwel 128:1000. Dus is de kans dat ons gezin tot de categorie `louter zonen' behoort gelijk aan = 11,3 procent.'

Bayesiaanse en klassieke statistiek geven vaak praktische dezelfde antwoorden als er aan data geen gebrek is. Schort het daaraan, dan ontstaan verschillen. De Vos: ``In 1986 explodeerde kort na de start het ruimteveer Challenger door zes lekkende rubberen ringen. De klassieke analyse gaf toen achteraf een ontplofkans van 0,1 procent, Bayesianen kwamen uit op op 16 procent. Bij extreme gebeurtenissen kom je met Bayes hoger uit. Verzekeraars van olietankers willen bijvoorbeeld de kans weten op vier rampen binnen een zekere tijd, met het oog op failissement. Bayesianen komen dan tien keer zo hoog.'

Het klassieke antwoord geeft vaak het verkeerde signaal, vindt De Vos. ``De 1 op de 342 miljoen van Elffers is misleidend. Een gewoon mens denkt: `dat is geen toeval, dus Lucia de B. heeft het gedaan'. Dat is een grove denkfout, die in de zaak Sally Clark rampzalig uitpakte (zie kader). Alleen Bayesiaanse statistiek kan uitrekenen wat de kans is dat Lucia de B. het gedaan heeft. Daarvoor zijn subjectieve schattingen vooraf nodig, en dat krijg je van de klassieken dan ook op je brood. Maar je kunt die schattingen onderbouwen en preciseren met nader onderzoek. En het is zeer leerzaam tenminste een idee te hebben van de grootteorde van die kans.'

Elffers heeft zijn methode om aan 1 op 342 miljoen bij Lucia de B. te komen in het Nederlands Juristen blad (26 sept. 2003) toegelicht aan de hand van een fictief voorbeeld. In navolging van Elffers voert De Vos de fictieve verpleegkundige Lucy Klomp ten tonele. Ze heeft 11 sterfgevallen meegemaakt in een periode waarin één sterfgeval normaal is, maar iedere aanwijzing voor haar betrokkenheid ontbreekt. De Vos: ``Elffers zou het hof ook in dit geval een extreem kleine kans op toeval rapporteren, circa 1 op 100 miljoen. Terwijl ik beweer dat een veroordeling van Lucy Klomp 80 procent kans heeft ten onrechte te zijn.'

De berekening gaat als volgt. Vooraf: de kans dat je met een moordzuchtige verpleegster hebt is a priori (voordat je weet wat er aan de hand is) zeer veel kleiner dan dat het een onschuldige verpleegster is. Dat moet je afwegen tegen het feit dat de kans op 11 doden vele malen groter is in het geval `moordzuchtig' dan in het geval `onschuldig'. Als de kans op 11 doden 1 op de 100.000.000 is wanneer Lucy Klomp onschuldig is en 1 op 2 – waarover straks meer – wanneer zij wel schuldig is, dan is de likelihood ratio onschuldig tegen schuldig gelijk aan 1:50.000.000. De prior odds komen van de kans dat een willekeurige verpleegkundige moorden pleegt. Die schat de Vos 1 op 400.000. ``Er zijn veertigduizend ziekenhuisverplegenden in Nederland, dus dan zou eens per tien jaar een verpleger aan het moorden slaan. Ik hoop dat dat een overschatting is.' Bayes zegt nu dat de posterior odds bij elf doden uitkomen op 400.000 : 5.000.000, dus een kans van = 0,75 procent dat Lucy Klomp schuldig is.

Dat is slechts een tussenstand. De Vos: ``Het mooie van Bayes is dat je steeds informatie kunt toevoegen. Via prior odds kom je via data – elf sterfgevallen – op posterior odds, die dan weer prior odds zijn bij een volgende stap. Stel je zoekt verdachte aanwijzingen tegen Lucy maar vindt ze niet. Dat is vreemd bij zoveel moorden. Stel je dacht 20 procent kans te hebben niets verdachts te vinden als Lucy schuldig was. Bij onschuld is die kans 100 procent. Dat geeft een aannemelijkheidsverhouding van 5:1. Pas de regel van Bayes toe en de odds gaan van 8 om 1000 naar 40 om 1000, ofwel een kleine 4 procent kans op onschuld.'

Forensisch bewijs

Dan die 1 op 100.000.000. Dat cijfer is berekend op basis van een vaste kans op een sterfgeval die voor iedere verpleegkundige even groot is. Bayesianen, die onzekerheden meenemen, zouden veel hoger uitkomen. De Vos: ``Op basis van ervaring schat ik 1 op 2 miljoen. Verpleegkundigen verschillen: de een heeft meer ervaring dan de ander en ook de werkomstandigheden lopen uiteen. Een Bayesiaanse analyse van Elffers data zou dus wel eens kunnen uitwijzen dat de kans dat de kans op 11 doden onder normale omstandigheden 1 op 2.000.000 is, dus vijftig maal zo groot. Dan gaan de odds van 80 om 1000 naar 4000 om 1000. Dus 4:1 wat betekent dat Lucy een goede kans heeft – 80 procent – om onschuldig te zijn. Zonder forensisch bewijs is van wettig en overtuigend vaststellen van schuld dus geen sprake en rest het hof niets anders dan Lucy Klomp vrij te spreken. Of dat ook voor Lucia de B. geldt hangt af van al het overige bewijsmateriaal. Waarbij de Bayesiaanse methode bij uitstek geschikt is om deze aanwijzingen te wegen.'

Richard Gill, hoogleraar mathematische statistiek aan de Universiteit Utrecht, voelt, hoewel behorend tot het klassieke kamp, bij de zaak Lucia de B. meer voor de aanpak van De Vos dan die van Elffers. Gill: ``Beide zijn in hun eigen termen correct, maar de analyse van De Vos zou wel eens relevanter kunnen zijn. Elffers en De Vos beantwoorden verschillende vragen. Beide uitkomsten hebben sterke en zwakke kanten. Bij De Vos zijn veel cijfers uit de duim gezogen, zachte en harde gegevens worden door elkaar gehutst. Elffers test een hypothese op data die die hypothese suggereerden. Het hof zou beide procedures moeten volgen en dan op eigen verantwoordelijkheid, zich niet verstoppend achter formules, tot de juridisch en moreel juiste conclusie komen.'

De Vos vindt dat de rechter vooralsnog ``verrassend rationeel' handelt. ``De elf sterfgevallen an sich overtuigen niet, zoveel is duidelijk. De bijdrage van de statistiek is dat ze het hof uitnodigt om aanvullende informatie te vergaren. Precies wat er tijdens het hoger beroep gebeurt.'

Gerectificeerd

Correctie 80 procent

In de Bayesiaanse berekening van de 80 procent op onschuld zijn enkele fouten geslopen. De posterior odds zijn 400.000 op 50.000.000 (i.p.v. 5.000.000), ofwel 8 om 1000. Dat geeft een kans op onschuld (i.p.v. schuld) van 4/504 = 0,8 procent.