Boodschap

Met groot genoegen heb ik het artikel van Rob van den Berg, 'Statistiek volgens een Engelse dominee', gelezen. Er worden op fraaie toegankelijke wijze toepassingen geschetst van een van de belangrijkste ontdekkingen van deze eeuw: de Bayesiaanse statistiek, voortvloeiend uit het 18-eeuwse theorema van dominee Thomas Bayes.

Ik wil hier echter reageren op een rekenfout in het artikel. Stelt u voor u komt een vage kennis toevallig op straat tegen. U weet dat hij twee kinderen heeft. Hij heeft nu een zoon bij zich. Wat is de kans dat zijh andere kind ook een jongen is? Van den Berg schrijft, ten onrechte, dat die kans 33% is. De kans is echter 50%, domweg omdat het geslacht van het andere kind 'onafhankelijk' is van het geslacht van het kind dat u ziet.

Om dezelfde reden is de kans op een tweede zoontje 50% wanneer de zoon die u ziet het oudste kind is, of het kind dat buiten speelt, etc. (In tegenstelling tot wat Van den Berg schrijft maakt het dus niet uit of het kind wordt voorgesteld als een zoon of als het oudste kind.)

Van den Berg redeneert: Uw kennis kan niet een dochter/dochter gezin hebben, dus heeft hetzij een zoon/zoon, hetzij een zoon/dochter, hetzij een dochter/zoon gezin, dus zoon/zoon betreft een van de drie gevallen en dus is de kans 1/3, 33%. Deze redenering is onjuist omdat de drie genoemde gevallen niet even waarschijnlijk zijn. In de situatie waarin u de kennis hebt ontmoet met een zoon, is de kans op een zoon/zoon gezin bijvoorbeeld twee keer zo groot als de kans op een zoon/dochter gezin: Als alle vaders met een van hun twee kinderen zijn gaan wandelen lopen alle zoon/zoon vaders met een zoon, echter, maar de helft van de zoon/dochter vaders loopt met een zoon, de andere helft loopt immers met een dochter.

De kans 33% kon wel het juiste antwoord zijn in een andere situatie, namelijk als de keuze van het kind om mee te gaan wandelen niet willekeurig was geweest. Bijvoorbeeld de situatie waarin alle zoon/dochter en dochter/zoon vaders met de zoon waren gaan wandelen. Misschien hoopte Van den Berg deze situatie te creëren door de omschrijving 'trots voorstelt als zijn zoon', echter, een andere tekst zou daartoe nodig zijn geweest. In de situatie als beschreven door Van den Berg is 50% het enige juiste antwoord.

Ten slotte hoop ik dat de kleine rekenfout niet de aandacht afleidt van de belangrijke boodschap van hetartikel van Van den Berg, namelijk het grote belang van de Bayesiaanse redeneerwijze.

    • Prof.Dr. Peter Wakker