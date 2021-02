De meeste mensen roepen onderuitzittend op de bank vermoedens over wie de mol is naar de televisie. Haico Dorenbos zoekt met statistiek en machine learning naar de saboteur in het zaterdagse NPO1-programma Wie is de mol?. Voor wie het niet kent: tien (min of meer bekende) deelnemers proberen een saboteur in hun midden te ontmaskeren, onderwijl opdrachten uitvoerend waarmee ze geld kunnen verdienen. Elke aflevering maken ze een test, degene die de minste vragen over de mol goed heeft beantwoord valt af.

Dorenbos (24) volgt aan de TU Twente de master computer science, hij heeft een bachelor in zowel computer science als technische wiskunde. Enkele seizoenen geleden raakte hij gefrustreerd toen ‘zijn mol’ eruit vloog. Hij vroeg zich af of een objectief algoritme de mol beter kon voorspellen. Hij bouwde twee jaar aan zijn ‘Moldel’, vertelt hij aan de telefoon. Getest op eerdere seizoenen bleek dat het Moldel na zeven afleveringen de mol meestal kon voorspellen.

Het algoritme gebruikt vijf lagen om tot een voorspelling te komen. Eén laag kijkt hoe afvallers de vragen beantwoorden die in beeld komen. Het idee is dat de kandidaten die de afvallers verdenken meestal niet de mol zijn. Een andere laag kijkt naar hoeveel jokers en vrijstellingen zijn ingezet. Als iemand de finale bereikt zonder veel jokers, is het waarschijnlijker dat die speler de Mol is. Dan is er een laag die met behulp van gezichtsherkenning kijkt hoe vaak elke kandidaat in de eerste afleveringen in beeld komt. De mol komt in de eerste vijf afleveringen weinig in beeld.

Twee lagen kijken naar dingen buiten het programma. Informatie over de kandidaten op Wikipedia wordt vergeleken met informatie over eerdere mollen. En hij kijkt op sociale media wie wanneer actief is of over wie dingen zijn verschenen tijdens de opnameperiode.

„De lagen die het meeste bijdragen aan een goede voorspelling, hoe vaak ze in beeld zijn en de antwoorden op de testvragen, kostten het minste moeite om te bouwen”, zegt Dorenbos. De Wikipedia-laag leverde relatief weinig op. „Daar pruts je dan lang aan om er toch iets uit te krijgen.”

Dorenbos werkt aan nog meer lagen, maar waar die naar kijken wil hij niet zeggen. „Anders kunnen de makers er rekening mee gaan houden.”

Wie niet van spoilers houdt moet nu stoppen met lezen. Volgens het algoritme is de kans 50 procent dat Marije dit seizoen de mol is, en 40 procent dat het Splinter is. Charlotte – mijn mol – staat op 1,2 procent. Hm.