De nieuwe cijfers van de keizer

Lang geleden verschenen aan het hof van de keizer twee kleermakers die beweerden dat ze wonderbaarlijke kleren konden maken. De stof ervan was prachtig, maar hij was uitsluitend zichtbaar voor mensen die geschikt waren voor hun baan; incompetente of domme mensen zagen niets. In werkelijkheid waren er helemaal geen kleren. De kleermakers knipten met grote scharen in de lucht en naaiden met naalden zonder draad. Van keizer tot paardenknecht durfde niemand echter toe te geven dat hij niets zag, en de volgende dag schreed de keizer naakt door de stad terwijl alle omstanders luidkeels zijn nieuwe gewaad bewonderden.

‘De nieuwe kleren van de Keizer’ is een klassiek voorbeeld van bullshitting. Bullshit is volgens de filosoof H.G. Frankfurt taalgebruik dat dient om de toehoorder te intimideren en onzeker te maken. Imponeertaal dus. Bullshit is niet hetzelfde als leugens. De leugenaar vindt het belangrijk of iets waar of onwaar wordt gevonden. De bullshitter is daar niet in geïnteresseerd, hij is er op uit zijn toehoorder te onderwerpen door hem een dom gevoel te bezorgen.

Die toehoorder moet denken: ik snap dit niet, laat ik mijn mond maar houden. Hoogstens haalt hij zijn schouders op en doet wat lacherig, maar dat vormt voor een bullshitter geen serieuze tegenstand.

Beschrijvingen van moderne kunst en architectuur bevatten vaak imponeertaal. ‘Door het gebruik van vergankelijke materialen zoals toiletpapier corrodeert de kunstenaar immanente fenomenen in een dialectiek van verleiding. Deze chaotisering forceert onvermijdelijk een nieuwe synthese.’ Dat heb ik zelf verzonnen. Het volgende citaat is echt: ‘De publieke toegang als gebaar – op zoek naar eloquente sprakeloosheid’. Het is de titel van een hoofdstuk over buitendeuren, in het Jaarboek Architectuur 2012.

Ook in de wetenschap komt imponeertaal voor. Een wetenschappelijke lezing of publicatie bevat vaak termen en begrippen die de toehoorders of lezers niet echt begrijpen, maar dat durven ze niet toe te geven.

Dat geldt vooral voor de nieuwste termen uit de waarschijnlijkheidsrekening of statistiek. Statistiek is onmisbaar voor het onderzoek aan levende organismen. Iedere plant is namelijk verschillend, en ieder mens ook. Daarom valt de ene obese persoon op vermageringspillen méér af dan de andere. Statistisch-wiskundige modellen maken het mogelijk om uit metingen bij een beperkt aantal proefpersonen te schatten hoeveel alle obese mensen ter wereld gemiddeld zouden afvallen, en hoeveel onzekerheid er in die schatting zit.

Toen er nog geen computers waren, deden onderzoekers dat rekenwerk zelf, met potlood en papier. Sindsdien zijn onderzoekers en statistici uit elkaar gegroeid. De statistici bedenken steeds gecompliceerdere rekenwijzen en de modale onderzoeker begrijpt daar steeds minder van. Hoe zou hij ook? Hij heeft ooit met moeite zijn tentamen statistiek gehaald en dat zo snel mogelijk weer vergeten. Toch wil de onderzoeker graag een ‘significante’, d.w.z. betrouwbare conclusie uit zijn onderzoek krijgen, anders valt er niets te publiceren.

Het wordt dan verleidelijk om allerlei geavanceerde rekenmethoden op de metingen los te laten in de hoop op een significante uitkomst. De onderzoeker hoeft die methoden niet zelf te doorgronden, ze zitten kant en klaar in de computer, en de officiële bewoordingen om de methode te omschrijven in de publicatie zijn ook wel te vinden.

Neem ‘multipele imputatie’. Dat is een nieuwe statistische techniek om ontbrekende uitkomsten te schatten. Bij onderzoek ontbreken vaak uitkomsten ten gevolge van omgevallen bloedbuisjes, weggebleven proefpersonen of onleesbare antwoorden en dat bemoeilijkt het trekken van conclusies. Die ontbrekende uitkomsten kunnen worden geschat met behulp van multipele imputatie. Het is een prachtige techniek, maar als je de schattingsprocedure honderd keer uitvoert komt er honderd keer iets anders uit, en het vereist diep wiskundig inzicht om te bepalen welke schatting het dichtst bij de waarheid ligt. Een onderzoeker die dat inzicht mist komt al gauw in de verleiding om de uitkomst te selecteren die er volgens hem uit had moeten komen.

De statistici kunnen hier weinig tegen doen. Ze proberen de jacht op significanties te remmen, maar uiteindelijk beslist de onderzoeker zelf welke getallen hij opneemt in zijn publicatie. De briljante wiskundigen die de nieuwe technieken hebben uitgevonden begrijpen het probleem vaak niet eens. Ze kunnen zich niet voorstellen dat iemand de computer laat draaien tot er een wenselijk antwoord uitkomt. Dat is geen wiskunde! De referent die de publicatie moet beoordelen durft geen kritiek te leveren op statistische technieken die hij zelf niet beheerst, hij neemt aan dat de auteurs begrijpen wat ze doen en hij keurt het artikel goed.

De kleermakers van de keizer werden ontmaskerd toen een kind zei: ‘Maar hij heeft helemaal niets aan!’ Daarom doe ik bij deze een oproep aan jonge onderzoekers in de levenswetenschappen. Als op een congres een spreker je met geavanceerde statistische berekeningen een dom gevoel bezorgt, raap dan al je moed bij elkaar, stap naar de microfoon en zeg: „Ik zie het niet.’ Je zult verrast zijn hoeveel bijval je krijgt.

Voor bronnen zie mkatan.nl