Belangrijk: Voor het goed functioneren van nrc.nl maken wij gebruik van cookies (meer informatie).
Hiervoor hebben wij wel eerst je toestemming nodig. Klik op de groene knop als je hiermee akkoord gaat.

Zelfs Newton masseerde zijn data

farbeskreis

Farbeskreis, van Goethe. Goethe beschuldigde Newton van fraude.

De ene na de andere psycholoog gaat onderuit door geknoei met data. De marketingexpert Dirk Smeesters vertrok twee weken geleden als hoogleraar aan de Erasmus Universiteit Rotterdam (EUR), nadat een integriteitscommissie bij drie van zijn wetenschappelijke publicaties ‘datamassage’ had vastgesteld. Naar nu is gebleken heeft ook Lawrence Sanna van de universiteit van Michigan eind mei ontslag genomen na indringende vragen over de data bij zijn artikelen.

Die vragen zijn gekomen van gedragseconoom Uri Simonsohn van de universiteit van Pennsylvania. Simonsohn heeft een statistische methode ontwikkeld om verdachte patronen op te sporen in data van wetenschappelijke artikelen. Met deze methode, waarover hij nog moet publiceren, vond Simonsohn ook ‘vreemde patronen’ in de data van Smeesters. Zijn melding bij EUR leidde tot het onderzoek dat Smeesters de kop kostte.

Na de val van de Tilburgse psycholoog Diederik Stapel heeft Simonsohn ook diens data getoetst en beoordeeld als ‘fake’. Uit de jongste rapportages van de commissies die onderzoek doen naar Stapel blijkt dat de psycholoog bij 47 artikelen heeft gefraudeerd. Simonsohn nam nog een psycholoog op de korrel, maar onbekend is nog wie dat is.

Klokkenluider Simonsohn lijkt dus een veelbelovende methode te hebben ontwikkeld, die het ook voor een buitenstaander mogelijk maakt om datafraude te ontdekken. Maar maakt dat de bestrijding van fraude met onderzoeksdata ook makkelijker? Nee, denkt Jan P. Vandenbroucke, hoogleraar klinische epidemiologie (LUMC) en lid van de Koninklijke Nederlandse Akademie van Wetenschappen. Want een begrip als het ‘masseren van data’, zo schrijft hij, is helemaal niet zo eenduidig als het lijkt.

Het probleem van ‘datamassage’ is complex. Als je als wetenschapper een idee hebt dat in staat lijkt om veel te verklaren, dan verzamel je bijkomende data. Die data vat je dan samen. Elke samenvatting van data, en zeker statistische samenvattingen, houden altijd keuzes in. Deze keuzes zijn altijd gekleurd door het idee dat je in je hoofd hebt. Dat kan niet anders, om met onze nationale goeroe te spreken: “Je gaat het pas zien als je het door hebt”; dat geldt niet alleen voor voetbal, maar ook voor wetenschap.

Meer dan eens heeft een wetenschapper dan ook toegegeven aan de neiging om onwelgevallige data weg te laten, betoogt Vandenbroucke. Vandenbroucke verwijst daarbij naar de publicatie Cooking and trimming by scientific giants (Irving Klotz, 1992), met voorbeelden van datamassage door Newton, Einstein, Darwin, Millikan “en vele andere reuzen in de wetenschap”. Achteraf bleek dat deze wetenschappers het bij het rechte eind hadden.

Goethe beschuldigde Newton van fraude; vermoedelijk terecht, want Newton ‘zag’ geen tussenkleuren na scheiding van licht met een zuivere kleur dat hij door prisma’s liet gaan. Goethe hield vol dat er ook tussenkleuren waren die hij zelf duidelijk kon zien. Goethe zat uiteindelijk fout; hij zag wel tussenkleuren maar de hele zuivere scheiding van kleuren, overeenkomstig met de ‘waarnemingen’, maar vooral van de theorie van Newton, was pas veel later mogelijk met nieuwe technieken – wat Newton zelf vermoedelijk nooit heeft meegemaakt.

De Amerikaanse epidemioloog John Ioannidis heeft veel ophef veroorzaakt met zijn artikel Why most research findings are false (PLoS Medicine, 2005). Vandenbroucke wijst erop dat dit stuk met de grond gelijk is gemaakt door twee vooraanstaande statistici/epidemiologen, die concluderen dat Ioannidis’ berekeningen fout zijn. Zelf zegt Vandenbroucke op een mildere wijze afstand te hebben genomen van Ioannidis.

Mijn stelling was, als hierboven, dat een hele belangrijke taak van wetenschap is nieuwe verklaringen te bedenken en dat je het dus noodzakelijkerwijze vaak fout hebt, maar dat de ernst van het ‘fout hebben’ zeer sterk afhangt van de consequenties: of het gaat om wetenschappelijk verklaren (denk aan het Higgs deeltje) dan wel om acties die gevolgen hebben voor mensen (denk aan één RCT in de geneeskunde die gevolgen kan hebben voor miljoenen patiënten) – en dat de regels voor omgang met data en hypothese in deze twee situaties dus heel erg verschillen.

Geplaatst in:
Wetenschapsbedrijf
Lees meer over:
Diederik Stapel
Dirk Smeesters
Erasmus Universiteit Rotterdam
Jan Vandenbroucke
John Ioannidis
Lawrence Sanna
Uri Simonsohn
wetenschapsfraude

17 reacties op 'Zelfs Newton masseerde zijn data'

H.N Geraedts

Het moge intussen ook duidelijk zijn dat het Anthropogenic Global Warming CO2 relaas in belangrijke maten op gemasseerde, foutief geextrapoleerde of gefabriceerde data berust. Ref: Mann, Steig, Amman, Thomson, Hansen, Jones, Briffa, Trenberth, Forest, Dessler en Gergis bij wijze van voorbeeld.

Dat er nog geen koppen gevallen zijn is waarschijnlijk een kwestie van tijd. De emails van Climategate I en II spreken boekdelen en het feit dat geen van de bovengenoemde wetenschappers noch hun data noch hun algoritmes ["materials and methods"] hebben gearchiveerd is verbluffend, en er is nu een aanvraag gaande naar Mann’ emails onder FOI.

Frank Leystra

“De uitzondering die de regel bevestigd is ontdekt”, zou ook een mooie (maar te lange) titel zijn. Als ik nou stel dat ik ‘s ochtends maar moeilijk uit mijn bed kom, dan heb ik ook mijn data gemasseerd. Zo heel af en toe ben ik ‘s ochtends fris en fruitig. Het verschil is dat ik denk dat de wetenschap ook een taak heeft om de uitzonderingen te onderzoeken of in ieder geval op te merken, want daar liggen weer nieuwe ontdekkingen in het verschied. Zo ben ik heel benieuwd naar een manier om ‘s ochtends al zingend en huppelend de dag te beginnen.

victor brans

Zelfs bij het centraal bureau statistiek (CBS) wordt er bij voorspellingen voor de toekomst met data gemanipuleerd, bv voor berekeningen van de gemiddelde leeftijd over 40 jaar. De intervallen per 10 jaar kloppen niet bij narekenen.Dit heeft al grote consequenties voor de dekkingsgraad van pensioenfondsen.

G. Heinrichs

Zulke creatieve empirische boekhouding is ‘science at its best’, schreef Paul Feyerabend 35 jaar geleden al over de giganten der wetenschap. Zouden we Galileo en Newton nu nog kennen als ze niet hadden uitgemunt in ‘ad hoc changes in the evidence, specious arguments, and a lot of hot air’?

Frank Boekamp

Datamassage is een niet eenduidig gedefinieerde term. Er is een duidelijk verschil tussen enerzijds het weglaten van data waarvan de kwaliteit te wensen overlaat om de onderzoeksresultaten betrouwbaarder te maken en anderzijds het bewust manipuleren van data om de onderzoeksresultaten in een gewenste richting te sturen. Beide gevallen lijken onder de term datamassage te vallen.

Het is overigens vrij eenvoudig om de kans op dit soort onderzoeksfraude met data te verkleinen: voer een functiescheiding in tussen het verzamelen en opslaan van data en het gebruik ervan. Professionele datamanagers zijn dan verantwoordelijk voor de verzameling en opslag van alle data en de onderzoekers kunnen op basis van argumenten de data filteren. Het is met deze oplossing achteraf altijd mogelijk om terug te gaan naar de brondata en te bekijken welke data weggelaten is in een bepaald onderzoek.

Nadeel van deze oplossing is dat zij duurder is dan de vaak toegepaste methode om een paar studenten (gratis) op aangeven van de onderzoeker allerlei handelingen met de data te laten uitvoeren. Zoals gesteld in het artikel is de potentiele schade van klinisch wetenschappelijk onderzoek aanzienlijk en zou de verplichting om voor klinisch wetenschappelijke onderzoeken een onafhankelijke partij te moeten betrekken voor het verzamelen en opslaan van de data wettelijk geregeld moeten worden.

Zoals met zoveel risico’s in het leven draait het dus ook hier uiteindelijk om de vraag hoeveel geld we beschikbaar willen stellen om het risico te verkleinen.

fokko jan dijksterhuis

Mooi stuk. Het geval Newton-Goethe is wel iets ingewikkelder. Zij hadden een andere opvatting over kennisverwerving en onderzoeksmethodiek. Newton wilde in de eerste plaats de heterogeniteit van wit licht en de homogeniteit van gekleurd licht aantonen en richtte zijn experiment zo in dat dat glashelder gemaakt werd. Goethe wilde juist verschijnselen vanuit hun volle complexiteit begrijpen en onderzocht daarom het prismatische spectrum op alle afstanden. (zie het mooie artikel van Ribe en Steinle in Physics Today, http://experimentum-lucis.de/Paper/Exploratory.pdf) Het is ook niet zo eenvoudig te zeggen wie ‘gelijk’ had, omdat Goethe bovendien meer geinteresseerd was in perceptie van kleuren. Een razend ingewikkelde materie waarvoor Newton niet veel te bieden heeft.

M. Zaal

Een kleine correctie: Simonsohn is een psycholoog. Door de term gedragseconoom kan wat verwarring ontstaan, als in: psychologen worden onder handen genomen vanuit een andere discipline. Het veld van de gedragseconomie maakt onderdeel uit van de sociale psychologie. Zie ook Simonsohn’s vele publicaties in sociaal psychologische tijdschriften.

natascha adama

Zelfs als zou een computer een random sampling maken, alles en dan ook alles berekenen, zou er toch sprake zijn van data massage. De persoon die de data invoert kan de sampling manipuleren. Dat zeg ik als politicoloog die zich buigt over ontwikkelingsvraagstukken, democratie en dergelijke. Veel werk in de wetenschap is reeds gedaan, in de jaren 1950-1980 zijn de meest baanbrekende dingen geschreven. Thans is er weinig geld of wordt het geld gegeven door sponsoren (sociale psychologie een goed voorbeeld) en staan wetenschappers onder enorme druk om te presteren. Dat er steeds meer fraude gevallen aan het licht komen, komt omdat wie niet voldoende publicaties op zijn naam heeft staan, gedoemd is, en de academische vrijheid is eigenlijk een utopie. Ik vind het voorbeeld van Newton ietswat ironisch, omdat mensen juist toen beschikte over academische vrijheid en jarenlang, petrischalen konden laten sudderen en nadenken over ‘societies’, over vrijheid enz enz….

SF

Er is een heel groot verschil tussen datamassage en fraude.

Datamassage is, mits duidelijk aangegeven welke handelingen uitgevoerd zijn, gewoon toegestaan. Het criterium is dus dat er sprake dient te zijn van navolgbaarheid, zodat het onderzoek repliceerbaar is.

Jadwiga de Bock Majewska

voorstel idee alstublieft: gelezen : er zijn misschien voor sommige wetenschappers twee methoden van verzameling en/of data interpretatie:
citeer uit woorden boek Kramers’:
1. Inductie= een algemene regel trekken uit een aantal waarnemingen
2.deductie= afleiding van het bijzondere uit het algemene.

sheukel

So what??? Maakt dat de flessetrekkerij van pseudo-wetenschappers als de heer Stapel(gek) minder verderfelijk?? Bovendien leven we nu en niet toen.
De heer Berkhout volgend kunnen we dan ook de Islam-terreur van nu goedpraten door het over de Inquisitie van toen te hebben?? Ja, die fijne gedragswetenschappers weten altijd een truc om zichzelf belangrijker te maken dan ze zijn.

JW

Data wordt vergaard door meetmethoden. Deze meetmethoden veranderen in de tijd, vooral in kwalitatief opzicht. ‘Masseren van data’ is (vaak) vanuit de technische hoek een correctie op het ontbreken van momentane meetkwaliteit, welke in het gunstige geval in de nabije toekomst wél gemeten kan worden. Kortom: nogal een grijs gebied en zeker als allerlei disciplines met elkaar vergeleken worden. Hutspot (van disciplines) artikel: datamassage =/= fraude.

Dr Gerard te Meerman, biostatisticus

Ik vind de aan Vandenbroucke toegeschreven uitspraak dat het stuk van Ioannidis (why most research finding are false) met de grond gelijk is gemaakt nogal overdreven. Ioannidis heeft er een tamelijk overtuigende reply op gegeven (plos medicine june 2007, vol 4 issue 6 pagina 1132 en 1133 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1896210/pdf/pmed.0040215.pdf) Het belang van het stuk van Ioannidis is dat hij terecht wijst op de noodzaak van onafhankelijke replicatie van resultaten. Ik wil daar nog bij opmerken dat dat niet zo simpel is als alleen maar herhalen: als je aanneemt dat het gepubliceerde onderzoek een kans had op een dergelijke resultaat van 50%, heb je vier keer zoveel data nodig om bij een negatief resultaat vrij zeker te zijn dat het oorspronkelijke resultaat meer op toeval dan op een systematisch effect heeft berust.

L.R. Tromp

Er is een waarneming. Daaruit volgt een vraag. Om die te beantwoorden zoekt en verzamelt de wetenschapper naar data om die vraag te kunnen beantwoorden. Dat betekent keuzes welke data wel en welke niet.
Bij de gebruikte data zijn de volgende vragen te stellen.
1 Waarom vindt een wetenschapper een bepaald data relevant?
2 Is het gegeven éénduidig interpretabel? Onderscheid tussen feit, interpretatie van het feit en daaruit volgende conclusie.
3 bij interpretabel waarom interpreteert de wetenschapper het gegeven zodanig, dat die het voor zijn onderzoeksvraag relevant acht.
4 Beïnvloedt een bepaalde vooronderstelling of een te verwachte antwoord de datakeuze?
In dit proces behoeft niet per se sprake te zijn van bedrog. Dat is er wel als de wetenschapper willens en wetens niet bestaande data gebruikt.

L.R. Tromp

Er is een waarneming. Daaruit volgt een vraag. Om die te beantwoorden zoekt en verzamelt de wetenschapper naar data om die vraag te kunnen beantwoorden. Dat betekent keuzes welke data wel en welke niet.
Bij de gebruikte data zijn de volgende vragen te stellen.
1 Waarom vindt een wetenschapper een bepaald data relevant.?
2 Is het gegeven éénduidig interpretabel? Onderscheid tussen feit, interpretatie van het feit en daaruit volgende conclusie.
3 bij interpretabel waarom interpreteert de wetenschapper het gegeven zodanig, dat die het voor zijn onderzoeksvraag relevant acht.
4 Beinvloed een bepaalde vooronderstelling of een te verwachte antwoord de datakeuze?
In dit proces behoeft niet per se sprake te zijn van bedrog. Dat is er wel als de wetenschapper willens en wetens niet bestaande data gebruikt.

dirk zoebl

het mooiste voorbeeld van datamassage vind ik nog altijd de erwtenproeven van Mendel, die uitkomsten waren veel te mooi om waar te kunnen zijn, iets dat jaren nadien door de mathematicus en erfelijkheidskundige R.A. Fisher is aangetoond in een beruchte publikatie. mendel (met zijn wiskundige aanleg en inzicht) wist natuurlijk van te voren al hoe zijn Ánlagen (voor kleur, gladheid etc) zouden vererven, en heeft daar waarschijnlijk, om redenen van pedagogie, naartoe gewerkt als veldgegevens (tellingen van een bijwijlen slordige assistent??) teveel verstoringen van dat beeld opleverden, zou ik ook doen! anders schiet het niet op! stel je voor dat je weer een jaar moet wachten en je erwten opnieuw moet inzaaien,bestuiven, merken, tellen etc etc etc!!!goedwillige fraude zou ik zeggen!

dirk zoebl

en een groot geluk voor Mendel was dat niemand, noch (jaloerse) collegae botanici, noch intelligente amateurs, begrepen waar het om ging, anders was er, kun je donder op zeggen, wel iemand op zijn notitieboekje gedoken, dat gebeurde dus pas decennia later, door die Fisher!

Reageer op 'Zelfs Newton masseerde zijn data'

Op deze site gelden onze huisregels. U kunt een gravatar gebruiken.