Waarom het Stanford Prison Experiment nu kritiek krijgt

Psychologie Het Stanford Prison Experiment is beroemd én omstreden. Vorige week verschenen twee kritische artikelen.

Een ‘gevangene’ en een ‘bewaker’ tijdens het experiment uit 1971. Na zes dagen werd het experiment voortijdig afgebroken.
Een ‘gevangene’ en een ‘bewaker’ tijdens het experiment uit 1971. Na zes dagen werd het experiment voortijdig afgebroken. Foto Corbis

Het is deze week precies 48 jaar geleden dat het Stanford Prison Experiment (SPE) werd uitgevoerd. Een van de beroemdste experimenten uit de geschiedenis van de psychologie, maar het ligt ook steeds meer onder vuur. Vorige week publiceerde vakblad American Psychologist er twee buitengewoon kritische artikelen over en in april was er al een kritisch artikel verschenen in The Journal of Social Psychology.

Wat was het SPE ook alweer? Tien mannelijke studenten die zich hadden opgegeven voor een onderzoek naar ‘gevangenisleven’ werden op 15 augustus 1971 onverwacht en met veel spektakel thuis gearresteerd en naar een gesimuleerde gevangenis gebracht in de kelder van het psychologiegebouw van Stanford University, Californië. Daar kregen ze een soort jurk aan met een nummer erop (zonder onderbroek), een nylonkous over hun haar en een zware ketting rond hun enkel. Elf andere studenten hadden het geluk dat het lot hen als ‘bewaker’ had aangewezen. Een deel van hen vernederde de ‘gevangenen’ op extreme manieren (liet hen elkaar seksueel ‘bespringen’, bijvoorbeeld) en reageerde agressief op een ‘opstand’. Enkele gevangenen raakten overstuur.

Volgens onderzoeksleider Philip Zimbardo laat het SPE zien hoe heel normale jongens agressief of juist volgzaam kunnen worden als je hen indeelt in bewakers en anonieme, ‘ontmenselijkte’ gevangenen. Na zes dagen werd het experiment voortijdig afgebroken toen Zimbardo’s vriendin Christina Maslach hem erop wees dat het machtsmisbruik, door sommige bewakers én door de onderzoekers, veel te ver ging.

Zimbardo zocht altijd gretig media-aandacht voor het experiment

Er is waarschijnlijk geen ander wetenschappelijk experiment dat zóveel publiciteit heeft gekregen. Er is een documentaire over gemaakt (Quiet Rage, 1992) en drie speelfilms (Das Experiment, 2001, The Experiment, 2010, en The Stanford Prison Experiment, 2015). Na de misstanden in de Abu Ghraibgevangenis in Irak schreef Zimbardo het boek The Lucifer Effect (2007), dat voor bijna de helft van de 551 bladzijden gedetailleerd navertelt wat er tijdens het SPE gebeurde.

Zimbardo zocht altijd gretig media-aandacht voor het SPE: toen het nog liep stuurde hij al persberichten uit. Dat meldt Thibault Le Texier (verbonden aan de universiteit van Nice) in een van de twee kritische artikelen die nu in American Psychologist staan. Zijn artikel is gebaseerd op zijn vorig jaar verschenen boek over het SPE, Histoire d’un mensonge (‘Geschiedenis van een leugen’). Hij onderzocht als eerste al het SPE-archiefmateriaal, schrijft hij, en interviewde 15 deelnemers.

Wat is er mis met het SPE dat het nu een leugen wordt genoemd? Een selectie uit de kritiek.

Kritiekpunt 1

De deelnemers deden gewoon wat hun gevraagd was te doen

Dit is waarschijnlijk het belangrijkste en meestomvattende kritiekpunt; het staat centraal in alledrie de recente artikelen. De SPE-bewakers waren tijdens een introductiedag getraind om zich hard op te stellen, schrijft Le Texier. Volgens opnames in het archiefmateriaal gaf de opzichter (een van de onderzoekers) de bewakers suggesties voor manieren om de gevangenen te vernederen, bijvoorbeeld hen push-ups laten doen – wat vervolgens inderdaad gebeurde.

In het eerste wetenschappelijke artikel over het SPE, uit 1973, schrijven Zimbardo en collega’s daarentegen dat er geen training was, een ander artikel uit 1973 spreekt van „minimale richtlijnen”, en in The Lucifer Effect staat „geen formele training”. Inderdaad zullen niet álle manieren waarop bewakers gevangenen vernederden door de onderzoekers ingefluisterd zijn. De push-ups dus wel, maar dat een gevangene die in hongerstaking was gegaan de opdracht kreeg worstjes te liefkozen, zoals Zimbardo in The Lucifer Effect beschrijft, hebben de bewakers vast zelf bedacht.

Zimbardo wilde naar een bepaalde uitkomst toewerken en de bewakers wisten dat

Maar Zimbardo wilde wel naar een bepaalde uitkomst toewerken (aantonen dat gevangenissen een toxische omgeving zijn), en de bewakers wisten dat. Le Texier zag in het archief dat Zimbardo de bewakers vertelde dat hij de omstandigheden wilde onderzoeken die leiden tot onder meer agressie en identiteitsverlies, en dat „we” gevoelens van frustratie en machteloosheid bij de gevangenen konden oproepen. Eén van de bewakers schreef in een dagboekje (in het SPE-archief) dat hij dacht eruitgegooid te worden als hij te aardig was. Dat zou financieel onvoordelig zijn: de deelnemers kregen 15 dollar per dag, wat in 2019 zo’n 85 euro zou zijn, gecorrigeerd voor inflatie.

Uit onderzoek is bekend dat deelnemers aan een onderzoek sowieso graag ‘goede proefpersonen’ willen zijn. Daarom moet een onderzoeker de hypothese ook niet aan hen bekendmaken. Zimbardo deed dat wel, en méér dan dat, betogen Alexander Haslam, Stephen Reicher en Jay Van Bavel in het andere artikel dat vorige week in American Psychologist is gepubliceerd. Zimbardo stelde zich op als leider van de bewakers, als een van hen: hij sprak in de ‘we’-vorm. Hijzelf en andere onderzoekers gaven de bewakers instructies en moedigden hen expliciet aan zich agressief te gedragen. Een bewaker die zijn best niet deed, werd op het matje geroepen. De bewakers werden niet agressief door hun bewaker-rol, zoals Zimbardo altijd heeft gezegd, maar door diens leiderschap, betogen Haslam, Reicher en Van Bavel, die zich mede baseren op het archief en het boek van Le Texier.

Jared Bartels (William Jewell College, Missouri) onderzocht in drie experimenten (in april gepubliceerd in The Journal of Social Psychology) hoe mensen denken dat de instructies van Zimbardo uitpakken. Hij gaf sommige mensen heel basale informatie over een SPE-achtig gevangenisonderzoek, en anderen extra teksten over onder meer de vervelende gevoelens die bewakers bij gevangenen konden oproepen, zoals Zimbardo had uitgesproken. Die tweede groep verwachtte inderdaad meer vijandigheid dan bij de basale informatie. Die verwachtingen had Zimbardo dan dus ook gecreëerd.

Verscheidene bewakers en gevangenen zeiden achteraf dat ze maar een rol speelden

Verscheidene bewakers en gevangenen in het SPE zeiden achteraf dat ze hadden willen doen wat goed was voor het onderzoek, en dat ze maar een rol speelden, zag Le Texier in het archiefmateriaal. Eén gevangene heeft in de loop der jaren een paar keer verteld dat hij de zenuwinzinking die hij kreeg omdat hij weg wilde, slechts acteerde.

Zimbardo gelooft dat niet en heeft een filmpje online gezet met fragmenten uit Quiet Rage waarin de gevangene het zelf tegenspreekt. En in een reactie op zijn site zegt Zimbardo dat hij nooit bewakers heeft opdragen om zich echt wreed te gedragen. Verder wijst hij op de overeenkomsten tussen het SPE en de Abu Ghraibgevangenis, waar bewakers gevangenen óók op wrede manieren vernederden.

Kritiekpunt 2

Pogingen om het SPE te herhalen, laten zien dat ‘bewakers’ niet altijd agressief worden

Dit kritiekpunt is al ouder en wordt zijdelings besproken in de drie nieuwe kritische artikelen. Er zijn twee serieuze pogingen gedaan om het SPE te herhalen. In 1979 publiceerden drie Australiërs onderzoek waarin ze drie verschillende regimes in gesimuleerde gevangenissen vergeleken: een streng regime waarin gevangenen bij hun nummer werden aangesproken, een beleefd regime waar bewakers en gevangenen elkaar ‘meneer’ noemden, en een democratisch regime waarbij gevangenen mochten meebeslissen over activiteiten. Alleen in het strenge regime werd de sfeer erg vijandig. Er is dus méér nodig dan louter een indeling in bewakers en gevangenen. Maar dat wisten we ook al van het SPE, waarin niet álle bewakers agressief werden en niet álle gevangenen overstuur raakten.

Alleen in het strenge regime werd de sfeer erg vijandig

Van een andere orde is een gevangenisonderzoek dat Stephen Reicher en Alexander Haslam in 2001 uitvoerden, in samenwerking met de BBC, die het filmde. Reicher en Haslam begonnen met 5 ‘bewakers’ en 9 ‘gevangenen’, één gevangene werd op de derde dag tot bewaker gepromoveerd en toen kwam er een nieuwe gevangene bij. Daarna vond een opstand plaats: de gevangenen overmeesterden de bewakers, waarna de hele groep probeerde egalitair samen te leven, wat niet lukte. Deze studie verschilt in zowel uitvoering als resultaten sterk van het SPE.

Op zijn site noemt Zimbardo het een „realityshow” die „op geen enkele manier voldoet aan de wetenschappelijke voorwaarden voor een replicatie”. Hij heeft zelfs geprobeerd publicatie ervan in een wetenschappelijk tijdschrift tegen te houden, schrijft hij openlijk in een commentaar op de publicatie ervan in British Journal of Social Psychology (2006). In dat commentaar noemt hij de BBC-studie „frauduleus”. Het enige goede eraan, schrijft hij, is dat die laat zien dat bewakers niet agressief worden als alle gedrag openbaar is en geëvalueerd kan worden. Het SPE werd ook gefilmd, niet openlijk maar met verborgen camera’s (wat de deelnemers wel wisten).

Kritiekpunt 3

De dataverzameling was slordig

Over filmen gesproken: in zijn onderzoek in het SPE-archief ontdekte Le Texier dat er maar zes uur video en vijftien uur audio was opgenomen, terwijl het onderzoek zo’n 150 uur (zes dagen) heeft geduurd. Eén van Zimbardo’s collega’s, Craig Haney, schreef in een verslag dat in het SPE-archief zit dat ze vooral de dramatische en ongewone momenten hadden gefilmd, waardoor het videomateriaal niet representatief is. Op dag drie is helemaal niets opgenomen; de onderzoekers waren toen te druk met geruchten over een mogelijke opstand, schrijft Le Texier. Maar bijvoorbeeld in The Lucifer Effect bespreekt Zimbardo een analyse van het videomateriaal zonder te vermelden hoe incompleet het is. Wat ook ontbreekt is (religieuze, politieke, culturele, maatschappelijke) achtergrondinformatie over de deelnemers. Jammer, schrijft le Texier, want die had misschien kunnen helpen verklaren waarom sommigen zich meer in hun rol inleefden dan anderen. Op het ontbreken van data in het archief heeft Zimbardo niet gereageerd (noch op mail van NRC).

Kritiekpunt 4

De ‘gevangenen’ konden écht niet weg

Dat het SPE onethisch was, is bekend. Het was de reden dat Zimbardo het afbrak. Op zijn site schrijft hij dat het niet meer mogelijk is om het SPE te repliceren, „vanwege de kritiek dat het niet ethisch is”. Hij heeft zijn excuses aangeboden voor het lijden dat hij veroorzaakt heeft. Maar Le Texier ontdekte in het archief dat dat lijden niet alleen veroorzaakt werd door de onderlinge agressie, maar dat Zimbardo de gevangenen bovendien wilde laten geloven dat ze hun gevangenis echt niet konden verlaten, behalve in geval van nood. Zo staat het in het protocol dat hij naar de ethische commissie van de universiteit had gestuurd. Ze moesten ziek worden, een zenuwinzinking krijgen, of speciale toestemming van de onderzoekers krijgen om vrij te komen.

Hij heeft zijn excuses aangeboden voor het lijden dat hij veroorzaakt heeft

Schrijver Ben Blum gaf daar vorig jaar in een artikel op Medium.com nog extra informatie over. Blum deed ongeveer tegelijk met Le Texier onderzoek naar het SPE. Hij sprak de twee gevangenen die op dag twee al zeiden weg te willen en te horen kregen dat dat niet kon. Een van hen zei nog steeds spijt te hebben dat hij Zimbardo niet voor de rechter heeft gesleept wegens wederrechtelijke vrijheidsberoving. Dat was de gevangene die een zenuwinzinking acteerde of kreeg en werd vrijgelaten. Hij werd gevangenispsycholoog, schrijft Zimbardo.

Conclusie

Wat moeten we nu denken over het SPE? Le Texier en Blum noemen het een „leugen”. Zimbardo noemt het, in een interview op Vox.com, een „krachtige demonstratie van een psychologisch fenomeen”, namelijk dat menselijk gedrag „veel meer beïnvloed wordt door sociaal-situationele variabelen dan we ooit eerder hadden gedacht”. Het gedrag van de deelnemers was ook vrij extreem, alleen lijkt het erop dat Zimbardo’s leiderschap daarbij bepalender was dan de indeling in bewakers en gevangenen, betogen Haslam, Reicher en Van Bavel.

In onderzoek van Jared Bartels uit 2015 bleek dat lesboeken ‘inleiding in de psychologie’ (uit 2012-2015) het bij het SPE vrijwel nooit hebben over de replicatiepogingen, de manier waarop bewakers gestuurd werden, het feit dat niet alle bewakers agressief werden, dat de situatie niet sterk op een gevangenis leek, en dat op een onderzoek naar ‘gevangenisleven’ bovengemiddeld agressieve jongens reageren, zoals uit onderzoek is gebleken. Die tijd van kritiekloosheid lijkt in ieder geval definitief voorbij.