"Pavlov' wint van "Tit for tat'

Hoe kan samenwerking ontstaan in een wereld van aarts-egosten? Ter beantwoording van deze vraag schreef de Amerikaanse politicoloog Robert Axelrod ruim tien jaar geleden een beroemd geworden computertoernooi uit. Opdracht: schrijf een programma dat optimaal scoort in het zogeheten getereerde Prisoner's Dilemma.

Het Prisoner's Dilemma is een klassiek probleem uit de speltheorie. Twee partijen staan voor de keuze om al dan niet samen te werken. Wederzijdse samenwerking is voor beide partijen gunstig. Nog gunstiger (voor partij A) is het wanneer partij B meewerkt maar A niet. A plukt dan de vruchten van de coöperatie van B zonder er zelf een poot voor uit te hoeven steken. Maar wanneer beide partijen aldus "spelbreuk' plegen, schiet geen van beiden daar wat mee op.

Het dilemma is nu, welke keuze in een gegeven situatie gunstiger is: wel of niet samenwerken. Wie zich coöperatief opstelt, loopt de kans op een voor beide partijen voordelig resultaat (harmonieuze samenwerking), maar ook op uitbuiting door de tegenpartij (wanneer die niet meewerkt). Wie daarentegen egostisch handelt, loopt de kans om van de samenwerkende opstelling van de andere partij te profiteren, maar aan de andere kant ook op een nulresultaat wanneer de tegenpartij evenmin meewerkt.

In de toernooien van Axelrod streden ingezonden computerprogramma's in een groot aantal ronden tegen elkaar. Opmerkelijk was dat ingenieuze programma's die slechts tot doel hadden om andere programma's uit te buiten, jammerlijk faalden. De meeste punten werden behaald door een zeer simpel programma, TIT FOR TAT of kortweg TFT. Dat onthield slechts de laatste beurt van de tegenstander en deed vervolgens precies hetzelfde. Werkte de tegenpartij de vorige zet mee, dan koos TFT ook voor samenwerking; zo niet, dan liet TFT hem op zijn beurt in de steek. TFT was kortom coöperatief ingesteld zonder zich te laten uitbuiten.

De opmerkelijke les is dat, althans in modelsituaties, een coöperatieve strategie als TFT het lonendst is. Het eigenbelang is dus het best gediend met samenwerking. Maar geldt dit ook in werkelijke situaties, bijvoorbeeld in de natuur?

Een probleem met TFT is dat het gevoelig is voor vergissingen. Twee voorbeeldig samenwerkende TFT's kunnen bijvoorbeeld eeuwig met elkaar "in de clinch' raken zodra een van hen per ongeluk een keer niet meewerkt.

Twee onderzoekers, de zoöloog Martin Nowak uit Oxford en de wiskundige Karl Sigmund uit Wenen, hebben nu in een "evolutionaire' computersimulatie waarbij af en toe vergissingen ("mutaties') waren toegestaan, een strategie ontdekt die nog succesvoller is dan TFT (Nature 1 juli, p. 56-58). Die strategie is: dezelfde optie volgen als in de vorige beurt wanneer die tot een gunstig resultaat leidde, wisselen wanneer dat niet het geval was. Kortom: "winnen-doorgaan, verliezen-omschakelen' of, nog korter, "Pavlov'.

Wanneer Nowak en Sigmund een simulatie vele "generaties' achter elkaar door lieten gaan, ontstond de "Pavlov'-strategie vroeg of laat vanzelf en bleef daarna heel stabiel. "Pavlov' bleek het ook makkelijk van TFT te winnen, dat vaak vroeg in de simulaties een tijd domineerde.

Het resultaat van Nowak en Sigmund is belangrijk voor de beantwoording van de vraag hoe wederzijds altrusme in de biologische natuur ontstaat. "Pavlov' heeft als voordeel boven TFT dat het vergissingen makkelijk corrigeert en dat het beter in staat is om "suckers' - onvoorwaardelijke samenwerkers - uit te buiten. Dit alles suggereert dat "Pavlov' een "robuustere' strategie is dan TFT en dat ze bij werkelijke diersoorten ook vaker zal worden aangetroffen. Het aardige van het resultaat is dat het aanspoort tot experimenteel werk: het moet mogelijk zijn om in de natuur te kijken of coöperatief gedrag daar vaker verloopt volgens TFT, volgens "Pavlov' of nog andere strategieën.