Julian Togelius: „Iedereen heeft het over algoritmes en kunstmatige intelligentie. Game-bedrijven kunnen niet achterblijven.”

Foto NYU Polytechnic Institute

‘AlphaZero kan maar één spel spelen’

Interview Julian Togelius Games zijn volgens Julian Togelius een goede proeftuin voor kunstmatige intelligentie. Maar ‘echt’ slim spelen ze nog niet.

Schaak werd lange tijd in het westen gezien als hét summum van het menselijk denken, vertelt de Zweedse onderzoeker Julian Togelius via Skype. Als een computer dát kon leren spelen… Hij moet er om lachen. „Toen kwamen we erachter dat we mooie algoritmen kunnen bouwen die heel goed schaak kunnen spelen… en verder niks.”

Nu, jaren later, richten onderzoekers hun pijlen op videogames. Eind januari presenteerde Google’s DeepMind-project een algoritme dat tien wedstrijden tegen professionele StarCraft-spelers wist te winnen. Dat spel, een tactische oorlogsgame waarin de speler een leger aanstuurt, wordt in gamer-kringen het ‘schaak van de gamewereld’ genoemd.

Games zijn ideaal voor onderzoek aan kunstmatige intelligentie, vindt Togelius: zijn werk is „vijftig procent games voor kunstmatige intelligentie, en vijftig procent kunstmatige intelligentie voor games”. Alleen: de twee disciplines begrijpen elkaar niet altijd. Hij schreef daarom een populair-wetenschappelijk boek dat in januari verscheen: Playing Smart: On Games, Intelligence and Artificial Intelligence.

Hij gelooft heilig in de kracht van games als proeftuin voor kunstmatige intelligentie, maar een ‘echt’ slim spelend algoritme is nog ver weg, zegt Togelius. „Als je maar één ding kan, ben je toch niet intelligent?”

Twee jaar geleden leerde Google het AlphaZero-programma toch om drie verschillende spellen te spelen?

Togelius: „Ik wil de onderzoekers achter AlphaZero niet afvallen, ze hebben fantastisch werk verricht, maar er is een risico dat mensen hun werk niet begrijpen. AlphaZero kan maar één spel spelen. Daarna moet je hem opnieuw trainen om een andere te spelen. Dat kostte Google vier uur. Zonder hun absurd dure rekenkracht had dat zelfs jaren geduurd.

„Okee, het duurt ook jaren om een grootmeester schaak te worden, maar een mens kan snel leren. Ik kan geen vlinderdas strikken, maar als ik een filmpje bekijk en een paar keer oefen, dan lukt het wel. Een machine die je met de geijkte methode traint, waarbij hij telkens een stap simuleert en dan evalueert of die zijn winst maximaliseert? Die doet daar heel lang over. We hebben nog geen systemen bedacht die algemene vaardigheden opdoen, dat gaat nog lang duren.”

U schrijft nu voor het eerst een populair-wetenschappelijk boek…

„Een paar jaar geleden werd ik uitgenodigd voor een nieuwjaarsfeestje waar ik als single écht geen zin in had. Al die stellen! Dus ik kocht een last-minute en verdween. Ik wou eerst sciencefiction gaan schrijven, maar voordat ik het wist was ik hier mee bezig. Er zijn best wat slechte boeken over kunstmatige intelligentie op de markt die domme claims maken – ik wilde games gebruiken om uit te leggen hoe het echt werkt.”

Waarom games?

„De geschiedenis van kunstmatige intelligentie is de geschiedenis van het ontleden van wat ‘intelligentie’ überhaupt is. Spellen weerspiegelen onze gedachten. Game design zie ik als de kunst van het bedenken van niet alleen interessante cognitieve, maar ook affectieve problemen. Ze bieden ons zo toetsbare criteria.

„Veel onderzoekers kijken daar vrij oppervlakkig naar. Ze zien games als een kwestie van ‘jij verliest, ik win’, met een meetbare score. Denk echter aan het spel Mass Effect: dat is een soort interactieve Star Trek en zit vol complexe systemen, waarin je naast schieten ook moet nadenken over vragen als ‘Wat wil dit personage? Welke kant gaat dit verhaal op? Moet ik dit geliefde personage opofferen of niet?’. Hoe ziet de intelligentie er uit die goed Mass Effect kan spelen? En dan soortgelijke games speelt? Dat vind ik interessante vragen.”

Vorig jaar daagde u samen met andere game- en AI-wetenschappers mensen uit om een bredere intelligentie te bouwen.

„We hebben al vijf jaar een competitie waarbij deelnemers een model krijgen van een gamewereld, en daar vervolgens hun kunstmatige intelligenties op los laten. Dat leverde nieuwe planningsalgoritmen op, dat is heel cool. Maar je ziet dan dat algoritme A één game heel goed kan, en algoritme B weer een ander. Waar we op hopen is dat mensen uiteindelijk met een algoritme komen dat zijn aanpak kan afstemmen op elk spel.”

Heeft DeepMind Starcraft gekraakt?

„Wat DeepMind heeft gedaan is een flinke prestatie, waarvan ik niet had gedacht dat die mogelijk was. Maar er is nog wel wat aan op te merken. Zo kreeg de menselijke speler geen kans om te wennen aan de tactiek van de computer. Die is vrij broos, een goede speler kan daar wel doorheen prikken.”

Waarom blijft StarCraft zo lastig?

„Bij schaak en go heb je alleen de regels van het spel nodig, dan kun je al uitrekenen welke stappen gemiddeld optimaal zijn. StarCraft heeft geen echter geen ‘regels’ maar code: dat is hardwaretechnisch sowieso vrij duur om te draaien naast een algoritme.

„Daarnaast houdt StarCraft informatie achter, net zoals bij poker, terwijl je bij schaak overzicht hebt over het hele bord. Je kan je tegenspeler expres verkeerde hints geven. StarCraft heeft ook wat willekeurige factoren erin. En tenslotte: er is een reden waarom het zo lang duurde voordat we go kraakten. Schaak heeft zo’n 35 mogelijke zetten per beurt, go heeft er honderden. Volgens schattingen heeft StarCraft wel een miljoen mogelijke zetten per beurt. Probeer dan maar eens een paar beurten vooruit te rekenen. Daarom zagen we tot nu toe vooral StarCraft-algoritmen die bestaande strategieën nadoen.”

Een live-demonstratie van DeepMind’s AlphaStar-machine, die StarCraft kan spelen.

U pleit er voor dat gamebedrijven beter gebruik moeten maken van kunstmatige intelligentie.

„Als ik bij een gamebedrijf aanklopte, dan hoorde ik vroeger: ‘We hebben al goede vijanden voorgeprogrammeerd in onze games. Waarom zouden we geld stoppen in zelflerende software?’. Maar de bad guys zijn eigenlijk het minst interessante aspect van kunstmatige intelligentie als het op games aankomt! We kunnen in de toekomst misschien zelfs games bouwen die zich aanpassen aan het gamegedrag van de speler, die nieuwe puzzels voor jou persoonlijk bedenkt die je fantastisch vindt maar nooit eerder aan gedacht hebt! Vroeger wilde niemand daar aan. Maar nu iedereen heeft het over algoritmes en neurale netwerken, dus ook de game-industrie gaat nu om.”

Maakt u zich geen zorgen dat gamebedrijven zo veel data verzamelen?

„Ik maak me daar heel erg zorgen over! Op het moment staat de wereld op stelten om wat Facebook met zijn data doet, maar als je je persoonlijke data op Facebook zet, dan weet je wat je geeft. Mensen hebben helemaal niet door hoeveel ze van zichzelf meebrengen als ze een game spelen. Shoshannah Tekofsky van Tilburg University heeft daar onderzoek naar gedaan. Ze kon zaken als leeftijd en persoonlijke drijfveren ontwaren uit het spelgedrag van mensen die de game Battlefield 3 speelden. En Battlefield is een vrij simpel schietspel. Er zijn verzekeringsmensen en kredietagentschappen die dat soort data dolgraag willen gebruiken, tenzij er wetgeving komt om dat te voorkomen.”

    • Len Maessen