We zoeken een computer die veters kan strikken en eten koken

Informaticus Daan Wierstra is teamleider bij een techlab van Google. Zijn team ontwierp een computerprogramma dat kan leren. Maar tijd abstraheren om plannen te maken, kan het nog niet.

Illustratie Levi Jacob
Illustratie Levi Jacob Illustratie Levi Jacob

Een volle theaterzaal kijkt naar opnames van het klassieke computerspel Space Invaders. Spannend. De speler kan er aanvankelijk niets van, maar na een tijdje schiet hij het ene na het andere ruimteschip uit de lucht. Vreemd: de speler mikt dan haast onnatuurlijk precies.

Daan Wierstra (37) kijkt trots de zaal in. De speler op het scherm is geen mens, maar een computerprogramma dat Wierstra en zijn team hebben geschreven. Het is een programma dat computerspelletjes speelt. Of beter nog: een computerprogramma dat zelf computerspelletjes leert spelen.

Dat leren, daar gaat het om.

Wierstra leidt een onderzoeksteam binnen Deepmind, een technologielab in Londen dat in 2014 werd overgenomen door Google. Deepmind heeft het ambitieuze doel om een kunstmatige intelligentie te bouwen die écht intelligent is. Wierstra praat er bevlogen, maar kalm over.

De kunstmatige intelligentie van de huidige generatie supercomputers is beperkt, legt hij uit. Neem de schaakcomputer Deep Blue die in 1997 schaakgrootmeester Gary Kasparov versloeg. „Begrijp me niet verkeerd”, zegt Wierstra. „Deep Blue was een knappe technische prestatie. Maar Kasparov zit nog veel knapper in elkaar. Hij kan ook schoenveters strikken, autorijden en avondeten koken.”

De kunstmatige intelligentie die Wierstra voor ogen heeft, is meer Kasparov dan Deep Blue. Het moet een systeem zijn dat de wereld begrijpt en met creatieve oplossingen komt, zonder dat de problemen worden voorgekauwd.

De spelwerelden van klassieke computerspelletjes zoals Space Invaders zijn het ideale oefenterrein voor zo’n intelligente kunstmatige intelligentie, legt Wierstra uit. Er zijn regels en er is een doel. Het is aan de kunstmatige intelligentie om uit te vinden wat.

De intelligentie van Wierstra leert door ervaring. Door hetzelfde spelletje duizenden keren te spelen, leert het algoritme uiteindelijk wat wel en wat niet tot een hogere score leidt. „Als het algoritme in zijn jeugd van een klifrand afstort, zal het zich later herinneren dat het kliffen moet vermijden”, zegt Wierstra.

Waarom kunnen jullie wel echt intelligente systemen ontwerpen?

„De eerste reden is ruwe computerkracht. Ons algoritme leert in drieënhalve week om een spelletje te spelen. In 1990 had dat nog een kwart miljoen jaar gekost. De tweede reden is menskracht. Deepmind heeft meer dan honderd mensen in dienst die systemen ontwerpen en kunnen bouwen. Binnen een academische vakgroep is dat onmogelijk. Zulke aantallen onderzoekers krijg je alleen bij elkaar binnen bedrijven, zoals de Bell Labs van AT&T, of grote overheidsprojecten als het Apolloprogramma.”

De kunstmatige intelligenties van Deepmind hebben een geheugen en kunnen leren. Kijken jullie veel af bij levende intelligentie?

„De oprichter van Deep Mind is niet voor niets een neurowetenschapper. De menselijke intelligentie is ons voorbeeld, de architectuur van ons systeem is direct geïnspireerd op die van het brein.”

Je zegt dat de intelligentie alles zelf moet leren. Maar jullie geven de opdracht: haal de hoogste score.

„Zo’n geïnternaliseerd waardesysteem is simpel, elegant en zelfs noodzakelijk voordat een systeem kan leren. Dieren vermijden ook pijn, honger en dorst. En de mens heeft nog complexere drijfveren. Wij zijn bijvoorbeeld nieuwsgierig en streven kameraadschap na.”

Maar plannen maken kan het algoritme nog niet goed, toch? Een spelletje waarbij de speler sleutels moet verzamelen en deuren moet openen kreeg jullie algoritme niet onder de knie.

„Klopt. Daarachter ligt de fundamentele vraag hoe ons besef van tijd in elkaar steekt. Mensen denken in stappen van variabele lengte. Als ik koffie ga zetten, pak ik eerst een kopje uit de kast, doe ik koffiepoeder in het filter en zet ik de machine aan. Dat zijn actiebrokken die onderling gekoppeld zijn, maar in tijdsduur verschillen. Ons algoritme kan tijd niet abstraheren en plannen maken. Het denkt van milliseconde tot milliseconde.”

Is het mogelijk een computer te bouwen die ons kan aanvoelen en begrijpen?

„Je bedoelt een systeem met een theory of mind, zoals bij mensen en chimpansees? Ik zou niet weten hoe we dat zouden moeten bouwen. In zekere zin is het ook een filosofische vraag. Ik wil iets meetbaars hebben, anders verlies ik mijn interesse.”

We hoeven dus niet bang te zijn dat een kunstmatige intelligentie die ons beter begrijpt dan wijzelf de wereld overneemt?

„Die angst voor een sterke kunstmatige intelligentie is hilarisch prematuur. Alsof mensen zich in de negentiende eeuw zorgen maken over de opwarming van de aarde. Laten we het er over dertig jaar nog eens over hebben.”

Want dan hebben jullie een kunstmatige intelligentie ontwikkeld die de wereld kan overnemen?

„Laat ik niet de fout maken om een voorspelling te maken die niet uitkomt. Ik kan hooguit vijf jaar in de toekomst kijken. We gaan kunstmatige intelligentie in die tijd niet oplossen. Maar ik kan wel beloven dat we ongelofelijk spannende dingen gaan doen.”

Kan jullie algoritme ook leren hoe het een echte auto moet besturen?

„Ja!” Wierstra grinnikt. „Interessant hè? Verder wil ik daar niet veel over zeggen. Maar als een algoritme op de rem kan trappen omdat plotseling een kind oversteekt, dan is dat toch winst?”