Kunstmatige intelligentie

Nieuwe Go-software leert zichzelf spelen en is al in een maand beter dan wie ook

De AlphaGo Zero verpletterde zijn één jaar oudere versie AlphaGo zonder enige vorm van menselijke kennis over het go-spel te gebruiken.

AlphaGo Zero versloeg in mei go-wereldkampioen Ke Jie. Foto EPA/WU HONG

Een nieuwe go-computer van Google Deepmind: AlphaGo Zero heeft zijn één jaar oudere versie AlphaGo, die vorig jaar nog triomfantelijk het wereldnieuws haalde, met 100-0 verpletterd. Dat rapporteren onderzoekers van DeepMind deze donderdag in Nature. Uniek is dat de computer dat doet zonder enige vorm van menselijke kennis over het go-spel te gebruiken. Hij begint als een tabula rasa, met alleen het bord, de stenen en de spelregels. Menselijke partijen krijgt hij niet te zien.

In de eerste partij speelde AlphaGo Zero alleen maar willekeurige zetten tegen zichzelf. Bij elke volgende partij die de computer tegen zichzelf speelde, verbeterde hij een beetje door een geavanceerde vorm van het belonen van goede zetten en het bestraffen van slechte zetten. Al na drie dagen spelen haalde AlphaGo Zero het niveau van de versie die in 2016 veelvoudig wereldkampioen Lee Sedol versloeg.

„De keuzes van AlphaGo Zero in de opening en in het eindspel komen overeen met de beste keuzes die mensen hebben gevonden”, schrijven twee leden van de Amerikaanse go-vereniging in een commentaar in Nature. „Sommige zetten in het middenspel zijn echt mysterieus en geven go-spelers het gevoel dat ze een sterke menselijke speler aan het werk zien in plaats van computer.” Het is vooral in het middenspel dat AlphaGo Zero onconventionele strategieën en creatieve zetten heeft gevonden.

De prestaties van de nieuwe go-computer laten zien dat het ontwikkelen van slimme algoritmen belangrijker is dan het gebruiken van grote hoeveelheden trainingsdata. Nu de onderzoekers een bovenmenselijk presterend algoritme hebben ontwikkeld dat begint als een tabula rasa, liggen ook praktische toepassingen in het verschiet. Wel moet het gaan om problemen die precies in regels zijn te vatten.

In een tweede commentaar in Nature gaat informaticahoogleraar Satinder Singh onder andere in op de mediaobsessie met superintelligente machines: „Dit is niet het begin van het einde, omdat AlphaGo Zero, net zoals tot nu toe elk ander succesvol systeem met kunstmatige intelligentie, extreem beperkt is in wat het weet en wat het kan doen vergeleken met mensen en zelfs met andere dieren.”