Computer kraakt go

Supercomputer beheerst moeilijkste bordspel ter wereld.

„In de westerse wereld hebben jullie schaken, maar go is onvergelijkelijk veel subtieler en intellectueler.” Dat zegt de beste go-speler van de afgelopen tien jaar, de Zuid-Koreaan Sedol Lee. Toch is zelfs het millennia oude Aziatische bordspel go niet meer veilig voor de computer. Het computerprogramma AlphaGo heeft de eer voor het eerst een beroepsspeler, drievoudig Europees kampioen Fan Hui, te hebben verslagen. Het werd 5-0 voor de computer in een match van vijf wedstrijden.

AlphaGo is het geesteskind van David Silver, Demis Hassabis en hun collega’s van het in kunstmatige intelligentie gespecialiseerde bedrijf Google DeepMind in Londen – Google kocht het in 2014 voor 600 miljoen euro. Het team publiceert zijn resultaten deze donderdag in Nature.

Hoogleraar informatica Jaap van den Herik van de Universiteit van Tilburg noemt de prestatie „fantastisch, maar nog niet het summum”. Wereldtopper Sedol Lee is nog een stuk sterker dan de Europees kampioen. In maart gaat AlphaGo het opnemen tegen de Zuid-Koreaan – als Lee wint, krijgt hij een miljoen dollar. Van den Herik is niet verbaasd dat computers op professioneel niveau go kunnen spelen, maar hij had verwacht dat dat pas rond 2020 zou lukken.

Nadat IBM-supercomputer Deep Blue in 1997 schaakwereldkampioen Garry Kasparov had verslagen, werd go de nieuwe uitdaging voor computers – Demis Hassabis van Google DeepMind is zelf een topschaker.

Van alle bordspelen is go verreweg het lastigste. Het aantal mogelijke stellingen op het bord ligt in de orde van 10171, vergeleken met ongeveer 1038 bij schaken. Nog lastiger bleek het om de computer te laten berekenen hoe goed een bepaalde stelling is. Zelfs go-professionals kunnen vaak niet uitleggen waarom ze een bepaalde zet spelen. Onbewust herkent hun brein sterke en zwakke patronen in stellingen. Juist in het herkennen van patronen wordt de computer de afgelopen jaren steeds beter.

De verklaring voor het vroege succes van AlphaGo ligt vooral in de opmars van ‘Deep Learning’: het lerende brein wordt in een computer nagebootst via een netwerk van kunstmatige neuronen. Dat ‘neuraal netwerk’ is verdeeld in lagen; elke laag herkent een onderdeel van een patroon. Het gehele netwerk wordt getraind met voorbeelden. Zo worden sommige verbindingen in het netwerk zwakker en andere sterker, net zoals dat in het brein gebeurt.

Decennialang was de computerrekenkracht te klein om netwerken van duizenden neuronen te simuleren. De laatste jaren lukt dat steeds beter. Dat succes, de opkomst van Big Data (heel veel partijen om van te leren) en de grote rekenkracht verklaren de opmars van AlphaGo.

Toch gebruikt AlphaGo, vergeleken met Deep Blue, minder brute rekenkracht – en juist meer spelintelligentie. Daardoor evalueerde de computer in zijn match tegen Fan Hui duizenden malen minder posities dan Deep Blue in 1997 tegen Kasparov.

Slimmer in plaats van bruter, daarin ligt ook het grootste belang van dit project voor de wetenschap. Uiteindelijk wil Google DeepMind de menselijke intelligentie ontrafelen, liefst met één enkel rekenrecept dat alle functies van een menselijk brein op een computer kan uitvoeren.