Computer speelt nu beter go dan prof

Een supercomputer heeft eindelijk een menselijke kampioen verslagen bij go, het moeilijkste bordspel ter wereld.

Twee amateurs spelen een spelletje Go.
Twee amateurs spelen een spelletje Go. Twee amateurs spelen een spelletje go. Foto NRC

„In de westerse wereld hebben jullie schaken, maar go is onvergelijkelijk veel subtieler en intellectueler.” Dat zegt de beste go-speler van de afgelopen tien jaar, de Zuid-Koreaan Sedol Lee. Toch is zelfs het millennia oude Aziatische bordspel go niet meer veilig voor de computer. Het computerprogramma AlphaGo heeft de eer voor het eerst een beroepsspeler, drievoudig Europees kampioen Fan Hui, te hebben verslagen. Het werd 5-0 voor de computer in een match van vijf wedstrijden.

AlphaGo is het geesteskind van David Silver, Demis Hassabis en hun collega’s van het in kunstmatige intelligentie gespecialiseerde bedrijf Google DeepMind in Londen – Google kocht het in 2014 voor 600 miljoen euro. Het team publiceert zijn resultaten deze donderdag in Nature.

Hoogleraar informatica Jaap van den Herik van de Universiteit van Tilburg is gespecialiseerd in computerspelen. Hij noemt de prestatie „fantastisch, maar nog niet het summum”. Wereldtopper Sedol Lee is namelijk nog een stuk sterker dan de Europees kampioen. In maart weten we meer. Dan gaat AlphaGo het opnemen tegen de Zuid-Koreaan – als Lee wint, krijgt hij een miljoen dollar. Van den Herik is niet verbaasd dat computers op professioneel niveau go kunnen spelen, maar hij had verwacht dat dat pas rond 2020 zou lukken.

Deep Blue

Nadat IBM-supercomputer Deep Blue in 1997 schaakwereldkampioen Garry Kasparov had verslagen, werd go de nieuwe uitdaging voor computers – Demis Hassabis van Google DeepMind is zelf een topschaker.

Van alle bordspelen is go verreweg het lastigste. Het aantal mogelijke stellingen op het bord ligt in de orde van 10171, vergeleken met ongeveer 1038 bij schaken. Nog lastiger bleek het om de computer te laten berekenen hoe goed een bepaalde stelling is. Zelfs go-professionals kunnen vaak niet uitleggen waarom ze een bepaalde zet spelen. Onbewust herkent hun brein sterke en zwakke patronen in stellingen. Juist in het herkennen van patronen wordt de computer de afgelopen jaren steeds beter.

Kijk hieronder naar een simpele uitleg van dit complexe bordspel (de tekst gaat verder onder de video):

De verklaring voor het vroege succes van AlphaGo ligt vooral in de opmars van ‘Deep Learning’. Die techniek komt voort uit meer dan zestig jaar oude ideeën: het lerende menselijk brein wordt in een computer nagebootst via een netwerk van kunstmatige neuronen. Dat ‘neuraal netwerk’ is verdeeld in lagen; elke laag herkent een onderdeel van een patroon. Het gehele netwerk wordt getraind met voorbeelden. Zo worden sommige verbindingen in het netwerk zwakker en andere sterker, net zoals dat in het brein gebeurt.

Lerende machine

Decennialang was de computerrekenkracht echter te klein om netwerken van duizenden neuronen te simuleren. De laatste jaren lukt dat steeds beter. Dat succes, de opkomst van Big Data (heel veel voorbeelden van partijen om van te leren) en de grote rekenkracht verklaren de opmars van AlphaGo.

Toch gebruikt AlphaGo, vergeleken met Deep Blue, minder brute rekenkracht – en juist meer spelintelligentie. Het herkent kansrijke patronen in het spel. Daardoor evalueerde de computer in zijn match tegen Fan Hui duizenden malen minder posities dan Deep Blue in 1997 tegen Kasparov.

Slimmer in plaats van bruter, daarin ligt ook het grootste belang van dit project voor de wetenschap en de toepassingen van die wetenschap. Uiteindelijk wil Google DeepMind de menselijke intelligentie geheel ontrafelen, liefst met één enkel rekenrecept dat alle functies van een menselijk brein op een computer kan uitvoeren.
Tot die tijd zal Deep Learning steeds vaker zijn weg vinden in het herkennen van foto’s, video’s en spraak, bij automatische vertalingen, in sociale netwerken en in de onvermijdelijke advertentieverkoop. Toepassingen in eHealth, financiële markten en in de automatisering van advocatuur en rechtspraak komen er ook aan. Voor Deep Learning-software maakt het niet uit wat hij moet leren, als er maar veel voorbeelden zijn.