Go is beroofd van hemels imago

De go-wereld is geschokt. Zelflerende software speelt het complexe spel nu beter dan de mens. Eindstand: 4-1

Het eindspel van de laatste wedstrijd, met links het demonstratiebord en commentator Michael Redmond.

Vandaag is het voorbij. De beste go-speler van het afgelopen decennium is verslagen door een computer. De laatste wedstrijd is dinsdag gespeeld, einduitslag  4-1. Voor de computer. Het was tot het laatste moment spannend, maar wel met een langzaam groeiend voordeel voor de computer in het eindspel.

Verbijsterd heeft afgelopen week de go-wereld toegekeken hoe de Zuid-Koreaan Lee Sedol is

verslagen door de go-computer AlphaGo, gebouwd door Google DeepMind. Na drie partijen stond de computer zaterdag al op een onoverbrugbare voorsprong van 3-0. Toen Sedol zondag eindelijk een partij wist te winnen, zei hij: „Ik zou deze winst voor niets in de wereld willen inruilen.” Nu hij vrij had kunnen spelen, was een grote druk van zijn schouders gevallen.

Lee Sedol in diepe gedachten tijdens de derde wedstrijd. Foto AP

Kijk hier naar een korte samenvatting van deze vierde wedstrijd waarin Sedol wint. 

Creatief spel

Lee Sedol, beroemd om zijn creatieve spel, dacht voor het begin van de match nog dat hij met 5-0 of 4-1 zou winnen. In oktober had AlphaGo al met 5-0 gewonnen van Europees kampioen Fan Hui, maar die staat ‘slechts’ nummer 370 op de wereldranglijst. Sedol is nummer 4.

Go-speler Lee Sedol, na afloop van zijn overwinning afgelopen zondag, na drie nederlagen op rij tegen het computerprogramma AlphaGo.  Foto AP/Lee Jin-man

Go-professional Myungwan Kim, de nummer 6, zei afgelopen februari enigszins jaloers nog dat Lee Sedol het prijzengeld van een miljoen dollar niet zou kunnen mislopen. Door het extreem grote aantal spelmogelijkheden op het go-bord van 19x19 lijnen gold het spel altijd als ‘onkraakbaar' voor een computer. Schaken is gemakkelijker ‘door te rekenen’.

Stelling tijdens de vierde wedstrijd.

De Chinezen beschouwen go als een van de vier klassieke kunsten, naast muziek, kalligrafie en schilderen. AlphaGo heeft een deel van die hemelse magie weggenomen. Go is een aards spel geworden waarbij aan het einde de computer wint.

Go-experts mogen AlphaGo onderschat hebben, experts uit de wereld van kunstmatige intelligentie zijn minder verbaasd. Zij kennen de spectaculaire kracht van de lerende technieken die AlphaGo gebruikt. AlphaGo leert op een manier die enigszins lijkt op de manier waarop het menselijk brein leert. Een geprogrammeerd netwerk van kunstmatige neuronen is verdeeld in verschillende lagen die elk een ander aspect van de patroonherkenning voor hun rekening nemen. Door de grote hoeveelheid lagen heet de gebruikte techniek Deep Learning.

Trainingsmethoden

AlphaGo heeft al zetten gedaan die menselijke go-spelers tot nu toe nooit zouden spelen, maar die toch voordelig zijn gebleken. Net zoals bij schaken is gebeurd, zal de computer dus ook het go-spel gaan verrijken met nieuwe inzichten en nieuwe trainingsmethodes. De menselijke belangstelling om juist nu go te leren spelen is trouwens ook toegenomen, zoals bijvoorbeeld blijkt uit de aanmeldingen op de website 321go.org van de Nederlandse Go Bond, waarop je go kan leren spelen. De Go Bond telt ongeveer 650 leden.

AlphaGo heeft in de afgelopen twee jaar geleerd van miljoenen zetten die zijn gespeeld door professionele go-spelers. Belangrijker nog is dat de computer ook leert door eindeloos tegen zichzelf te spelen. De computer kan van die duizenden tot misschien wel miljoenen partijen per dag leren, terwijl een mens niet verder komt dan duizend partijen in een jaar.

Nu de computer go beheerst, lonken nieuwe uitdagingen. Een strategisch videospel zoals StarCraft bijvoorbeeld, of het kaartspel poker, waarbij spelers onvolledige informatie hebben en bovendien kunnen bluffen.

Lees hier een stuk van Margriet van der Heijden over de gevaren van artificiële intelligentie:  'Een machine met enkel kille drijfveren'

De reputatie van Google

De match is belangrijk voor Google’s aanzien. Google-topmannen Eric Schmidt en Sergej Brin kwamen een kijkje nemen in Seoul. Uiteindelijk gaat het Google om toepassingen in de echte wereld. Die zit vol met onverwachte fenomenen, en daarom zijn technieken die van de grond af aan de wereld leren begrijpen veel kansrijker dan technieken waarbij vooraf alles met regels moet worden geprogrammeerd. Robots en zelfrijdende auto’s die in de echte wereld veel last hebben van chaos en complexiteit zullen zich niet zonder lerende algoritmes staande kunnen houden.