AlphaZero pakt het schaakspel aan

Toen Garry Kasparov in 1996 van de computer Deep Blue had verloren, ging de koers van het aandeel IBM omhoog. IBM gold als de ouwe opa van de computerwereld en door Deep Blue werd de firma weer jong en fris. Nu lijkt Google aan de beurt om de vruchten te plukken van een schaakoverwinning.

De eerste ronde van de London Chess Classic werd gespeeld in het Londense hoofdkwartier van Google, en dat was geen toeval. Google had een belangrijke mededeling over schaken en kunstmatige intelligentie.

Tot voor kort waren Komodo, Houdini en Stockfish de sterkste schaakcomputers. Ze ontlopen elkaar weinig en de grote meerderheid van hun onderlinge partijen werd remise. Alle schaakprogramma’s werden ongeveer op dezelfde manier geprogrammeerd. Ze werden volgestopt met openingsboeken en eindspelkennis en tussen opening en eindspel moesten ze het doen met de op menselijke kennis gebaseerde stellingsbeoordelingen en enorme rekenkracht.

Nu is er AlphaZero. Aan het begin van de London Chess Classic werd door de firma DeepMind Google bekend gemaakt dat hun schaakprogramma AlphaZero een match tegen Stockfish had gewonnen met de spectaculaire score van 64-36. DeepMind, dat een paar jaar geleden – naar verluidt voor een half miljard dollar – door Google is gekocht, had met het programma AlphaGo al de beste go-spelers van de wereld verslagen. Nu was het schaken aan de beurt.

De uitslag was spectaculair, maar vooral de manier waarop AlphaZero zo sterk was geworden. Er was volgens de ontwerpers geen menselijke kennis ingepompt, alleen de regels van het schaakspel. Vervolgens was AlphaZero door zelfstudie – het spelen van miljoenen partijen tegen zichzelf – na vier uur oefenen in de Google Cloud al sterker geworden dan Stockfish.

Het klinkt als een sprookje van kunstmatige intelligentie en zelflerend vermogen, en er is al het een en ander tegen ingebracht. Waarom speelt Stockfish bijvoorbeeld in de partij hieronder zo slecht? Ik ken hem veel beter.

Google heeft de condities van de match zwaar in het nadeel van Stockfish gemanipuleerd, maar het succes blijft indrukwekkend.

AlphaZero - Stockfish, Londen 2017

1. d4 e6 2. e4 d5 3. Pc3 Pf6 4. e5 Pfd7 5. f4 c5 6. Pf3 cxd4 7. Pb5 AlphaZero, zonder openingsboek, brengt een interessant nieuwtje. 7...Lb4+ 8. Ld2 Lc5 9. b4 Le7 10. Pbxd4 Pc6 11. c3 a5 12. b5 Pxd4 13. cxd4 Pb6 14. a4 Pc4 15. Ld3 Pxd2 16. Kxd2 Ld7 17. Ke3 b6 18. g4 h5 19. Dg1 hxg4 20. Dxg4 Lf8 21. h4 De7 22. Thc1 g6 23. Tc2 Kd8 24. Tac1 De8 25. Tc7 Tc8 26. Txc8+ Lxc8 27. Tc6 Lb7 28. Tc2 Wit heeft groot voordeel, maar Stockfish ruikt geen onraad. 28...Kd7 29. Pg5 Le7

Zie diagram

30. Lxg6 Dit stukoffer vereiste geen diepe berekening, maar wel een scherp oordeel over de stelling die straks ontstaat. 30...Lxg5 31. Dxg5 fxg6 32. f5 Tg8 Na 32...exf5 33. Df6 of 32...gxf5 33. Dg7+ wint wit meteen. 33. Dh6 Df7 34. f6 Stockfish ziet nog steeds gelijk spel. 34...Kd8 35. Kd2 Kd7 36. Tc1 Kd8 37. De3 Df8 38. Dc3 Hier zien ook minder begaafde computers dat zwart slecht staat. 38...Db4 39. Dxb4 axb4 40. Tg1 b3 41. Kc3 Lc8 42. Kxb3 Ld7 43. Kb4 Le8 44. Ta1 Kc7 45. a5 Ld7 46. axb6+ Kxb6 47. Ta6+ Kb7 48. Kc5 Td8 49. Ta2 Tc8+ 50. Kd6 Le8 51. Ke7 g5 52. hxg5 Zwart gaf op.