Turingtest

Was de grote Engelse wiskundige Alan Turing helemaal serieus toen hij in 1950 zijn 'imitatiespel' voorstelde als een test om te beoordelen of machines konden denken? Het lijkt me van niet. Zijn beroemd geworden artikel in het tijdschrift Mind, in alle overzichtsboeken over Kunstmatige Intelligentie geciteerd, had iets speels baldadigs en provocerends.

Ongeveer in dezelfde tijd vond een andere historische gebeurtenis plaats. Een knappe buitenlandse bezoeker vertelde aan de leiders van het bedrijf Philips dat er in de toekomst geld te verdienen zou zijn met computers. Ze geloofden het niet en lieten het terrein over aan IBM.

Toen ik dat nog eens nalas in de memoires van Hendrik Casimir, kwam ik een lijstje tegen van de verlichte beginselen waardoor hij en zijn voorganger zich lieten leiden toen ze het Natuurkundig Laboratorium van Philips bestuurden. Ach, moge dit lijstje een ereplaats krijgen in de werkkamer van onze wetenschapsminister Ritzen! Heel belangrijk lijkt me een onderdeel van beginsel 5: kies in twijfelgevallen voor anarchie.

Wat doet die Ritzen hier nu, ik wilde het over Turing hebben en alleen aangeven dat in 1950 computers nog bijna niets konden en dat juist daaruit de bravoure verklaard moet worden waarmee Turing de machine als de nieuwe mens inhaalde.

Kunnen machines denken? Die vage vraag maakte Turing in 1950 tot een wetenschappelijke vraag door een procedure aan te geven die later de Turingtest werd genoemd. Als een computer een dialoog zo zou kunnen voeren dat de menselijke gespreksgenoot niet kon uitmaken of hij met een computer of met een mens sprak, dan zou de machine intelligent genoemd moeten worden.

Turings baldadigheid zat hem al in de pseudo-nauwkeurige manier waarop hij vastlegde wat hij onder machines wilde verstaan. 'Machines' die op de gebruikelijke menselijke manier geboren waren, sloot hij uit. Ook een 'machine' die gekweekt zou kunnen worden uit een huidcel van een mens, wilde hij uitsluiten. Ja, hij was in 1950 zijn tijd vooruit. En door zijn definitie van wat hij onder machine wilde verstaan, maakte hij aan het begin al provocerend duidelijk dat hij eigenlijk geen verschil tussen mens en machine kende.

Ook uit de achteloze manier waarop hij voor de hand liggende tegenwerpingen van tafel veegde sprak een zekere baldadigheid. Bijvoorbeeld de tegenwerping dat een machine die slimme antwoorden gaf nog geen bewustzijn hoefde te hebben, en dat je dan ook niet van intelligentie kon spreken. Of een machine wel of niet bewustzijn had, dat was volgens Turing geen zinvolle vraag. Je zou het alleen uit kunnen maken als je zelf die machine was. De buitenwereld kon alleen afgaan op gedrag en dan was het begrip bewustzijn irrelevant.

Zo had Turing dat begrip handig verwijderd uit de discussie. Eerst was intelligentie voor het gemak gelijk gesteld aan het slagen voor de Turingtest en daarna werd terecht vastgesteld dat het begrip bewustzijn niet aan de orde kwam bij die test.

De enige tegenwerping die Turing wel serieus leek te nemen had met buitenzintuigelijke waarneming te maken. Hij sloot niet uit dat mensen telepathische vermogens konden hebben die computers misten. In dat geval zou zijn test in een 'telepathie-veilige' ruimte moeten worden afgenomen, om de computer geen oneerlijk nadeel te geven. Meende hij dat ernstig? Moeilijk te zeggen.

“We mogen hopen dat computers op den duur met de mens zullen wedijveren in alle zuiver intellectuele bezigheden“, schreef Turing. Wie waren die 'we'? Lang niet iedereen. Maar een eerlijk en intelligent mens moet zijn hoop misschien wel op de machine richten, als hij gemerkt heeft dat mensen dom en leugenachtig zijn.

Dat was in 1950. Sindsdien is het begrip 'Turingtest' getrivialiseerd. Het lijkt op het imitatiespel dat Turing voorstelde, maar het is iets anders geworden. Je hoort zeggen dat een computer voor de Turingtest geslaagd is op deelgebieden, zoals schaken of Rogeriaanse therapie. Onzinnig idee dat je bij een test die nu juist flexibiliteit en universaliteit wil meten, zou kunnen slagen op een onderdeel. Anders dan Turing voorspelde is een machine die aan een echte Turingtest kan voldoen niet in zicht. Zelfs als het wel zo zou zijn, zouden we de intelligentie aan de programmeur toeschrijven en niet aan de machine. Ook in 1950, toen het begrip nog nieuw en fris en niet getrivialiseerd was, was er al iets mis mee.

Er is een jaarlijkse wedstrijd waarin computers zogenaamd aan de Turingtest worden onderworpen. Het is een grapje zonder veel wetenschappelijke pretenties. De Loebner Prize werd dit jaar gewonnen door David Levy, een schaakmeester die vroeger vaak als proefkonijn tegen de schaakcomputers speelde. Zijn winnende programma had de eigenschap dat het nauwelijks reageerde op wat de gesprekspartner zei en gewoon door bleef kletsen over de seksuele escapades van president Clinton.

Het grootste succes op dit gebied is al in 1989 behaald door de Ier Mark Humphrys. Een Amerikaanse collega logde in op Humphrys' programma MGonz, denkend dat hij met een mens communiceerde. In Amerika was het nog lang geen borreltijd, maar toch bleef de Amerikaan 1 uur en 18 minuten verbonden. Het programma MGonz was obsceen en grof. Het schreef voortdurend dingen als 'OK klootzak, zeg nu eens eerlijk wanneer je voor het laatst geneukt hebt'. De herhaling van allerlei standaardzinnen viel de Amerikaan wel op, maar deed hem niet aan de menselijkheid van zijn gesprekspartner twijfelen. Intieme zaken besprak hij met het programma, zoals de lengte van zijn penis.

De Turingtest leert ons dus toch iets. Niet over Kunstmatige Intelligentie, maar over de vraag welke teksten wij als menselijk herkennen. Een tekstgenerator die grof, obsceen en beledigend is en nauwelijks acht slaat op wat de gesprekspartner opmerkt, wordt het langst als menselijk ervaren.