Een robot die beeld herkent en je bril vindt

P lato vroeg zich af: Hoe herkennen wij dingen? Wat maakt een tafel een tafel? Wat maakt een tempel een tempel? Sindsdien hebben veel denkers daar antwoord op gegeven. 2500 jaar later, lijkt de geschiedenis van de kentheorie zich te herhalen in de computertechnologie.

Afgelopen september werd de Nederlandse app Impala gekocht door smartphonechipfabrikant en multinational Qualcomm. Dat kondigde direct een grote wending in de computertechnologie aan.

Impala is een app die lijkt op een gewone fotobibliotheek – alleen hoef je niet zelf je foto’s te ordenen. Het systeem deelt je foto’s in in categorieën als strand, eten, vrienden, mannen, vrouwen. En dat is lang geen simpele uitvinding.

Impala is het resultaat van dertig jaar onderzoek naar beeldherkenning. Een computer krijgt geen afbeeldingen, maar slechts verzamelingen pixels. Om iets zinnigs te kunnen zeggen over een hoopje van 40.000 pixels, vroegen de onderzoekers zich ook af: Hoe herkennen wij dingen? Zo werd, naar analogie met De Idee van Plato, een model ontworpen van voorwerpen die de computer kon vergelijken met het gegeven plaatje. Helaas ziet een tafel door bepaalde belichting en uitsnijding er telkens anders uit, en daarom bleek dit Idee niet te werken.

De filosofie van de beeldherkenning moest zichzelf vernieuwen en tien jaar geleden kwam het antwoord. De huidige techniek verdeelt de hoop pixels in kleinere hoopjes en kijkt naar details: naar kleuren, texturen, hoeken en krommingen. En, zoals in de kentheorie van filosoof John Locke, stelt de computer een hypothese op over de afbeelding. Het systeem identificeert bijvoorbeeld stukjes van een mogelijk kopje. Bevinden deze stukjes zich naast een houten oppervlak, dan betreft het waarschijnlijk een kopje op een tafel. En een boot? Dat is een gat in het water met rechte lijnen.

Impala zal binnen een jaar op alle smartphones te vinden zijn. Maar vooral binnen de kunstmatige intelligentie leidt deze uitvinding een nieuw tijdperk in. Er zullen robots komen die je commando’s kan geven als ‘zoek mijn bril’, die afwijkingen kunnen scannen tijdens forensisch, medisch en biologisch onderzoek. En stel je voor: iedere computer herkent wat mooi en lelijk is en verwijdert automatisch al je mislukte plaatjes. Met de digitale beeldherkenning is een denkstap gezet waarvoor Locke zijn petje zou afnemen. De nerds kunnen al zegevieren: hun status is verheven tot die van filosoof.