De wereld in hapklare brokjes

De schermpjes waarop we werken worden steeds kleiner Google werkt aan Knowledge Graph: geen lijst met resultaten, maar in één keer het ‘object’ dat je zoekt Maar kun je de wereld wel zo opdelen?

redacteur technologie

Snel is beter dan langzaam. Zo luidt een van de tien ‘waarheden’ die Google kort na zijn oprichting in 1998 optekende. Vandaar dat de zoekmachine nog altijd trots meldt dat er „ongeveer 418.000 resultaten in 0,24 seconden” zijn gevonden. Gevolgd door de bekende lijst met blauwe links.

Maar nu het web verhuist van de desktop pc naar de telefoon is heel snel, heel veel resultaten tonen niet erg efficiënt. Een lange rij links is onoverzichtelijk op een klein scherm, laat staan op de miniprojector in Googles computerbril Glass. De zoekmachine moet precies begrijpen wat je zoekt – dan kan-ie meteen de juiste informatie tonen, zonder dat je verder hoeft te klikken.

Vorig jaar introduceerde Google de Knowledge Graph – sinds deze zomer ook in Nederland. Hier wordt het de Kenniskaart genoemd, een ingrijpende verandering van de traditionele zoekmethode op basis van tekstanalyse. In de wereld van Graph bestaan alleen ‘objecten’ en hun onderlinge verbindingen, in een overzichtelijke vorm. Bijvoorbeeld: als je zoekt op ‘Mark Rutte’, verschijnt er een prominent venster met essentiële informatie over de premier: zijn geboortedatum, zijn politieke partij en een samenvatting afkomstig van Wikipedia.

Het zijn geen lukrake zoekresultaten (honderdduizenden documenten met „Mark Rutte”) maar gestructureerde gegevens. Mark Rutte is het object, zijn beroep is een eigenschap. En de premier staat volgens de Knowledge Graph in verbinding met Geert Wilders en koning Willem-Alexander.

Zo’n stelsel van objecten, eigenschappen en relaties creëert een zogeheten ‘graph’. De Knowledge Graph is in feite een enorme catalogus van personen, gebouwen, landen, grondstoffen, sportteams, et cetera. De teller staat inmiddels op 570 miljoen objecten, met zo’n 18 miljard eigenschappen. Het fundament van deze database is FreeBase, opgericht door John Giannandrea. Inmiddels leidt hij het Graph-team vanuit het hoofdkantoor in Mountain View, Californië.

FreeBase bestaat nog altijd als een bron database, voor iedereen toegankelijk en uit te breiden. Google onderhoudt FreeBase, dat nu zo’n 40 miljoen objecten telt. Veel minder dan in de Knowledge Graph. „Dat komt omdat wij ook veel externe databases gebruiken”, legt Giannandrea uit. Denk aan muziekgegevens, de filmdatabase van IMDB of Google Maps. Daarnaast put Google uit Wikipedia en het CIA Factbook.

Voorspelmachine

Knowledge Graph komt het beste tot zijn recht op mobiele apparaten. Bijvoorbeeld in Google Now, de telefoon-app die al bij voorbaat informatie presenteert die je mogelijk van pas kan komen. Zoals de verkeersdrukte op weg naar huis. De zoekmachine verandert in een voorspelmachine, die afhankelijk van je locatie, gedrag en geschiedenis pasklare informatie oplepelt. Hieraan ligt de aanpak van de Knowledge Graph ten grondslag.

Hetzelfde geldt voor Google Glass, de projectiebril die in 2014 op de markt moet komen. Glass heeft een nog kleiner scherm dat alleen versimpelde ‘kaarten’ weergeeft. Elke zoekopdracht moet in één keer raak zijn: je navigeert niet meer naar een antwoord, maar krijgt het gepresenteerd.

Een zoekmachine die werkelijk begrip van de wereld heeft, reageert op spraak en zelf initiatief neemt: dat ruikt naar kunstmatige intelligentie. Giannandrea: „Die term wordt zo vaak gebruikt dat hij eigenlijk geen betekenis meer heeft. Een zoekmachine is nu nog een idiot savant die veel weet, maar geen werkelijk begrip heeft. We proberen hem met hele kleine stapjes slimmer te maken.”

Laat uiteindelijk de hele wereld, tot op de laatste zandkorrel, zich in een database vangen en verbinden met alle andere elementen? Nee, zo ambitieus is zelfs Google niet. „Dat is niet te onderhouden”, luidt het droge commentaar.

Er is te veel informatie om te doorgronden en de wereld verandert continu. En mensen gebruiken andere omschrijvingen voor dezelfde objecten. Google werkt aan de Graph in 29 verschillende landen, maar het aanpassen aan de landen vergt veel tijd, zegt Shashi Thakur, een ontwikkelaar in het team: „Je moet de taalvormen herkennen en lokale kennis verzamelen. Zo moet je in Nederland meer weten over Mark Rutte en in Japan meer over sumoworstelaars, En je moet ook de goede restaurants in Rusland en Zuid-Oost Azië kennen.”

Ex-vrouwen

Bij een gemiddelde zoekopdracht verschijnt nu vaak een antwoord uit de Knowledge Graph. Het blijkt een manier om te ontsnappen aan de uitgesleten ‘klikpaden’ van de traditionele zoekmachine. Als gebruiker ben je geneigd op de bovenste zoekresultaten te klikken, op de populairste resultaten volgens Googles PageRank. Daardoor maak je diezelfde resultaten nog populairder.

De traditionele zoekmachine werkt wel als een soort lens voor de Knowledge Graph. Google onthoudt de meest gebruikte zoekopdrachten voor een onderwerp, om relevante eigenschappen uit de Knowledge Graph te presenteren. „Neem de burgemeester van New York”, zegt Thakur, „als je zoekt op Michael Bloomberg krijg je ook zijn inkomen gepresenteerd. Maar zoek je op Rudy Giuliani dan krijg je meteen een overzicht van diens ex-vrouwen. Blijkbaar zijn Amerikanen daar het meest in geïnteresseerd.” Je zult ook andere feiten in de Knowledge Graph te zien krijgen als je zoekt vanuit Nederland of Argentinië.

De Knowledge Graph is niet feilloos. Vorige maand werden de St. Louis Cardinals omschreven als een ‘gay butt sex team’, en niet als ‘professional baseball team’. Een lolbroek had een Wikipedia-lemma veranderd, dat automatisch door de Knowledge Graph werd doorgegeven. Zo’n flauwe grap kan fout uitpakken als iemand gaat knoeien met gegevens over medicijnen of voedingswaarden.

John Giannandrea belooft dat zijn Graph alleen data presenteert waarin „voldoende vertrouwen” is. Bij personen verschijnen dus geen roddels, maar alleen ‘harde feiten’ als geboortedata. Bij Google zijn het niet vrijwilligers, maar algoritmes die kijken of data elders op het web te verifiëren is. Menselijke controle komt er alleen aan te pas als er klachten binnenkomen via de feedback-knop. „Mensen zijn nog altijd slimmer dan computers”, aldus Giannandrea. Maar mensen hebben één nadeel: ze zijn niet makkelijk uit te breiden.