Hoe weet Google hoe lang je moet wachten?

De Formule Google voorspelt hoe lang het duurt voor je een tafeltje krijgt in een restaurant – concurrentiegevoelige informatie, waar restauranthouders zich niet aan kunnen onttrekken.

Illustratie Midas van Son

Of je nu een Android-toestel of een iPhone gebruikt: je telefoon weet waar je bent en waar je geweest bent. Je locatiegeschiedenis is net zo persoonlijk als je dagboek.

Google gebruikt zulke data, mits je er toestemming voor geeft, om te voorspellen hoe druk het is in winkels of hoe lang je moet wachten in een restaurant. Google schat zelfs in hoe lang je op zoek zult zijn naar een parkeerplek. Hoe werkt dat?

Je telefoon is een baken. Zelfs als er geen gps-ontvangst mogelijk is, is je locatie te herleiden via wifi-netwerken in de buurt of zendmasten van je mobiele netwerk.

Als je locatiedata van verschillende gebruikers bij elkaar optelt, krijgen de gegevens nog veel meer betekenis. Dat merkte fitness-app Strava begin dit jaar, toen bleek dat veelgebruikte joggingroutes de locatie van militaire bases in oorlogsgebieden verklapten.

Google gebruikt zulke ‘cumulatieve en geanonimiseerde’ locatiedata om te meten hoe druk het is in winkels en restaurants. Ook toont het bedrijf hoeveel tijd klanten in een winkel doorbrengen, gebaseerd op data van de laatste paar weken.

Popular times verschenen voor het eerst in 2015. Sinds november 2017 vertonen Google Maps en Google Search actuele wachttijden van ruim een miljoen restaurants wereldwijd.

Zulke schattingen over drukte verschijnen als er ‘genoeg’ gegevens zijn. Google geeft geen details over hoeveel metingen er nodig zijn. Om toch te begrijpen hoe het algoritme tot stand komt, nemen we een blogpost van Google Research als basis. Onderzoekers bouwden een algoritme voor Google Maps dat probeert te voorspellen hoe lang het duurt om een parkeerplaats te vinden.

Hoe vind je een fingerprint – een ‘vingerafdruk’ of terugkerend gedragspatroon in een berg locatiedata? Bij het parkeer-algoritme benaderde Google eerst mensen om aan te geven waar en wanneer ze problemen hadden om een parkeerplek te vinden. Dat leverde een ‘ground truth’ dataset met de locatiegeschiedenis van ruim 100.000 individuen.

Naast het recht vergeten te worden, is het misschien tijd voor het recht niet gemeten te worden

Om hun parkeertijd te berekenen, namen de onderzoekers het verschil tussen het tijdstip waarop mensen zouden arriveren als ze bij de voordeur zouden parkeren en de tijd waarop ze daadwerkelijk aankwamen.

Aanvankelijk leek langzaam rondcirkelen door de buurt een goede indicatie te zijn van mensen die op zoek zijn naar een parkeerplek. „We dachten dat we een silver bullet hadden”, schrijven de Google-onderzoekers. Bij het trainen van het algoritme bleek de beste voorspelling echter te zijn hoe verspreid de parkeerplaatsen liggen.

In totaal is het parkeertijd-algoritme gebaseerd op twintig eigenschappen, waaronder het tijdstip van de dag. Google trainde het algoritme ook om niet „voor de gek gehouden te worden” door mensen die met een taxi of bus aankomen en schijnbaar voor de deur parkeren. Beschikbare parkeerplekken (‘beperkt’, ‘gemiddeld’ en ‘gemakkelijk’) worden weergegeven in tientallen Amerikaanse steden en het werkt inmiddels ook in Amsterdam.

De aanpak van de druktemeting in winkels en restaurants lijkt op die van het parkeerprobleem, zegt Google desgevraagd: er is ook een ‘ground truth dataset’ samengesteld en een vingerafdruk ontwikkeld die gedrag van mensen in kaart brengt die door een winkel wandelen of wachten in een restaurant. Het bedrijf geeft echter geen verdere details vrij over hoeveel metingen nodig zijn om een betrouwbare voorspelling te doen, of welke bewegingspatronen hoe zwaar gewogen worden.

Er is geen opt-out

Voor gebruikers is het handig, die druktemetingen. Dat kleine diagrammetje kan je dagelijkse keuzes beïnvloeden. Misschien besluit je naar een andere winkel te gaan of een ander restaurant: een plek waar het niet druk is (of juist drukker, in plaats van een tent waar niemand zit).

Soms publiceert Google hoeveel tijd klanten in een winkel doorbrengen. Dat is concurrentiegevoelige informatie. Ben je daar als middenstander of horecagelegenheid niet blij mee, dan is het niet mogelijk deze ‘publieke’ informatie te laten verwijderen. Naast het recht vergeten te worden, is het misschien tijd voor het recht niet gemeten te worden.

Wat is een algoritme eigenlijk? In deze animatie leggen we het uit.

Hoe algoritmes ons dagelijks leven bepalen

Ons leven wordt bestuurd door algoritmes, regeltjes achter de schermen. Deze wiskundige formules, gevoed door grote hoeveelheden data, sturen onze selectie van nieuws, entertainment en aankopen, vissen automatisch dieven en verdachten uit de massa. Lees de inleiding: Hoe algoritmes ons dagelijks leven sturen ›

Vervoer

Techbedrijven zijn dol op locatiedata en bewegings­gegevens, hoe gedetailleerder hoe beter. Zo ‘ziet’ Google hoe lang mensen op zoek zijn naar een parkeerplaats en leert Apple van je iPhone waar je werkt. Je kunt bewijzen dat je veilig rijdt en erop vertrouwen dat je om de file geleid wordt, of de snelste liftcabine voorgeschoteld krijgt. Maar welke algoritmes bepalen wat veilig is of wie er voorrang krijgt in de de file of in lift?

Lees ook:

  1. Hoe omzeilt TomTom de files?

  2. Hoe bepaalt de verzekeraar hoe veilig jij rijdt?

  3. Hoe bepaalt de lift wie voorrang krijgt?

  4. Hoe weet Google hoe lang je moet wachten?

Media

Kun je smaak in statistiek vatten? De grote streaming-diensten doen niet anders. Ze proberen een breed publiek inhoud op maat aan te bieden met behulp van algoritmes. Spotify en Netflix doen het door mensen met dezelfde voorkeuren te clusteren. Nieuwsdienst Blendle probeert er juist voor te zorgen dat je andere dingen ziet dan je zou verwachten. Apple laat personificatie grotendeels achterwege: Apple News is gebaseerd op locatie, niet of nauwelijks op je klikgedrag.

Lees ook:

  1. Hoe weet Netflix welke serie je wilt zien?

  2. Hoe weet Blendle wat jij wilt lezen?

  3. Hoe stelt Apple jouw nieuws samen?

  4. Waarom is dit het volgende liedje dat Spotify je laat horen?

Shoppen

Amazon is de webwinkel die groot werd met het doen van aanbevelingen op basis van wat anderen kochten. Wat zijn de trucs waarmee online winkels en reisbureaus je tot een aankoop verlokken? Achter de schermen wordt consumentengedrag in datapatronen gegoten, om beter in te schatten wat je wilt of hoe je te beïnvloeden bent. Ieder mens is uniek, maar bij elkaar zijn we toch redelijk voorspelbaar.

Lees ook:

  1. Hoe verleidt Booking.com je snel een hotelkamer te boeken?

  2. Hoe weet Bol.com wat je wilt kopen?

  3. Retargeting: hoe lang blijven mijn schoenen me achtervolgen?

  4. Hoe Facebook advertenties héél precies op maat maakt

Fraude

Algoritmes zijn bij uitstek geschikt om conclusies te trekken uit grote hoeveelheden data. Daardoor kunnen ze sneller ‘verdachte’ elementen opsporen, of het nou gaat om betalingsverkeer, uitkeringsgerechtigden of winkeldiefstal. De regels voor wat nou eigenlijk verdacht gedrag is, worden echter wel door mensen bepaald.

Lees ook:

  1. Hoe beschermt de bank je tegen oplichters?

  2. Hoe controleert de gemeente of jij fraudeert?

  3. Hoe bepaalt de zelfscankassa welke klanten gecontroleerd worden?

Naar aanleiding van deze productie organiseerde NRC op donderdag 12 april een avond in Pakhuis de Zwijger in Amsterdam. Terugkijken kan hier.

Redactie Marc Hijink en Eva de Valk, animatie Midas van Son, Harrison van der Vliet en Elze van Driel, illustraties Midas van Son, vorm Koen Smeets.