Hey Google, nu even niet meeluisteren

Opnames spraakassistent Google laat analisten luisteren naar gesprekken die gebruikers voeren met de Google spraakassistent. Is dat tegen de afspraken?

Reclame voor Google Home-producten. De spraakassistent registreert veel meer gesprekken dan gebruikers weten.
Reclame voor Google Home-producten. De spraakassistent registreert veel meer gesprekken dan gebruikers weten. Foto Simon Dawson/Bloomberg

Wie luistert er mee met de Google Assistent? Die vraag dringt zich op nadat zo’n duizend audiofragmenten van Nederlandstalige gebruikers van Googles spraakassistent, deze week uitlekten naar de Vlaamse omroep VRT en de NOS. De opnames kwamen van een medewerker van een taalanalyse-bureau dat in opdracht van Google werkt.

Google beweert dat niemand je afluistert als je een smart speaker gebruikt of de Google Asssistent op je telefoon. De assistent bestaat immers volledig uit software die antwoord geeft op commando’s als ‘Doe het licht uit’ of vragen als ‘Hoe laat vertrekt mijn vlucht naar Parijs’, of ‘Gaat het morgen regenen?’

In de privacyvoorwaarden van Google staat duidelijk dat het bedrijf spraak- en audiofragmenten verzamelt, maar er staat niet expliciet bij dat mensen ook meeluisteren.

Google had afgelopen voorjaar al erkend dat het mensen inhuurt om audiofragmenten te analyseren. Dat was naar aanleiding van een verhaal dat Bloomberg schreef over Alexa, de spraakassistent van concurrent Amazon. Ook bij Amazon klapte een medewerker uit de school om duidelijk te maken dat audiofragmenten – ook gewone gesprekken die niet voor de spraakassistent zijn bedoeld – worden opgevangen en doorgestuurd voor analyse door mensen.

De software achter Google Assistant is getraind met bestaande spraakdatabases, onder meer afkomstig van Google Voice Search. Om de spraakherkenning verder te verbeteren – en ook de uitspraken van gebruikers in taalgebieden als Nederland goed te interpreteren – blijft Google sleutelen aan de algoritmes.

Dat gaat deels geautomatiseerd en deels met menselijke analisten die veel korte fragmenten moeten labelen. Die zijn volgens Google niet te herleiden tot personen of Google-accounts. De audio is echter niet vervormd om herkenning te voorkomen.

Actievatiewoord herkend

De ingehuurde ‘taalexperts’, zoals Google ze aanduidt, krijgen ook audio te horen van gesprekken die onbedoeld zijn opgenomen. Bijvoorbeeld als de knop van Google Assistant op de telefoon ongemerkt is ingedrukt, of als een smart speaker een de activatiewoorden - ‘OK Google’ of ‘Hey Google’ denkt te herkennen. De medewerkers worden geacht deze gesprekken ‘niet te transcriberen’. Toch worden die beluisterd.

Lees ook Column Marc Hijink over meeluisteren: de ziekte van Airpod

Welke gesprekken worden er precies geanalyseerd? Het gaat om circa 0,2 procent van de audiobestanden van mensen die bij het activeren van Google Assistant (de spraakassistent op onder meer de telefoon) en Google Home (de smart speaker) hebben aangevinkt dat ze „Spraak- en Audioactiviteit” willen laten opnemen.

Dit is een optie die gebruikers zelf actief moeten aanvinken. Google stimuleert je wel om dit te doen, door vooraf te melden dat de Google Assistent anders niet volledig zal werken. Welke functionaliteit ontbreekt of wat de beperkingen zijn, wordt echter niet duidelijk.

De zorgen gaan vooral over die opnames van gesprekken die onbedoeld zijn – false accepts, zoals Google ze noemt.

Lees ook: Google-medewerkers luisteren mee met gesprekken Google Assistent

Dat er onbedoelde opnames tussen de audiofragmenten sluipen, lijkt logisch: achtergrondgeluiden of ongerichte gesprekken zijn lastig te interpreteren door de software, en worden dus ter analyse aan medewerkers voorgelegd.

De kans op onbedoelde opnames stijgt nu Google ook de optie aanbiedt om vervolgvragen te stellen zónder opnieuw het activatiewoord uit te spreken. Dat voelt meer als natuurlijke conversatie, maar het is een extra uitdaging voor Googles software. Deze ‘Verder Praten-functie’ staat niet standaard aan en moet je als gebruiker wel eerst activeren.

Te gast in huis

NRC sprak vorige maand Mark Spates, hoofd van Googles ‘connected home’-afdeling. Hij gaat over de ontwikkeling van smart speakers. „We weten heel goed dat we te gast zijn in je huis. Bij de installatie van een apparaat proberen we zo transparant mogelijk te zijn en de gebruiker te respecteren.”

Google legde tijdens zijn laatste ontwikkelaarsconferentie sterk de nadruk op privacy. Data van de Google Assistent zouden ook niet gebruikt worden om het gebruikersprofiel te verfijnen voor advertenties. Maar de assistent heeft, om echt toegevoegde waarde te bieden, juist veel gegevens van de gebruiker nodig. Zo krijgt Googles nieuwste slimme scherm een camera die het gezicht van de verschillende gebruikers in huis herkent. Google benadrukt dat de beelden van deze zogeheten Facematch binnenshuis blijven.

Maar die extra functies lijken lastig te verkopen zolang uitgelekte audiobestanden, zoals afgelopen week, in de openbaarheid komen. Het lijkt er dus op dat Google zijn interne dataverwerking niet op orde heeft. Het bedrijf zint daarom op vervolgstappen voor de toeleverancier die de gesprekken uitschrijft. „We zullen actie ondernemen. We houden onze waarborgen opnieuw tegen het licht om te voorkomen dat dit soort misbruik in de toekomst kan plaatsvinden”, schrijft Google in een reactie.

Maar Google zou er ook goed aan doen om duidelijker in de voorwaarden te vermelden dat menselijke oren kunnen opvangen wat er in de huiskamer, wc, douche of slaapkamer gebeurt zodra je daar een Google Home-apparaat neerzet.

Amazon bood gebruikers naar aanleiding van de commotie rond Alexa de mogelijkheid om vragen direct weer te wissen. Met een spraakcommando uiteraard: „Alexa, vergeet alles wat ik vandaag gezegd heb”. Dat is een opdracht waarnaar Google Assistent ook zou moeten luisteren: „Hey Google, vergeet het maar.”