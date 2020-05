Van spelende kinderen – „Hallo Siri, wil je mijn vriendje zijn?” – tot per ongeluk opgenomen drugdeals, ruzies, slaapkamergeluiden en gesprekken tussen pedofielen. Er is weinig wat Thomas Le Bonniec niet voorbij hoorde komen in de drie maanden dat hij audio-opnames analyseerde van Apples digitale assistent, Siri.

Net als honderden collega’s schreef hij aan de lopende band flarden van gesprekken uit die waren opgevangen via AirPods, Apple Watch, iPhone, iPad of CarPlay. Zo hielp Le Bonniec (25) de Franstalige Siri te verbeteren. Zoiets gebeurde ook voor de Nederlandse Siri-versie.

Le Bonniec was een van de klokkenluiders die vorig jaar aan het licht brachten dat technologiebedrijven als Apple, Google en Amazon op grote schaal audio verzamelen en analyseren om spraakassistenten en smart speakers te verbeteren.

Omdat er volgens hem weinig veranderd is aan het „massale afluisteren”, besloot Le Bonniec deze week voor het eerst uit de anonimiteit te treden. In een brief (pdf) roept hij Europese privacytoezichthouders op om de dagelijkse praktijk van audioanalyse kritischer te onderzoeken.

De Fransman schendt de geheimhoudingsplicht die hij ondertekende toen hij in mei 2019 ging werken voor Globe Technical Services, een van Apples toeleveranciers in het Ierse Cork. „Siri lijkt een vriendelijke vorm van kunstmatige intelligentie”, zegt hij in een gesprek met NRC. „Maar het is ook een soort spion, die alleen maar kan antwoorden en reageren omdat er miljoenen audio-opnames zijn beoordeeld en gecorrigeerd door mensen.”

Verbeteren wat de computer denkt te herkennen is de enige manier om algoritmes te verbeteren. Na de aanvankelijke ophef over dit meeluisteren – iets wat de techbedrijven niet of onvoldoende uitlegden aan hun gebruikers – volgden er Kamervragen, excuses van bedrijven en nieuwe privacyinstellingen, waarmee gebruikers kunnen aangeven dat hun opnames niet geanalyseerd mogen worden. Daarmee leek de kous af.

Maar niet voor Le Bonniec. Apples belofte om de privacy van klanten te verbeteren vindt hij te vrijblijvend: toezichthouders moeten volgens hem de analyseprogramma’s onderzoeken en ongeoorloofd afluisteren bestraffen.

Waarom bent u dit werk gaan doen als u het zo verderfelijk vindt?

„Ik werd benaderd door een wervingsbureau voor een baan als audioanalist. Pas op de dag dat ik begon, bleek het om opnames van Apple-apparaten te gaan. In het kantoor waar ik werkte zaten veel studenten en muzikanten. Het was goed betaald, tweeduizend euro per maand voor ongeschoold werk.”

„We stonden onder toezicht van iemand van Globe Tech en een Apple-manager. We werden niet geacht met elkaar te spreken of informatie te delen. De beveiliging was niet erg strikt. Ik kon zo een usb-stick met screenshots naar buiten smokkelen.”

Overzicht van het aantal te analyseren Siri-opnames met AirPods, Apples draadloze hoofdtelefoon. Het gaat om meer dan een miljoen audio-fragmenten alleen al uit het Verenigd Koninkrijk. Een overzicht van te analyseren Siri-opnames die opgevangen zijn met iPads: honderdduizenden per taalgebied. Voorbeeld van ‘grading’ van Siri-commando’s. Van boven naar onder: het audiobestand, de geïnterpreteerde tekst en de versie van de menselijke beoordelaar. Gebruiksaanwijzing voor het ‘taggen’ van gebruikersdata, om Siri-opdrachten te koppelen aan een specifiek commando.

Waarom stopte u ermee?

„Het was geestdodend, elke dag naar dertienhonderd opnames luisteren. Het verloop was groot: elke maandag begonnen er vijf of tien nieuwe mensen en bleven er een hoop weg. Ik moest zeer persoonlijke gesprekken analyseren. Niet alleen van de eigenaar van het apparaat, ook van omstanders. Vaak waren de opnames per ongeluk gemaakt. Toen ik een gesprek tussen pedofielen opving, was dat voor mij de druppel.”

Sloeg Siri vaak per ongeluk aan?

„Dat verschilde. Eén op de vijf, soms één op de drie opnames was een vergissing. Bijvoorbeeld omdat iemand „serieus” of „serie” zei.”

Apple meldt dat minder dan 0,2 procent van de gesprekken onderzocht wordt. Om hoeveel opnames gaat het volgens u?

„Per apparaat (bijvoorbeeld iPad, iPhone of Apple TV) analyseerden we 500.000 tot een miljoen opnames - voor elke taal. De opnames werden lang bewaard – ik werkte er van mei tot juli 2019 en hoorde gesprekken over Kerstmis en Valentijnsdag.”

Apple stelt dat het geen persoonlijk identificeerbare data gebruikt voor Siri-analyse. Volgens u doet Apple dat wel?

„Als je Siri een opdracht geeft als: ‘bel Mike’, moet je bij iemands contactgegevens kunnen om te kijken of dat goed gaat. Bij een van de projecten – waaraan ik zelf niet werkte – legden medewerkers zulke links naar persoonlijke data. ”

Hoe weet u dat de werkwijze van Apple niet veranderd is?

„Ik heb uitgebreid gesproken met voormalige collega’s. Die zijn in oktober 2019 weer aan de slag gegaan voor Apple. Zij vertelden me dat hun werk hetzelfde is gebleven. Alleen betaalt het nu nog iets beter.”

Reactie Apple en toezichthouders NRC sprak naast Le Bonniec ook een andere persoon die Siri-opnames analyseerde en kreeg inzage in screenshots. Om Siri te verbeteren is analyse van een ‘minimale hoeveelheid’ audio nodig, zegt Apple. Persoonlijke data wordt verwijderd; gebruikers worden niet geprofileerd en hen wordt nu om toestemming voor analyse gevraagd. Volgens Apple stemt het merendeel toe. Het Siri-onderzoek stopte kort en is in het najaar van 2019 hervat. De analisten zijn nu in dienst bij Apple. De Ierse Data Protection Commission onderzoekt naast Siri ook digitale assistenten van Google en Microsoft. De European Data Protection Board belooft nieuwe richtlijnen voor spraakassistenten. Daarnaast is er een reële kans dat de techbedrijven achteraf alsnog een boete krijgen, omdat ze miljoenen gebruikers jarenlang niet duidelijk om toestemming vroegen voor de analyse van audio. De maximale boete voor overtreding van de AVG is 4 procent van de jaaromzet.

