Vertrouwde Hillary Clinton te veel op big data?

Data-analyse

Hillary Clinton zette tijdens haar campagne vol in op big data, het slim analyseren van grote hoeveelheden kiezersgegevens. Toch verloor ze. Vertrouwen politici te veel op cijfers?

Illustratie: Tomas Schats

Naast het vertrouwen in traditioneel campagne voeren en de betrouwbaarheid van peilingen en de media, heeft het verlies van Hillary Clinton ook het heilige geloof in big data een knauw gegeven. Het was immers het Clintonkamp dat voor de verkiezing opschepte over het enorme datateam, deels geërfd van Obama. Haar team gebruikte een geavanceerd algoritme om grote hoeveelheden gegevens van kiezers te verzamelen, analyseren en benutten.

Obama zette met zijn campagnes van 2012 de standaard voor het politieke gebruik van big data. Geen advertentie, telefoontje, of ronde langs deuren werd meer gepland zonder onderliggende data-analyse. Het was de technologische revolutie die computernerds tot campagnehelden maakte.

Na het verlies van Clinton werd schamper gesproken over het vertrouwen van politici in big data. Over de dataspecialisten van Donald Trump was minder bekend. Aangenomen werd dat hij meer vaarde op zijn eigen intuïtie dan op cijfers, peilingen en rekenmodellen. The Economist vergeleek het als een strijd tussen „het massieve slagschip vol data” van Clinton en „een chaotische vloot speedbootjes op sociale media” van Trump. Klopt dat wel? En hoe kon Clintons datateam er zo naast zitten?

Amateuristisch imago

Achter Trumps strategie zat wel degelijk een team van experts die zich bezighielden met het vergaren, interpreteren en gebruiken van een enorme hoeveelheid kiezersdata, vertelt Camilo Sandoval. „Ik denk dat wij ongeëvenaard veel informatie van kiezers hadden dat we real time konden analyseren en inzetten voor de campagne.”

Sandoval leidde de onzichtbare afdeling data-analyse en kiezerscontact van de Trumpcampagne. „Wij wilden gezien worden als de underdog. We beschouwden het als een geuzennaam als we amateuristisch werden genoemd. We hielden al onze data geheim, ook al boden deze ons een schat aan informatie. Wij wisten al vijf dagen voor de verkiezingen vrij zeker dat Trump meer dan het benodigde aantal kiesmannen zou winnen.”

Het is voor de winnaar makkelijker praten dan voor de verliezer. Herhaaldelijke verzoeken om toelichting aan drie leidinggevenden van Clintons datateam bleven onbeantwoord. Ook in Amerikaanse media hebben zij alleen anoniem bevestigd dat hun algoritme – bijgenaamd Ada – de verwachtingen niet waarmaakte.

Amelia Showalter leidde vier jaar geleden een club digitale analisten van de Obamacampagne. Zij weet een en ander over hoe dat werk is voortgezet door Clinton. „Laten we vooropstellen dat data-analyse niet de reden is dat Obama won en Clinton verloor. Het is slechts een hulpmiddel om kiezersgedrag te voorspellen en te beïnvloeden. Het kan een verschil maken van misschien 1 of 2 procent van de stemmen”, zegt ze.

Lees ook de recensie van ‘Weapons of Math Destruction’: Big data bedreigt de democratie

Elke dag kreeg Trump een update

Politieke data-analisten bouwen modellen en voeden die met peilingen en kiezersgegevens. Door 10.000 kiezers te interviewen over hun waarschijnlijke stem en opkomst en die uitkomsten te vergelijken met in de VS openbare kiezersdata, kunnen campagnemedewerkers op basis van demografische criteria voorspellen hoe groot de kans is dat iemand op hun kandidaat stemt. Ook kunnen ze inschatten of ze bereid zijn om geld te doneren of vrijwilligerswerk te doen, en in welke staten en wijken extra inzet nodig is om zwevende kiezers of dreigende thuisblijvers te overtuigen.

Het medium en zelfs het taalgebruik waarmee verschillende soorten kiezers het beste kunnen worden aangesproken, worden uitvoerig geanalyseerd en getest. Showalter: „Dat proces is in deze campagne niet veranderd, het is alleen sneller en omvangrijker geworden.”

In de incoherent ogende Trumpcampagne werd geen beslissing genomen zonder data te raadplegen, zegt Sandoval. „Elke dag kreeg Trump een update van onze analyses. Op basis daarvan besloten we waar de volgende campagnebijeenkomst gehouden moest worden, maar ook over welke onderwerpen hij die dag het beste kon twitteren: over werkloosheid of over Clintons onbetrouwbaarheid.”

Het grote voordeel van de Trumpcampagne ten opzichte van die van Clinton was dat het al op volle toeren had moeten draaien tijdens de voorverkiezingen. Clinton had binnen de Democraten alleen tegenstand van senator Bernie Sanders. Trump moest ondertussen elf Republikeinse tegenkandidaten verslaan. „Wij konden dus in elke staat testen wat kiezers ons vertelden en welke strategieën werkten”, zegt Sandoval.

Goede modellen, slechte data

Het doorslaggevende falen van Clinton datateam was waarschijnlijk niet dat de algoritmes, modellen en analyses niet klopten, zeggen zowel Sandoval als Showalter. Het waren de data die niet deugden. „Het grote probleem is dat je afhankelijk bent van informatie die kiezers zelf geven”, legt Showalter uit. „En kiezers liegen vaak. Ze zeggen dat ze gaan stemmen als ze dat niet gaan doen en geven politiek correcte antwoorden.”

Dat kan de oorzaak zijn dat de Clintoncampagne niet de juiste informatie had en die van Trump wel. „Tegen ons durfden kiezers wel te zeggen dat ze op Trump zouden stemmen, terwijl ze dat in andere peilingen en misschien zelfs voor hun familie verzwegen”, zegt Sandoval. Daarom dachten ze bij Clinton dat staten als Wisconsin en Michigan ‘veilig’ waren, terwijl het team van Trump zag dat ze konden winnen als ze er nog een rally organiseerden.

„Natuurlijk hebben we wel onze adem ingehouden of niet wij ernaast zaten, in plaats van al die andere peilingen”, aldus Sandoval. „Maar het bleek dat wij het bij het rechte eind hadden. Deze campagne toont niet het verlies van big data, maar het belang van de juiste data.”