Dataïsme

Vergeet de toekomst. Wie kan het heden voorspellen? Het is een van de moeilijkste vragen om te beantwoorden: wat gebeurt er nu? Alles wat we lezen of horen komt immers met een zekere vertraging tot ons. We vliegen blind door het heden en zijn historici van ons eigen leven.

Maar dit lijkt te veranderen. De moderne sociale media en de explosie van data en computerrekenkracht bieden ongekende mogelijkheden het heden te vatten. Onder het modewoord ‘big data’ wordt een radarscherm gebouwd dat ons precies moet vertellen wat er nu gebeurt.

Nergens is dat enthousiasme groter dan in Silicon Valley, dé innovatiemotor van de wereld. Een bezoek aan de campussen van internetgiganten als Google, Facebook en LinkedIn geeft mij het gevoel oud te zijn, heel erg oud. Zelden zie je iemand van onder de dertig.

Maar het zijn niet de glijbanen, Lego-knutseltafels en mobiele haarsalons voor hond en kat die het meeste indruk maken. Dat is de enorme technische kennis van deze whizzkids. Een van de oprichters van een softwarebedrijf vertelde me dat hij de afgelopen jaren alle sollicitaties persoonlijk heeft behandeld. Iedereen kreeg dezelfde test voorgelegd. Van de vijfduizend kandidaten wisten maar twee een perfecte score te halen. De ene koos voor dit bedrijf, de andere werd een beroemde hoogleraar.

De intellectuele spanwijdte van deze generatie blijkt uit het cv van een van de allereerste datawetenschappers: Jeff Hammerbacher. Hij begon bij een grote zakenbank, ontwierp toen de software voor Facebook, startte vervolgens zijn eigen databedrijf Cloudera, en werkt nu met genetische data als hoogleraar in het Mount Sinai-ziekenhuis in New York. En hij is pas 32.

Moeilijk voorstelbaar is ook de enorme rekenkracht van deze techbedrijven. De regel lijkt te zijn: je onderschat de inzet systematisch, zelfs als je de regel toepast. Dit geldt ook voor mensen die de bedrijven van binnen goed kennen. De echt interessante projecten zijn vaak supergeheim. Onderwerpen waarin men nu voluit investeert zijn onder andere kunstmatige intelligentie en medische informatie.

Een van de bedrijven die het heden probeert te voorspellen is Dataminr, een lieveling van Wall Street. Zijn belangrijkste bron is de dagelijkse stroom van 500 miljoen tweets. Daarmee beweert het belangrijke ontwikkelingen te kunnen opsporen voordat ze gebeuren. Denk daarbij aan een omslag van de publieke opinie, de val van een beurskoers of de uitbraak van een revolutie. De voorsprong is typisch zo’n 5 tot 10 minuten. Opvallend is dat de computers niet alleen de vorming van een trend zien, maar ook de onderhandse interventies van overheden en bedrijven om een trend bij te sturen.

Bedrijven gebruiken onze ongebreidelde datastroom om uiterst persoonlijke zaken af te leiden als seksuele voorkeur, drugsgebruik en de aanzet van depressie. In een berucht geval stuurde een supermarkt advertenties voor babyproducten aan een tiener. Toen de vader daarop boos reageerde – wilde het bedrijf zijn dochter soms een kind aanpraten? – bleek het warenhuis iets te weten wat hij nog niet wist: zijn dochter was zwanger!

Facebook heeft laten zien dat het verkiezingen kan beïnvloeden door de voorkeursinstellingen van gebruikers subtiel te wijzigen volgens onderzoek gepubliceerd in het tijdschrift Nature. Nota bene: 30 procent van de Amerikanen krijgt het nieuws via Facebook.

Big data mag dan een zakelijk succes blijken, maatschappelijk is het vooralsnog een teleurstelling gebleken. De explosieve groei van data en databedrijven heeft niet de transformatie van de politiek gebracht die velen voorspelden.

Er zijn vele redenen daarvoor, allemaal zorgwekkend. Het is een ding om de snelste weg naar een bestemming te vinden, het is een ander om maatschappelijk onrecht aan te pakken. De datastortvloed wordt nu door computers verwerkt. Maar om de samenleving te verbeteren, zullen mensen de data moeten begrijpen. Dat vraagt om verhalen die aanspreken. Van big data naar grote verhalen, prachtig werk voor de geesteswetenschappen.

Zelf kunnen we ook wat doen. Allemaal werken we, vrijwillig en voor niets, voor Google als we zijn zoekmachine of routeplanner gebruiken. Maar we hebben moeite ons belangeloos voor de publieke zaak in te zetten. Van de top-20 websites is alleen Wikipedia niet commercieel.

Ook overheden kunnen meer. Zij lopen ver achter in de toepassing van data. De oplossing is geen gratis Lego-bouwdozen, maar een lerende en stimulerende omgeving die technologie begrijpt en waardeert.

Tenslotte de academische wereld. Het is niet genoeg de slimste studenten op te leiden. De soms wat naïeve omarming van big data – door New York Times-columnist David Brooks zo mooi ‘dataïsme’ gedoopt, zie ook het recente boek van zijn collega Steve Lohr met dezelfde titel – vraagt kritische reflectie. Welke regulering en wetgeving is nodig? Wat zijn de plussen en minnen? En waar blijven de kunsten? Hoogste tijd voor een scheutje dadaïsme.

Een ding is duidelijk. Politiek, publiek en wetenschap staan op achterstand. Het kan toch niet zo zijn dat straks de enige die precies weet wat er gebeurt een naamloze cluster van servers is, die ergens stilletjes in een grote fabriekshal staat te zoemen.