We verdrinken in Big Data

Overal laten we digitale sporen na: op sociale netwerken, op bewakingscamera’s, in zoekmachines en medische dossiers. Vrijwel alle transacties, interacties en observaties worden bewaard en zijn doorzoekbaar. Wordt de wereld slimmer van die zee  aan data of verzuipen we erin? Supercomputer bijten zich vast in Big Data – het modewoord van de IT-industrie. Een paar

Illustratie: Rik van Schagen

Overal laten we digitale sporen na: op sociale netwerken, op bewakingscamera’s, in zoekmachines en medische dossiers. Vrijwel alle transacties, interacties en observaties worden bewaard en zijn doorzoekbaar. Wordt de wereld slimmer van die zee  aan data of verzuipen we erin? Supercomputer bijten zich vast in Big Data - het modewoord van de IT-industrie.

Een paar cijfers:

Het internetverkeer stijgt naar een exabyte per dag in 2013 (was een exabyte per jaar in 2001)
De hoeveelheid opgeslagen data stijgt in 2020 tot 40.000 exabyte
Het merendeel van die informatie bestaat uit bewakingsbeelden
We uploaden 60 uur video per minuut bij Youtube
Er worden dagelijks  vier miljard Youtube-films bekeken door 800 miljoen gebruikers
1 miljard FaceBook -gebruikers die dagelijks 3,2 miljard likes en comments uitdelen en 300 miljoen foto’s uploaden
Google Voice krijgt per dag tien jaar aan spraakherkenningsopdrachten te verwerken
Er worden ruim 400 miljoen tweets per dag verstuurd
In 2020 zijn er 24 miljard apparaten met een internet-verbinding
de hoeveelheid medische informatie
verdubbelt elke vijf jaar
Groot-Brittannië telt 1,85 miljoen bewakingscamera’s
Er staan meer dan 2.000 camera’s langs Nederlandse snelwegen
Nederlandse politie tapte in 2011 3.331 IP-verbindingen af, een verdubbeling van 2010
In 2016 worden er jaarlijks 1,5 miljard smartphones verkocht (nu ca. 400-500 miljoen)

Supercomputer Watson: de voorzijde (links, in het paars) en de achterzijde (rechts)Supercomputer Watson: de voorzijde (links, in het paars) en de achterzijde (rechts)

 

IBM’s supercomputer Watson versloeg de mens in spelshow Jeopardy!, begin 2011. Maar nu komt het echte werk: Watson gaat artsen,  banken en winkelketens helpen met de analyse van grote hoeveelheden data. Het begin van een nieuw digitaal tijdperk, denkt IBM.

Mocht er voor de volgende James Bond-film nog een spectaculaire locatie nodig zijn, dan is IBM’s hoofdlaboratorium in het Amerikaanse Yorktown Heights een goede optie. Alsof er net een gigantische vliegende schotel geland is in de bossen langs de Hudson-rivier. Binnen, in een stampend datacentrum, staat supercomputer Watson die vorig jaar de populaire Amerikaanse spelshow Jeopardy! won van de twee beste menselijke kandidaten. Net zo’n historische overwinning als de IBM-computer die in 1997 grootmeester Kasparov versloeg in een schaaktoernooi. Voor een supercomputer oogt Watson bescheiden: 90 snelle servers met een paars lampje erop – voor het dramatische effect. Aan de achterkant hangt de gebruikelijke kabelspaghetti. De echte kracht van Watson, legt IBM-onderzoeker Eric Brown uit, zit ’m in de software die natuurlijke taal begrijpt en kan leren van eerdere vragen. „Het is een combinatie van technologieën waar we al tientallen jaren aan werken.”

IBM's T.J. Watson Research Lab in Yorktown Height, New York.IBM's T.J. Watson Research Lab in Yorktown Height, New York.

Lees de volledige artikelen over IBM’s onderzoekslab en de groeiende belangstelling voor Big Data in NRC Handelsblad van zaterdag 15 december (alleen voor abonnees)

 

    • Marc Hijink