Theorieën zijn zo passé

De wetenschapspraktijk zal volledig veranderen, zegt Chris Anderson van het blad Wired en het boek The Long Tail.

Oorzaak: de enorme bergen data van tegenwoordig.

Er is weer eens een einde voorspeld. Na het einde van de geschiedenis, van religie, van olie, voedsel en de wereld in het algemeen (om maar eens wat eindes te noemen), is nu the end of theory op komst, het einde van de theorievorming in wetenschap.

Door de enorme hoeveelheden data die we tegenwoordig kunnen opslaan en systematisch doorzoeken, zal de wetenschapspraktijk zoals we die nu kennen volledig van karakter veranderen. Voor het toetsen van theorieën is dan geen plaats of noodzaak meer, betoogt de Amerikaanse wetenschaps- en internetjournalist Chris Anderson in het laatste nummer van technologieblad Wired van deze maand.

Anderson verwierf wereldwijde bekendheid met het beschrijven van een eerdere cultuuromslag. In zijn boek The Long Tail: Why the Future of Business is Selling Less of More (2006) legde hij uit dat veel commerciële ondernemingen zich niet langer louter hoeven te richten op de populairste producten in de markt: dankzij de dalende productie- en vervoerskosten kunnen ze soms meer geld verdienen met nicheproducten; zie webboekhandel Amazon die ook heel veel minder gangbare boeken verkoopt.

De nieuwe ommezwaai die Anderson nu in de wetenschap signaleert lijkt minder bijval te krijgen, maar heeft in elk geval al een hoop serieuze reacties opgeroepen van bekende onderzoekers.

Wat wetenschappers tot nu toe altijd hebben gedaan, zegt Anderson, is: eerst een hypothese formuleren, een model van hoe de wereld in elkaar zit, dat model dan toetsen en het eventueel vervangen door een beter model. Maar tegenwoordig bestaat de mogelijkheid om zo’n onbevattelijke hoeveelheid gegevens op te slaan (en dat gebeurt ook), dat een nieuwe benadering is gewenst: eerst wiskundige analyses op de data loslaten en daar vervolgens pas een context bij zoeken. Theorieën en modellen zijn niet meer nodig, en dat komt goed uit, want ze kloppen toch per definitie niet; het zijn benaderingen.

Neem de erfelijkheidsleer, zegt Anderson. Wat we vroeger op school hebben geleerd over dominante en recessieve genen, blijkt nu een enorme simplificatie van de werkelijkheid te zijn waar we in de praktijk weinig meer mee kunnen. Dat is dan ook oude wetenschap. Nieuwe wetenschap is het op grote schaal ontcijferen van het DNA van planten, dieren en hele ecosystemen, om daarna betekenisvolle patronen in de verkregen data te ontdekken. Volgens Anderson is de theoretische natuurkunde, met name de deeltjesfysica, in crisis geraakt omdat er oude wetenschap wordt bedreven. Het is veel te duur geworden om goede experimenten te ontwerpen om de hypothesen uit het Standaard Model te falsifiëren.

Op de goede weg zijn mensen die conflicten proberen te voorspellen op basis van patronen in een wereldwijde informatiestroom van nieuwsberichten, of epidemieën op basis van enorme gezondheidsdatabestanden. Mensen die nieuwe objecten in het universum zoeken met camera’s die jarenlang 3,5 gigapixel per 17 seconden opslaan. Mensen die prijsfluctuaties in vliegtickets ontdekken op basis van gegevens van 1.100 miljard vluchten uit het verleden (en die dan zelf een handeltje beginnen omdat ze kunnen voorspellen wanneer de tickets het goedkoopst zijn).

Kortom, patroonherkenners. Welkom in de Petabyte Age, zoals Anderson het formuleert, het tijdperk van de petabytes (één petabyte is een miljoen gigabytes, oftewel een miljard MB).

Maar of Petabyte Age net zo’n buzz word zal worden als Long Tail? In de wetenschapsfilosofische internetcommunity The Edge (www.edge.org) hebben vooraanstaande wetenschappers al veel kritiek geuit op het idee dat een heel nieuw soort wetenschap aan het ontstaan is.

Internetgoeroe Kevin Kelly is het eens met de gedachte dat enorme databestanden de wijze waarop we leren, kunnen veranderen. Maar volgens hem is het patroon herkennen dat daarvoor nodig is – Correlative Analytics, noemt hij het – louter een extra stuk gereedschap.

Volgens technisch wetenschapper Daniel Hillis hebben wetenschappers altijd al data, observaties dus, als uitgangspunt genomen voor hun verdere onderzoek én theorievorming en zal de beschikbaarheid van grote gegevensbestanden die wetenschappelijke methode niet veranderen. Het is nu eenmaal niet interessant als je alleen maar weet dat iets werkt, terwijl je niet weet waarom, zegt computerwetenschapper Jaron Lanier.

En, vraagt computerwetenschapper Joseph Traub zich af, waarom denkt Anderson dat wetenschappelijke wetmatigheden, die hij met het woord ‘theorie’ aanduidt, in de toekomst minder belangrijk zullen worden? In wetten kun je immers heel veel data vangen.

Een boek over the end of theory zal er voorlopig wel niet komen. Anderson geeft eerst een boek uit over hoe je geld kunt verdienen door producten gratis weg te geven.