Een mooie theorie hoeft in de wetenschap niet meer

Na de terugkeer van religie en geschiedenis, waarvan het verdwijnen veelvuldig werd voorspeld, naakt nu het einde van de klassieke theorievorming in de wetenschap.

En weer is het einde van een verschijnsel voorspeld. Na het einde van de geschiedenis, van religie, van olie, natuurlijk voedsel en de wereld in het algemeen, om maar enkele met veel ophef aangekondigde eindes te noemen, is nu the end of theory op komst, het einde van de theorievorming in de wetenschap.

Want door de enorme hoeveelheden data die tegenwoordig kunnen worden opgeslagen en systematisch doorzocht, zal de wetenschapspraktijk zoals we die nu kennen volledig van karakter veranderen. Voor het toetsen van theorieën is dan geen plaats of noodzaak meer, betoogt de bekende Amerikaanse wetenschaps- en internetjournalist Chris Anderson in het jongste nummer van technologieblad Wired.

Anderson verwierf wereldwijde bekendheid met een eerdere cultuuromslag die hij weliswaar niet had voorspeld, maar wel als eerste beschreef. In zijn boek The Long Tail: Why the Future of Business is Selling Less of More (2006) legde hij uit dat veel commerciële ondernemingen zich niet langer louter hoeven te richten op de populairste producten in de markt: dankzij de dalende productie- en vervoerskosten kunnen ze soms meer geld verdienen met nicheproducten; zie de webboekhandel Amazon die ook heel veel minder gangbare boeken verkoopt. Het begrip ‘Long Tail’ – als je alle verschillende producten in volgorde van hoogste omzet langs een horizontale as uitzet en de omzet op de verticale as, heeft die grafiek een lange staart – is inmiddels een gevleugelde term. De nieuwe ommezwaai die Anderson nu signaleert, lijkt minder bijval te krijgen, maar heeft wel al veel interessante reacties opgeroepen van bekende onderzoekers uit diverse wetenschappen, die volhouden dat theorievorming essentieel is voor de voortgang van de wetenschap.

Wat bedoelt Anderson dan? Wat onderzoekers tot nu toe altijd hebben gedaan, zegt hij, is: eerst een hypothese formuleren, een model hoe de wereld in elkaar zit, dat model vervolgens toetsen en het dan zonodig aanpassen of vervangen door een beter model. Maar dankzij moderne technieken bestaat tegenwoordig de mogelijkheid om een zo omvangrijke, voor een mens niet te bevatten hoeveelheid gegevens op te slaan (en dat gebeurt ook), dat een nieuwe benadering volgens Anderson gewenst is. Eerst zouden onderzoekers wiskundige analyses op de data moeten loslaten, meent hij, en daar vervolgens pas een passende context bij zoeken. Theorieën en modellen zijn dan niet meer nodig, en dat komt goed uit, want modellen kloppen toch per definitie niet; het zijn tenslotte benaderingen.

Een voorbeeld is de moderne erfelijkheidsleer, aldus Anderson. Wat we vroeger op school hebben geleerd over ‘dominante’ en ‘recessieve’ genen blijkt bij nader inzien een enorme simplificatie van de biologische werkelijkheid te zijn. Dat is dan ook oude wetenschap.

Vervolg theorie: pagina 8

Welkom in de tijd van de ‘petabytes’

Nieuwe wetenschap is het op grote schaal ontcijferen van het DNA van planten, dieren en hele ecosystemen om daarna betekenisvolle patronen in de verkregen data te ontdekken. Volgens Anderson is de theoretische natuurkunde, met name de deeltjesfysica, in crisis geraakt, omdat er oude wetenschap wordt bedreven.

Het is veel te duur geworden om goede experimenten te ontwerpen om de hypothesen uit het Standaard Model te falsifiëren. En dat model zal hoe dan ook weer een simplificatie van de werkelijkheid blijken – dus is de natuurkunde nu op de verkeerde weg.

Op de goede weg zijn mensen die conflicten proberen te voorspellen op basis van patronen in een wereldwijde informatiestroom van nieuwsberichten, of epidemieën op basis van enorme databestanden over gezondheid. Mensen die nieuwe objecten in het universum zoeken met camera’s die jarenlang 3,5 gigapixel per 17 seconden opslaan. Mensen die prijsfluctuaties in vliegtickets ontdekken op basis van gegevens van 1.100 miljard vluchten uit het verleden (en die dan zelf een handeltje beginnen). Kortom, patroonherkenners. Welkom in de Petabyte Age, zoals Anderson het noemt, het tijdperk van de petabytes (één petabyte is een miljoen gigabytes).

Maar of Petabyte Age net zo’n buzz word zal worden als Long Tail? In de wetenschapsfilosofische internetcommunity The Edge (www.edge.org) hebben vooraanstaande wetenschappers al veel kritiek geuit op het idee dat er een heel nieuw soort wetenschap aan het ontstaan is. Internetgoeroe Kevin Kelly is het eens met de gedachte dat enorme databestanden de manier waarop we dingen leren, kunnen veranderen – zoals Google in staat is teksten te vertalen zonder zelf taal te kunnen produceren. Maar volgens hem is de patroonherkenning die daarvoor nodig is – Correlative Analytics, noemt hij het – louter een extra stuk gereedschap in het wetenschappelijke bedrijf. Volgens technisch wetenschapper Daniel Hillis zal de beschikbaarheid van grote gegevensbestanden de wetenschappelijke methode niet principieel veranderen. Het is nu eenmaal niet interessant om alleen te weten dat iets werkt, terwijl je niet weet waarom, zegt computerwetenschapper Jaron Lanier. En, vraagt computerwetenschapper Joseph Traub zich af, waarom denkt Anderson dat wetenschappelijke wetmatigheden minder belangrijk zullen worden? In ‘wetten’ kun je immers heel veel data vangen en kleinkrijgen. Na de geschiedenis en religie zal dus ook de theorie wel weer terugkeren. Andersons volgende boek, dat voor volgend jaar op de agenda staat, gaat in elk geval weer gewoon over marketing en de vraag hoe je als ondernemer geld kunt verdienen door je producten gratis weg te geven. Zoals een krant op internet.