Zeg me wat u tweet en ik weet hoe dik u bent

Amerikanen tweeten vooral over pizza, als het om eten gaat.

Hoeveel calorieën gaan er in de 140 lettertekens van een twitterbericht? Amerikaanse onderzoekers van de University of Vermont hebben een computerprogramma gemaakt dat gedrag en gezondheid van de bevolking kan meten aan de hand van berichten op sociale media. Ze publiceerden het resultaat van metingen met hun zogeheten Lexicocalorimeter in het wetenschappelijke tijdschrift PLOS ONE

In alle Amerikaanse tweets zorgde het woord ‘pizza’ voor de meeste calorieën. Alleen in de staten Mississippi en Wyoming stonden respectievelijk ‘roomijs’ en ‘koekjes’ bovenaan de lijst, maar ook daar stond ‘pizza’ hoog in de ranglijsten. Aan de uitgavenkant (calorieën verbranden) stond overal de activiteiten ‘televisie of film kijken’ bovenaan de ranglijsten.

Amerikaan kijkt naar Superbowl op televisie. @

50 miljoen geotagged tweets

Voor de studie gebruikten de onderzoekers een selectie van 50 miljoen tweets die in 2011 en 2012 vanuit de VS werden verzonden. Met ‘geotags’ konden ze bepalen uit welke staat de berichten afkomstig waren. Het computerprogramma speurde in de tweets naar woorden die iets zouden kunnen zeggen over calorie-inname of calorie-verbruik. Aan ieder van de duizenden trefwoorden hingen de onderzoekers een getal voor de mate van energie-inname of -verbruik.

In vrijwel alle staten is pizza het meest getwitterde voedsel als caloriebron (maar let op Mississippi) en overal is tv- of filmkijken de meest getwitterde activiteit. Illustratie PLOS ONE

Door vervolgens ranglijsten per staat te maken met caloriewoorden die het meest afweken van het Amerikaanse gemiddelde konden de onderzoekers een beeld te krijgen van de verschillen binnen de Verenigde Staten. Per staat konden zij beoordelen of veel eten samenging met veel bewegen. De gegevens van de Lexicocalorimeter staat op een openbaar toegankelijke dashboard weergegeven. Inwoners van Colorado komen het gunstigst uit de bus, die van Mississippi het slechtst.

Beperkingen van het onderzoek

Een leuk tooltje, maar wat zegt het nu eigenlijk? De onderzoekers schrijven zelf al dat tweets natuurlijk geen betrouwbare weergave zijn van iemands persoonlijke dagelijkse menu en activiteiten. En in de verzameling waarmee het onderzoek is uitgevoerd zitten ook berichten van bedrijven of instellingen, wat natuurlijk niets zegt over persoonlijke leefstijl. Bovendien is het een select deel van de bevolking dat twittert; voornamelijk jongeren in stedelijke omgeving.

De meest significante afwijkingen van het pizza- en tv-kijkenpatroon, per staat. Illustratie PLOS ONE

En er zitten meer addertjes onder het gras. Sommige woorden die als indicator werden gebruikt zijn dubbelzinnig. De onderzoekers noemen daarbij zelf al het werkwoord ‘run’ – opgevat als de activiteit hardlopen, maar tegelijk is dit in de Oxford English Dictionary het werkwoord met de meeste betekenissen – zoals met een mes doorsteken (run through) of ‘termijn’ (in the long run)

Aardige indicatie

Ondanks deze beperkingen levert de analyse toch wel zinnige informatie op, menen de Amerikaanse onderzoekers. Ze vergeleken de met de Lexicocalorimeter berekende calorieratio (inname gedeeld door verbruik) met bekende gezondheidsstatistieken, zoals overgewicht, diabetes, bloeddruk en levensverwachting. Daaruit bleek dat de Lexicocalorimeter in ieder geval een aardige indicatie geeft van de gezondheidstoestand van de bevolking per staat.

De onderzoekers hopen dat de Lexicocalorimeter kan uitgroeien tot een waardevolle aanvulling op bestaande epidemiologische gegevens. Het voordeel van de methode is dat hij ook realtime kan worden gebruikt. Soortgelijke experimenten zijn ook eerder gedaan met het in kaart brengen van lokale ziekte-uitbraken, waaruit bleek dat infectiehaarden met digitale data-analyse sneller zijn op te sporen dan via het gangbare epidemiologische netwerk van artsen.

De algoritmen van de Lexicocalorimeter zijn ook toepasbaar op andere interessegebieden. Inmiddels is er al een Hedonometer (die kijkt hoe gelukkig mensen zijn op basis van hun tweets) en de onderzoekers hebben plannen voor een Insomniameter om slaapproblemen in kaart te brengen en een Hangovermeter die informatie kan geven over alcoholmisbruik.