Deze stagiair bedacht het in 2013 meest gelezen stuk van The New York Times

De quiz op de site van The New York Times. Screenshot nytimes.com

Het meest gelezen artikel van The New York Times uit 2013 gaat niet over de aanslagen op de Boston Marathon, de nieuwe paus of de shutdown in Amerika. Het komt van een datastagiair en is geen artikel maar een quiz. Universiteitsblog Knight Lab sprak met de stagiair over ‘zijn’ hit.

Josh Katz besloot tijdens zijn studie aan de universiteit van North Carolina tien jaar oude data over dialecten, verzameld door Harvard-onderzoekers, wat nader te bestuderen en in zogenaamde heat maps (Wiki, Engels) te verwerken. Zo werd duidelijk welk Engels dialect waar in Amerika het vaakst voorkwam.

Ontdekt door grafische redactie van The New York Times

Hij publiceerde de kaarten op de website van zijn universiteit en op Rstudio.com. In augustus vorig jaar ontdekte de grafische redactie van The New York Times zijn kaarten en nodigde hem uit om stage te komen lopen op de redactie in New York City.

Katz was tevreden met de data, maar wilde deze graag actualiseren. Hij zette de 120 originele vragen uit het Harvard-onderzoek samen met twintig aanvullende vragen op Rstudio.com voor feedback. Daar rolde een twintigtal vragen uit, waar hij vijf specifieke vragen - over geslacht, leeftijd - aan toevoegde.

Met alle informatie op zak werd de quiz, zoals deze te vinden is op de site van The New York Times, gebouwd. Na een serie van 25 vragen krijg je drie steden te zien waarvan de kans het grootste is dat ze hetzelfde dialect spreken als jij.

Binnen tien dagen nummer één

Opvallend genoeg was de quiz bijna niet op de site terechtgekomen. Katz had over zijn plan verteld aan een enthousiaste groep redacteuren aan het begin van zijn stage, maar in midden-december stond het nog altijd niet online. Op 21 december werd het alsnog gepubliceerd en op 31 december was het ’t meest gelezen stuk van 2013 geworden.

Katz over zijn publicatie:

“Doordat ik het project op internet zette kreeg ik heel snel veel reacties en suggesties om het onderzoek te verbeteren. Dat was erg fijn werken. Ik ben enorm verrast door het succes van het artikel. Al snap ik wel waar het door komt. Dialect gaat over de identiteit van mensen en dat is heel interessant.”

Het meest intrigerende aan het geheel is misschien wel dat de quiz maar tien dagen nodig heeft gehad om het meest gelezen artikel van 2013 te worden. Technologieredacteur Robinson Meyer van The Atlantic schrijft:

“Een stukje software over het nieuws dat is gemaakt door ontwikkelaars van de krant zelf genereerde meer ‘clicks’ dan elk ander artikel. [...] Dat is ongelofelijk.”

Inmiddels zit de stage van Katz erop. Of het dankzij zijn artikel komt is niet duidelijk, maar hij mag blijven bij de krant. Hij gaat meewerken aan een nieuw data-project.

The Atlantic maakte mede op basis van de kaarten van Katz de volgende video: