Auto op Street View voorspelt stemgedrag en inkomen Amerikaan

Demografische data

Aan de auto van een Amerikaan valt van alles af te lezen. Dat blijkt uit beeldanalyse van geparkeerde auto’s via Google Street View.

Uit beelden van geparkeerde auto’s kan stemgedrag afgeleid worden. Google Street View

Dat auto’s in een straat of woonwijk iets over de bewoners vertellen, ligt voor de hand. Amerikaanse IT-specialisten gaan nu een paar stappen verder. Zij zeggen dat ze uit de geparkeerde auto’s op opnamen van Google Street View (GSV) het opleidingsniveau, het gemiddelde inkomen, de etniciteit én het stemgedrag van buurtbewoners kunnen afleiden. Ze gebruiken hiervoor een algoritme dat op straatbeelden auto’s kan identificeren naar merk, type en bouwjaar. De onderzoekers schrijven dit woensdag in het wetenschappelijke tijdschrift PNAS.

Beleidsmakers in de VS zijn voor demografische gegevens nu aangewezen op enquêtes van het American Community Survey (ACS). Dat produceert jaarlijks bevolkingsstatistieken over steden en districten met meer dan 65.000 inwoners. Dat is een tijdrovende en kostbare affaire en gegevens over dunner bevolkte gebieden lopen vaak jaren achter. De auteurs van het PNAS-artikel suggereren daarom om de ACS-data aan te vullen met data die kunnen worden ontleend aan snel beschikbare Google Street View-beelden.

Lees hier over wat auto’s in Nederland vertellen over een wijk

In de VS beschikt meer dan 90 procent van de huishoudens over een auto en die voertuigen vertonen grote verschillen. In de Amerikaanse cultuur, schrijven de onderzoekers, „maakt een auto de man”. Met toestemming van Google gebruikten zij vijftig miljoen straatbeelden uit tweehonderd steden. Daarop lieten zij een zelflerend algoritme auto’s identificeren. Dat leverde beelden op van 22 miljoen auto’s, door het algoritme geclassificeerd in 2.657 verschillende categorieën. Dat zijn bijna alle merken en typen die sinds 1990 zijn verkocht in de VS.

De onderzoekers rangschikten de beelden naar postcode en district (county) en verdeelden de data in twee delen: alle districten waarvan de naam begon met een A,B of C en alle districten met beginletters van D t/m Z. Door de beelden uit A, B en C te combineren met cijfers van ACS ontwikkelden zij een model voor het verband tussen typen auto aan de ene en sociaaleconomisch profiel en stemgedrag aan de andere kant. Dat model gebruikten ze vervolgens om aan de hand van de beelden in het tweede dataset (D t/M Z) sociaal-economische profielen en stemgedrag te voorspellen. Die voorspellingen bleken voor zo’n 85 procent betrouwbaar.

Een aantal regelmatigheden springt eruit. Buurten waar pick-uptrucks domineren, stemmen Republikeins en wijken met Sedans kiezen Democratisch. Amerikanen van Aziatische afkomst hebben een voorkeur voor Aziatische merken. In ‘witte’ wijken zie je Volkswagens en Aston Martins en in Afro-Amerikaanse wijken domineren merken als Chrysler, en Buick.

    • Dirk Vlasblom