Vanuit de datamijn de misdaad voorspellen

In de ene wijk werkt de inbreker met een koevoet. Verderop is de glassnijder actief als het niet regent. Politieagenten worden data-analisten.

De criminaliteitsverwachting voor morgen. In het westen van de stad toenemende kans op inbraken na acht uur ’s avonds, onrust bij het station na middernacht.

Op het kaartje hangt de misdaadverwachting in gekleurde wolkjes boven de stad: rood voor veel, geel voor een beetje. De wolkjes zijn berekend door het computerprogramma DataDetective, op basis van het aantal misdrijven in hetzelfde seizoen vorig jaar – de trends in de afgelopen maanden, per uur en dag in de week en afhankelijk van het weer. DataDetective calculeert: vroeger donker? Dan zijn dieven eerder actief. Zaterdagnacht? Meer vandalisme in de binnenstad. Tenzij het plenst.

Harry Oerlemans, analist van politiekorps Midden en West Brabant, werkt met het programma. Hij en zijn collega’s hadden afgelopen zomer al uitgerekend wat ze in november in Tilburg aan overvallen en inbraken konden verwachten.

„Als we op dinsdagavonden tussen 6 en 11 een piek verwachten in een bepaalde wijk, gaan er extra agenten heen om te surveilleren of om de weg af te sluiten”, zegt Oerlemans. Ook geeft hij op basis van trends de agenten op straat tips mee: let in die straten op inbraken via het wc-raampje. In dat winkelgebied zijn straatroven, ga er dus met de fiets heen, zodat je er snel bij bent. Vorige week heeft het korps besloten om de verwachtingen voor straatroof en overvallen in de hele regio uit te rekenen.

Zeven mensen in het korps kunnen met het programma overweg, achttien agenten gaan met de gegevens op pad. Zij krijgen, vertelt een agent die eropuit wordt gestuurd, de voorspelkaartjes te zien en horen op welke kenmerken ze moeten letten.

Beetje bij beetje doet de politie slimmere dingen met de stapels gegevens die ze heeft. Wereldwijd experimenteren korpsen met predictive analysis of crime forecasting: het voorspellen van misdaadtrends om personeel gerichter in te kunnen zetten. In het Amerikaanse Richmond en Memphis stuurt de politie al agenten op pad aan de hand van statistische trendkaarten. New York heeft een Real Time Crime Center opgezet dat forecasting-technieken gebruikt, in Groot-Brittannië en Canada investeren bedrijven in statistische programma’s als Daily Crime Forecast.

Data-analyse is niet nieuw, de politie heeft al langer analisten die met statistische programma’s als SPSS Modeler patronen blootleggen in belgedrag of betaalverkeer. Wat er wel nieuw is aan crime forecasting is dat de gewone agent er zelf mee aan de slag kan, en niet enkel een handjevol rechercheurs.

„Zelfs de politie van Ghana heeft interesse”, zegt Rob van der Veer in zijn kantoor in Amsterdam. Hij is directeur van IT-bedrijf Sentient, dat DataDetective heeft gebouwd. Sentient levert ook dataminingsoftware aan banken en verzekeraars. Het bedrijf bouwt de software, de politie beheert de gegevens en bepaalt wie ermee mag werken. De korpsen Brabant-Noord, Amsterdam-Amstelland en Midden en West Brabant hebben DataDetective in gebruik. Begin volgend jaar, verwacht Van der Veer, besluit de politie of ze DataDetective in alle korpsen invoert.

Van der Veer laat zien hoe DataDetective handige ‘hotspotkaarten’ maakt, waarop meteen te zien is waar in de stad de meeste auto’s zijn gestolen. Hij toont ‘clusterkaarten’ waarop de huizen die met een koevoet zijn opengebroken in een ander groepje zijn gezet dan de huizen die met een glassnijder zijn bewerkt. „Dat is waarschijnlijk niet dezelfde dief.”

In het ideale geval maakt iedereen op het bureau analyses en trendkaartjes, krijgen agenten op straat ze op hun mobieltjes mee en hangen op alle bureaus schermen met actuele criminaliteitsverwachtingen. Die tijd is nog ver weg.

Belangrijk obstakel is dat iedereen de gegevens netjes moet invoeren. Want: een auto kun je ook een wagen of voertuig noemen. Die verschillende schrijfwijzen zitten in de weg als je auto-inbraken analyseert. Ook zijn trends bij kleine aantallen niet zo betrouwbaar. En als crime forecasting goed werkt, daalt de eerder voorspelde misdaad. Controleren of de voorspelling klopte is moeilijk.

Werkt DataDetective in de praktijk? Ja, zegt analist Oerlemans. Hij stuurt cijfers op van het ‘zomeroffensief’ in Tilburg, waarvoor hij de trends in diefstal en overvallen al eerder voorspelde. Na extra inzet van agenten daalden roof en overvallen met bijna de helft, inbraak een beetje. Dat was een trendbreuk.

Dat is voor een deel aan de software toe te schrijven, zegt Oerlemans. „Het gaat niet alleen om voorspellen. Het helpt met richten op één thema. Je gaat agenten gerichter inzetten, de gegevens beter bijhouden, je aanpak veranderen als er nieuwe informatie is. En je kunt wijkagenten en beveiligers beter aansturen als je goed kunt laten zien wat er aan de hand is.”

Oerlemans zou het liefst ook de verwachtingen voor de volgende dag uitrekenen. Dan telt het actuele weer mee, en dat maakt uit voor vandalisme of straatroof. DataDetective kan dat, maar het korps heeft nog niet genoeg data verzameld om het programma erop af te stemmen.

Amsterdam-Amstelland gebruikt DataDetective én SPSS Modeler. Analist Hedda Roos traint haar collega’s in het gebruik van DataDetective. Ze gebruikt het vooral voor het maken van trendrapporten, ze stuurt er geen mensen mee aan. Ze vindt dat de verwachtingen te hoog zijn. Iedereen begint over de film Minority Report, waarin met waarzeggers de misdaad preventief wordt bestreden, zegt ze. „Alsof je er een misdrijf mee kunt voorspellen!” En voor veel mensen, merkt ze, is zelfs dit programma nog te moeilijk.

Maar mondjesmaat, ziet ze, gaan agenten die ermee werken wel slimmere vragen stellen aan het programma. Ze willen niet alleen weten waar en wanneer het druk wordt, ook wat er gebeurt en hoe.

Want dat kan de agent ook in DataDetective: naar verbanden speuren om te begrijpen waarom er misdaad is. Voorbeeld: een agent merkt op dat er in april en mei meer voertuigen zijn gestolen. Zijn er een nieuwe autodieven? Nee, het programma vindt opvallend vaak het woord ‘motorfiets’ in de aangiftes, vergeleken met de periode daarvoor. In mei haalt iedereen z’n motor weer van stal. Die worden dan vaker gestolen.

Of agenten willen weten of bepaalde inbraken door dezelfde persoon zijn gedaan. Dan voeren ze de kenmerken in en vergelijken ze die met andere inbraken. Lijken ze op elkaar in buit, gereedschap, toetakeling van de inboedel? Wie waren toen de verdachten en welke van hen zouden het nu gedaan kunnen hebben?

Er is wel een groot gevaar: dat agenten de gevonden verbanden verkeerd interpreteren. Huiselijk geweld wordt pas sinds kort goed geregistreerd: natuurlijk vindt het programma dan een stijging. En het vond een correlatie tussen ramadan en vandalisme. Maar ramadan, zo bleek, viel in die jaren in het najaar, als er ook veel vuurwerkvandalisme is.

Voor Van der Veer van Sentient is het gevaar van verkeerd interpreteren geen tegenargument: „DataDetective kan trends en verbanden opsporen. Maar de agent moet die zelf goed interpreteren en blijven nadenken.” Het programma helpt er zelfs bij. Bij de link tussen ramadan en vandalisme kan DataDetective vaststellen dat de woorden ‘rotjes’ en ‘strijkers’ vaker in aangiftes staan.

Concurrent IBM van het geavanceerde SPSS Modeler ziet ook wel wat in gebruiksvriendelijkere data-analyse voor de politie. Het bedrijf wil het programma uitbreiden naar makkelijk leesbare trend-en hotspotkaarten. „Datamining neemt een wereldwijde vlucht”, zegt een consultant. „Het gaat weg uit het hoekje van de analist, naar de politieman op straat. Er zijn zoveel gegevens, die worden zo weinig gebruikt.”