Boeven vangen met een zoekmachine

Fraudeurs en misdadigers worden steeds professioneler. Alleen computers komen er nog uit.

In bioscoopfilms en goedkope televisieseries wordt het al lang vertoond. De speurder zit achter de computer en typt op zijn toetsenbord de naam van een verdacht individu in. Enkele ogenblikken later wordt zijn gezicht zwak verlicht door de gegevens waarmee het scherm zich vult. Adres, geboortedatum, levensloop, inkomen, strafblad, connecties, affaires, hobby's - alles is te zien. Als een paar van zijn dubieuze connecties op dezelfde manier zijn nageplozen is het verder een kwestie van een slim verhoor, wat auto's achtervolgen en een paar welgemikte pistoolschoten.

Fictie, maar daar komt verandering in. Op verschillende plaatsen wordt gewerkt aan programma's en apparatuur voor misdaadanalyse. Het zijn hulpmiddelen om in uiteenlopende gegevens interessante samenhangen op het spoor te komen. De georganiseerde misdaad vraagt er als het ware om, maar ook bij een groot rechercheonderzoek naar aanleiding van een gewone moord is het belangrijkste probleem het beheersen van de informatiestroom. Uitgetypte verhoren, getuigenverklaringen, resultaten van huiszoekingen en buurtonderzoeken, laboratoriumanalyses en in beslag genomen documenten voegen zich in de loop van het onderzoek bij de gegevens die de politie al in haar dossiers heeft. Als er op drie verschillende plaatsen sprake is van een man met een grijze jas en een dito hoed kan dat een belangrijke aanwijzing zijn, maar je moet wel net het geluk hebben dat je oog erop valt.

Computerprogramma's weten daar wel raad op. Het is een koud kunstje om een computer in duizenden rapporten en documenten te laten uitzoeken of er op nog meer plaatsen een grijze hoed is genoemd.

Een vroeg voorbeeld van zo'n programma is het in Groot Brittannie ontwikkelde Holmes (wat zogenaamd staat voor Home Office Large Major Enquiry System). In Nederland hebben de grote Zuid-Hollandse politiekorpsen samen met het softwarehuis Cap Gemini Pandata een soortgelijk programma ontwikkeld. Het heet Octopus en het wordt op dit moment al in Den Haag toegepast. Rotterdam en Dordrecht zullen spoedig volgen. Het programma voorziet in de mogelijkheid om in de toekomst ook met beeldmateriaal om te gaan: vingerafdrukken en foto's kunnen dan ook naar het scherm worden geroepen.

Crimineel netwerk

Toch kan ook de beste zoekmachine onoverzichtelijke resulaten opleveren als de output te omvangrijk wordt. Professionele speurders werken daarom vaak met diagrammen waarop met pijlen, strepen, cirkels en vierkanten een crimineel netwerk inzichtelijk wordt gemaakt. Ook hier leveren nieuwe gegevens veel problemen op. Een paar lijnen erbij zijn nog wel aan te brengen, maar als het er meer worden, treedt al spoedig chaos in. Overtekenen is dan het enige dat er op zit, maar dat kost tijd en geld. De Intelligence Analyst Workbench (IAW), een programma van het Britse concern ICL, kan daar iets aan doen. Het is een hardware-software combinatie die van uiteenlopende gegevens keurige diagrammen maakt. Een SUN-werkstation met zeer gedetailleerde scherm is aangesloten op verschillende gegevensbestanden: kentekenregistraties, bevolkingsregister, politiedossiers, etc. Ook een Holmes- of Octopus-bestand kan een bron zijn. Het zoeken begint met het intypen van de naam van een verdachte. Het adres wordt geleverd, strafbladnoteringen volgen, etc. Dan kunnen aan het systeem allerlei vragen worden gesteld: wie woont er nog meer op dat adres? wie hebben er gewoond? waar werkt de verdachte? welke mensen met een strafblad werken daar nog meer? welke auto hoort bij hem? is er wel eens iemand anders in die auto aangetroffen? waar woont die? etc. De workbench graaft in de databestanden en beeldt gevonden relaties en contacten op het scherm volgens een gestandaardiseerd systeem af. Een persoon wordt weergegeven met een cirkel, een organisatie door een rechthoek met afgeronde hoeken, een adres door een rechthoek met scherpe hoeken. Relaties zijn lijnen, vermoedelijke relaties stippellijnen.

Een andere afbeeldingstechniek wordt ook wel gebruikt: de matrix. Het plaatje is te vergelijken met een kilometertabel. Personen en activiteiten (als "drugshandel' of "fraude') nemen de plaats in van de steden en op de kruispunten wordt met een cijfer aangegeven of er een relatie bestaat. Optellen van de kolommen geeft een waarde voor elk individu.

Indepol

Een ander produkt van ICL is de droom van elke fraudebestrijder: Indepol (van Intelligence Defence and Police) Het is een geavanceerde zoekmachine voor het opsporen van financiële malversaties. Het systeem is vooral bedoeld om in te zetten bij een bedrijf dat van fraude wordt verdacht, maar het is ook zeer geschikt om in overheidsadministraties uitkeringsfraudeurs op te sporen. Een koppeling van de bestanden van ziekenfondsen, loonbelasting en uitkeringsinstanties kan heel vruchtbaar zijn, maar bij dergelijke toepassingen spelen privacybepalingen natuurlijk een beperkende rol. In Nederland bijvoorbeeld is het in het algemeen niet toegestaan verschillende bestanden in zijn geheel "tegen elkaar uit te draaien' en te zien wat er aan verdachte gevallen op de zeef blijven liggen. Dergelijke zoekacties gaan per individu en vereisen de medewerking van alle instanties.

Indepol kan gegevens uit allerlei bronnen aan: databases van velerlei soort, tekstbestanden en andere ongestructureerde gegevens. Ook documenten die alleen op papier bestaan kunnen worden ingevoerd, zoals kranteberichten. Ze worden dan gescand en door een letterherkenningsprogramma gehaald. Als het om Japanse of Arabische letters gaat worden ze met een paar annotaties als grafisch document opgeslagen.

Jokers

Als de invoerfase achter de rug is kan het zoeken beginnen. Het programma accepteert zoekcommando's die een beetje op gewone taal lijken. Namen kunnen met wild cards en "jokers' worden ingevoerd. Zo geeft J?nsen alles over Jensen en Jansen, en als de gebruiker Vand/veld/ intypt komen Van de Velde, Van der Velde en Van den Velde uit de computer rollen, en ook alle varianten met Veld en Velden. Erg handig als gezocht wordt naar het soms op professionele leest geschoeide meervoudig aanvragen van uitkeringen. Als alle Veldes uit dit voorbeeld op hetzelfde adres blijken te wonen en bovendien dezelfde geboortedatum hebben, dan gaat er bij de ervaren speurneus een lampje branden.

Indepol kan ook werken met incomplete en vage gegevens. Het programma kan zoeken naar een auto die zeker een gele Ford is en die waarschijnlijk een B en een V en misschien ook een W in zijn kenteken heeft. Ook kan je het programma naar een persoon laten zoeken die in ieder geval aan drie van de volgende vier voorwaarden voldoet: hij spreekt Frans, hij is ouder dan 30, hij heeft meer dan vijf dienstjaren en heeft een functie boven het niveau van sales manager. Het programma is ook goed in getallen. "Vijftigduizend gulden' zal altijd worden teruggevonden, of het nu in cijfers, in letters, met een f, een ƒ , met fl of met gld. is geschreven.

Dergelijk zoekopdrachten zijn ook wel met een gewoon programma voor het beheer van gegevensbestanden mogelijk (Dbase IV bijvoorbeeld), maar dan moeten er vreselijk ingewikkelde commando's worden gegeven, met vele IF-statements. Bovendien duurt het zoeken gauw tientallen minuten, want in vaak zal de database een aantal keren achter elkaar doorzocht moeten worden. Indepol werkt met een systeem (CAFS geheten) dat het mogelijk maakt in een keer te zoeken en met de snelheid waarmee een disk kan worden gelezen - de hoogst mogelijk dus.

Het programma is al enige keren met veel succes ingezet in Australië. Tot dan toe verhinderde de daar geldende verjaringstermijn (zes jaar) voor fraudegevallen een effectieve aanpak. Indepol heeft daar tot schrik van de georganiseerde misdaad een flinke bres in geslagen.

In Nederland is het programma nog niet ingezet. Het zou wel iets voor de "Actie schoon schip' zijn waar kamerlid Vermeend gisteren in de Tweede Kamer op aandrong. Naar zijn schatting gaat de fiscus jaarlijks voor 20 miljard gulden aan premies en belastingen de neus voorbij. Voor een fractie van dat geld kun je een heel mooi zoeksysteem installeren.

Tekening: Diagram zoals dat door het IAW-systeem kan worden geproduceerd. Een cirkel is een persoon, een rechthoek een adres en een rechthoek met ronde hoeken een organisatie.