Bewijs is geen bewijs

Er is een spoor, er is een verdachte. Om ze aan elkaar te koppelen is vaak het geoefend oog van een forensisch deskundige nodig, maar het wetenschappelijk gehalte laat te wensen over. `Als je strikt in de leer bent, zou je bijna alle bewijs moeten afwijzen'.

STEL: U HEEFT na jaren monogamie een nieuwe partner en besluit voor alle zekerheid een HIV-test te laten doen. De arts komt met het resultaat: helaas, u test positief. Toch zegt de dokter dat u zich nog niet te druk hoeft te maken.

Hoe dat komt? Een goede arts weet wat de betrouwbaarheid is van de test. Van elke duizend niet-geïnfecteerden, zal de test er toch één per abuis als hiv-positief aanwijzen. Nu zijn er heel veel mensen in Nederland nìet met HIV geïnfecteerd. Als u geen heroïne spuit met vuile naalden of neigt naar onbeschermde prostitutie is – na wat rekenwerk – de kans dat u positief test zonder hiv-infectie, aanzienlijk groter dan de kans dat u daadwerkelijk besmet bent.

Een tweede scenario. Op de deur van de plaatselijke bank zijn uw vingerafdrukken aangetroffen, terwijl daar gisteren een overval is gepleegd. Zijn die sporen van u? De dactyloscopist (deskundige in vingerafdrukken) doet een test en meldt vervolgens dat alle kenmerken van uw vinger met het spoor overeenkomen. Het resultaat: die sporen zijn van u.

Het voorbeeld van de HIV-test is van Ton Broeders, naast Leids criminologie-hoogleraar ook chief scientist van het Nederlands Forensisch Instituut (NFI). Het voorbeeld van de dactyloscopist is maar deels van hem, want geen rechercheur zal u van een bankoverval verdenken enkel omdat uw vingerafdrukken gevonden worden. Broeders wil duidelijk maken dat de manier waarop forensische onderzoekers omgaan met identificerende tests, niet de maatstaven volgt van, bijvoorbeeld, de medische wetenschap.

Broeders stond vorige week ook in deze krant. Hij liet zich toen in het Zaterdags Bijvoegsel uit over de relatie tussen de strafrechtjurist en de forensisch onderzoeker in de Schiedamse parkmoord. Wat onbesproken bleef, is de mate waarin het forensisch bewijs, en dan met name het bewijs dat een spoor aan een verdachte koppelt, zèlf voor twijfel vatbaar is.

ophef

Broeders besprak die vraag in 2003 in zijn proefschrift, maar ook in buitenlandse wetenschappelijke kringen is er ophef. Vorige maand schreven de Amerikaanse rechtspsychologen Michael Saks en Jonathan Koehler in Science een zeer kritisch review-artikel over de `komende paradigma-shift in het forensisch identificatie-onderzoek'. Dat onderzoek moet volgens hen nog altijd de stap maken van een voorwetenschappelijk stadium naar een empirisch gefundeerd onderzoeksgebied. Waarbij Saks meteen opmerkt dat er al mensen onterecht veroordeeld zijn.

Wat is er aan de hand? Forensisch onderzoekers staan, wetenschappelijk gezien, voor een bijzondere taak. Ze worden niet geacht uitspraken te doen over groepen bankovervallers, maar over één enkele. Welk speeksel hoort bij hem of haar? Welke vingerafdruk? Welke stem? Welke lichaamsgeur? Welk handschrift? Om die vraag te kunnen beantwoorden, doet de forensisch onderzoeker een belangrijke aanname: elke persoon is uniek, of tenminste zodanig uniek dat een opvallend kenmerk geen toeval kan zijn.

Volgens Saks is die aanname onterecht. Hij schrijft dat de onderscheidbare uniciteit geen theoretische of empirische basis heeft. Om er ironisch aan toe te voegen dat dat belangrijke praktische voordelen heeft voor de traditionele forensische wetenschap. `Er hoeven geen metingen aan sporenkenmerken verricht te worden, er hoeft niet geteld te worden hoe vaak bepaalde kenmerken in de bevolking voorkomen (...) er hoeft niet gerekend en uitgelegd te worden wat de kans is dat twee verschillende sporen op het oog toch dezelfde kenmerken hebben.'

Broeders legt uit: ``Ik wil best aannemen dat niemand precies uw handschrift heeft, maar daarmee zijn we er niet. Belangrijk is dat we niet weten of een tekst die niet van u is, in een test toch aan u kan worden toegschreven.'' Hetzelfde geldt voor vingerafdrukken, oorafdrukken, lichaamsgeur. Broeders: ``Er is nooit veel aandacht geweest voor deze vraag: hoeveel informatie hebben we nodig om die verschillen tussen oren, vingers etcetera in de praktijk te onderscheiden? De overheid had er geen belang bij om eraan te beginnen, en wetenschappers hadden geen behoefte om zich met politiewerk bezig te houden.''

Broeders is niet zo fel als de Amerikaan Saks. Hij zegt wel: ``Als je strikt in de leer bent, moet je bijna alle identificatiebewijs gaan afwijzen.'' Om daar meteen aan toe te voegen: ``Maar het is ook niet zo dat dat bewijs in overwegende mate niet klopt. Er zijn mij in Nederland geen zaken bekend waarin mensen onterecht veroordeeld zijn omdat de forensische identificatie verkeerd is uitgevoerd.''

Dat wil niet zeggen dat het niet fout kan gaan. In het buitenland is dat onder meer bij vingerafdrukken al gebleken, zoals in de zaak Brandon Mayfield. Deze advocaat uit de Amerikaanse staat Oregon werd vorig jaar mei gearresteerd wegens betrokkenheid bij de terroristische aanslagen in Madrid, eerder dat jaar. Twee Amerikaanse laboratoria, waaronder dat van de FBI, hadden zijn vingerafdrukken herkend in sporen op een plastic zak met springstofontstekers, die met de aanslagen in verband waren gebracht. Twee weken zat Mayfield in voorarrest, tot hij werd vrijgelaten omdat een Spaans laboratorium tot een heel andere conclusie was gekomen.

kritiek

Rechtspsycholoog Peter van Koppen, hoogleraar aan de Universiteit Maastricht die zich vorig jaar in zijn intreerede over dit onderwerp boog, heeft ook kritiek. ``DNA en vingerafdrukken zijn relatief sterke methodes. Maar het probleem is dat ze worden heilig verklaard, er wordt uitermate kritiekloos mee omgegaan.'' In zijn oratie zegt hij over vingerafdrukken: ``Wij weten dat vingerafdrukken sterk bewijs van identiteit zijn, enkel omdat dactyloscopisten dat zeggen.''

De manier waarop vingerafdrukken beoordeeld worden, is illustratief voor allerlei forensische disciplines waarbij het ervaren oog van de beoordelaar een belangrijke rol speelt. In de dactyloscopie gaat dat als volgt. Een vingerafdruk die op de plaats van een misdaad is gevonden, wordt ingescand. Een computerprogramma, gestationeerd bij de Dienst Nationale Recherche Informatie (DNRI) in Zoetermeer, vergelijkt die scan met alle vingers in het bestand.

De computer presenteert een aantal mogelijkheden, en vervolgens bepaalt een ervaren dactyloscopist aan de hand van twaalf kenmerken van de afdruk of er een vinger is die op al deze kenmerken met het spoor overeenkomen. Een tweede dactyloscopist kijkt de scorelijst van de eerste na. Zijn de deskundigen het eens, dan is er een match. Komen minder dan twaalf kenmerken overeen, dan niet.

Volgens de website van de DNRI is die methode waterdicht: `Bij volledige identificatie kan het niet anders dan dat de afdrukken toebehoren aan één persoon. De twee belangrijkste kenmerken van een vingerafdruk zijn immers: uniek en onveranderbaar.' Maar Peter van Koppen vindt van niet. ``Als ze absolute zekerheid claimen, liegen ze. Je moet je realiseren dat die methode een bepaalde mate van subjectiviteit kent. Elk resultaat heeft dus een zekere graad van waarschijnlijkheid, en we weten niet welke.''

Onderzoek naar het voorkomen van de twaalf dactyloscopische kenmerken in de bevolking is nooit gedaan, aldus Van Koppen. Echt niet, in de honderd jaar dat de methode in zwang is? ``Nee, echt niet.''

Arie Zeelenberg, handschriftdeskundige van de DNRI, betwist dat overigens. ``Er is al veel onderzoek gedaan, en er worden heden ten dage miljarden vingerafdrukken per dag vergeleken zonder dat het tegendeel blijkt. En de betrouwbaarheid rond de twaalf typica is recentelijk bevestigd in Amerikaans statistisch onderzoek.'' Broeders reageert: ``Dat is wel zo, maar dat onderzoek is altijd gedaan met referentie-afdrukken. Het wordt anders als je te maken hebt met vingersporen die écht na een misdrijf zijn aangetroffen.''

Nu is er wel een belangrijk verschil tussen de dactyloscopie en andere forensische disciplines: de uitslagen zijn in die andere takken van onderzoek minder stellig. Er wordt onderscheid gemaakt tussen een `mogelijke', `waarschijnlijke' of `vrijwel zekere' identieke herkomst.

Wat dat betekent, hangt af van de ervaring van de onderzoeker. Broeders: ``Neem handschriftonderzoek. De onderzoekers weten uit ervaring dat de ene soort r meer voorkomt dan de andere r. Maar dat is niet precies te kwantificeren.''

De Amerikaan Michael Saks, die het artikel in Science schreef, heeft een oplossing: klassieke forensische technieken moeten een voorbeeld nemen aan het forensisch DNA-onderzoek.

Variatie in de bevolking kwantificeren, voor genetici is dat routine – bij andere forensische technieken is het moeilijk. Voor een DNA-profiel valt precies uit te rekenen wat de kans is dat het van een willekeurige persoon afkomstig is. Peter de Knijff, hoogleraar forensische genetica in Leiden: ``De berekening is gebaseerd op een controlebestand met een steekproef van Nederlanders. Dat doen we met specialistische software.'' Bij tien kenmerken is de kans op overeenkomst minder dan 1 op de miljard of nog zeldzamer. ``Is het spoor slechter van kwaliteit en kun je minder kenmerken meten, dan is de kans groter. Bij drie kenmerken kom je uit op ongeveer 1 op duizend, 1 op tienduizend.''

match

Voor vingerafdrukken is het NFI onlangs met een project begonnen waarbij wordt geprobeerd om, met hulp van een database van vingerafdrukken, de variatie te kwantificeren. De Maastrichtse hoogleraar Van Koppen: ``Dan kun je dus ook uitspraken over de overeenkomst doen als, zeg, maar tien van de twaalf punten overeenkomen. In de huidige situatie zeggen we alleen dat er geen match is, en gooien we een hoop informatie weg.''

Of dergelijke analyses voor alle takken van forensische identificatie uit te voeren zijn, vraagt Ton Broeders zich af. ``Sommige kenmerken zijn heel moeilijk in een hard model onder te brengen. Je moet eerst bepalen: wat zijn de relevante kenmerken? Dat is heel lastig.''

En dan: om variatie te onderzoeken, moet er wel een goede database bestaan van het te onderzoeken materiaal. Bij TNO wordt onderzoek gedaan naar software voor biometrische kenmerken, onder andere voor forensische toepassingen. Jurgen den Hartog is er projectleider. ``Over de betrouwbaarheid van gezichtsherkenning en irisscans kun je goede uitspraken doen, als die scans onder gecontroleerde omstandigheden worden gemaakt. In het forensisch domein zijn die gecontroleerde omstandigheden er niet. Je zit met halve sporen, met verschillende soorten oppervlak. Ik ken de situatie niet, maar het lijkt me heel moeilijk en tijdrovend om met dat soort gegevens databases op te bouwen.''

Het lijkt er dus op dat verschillende forensische identificatie-methoden ook de komende tijd geen exacte wetenschap zullen worden. Hoe moet dat tot uitdrukking komen in de presentatie van de resultaten van dat forensisch onderzoek?

voortraject

Eén oplossing komt van een collega-hoogleraar van Broeders in Leiden, prof. Hans Nijboer (bewijs en bewijsrecht): ``Hoe uitgewerkter de procedures van tests zijn, hoe minder de vraag wordt gesteld: wat zegt dat bewijs ons? Hoe komt die bloedvlek daar? We moeten meer aandacht besteden aan die vraag in de rapportage van de deskundige. En we moeten ons bewust zijn van de chain of custody, oftewel het hele voortraject van het verzamelen van sporen, het bewaren ervan, enzovoort.'' Dat zegt ook hoogleraar Peter van Koppen: ``In de rechtszaal draait het uiteindelijk om het vertellen van verhalen.''

Broeders vindt het belangrijk dat de deskundige aan de rechter duidelijk maakt wat een kwalificatie als `mogelijk' of `waarschijnlijk' in de praktijk betekent. Want daar heeft de rechter moeite mee, maakte hij vorig jaar in zijn intreerede als Leids hoogleraar duidelijk: `Als de deskundige zijn wetenschappelijke reserve tot uitdrukking brengt in de vorm van een gekwalificeerde uitspraak, zien we dat die reserve paradoxaal genoeg juist als indicatie kan worden opgevat dat de uitspraak wel zal kloppen. Immers, de deskundige is altijd zo voorzichtig. Als hij zegt dat het waarschijnlijk is, dan zal het heus wel zo zijn.'

Een NFI-collega bedacht een formulering die meer recht doet aan het onzekere karakter van het forensisch bewijs. Stel dat je wilt weten of een bepaalde schoenafdruk van een verdachte is. De deskundige zou dan niet moeten verklaren dat de afdrukken `mogelijk' of `waarschijnlijk' van de verdachte zijn. Hij zou moeten opschrijven of de vondst van juist deze afdruk méér waarschijnlijk is als de verdachte daar gelopen heeft, dan wanneer de verdachte daar niet was. Broeders: ``Dat doet meer recht aan een alternatieve hypothese, bijvoorbeeld dat de voetsporen van iemand anders zijn met zulke schoenen.''

Het voordeel van deze formulering is dat de kracht van het bewijsmiddel gemakkelijker kan worden meegenomen in de uitspraak. Broeders: ``Je kijkt dan hoe ver jouw bewijsmiddel de weegschaal doet overhellen naar de andere kant.'' In forensische termen: een volledig DNA-profiel doet de weegschaal sterk hellen, vingerafdrukken wat minder, geuridentificatie door honden weer veel minder. Dat konden we toch niet goed kwantificeren? Broeders: ``Nee, maar als je dan toch een formulering moet kiezen, kies er dan een die logisch juist is.''