Spambuster maakt gebruik van DNA en eiwitherkenning

Een computertechniek die is ontwikkeld om DNA en eiwitvolgordes te analyseren, blijkt een krachtig wapen tegen spam, ongewenste emails. Onderzoekers van het Thomas J. Watson Laboratorium van IBM in New York wisten met hun programma `Chung-Kwei', genoemd naar een Feng Shui talisman die het huis beschermt, bijna 97% van alle inkomende spamberichten te onderscheppen. Chung-Kwei is gebaseerd op een computerprogramma dat in lange stukken DNA of eiwit karakteristieke, zich herhalende patronen opspoort. De bedoeling is om op basis van die terugkerende patronen de functie en structuur te bepalen van een eiwit of een stuk DNA en om eiwitten met een zelfde functie in verschillende organismen te identificeren. Die hebben niet altijd exact dezelfde aminozuurvolgorde. Sommige aminozuren kunnen door andere worden vervangen, zonder dat de werking van het eiwit verstoord raakt. Een programma dat op zoek gaat naar karakteristieke patronen in eiwitten moet dus een zekere flexibiliteit bezitten. Diezelfde flexibiliteit blijkt nu goed van pas te komen om patronen op te sporen in spam: ook daarin wordt vaak gebruik gemaakt van kleine variaties in woorden: om programma's die spamberichten afvangen om de tuin te leiden zoals de vervanging van de letter s door het dollarteken in de reclametekst `increa$se your $ex power'.

Het programma heeft een database nodig van karakteristieke spampatronen. Om die op te bouwen hebben de IBM onderzoekers het eerst een reeks van zo'n 65.000 spamberichten aangeboden. Die werd gevolgd door een soortgelijke reeks van 10.000 serieuze berichten om typische woord- of zinspatronen die in beide reeksen voorkwamen te verwijderen. De echte test bestond vervolgens uit de analyse van 90.000 berichten, waarvan tweederde spam. Chung-Kwei wist 97% van alle spamberichten te onderscheppen, terwijl slechts één op de zesduizend serieuze e-mails ten onrechte als spam werd aangemerkt. IBM gaat Chung-Kwei op de markt brengen, in een pakket met een aantal andere spambusters.

    • Rob van den Berg