Ribbeltjes, krasjes en glans; VOORZICHTIG SUCCES MET COMPUTERDETERMINATIE VAN STENEN WERKTUIGEN

Veel archeologische interpretaties zijn gebaseerd op intuïtie. Niettemin blijkt een computerprogramma redelijk succesvol in determinatie van slijtsporen op stenen werktuigen

ARCHEOLOGIE en kunstmatige intelligentie gaan niet samen, vinden veel archeologen. Ja, in de jaren tachtig hebben ze, aangestoken door de ontwikkeling van industriële expertsystemen voor bijvoorbeeld vliegtuigen, even gedacht dat de computer bij de analyse van vondsten wonderen kon verrichten. Maar het enthousiasme verdween snel. Het bleek lastig om de menselijke kennis in computertaal te vatten, de ontwikkelde prototypes konden slechts de kennis van een zeer beperkt terrein bevatten en waren niet meer dan zwarte dozen die zonder verantwoording met een antwoord kwamen. Verder hebben archeologen een principieel bezwaar: kennis die in een computersysteem is vastgelegd, dreigt te fossiliseren _ dankzij de snelle ontwikkelingen van de hardware.

Nee, archeologen hebben niks tegen computers, maar in hun vak zijn ze vooral goed om er databases mee aan te leggen. Dat is niet terecht, vindt echter Monique van den Dries (32), eerder dit jaar aan de Rijksuniversiteit Leiden gepromoveerd op 'Archeologie en de toepassing van kunstmatige intelligentie'. “Wat blijkt? De ontwikkelde systemen zijn nauwelijks getest en er is ook niet goed nagedacht over de doelen waarvoor je ze kunt gebruiken.” Van den Dries ontwikkelde zelf een expertsysteem, niet om te kijken wat de mogelijkheden van de techniek zijn, maar om de praktische toepasbaarheid te toetsen. Kan een expertsysteem helpen bij het onderwijs, vroeg ze zich af? Proefkonijn voor de studie werd de analyse van gebruikssporen op vuurstenen werktuigen. Ribbeltjes, minuscule krasjes, glans en gladheid verschaffen informatie over stenen werktuigen, die dateren van pakweg 250.000 à 20.000 v. Chr., en bijvoorbeeld zijn gebruikt voor het schrapen van huid of het snijden van vlees. Die kennis vertelt vervolgens weer iets over zaken als gedrag, taakverdelingen en economische activiteiten van de mensen die ze hebben gebruikt.

Waarom uitgerekend het specialisme van de gebruikssporen gekozen als proefobject? In Nederland is maar één expert op dit gebied, Annelou van Gijn, ook werkzaam aan de Rijksuniversiteit Leiden. Zij draagt haar kennis per jaar aan twee tot drie studenten over, maar dat vergt een intensieve begeleiding. Van Gijn is er mee geholpen als een deel van het onderwijswerk uit haar handen genomen wordt. Verder gebeurt de analyse van gebruikssporen op grond van subjectieve criteria. Van Gijns buitenlandse collega's komen bij de analyse van de gebruiksporen meestal wel tot dezelfde conclusie, maar langs verschillende wegen. Een vorm van standaardisering zou dus mooi zijn. Tot slot viel de keuze op gebruikssporenanalyse om de doodeenvoudige reden dat Van Gijn bereid was haar kennis in de computer te laten opslaan. Van den Dries: ''Niet alle experts durven mee te werken. Bang als ze zijn om expert af en overbodig te worden.''

De archeologe met bijvak toegepaste informatica hoefde geen besturingssysteem te ontwikkelen, maar maakte gebruik van een kant en klare shell (Level 5 Object). ''Net een baby, daar zit ook al alles op en aan, je moet hem alleen nog even leren lopen en praten.'' Dat deed ze door beslissingsregels op te stellen van het type als het geel is, dan is het een appel of een banaan, en als het langwerpig is dan een peer of banaan. ''Als ik nu met een kers, die niet langwerpig is, aan kom zetten, dan sluit het systeem de mogelijkheid van een banaan of peer uit. Een expertsysteem maakt dus het aantal mogelijkheden steeds kleiner.''

Opstellen van dergelijke beslissingsregels voor WAVES (Wear Analysing and Visualizing Expert System) bleek echter minder makkelijk dan gedacht. ''De analyse van gebruiksporen lijkt een objectief high tech gebeuren'', zegt Van Gijn in haar laboratorium, een van de best uitgeruste in Europa. ''We werken met stereo- en directlichtmicroscopen en nemen alles op. Maar ik doe alles heel intuïtief. Een computer werkt echter weer heel lineair.'' Probleem was ook dat veel sporen niet eenduidig zijn. Als een werktuig voor verschillende taken is gebruikt, overlappen de sporen elkaar. ''Dan ben je niet meer bezig appels met peren te vergelijken, maar verschillende soorten appels'', zegt Van den Dries.

Om het subjectieve karakter van de analyses zo veel mogelijk te ondervangen heeft Van den Dries dankbaar gebruik gemaakt van een referentiecollectie die Van Gijn heeft opgebouwd. Ze zit regelmatig met stukjes vuursteen prehistorische werkzaamheden na te bootsen, de ene keer schraapt ze een stuk huid schoon, dan weer snijdt ze in een olifantenpoot of bewerkt een gewei. Ten tijde van WAVES had Van Gijn driehonderd experimenten (inmiddels vijfhonderd) uitgevoerd door langere en kortere perioden te zagen, schrapen, snijden, krassen in en op twintig verschillende contactmaterialen, variërend van vlees tot gras en riet. Zo weet ze nu zeker dat een werktuig dat met zacht materiaal in aanraking is geweest een groot glanzend vlak heeft en dat hard materiaal minder contact maakt en dus slechts kleine glanspuntjes achterlaat. Met die kennis geladen leidt WAVES een gebruiker stapsgewijs langs allerlei kenmerken met als extra hulp foto's met voorbeelden en allerlei informatie over de diagnostische betekenis van kenmerken.

Terwijl de gebruiker zijn keuzes maakt, geeft WAVES scores aan contactmaterialen en handelingen. Aan het eind telt het systeem alle scores op en geeft aan waarvoor een werktuig gebruikt kan zijn. De handeling of het materiaal met de hoogste score wordt als het typerendst gegeven, maar het is een interpretatie en geen identificatie, de keuze blijft aan de analist, zegt Van de Dries. Verder heeft ze het systeem zo opgebouwd dat een gebruiker kan zien op grond van welke scores het systeem tot een conclusie komt. Blind tests met twee buitenlandse experts en twee studenten pakten niet slecht uit. De gemiddelde score met VES was 55,8 procent goede antwoorden. Een student zonder enige voorkennis haalde zelfs 56,8 procent. De resultaten zijn vergelijkbaar met vroegere blind tests zonder expertsysteem. Van den Dries plaatst één kanttekening: ''De experts scoorden ongeveer zeventig procent als ze de analyse zelf, zonder WAVES, uitvoerden. Hun lagere score met WAVES heeft te maken met de nog steeds subjectieve beschrijvingen van kenmerken. Zij interpreteerden sommige sporen net anders en dan geeft WAVES al snel een andere uitkomst.'' Het systeem bevalt wel zo goed dat het inmiddels in gebruik is in Leiden, Spanje, Engeland en Australië. Frankrijk volgt binnenkort. Van Gijn: ''Ik blijf wel nodig, om er voor te zorgen dat studenten blijven nadenken en dingen met elkaar combineren, maar het systeem heeft wel de tijdsdruk verminderd. Ze leren met WAVES niet sneller, maar leren wel beter waarnemen.''

Voor haar eigen analyses gebruikt Van Gijn WAVES niet. Dan ziet ze meer in WARP (Wear Analysing and Recognising neural network Prototype), dat Van den Dries heeft ontwikkeld om met WAVES te vergelijken. WARP kan nieuwe situaties interpreteren aan de hand van vergelijkingen met opgeslagen voorbeeldsituaties. Het geeft op grond van waarschijnlijkheden en statistische berekeningen altijd een voorspelling, dus altijd een antwoord. Vooral bij testen met archeologische stukken haalde WARP een hoge score goede antwoorden (tachtig procent). Toch spreekt Van den Dries geen voorkeur uit voor een van beide systemen: ''WARP is beter in interpoleren, WAVES in extrapoleren.'' Beide systemen zijn volgens haar nog te verbeteren door er nog meer voorbeelden in te stoppen. Ze ziet ook mogelijkheden voor andere onderzoeksgebieden als aardewerkanalyse, botdeterminatie en muntenonderzoek. ''Het terrein moet wel beperkt en duidelijk omschreven zijn.'' Nu een van haar systemen in gebruik is, verwacht ze dat de archeologen langzaam aan weer gewonnen zullen worden voor toepassingen van kunstmatige intelligentie. De ontwikkeling van systemen valt of staat echter met iets dat er meestal niet is: geld.