Antal van den Bosch: „Onze ideeën van toen zijn nog altijd ingebouwd in sprekende autonavigatie-systemen.”

Foto Roger Cremers

Interview

‘Vertaalprogramma werkt zoals je brein’

Antal van den Bosch | directeur Meertens Instituut Hij bouwde een namengenerator voor hamster Bumme, inmiddels is Antal van den Bosch directeur van het Meertens Instituut.

We lopen door de gang van het Meertens Instituut in Amsterdam. Tegen de muur staat het kolossale houten bureau van de eerste directeur en naamgever: Piet Meertens. Op een van de bureauplanken staat de zevendelige romancyclus Het Bureau, waarin schrijver J.J. Voskuil de dagelijkse besognes op het instituut vereeuwigde.

Onderzoek naar variaties en veranderingen in de Nederlandse taal en cultuur, daar draait het hier allemaal om. Voskuil werkte er van 1957 tot 1987. Hij maakte de intrede van de computer op het instituut nog net mee, maar was een uitgesproken tegenstander van het gebruik van de machine voor wetenschappelijke doeleinden. De huidige directeur Antal van den Bosch, aangesteld in 2017, heeft als een van zijn missies dat hij het instituut meer vruchten wil laten plukken van de oprukkende kunstmatige intelligentie (AI).

Begin september werd Van den Bosch ook aangesteld als bijzonder hoogleraar Taal en Kunstmatige Intelligentie aan de Universiteit van Amsterdam. Zijn missie daar: onderzoek doen naar hoe AI het taalonderzoek vooruit kan helpen, en andersom: hoe taalonderzoek AI-toepassingen zoals chatbots, tekstgeneratoren en automatische vertaalmachines kan verbeteren.

Bij het Meertens Instituut is de computer nu onmisbaar in bijna al het onderzoek. „Laat ik een voorbeeld geven”, zegt Van den Bosch. „Samen met Tilburg University en nu.nl voeren we een project uit. Lezers kunnen op nujij.nl reageren op nieuwsberichten. We ontwikkelen instrumenten waarmee moderatoren discussies beter kunnen duiden. Om wat voor soort discussie gaat het, zijn er voors en tegens te onderscheiden? Welke reacties zijn wel of niet constructief? Onze antropologen gebruiken hierbij hun kennis van hoe debatten kunnen escaleren en hoe mensen taal inzetten om uit te drukken bij welke groep ze horen.”

Hoe kwam uw interesse in taal samen met die in computers?

„Eigenlijk al heel vroeg. Ik hield van taal en was op de middelbare school gefascineerd door de overeenkomsten en verschillen tussen Frans en Latijn. Ook werd ik al meteen bij de introductie van de personal computer in 1981 gegrepen door de mogelijkheden. Ik was toen 12 en vond de pc het ultieme speelgoed. Ik woonde in Roosendaal, waar de computerclub programmeercursussen in Basic aanbood. Die ging ik volgen. Van mijn ouders kreeg ik een ZX Spectrum-computer en daarop experimenteerde ik met taal. Toen ik een nieuwe hamster kreeg, wilde ik een naam verzinnen. Ik wist ongeveer welke klank ik wilde. Met mijn ZX Spectrum heb ik toen een lettergrepengenerator gemaakt. Het programma suggereerde tien kandidaten, waarvan ik er eentje uitkoos: Bumme.”

Wist u dat er zoiets als computertaalkunde bestond?

„Toen ik in 1987 een studie moest kiezen, kwam ik erachter dat de universiteit van Tilburg net was gestart met een opleiding computerlinguïstiek. Ik viel toevallig met mijn neus in de boter. Dat moest het worden.”

Precies in de tijd dat Van den Bosch studeerde en promoveerde, vond in de computationele taalkunde een revolutie plaats. Decennialang was geprobeerd om computers taal te leren door ze vol te stoppen met grammaticale en semantische regels. De resultaten op speelgoedvoorbeelden waren fantastisch, maar het opschalen naar de echte wereld werkte slecht. Een totaal andere aanpak boekte wel snel succes: laat computers taal leren door ze zelf patronen te laten herkennen in grote hoeveelheden tekst. Niks regels, combineer data met statistiek.

Was er verzet tegen die nieuwe aanpak?

„In Tilburg liep mijn mentor Walter Daelemans in die nieuwe aanpak voorop. Ik kreeg als student van anderen aan de universiteit nog het advies om niet mee te gaan op zijn weg. Maar ik was gegrepen door het idee om de computer een deel van de wetenschappelijke ontdekkingstocht te laten doen. Een van mijn eerste klussen was het trainen van de computer op het uitspreken van woorden. Dat werkte al snel beter dan de beste regelgebaseerde systemen. Onze ideeën van toen zijn nog altijd ingebouwd in sommige sprekende autonavigatie-systemen.”

Wat vindt u er zo mooi aan?

„In het nieuwe millennium werden lerende computers steeds beter en namen de digitale dataverzamelingen en de praktische toepassingen explosief toe. Ineens boekte ons vakgebied razendsnel vooruitgang, in automatisch vertalen, spraakherkenning, spraaksynthese en chatbots. Het is verbluffend dat een programma als Google Translate zo goed werkt door patronen te herkennen in grote databestanden van vertaalde teksten. Puur en alleen op basis van statistiek kan het zinnen grammaticaal en semantisch correct genereren, zonder zelf te begrijpen wat woorden en zinnen betekenen.

„Ik vind het heel mooi dat de lerende computermodellen uit de natuurlijke taalverwerking zo goed blijken te correleren met wat hersenonderzoekers in het brein zien gebeuren tijdens de verwerking van taal. Neem bijvoorbeeld de uitdrukking ‘sterke koffie’. Stel dat ik daarvan maak ‘krachtige koffie’, dan begrijp je best wat ik bedoel, maar je hersenen zullen iets harder moeten werken. Die vragen zich af of ik hetzelfde bedoel als wanneer ik ‘sterke koffie’ zeg. Je brein is een soort voorspellingsmachine die naar de meest waarschijnlijke interpretatie neigt. Automatische vertaalprogramma’s doen op basis van statistiek iets vergelijkbaars.”

Wat is er nu aan het veranderen?

„Computationele taalkunde is in de afgelopen jaren deels industrieel geworden. Het zijn de grote techbedrijven die voorop zijn gaan lopen, geholpen door hun enorme dataverzamelingen. Tegelijkertijd is mijn eigen rol in de afgelopen jaren meer dienend geworden, als promotor van jongere onderzoekers, directeur, manager en beleidsmaker.”

Er is nog één onderwerp dat Van den Bosch niet onbesproken wil laten. „Waar ik de laatste tijd mee zit, is dat wetenschappers zichzelf weer meer buiten de maatschappij plaatsen. Neem de landelijke beweging WOinActie. Hun klacht over werkdruk is absoluut terecht. Maar ze wijzen voor alles wat mis is naar bestuurders en het systeem, en zetten wetenschap te veel op een sokkel. Ze zien wetenschap als iets heiligs en daarmee valorisatie, het benutten van de kennis, als iets vies. Mijn stelling is dat het beste onderzoek juist ook leidt tot de beste valorisatie.”

Van den Bosch vindt dat wetenschap gerund moet worden door gelijkwaardige teams van wetenschappers en professionele bestuurders: „Wetenschap houdt vast aan het idee dat alleen wetenschappers het voor het zeggen mogen hebben. Ik vind dat we wetenschap meer als een bedrijf moeten laten draaien, en dat de wetenschap zichzelf meer als een maatschappelijke partner moet laten zien.”

Aanvulling 27-10: Het citaat over academische actiegroep WOinActie is aangevuld. Van den Bosch noemt de klachten over werkdruk van WOinActie terecht.