Wat de vertaalapps wel en (nog) niet kunnen

«What the translation apps do and can not (yet)» Computersystemen vertalen steeds beter, maar de tekst ook echt begrijpen kunnen ze (nog) niet.

Illustratie Tjarko van der Pol

Met meer dan 140 miljard te vertalen woorden per dag heeft Google Translate het druk. En inmiddels is de vertaaldienst de half miljard maandelijkse gebruikers gepasseerd, aldus The New York Times. En het is lang niet de enige techgigant die zich begeeft op vertaalgebied. Facebook vertaalt met behulp van kunstmatige intelligentie – systemen die zelf kunnen leren en redeneren – buitenlandse statusupdates voor je. Het Chinese Baidu bouwt een systeem dat beter menselijke taal kan begrijpen, zodat computers namens bedrijven klanten te woord kunnen staan als chatbots. Ook Microsoft en Amazon werken aan vertaaldiensten.

Vertaaltechnologieën zetten grote stappen door machine learning, waarbij computers uit zichzelf leren. Zo wil Google nog dit jaar in alle talen overgaan naar de zogeheten ‘long short term memory’-techniek. Dit ‘lang kortetermijngeheugen’ kan tegen het einde van de zin het begin nog onthouden. Zo wordt er niet meer woord voor woord vertaald, maar kijkt de software naar de zin als geheel. Volgens het techbedrijf dringt het fouten met 60 procent terug.

Zijn de banen van vertalers in gevaar? Lees: De computer kent steeds meer woorden

Het zijn spannende tijden, zegt Lieve Macken, taaltechnoloog aan de opleiding Taal- en Letterkunde in Gent. Ze wijst op de stap naar zinsvertalingen die Google in april zette voor het Engels naar Nederlands. „De Nederlandse taal bestaat uit veel lastige werkwoorden. Als je zegt: ‘Ik bel hem morgen na de lunch terug’, dan is het moeilijk voor een vertaalsysteem om te snappen dat ‘terug’ nog bij ‘bellen’ hoort. Google snapt dat nu en schrijft: ‘I’ll call him back tomorrow after lunch.’”

Het kon al, maar nu nog beter

Grote bedrijven werken aan zelflerende technieken als automatisch vertalen, automatische spraakherkenning en tekst-naar-spraaksystemen. „Allemaal technologieën die al lang bestonden”, zegt Antal van den Bosch, hoogleraar taal- en spraaktechnologie aan de Radboud Universiteit. „Met meer data als voorbeeldmateriaal worden ze steeds beter. Door de komst van technologiereuzen, snelle netwerken en meer opslagcapaciteit van data worden schaalproblemen overwonnen.”

Toch zijn er ook nadelen aan dit soort vertaaldiensten. „Men vergeet weleens dat je feitelijk de teksten aan het bedrijf uitlevert”, zegt Macken. „Misschien wil je dat helemaal niet vanwege de privacy. Het is een van de redenen waarom de Europese Commissie haar eigen vertaalsysteem heeft gebouwd.”

Andere nadelen zijn er ook. Zo maakt Google nog steeds veel rare fouten in woordkeuze. Macken: „Wat automatische vertaalsystemen nog altijd niet kunnen – al claimen ze vaak van wel – is een zin écht begrijpen zoals wij taal begrijpen. Wie weet verandert ook dat.”