Mijn telefoon begrijpt me niet

Mensen maken voortdurend elkaars zinnen af. Toch hebben computers en smartphones moeite om onze woorden correct te voorspellen. Hoe komt dat? En hoe verbeter je de woordsuggesties?

Maak zelf heerlijke atoomgewichten, inclusief receptenboek. Atoomgewichten? Stoomgerechten, bedoelde de adverteerder op Marktplaats. Weer iemand die te snel op send drukt en een onbegrijpelijke boodschap de wereld in stuurt.

Autocorrectie is vaak autocorruptie. Het is een dagelijkse ergernis van 2,6 miljard smartphonegebruikers in de wereld. Je typt een woord, drukt op de spatieknop en de ingebouwde software maakt er iets heel anders van – spatieknop wordt ‘statieknop’ bijvoorbeeld.

De Engelstalige site damnyouautocorrect.com staat vol met hilarische misverstanden: I’m so lonely without you wordt I’m so kinky without you. In het Nederlands heet Erben Wennemars opeens ‘Erwten’, wordt steak ‘strak’, emancipatie ‘ejaculatie’, Kinkerstraat ‘kindersterfte’ en een zelfrijdende auto verandert in een ‘zelfrijzende auto’.

Toch is de smartphone het ideale apparaat voor woordsuggesties en spelcorrecties. Je tikt snelle berichten via chats en tweets en maakt op het kleine toetsenbord sneller spelfouten die gecorrigeerd moeten worden. Dat scheelt tijd – als het werkt. We vertrouwen op die correcties, maar vaak begrijpt de telefoon ons niet.

Wie zorgt ervoor dat de telefoon je woorden afmaakt? Apple, Google en Microsoft willen geen antwoord geven op de vraag welke medewerkers aan de Nederlandse taalproducten werken. De techbedrijven gebruiken wel dezelfde basistechnologie om woorden te (voor)spellen. „Daarmee kun je zo’n 25 procent aan toetsaanslagen besparen”, zegt Antal van den Bosch. Hij is hoogleraar aan het Centre for Language Studies aan de Radboud Universiteit in Nijmegen.

Van den Bosch verbetert woordherkenningssystemen door wetmatigheden te zoeken in menselijk taalgebruik die de computer – oftewel de telefoon – kan begrijpen. Met het meest geavanceerde systeem raadt de computer al zo goed wat je bedoelt dat je 50 procent minder toetsaanslagen hoeft te doen. De basis is statistiek: de kans dat de schrijver of schrijfster een volgende letter of een volgend woord gebruikt. „Uiteindelijk is het een kwestie van tellen. Niet spectaculair, maar het werkt wel.”

Waar komt autocorrectie vandaan?

„De technieken bestaan al tien, twintig jaar, maar dankzij de smartphone is iedereen autocorrectie gaan gebruiken. De eerste telefoons met woordsuggestie waren van Nokia, in de tijd dat telefoons nog met het t9-systeem werkten – letters typen met numerieke toetsenborden. Nokia gebruikte een woordenboek met vooral zakelijke en financiële termen. Dat was omdat mobiele telefoons in eerste instantie alleen gekocht werden door snelle jongens in de zakenwereld.”

Waarop is een goede woordenlijst gebaseerd?

„Je moet een lijst samenstellen voor een breed publiek, met woorden uit allerlei domeinen, zowel formele als informele. Je gebruikt daarvoor bijvoorbeeld Wikipedia, internetpagina’s, de krantenarchieven en Twitter. Als je dat bij elkaar gooit kun je een mooie woordenlijst maken van het Nederlands.

„In de Dikke Van Dale of Het Groene Boekje staan zo’n 300.000 woorden. Maar er zijn eindeloos veel woorden; ik verzamel digitale Nederlandse teksten en aan ruw materiaal hebben we zo’n tien miljard woorden. Als je dat indikt tot een unieke woordenlijst – ‘de’ en ‘het’ komen natuurlijk talloze keren voor – kom je op miljoenen woorden. Het gaat om samenstellingen, als reservebandventieldopje, maar ook om vaktermen, chemische samenstellingen of telwoorden als zevenentachtig of vijfennegentig.”

Hoe kan het dat mijn telefoon me soms niet begrijpt?

„Om snel een woord te suggereren is de database ingedeeld als een boomstructuur. Elke nieuwe letter is een ‘tak’ die uitwaaiert in mogelijke volgende letters. Totdat je bij het uiteindelijke woord uitkomt. Misverstanden ontstaan als het systeem corrigeert wat je net hebt getypt. Het taalmodel houdt er rekening mee dat je er soms een beetje naast zit. Zodat je, als je een D tikt, misschien ook de nabijgelegen S kan bedoelen. Als jouw woord niet in de woordenlijst staat en het andere woord wel, dan blijft-ie dat suggereren.” 

Irritant.

„Dat is heel irritant. Het probleem zit in de te kleine woordenlijst die de fabrikant meelevert. Om geheugenruimte te besparen zijn de databases beperkt tot de meest voorkomende woorden, bijvoorbeeld 100.000. Je kunt soms wel woorden toevoegen en zo je eigen woordenboek creëren. Sommige systemen trainen zichzelf, als je de correctie van de computer maar vaak genoeg corrigeert.”

En hoe weet de telefoon welk volgend woord ik ga tikken?

„Het statistisch taalmodel is contextgevoelig gemaakt, door het aantal woorden te tellen die vaak bij elkaar staan in een groot aantal teksten. Als je net ‘ik’ hebt getypt en je begint het volgende woord met een w, dan zal het waarschijnlijker zijn dat er ‘wil’ volgt. Ook dat is in een boomstructuur gevat, gebaseerd op kansberekening.”

Is menselijke taal zo makkelijk in regels te vatten?

„Taal voldoet aan allerlei wetmatigheden! De Amerikaanse taalkundige Zipf berekende dat het meest frequent voorkomende woord twee keer zo vaak voorkomt als het op één na meestgebruikte woord. En dat woord komt weer twee keer zo vaak voor als het vierde meestgebruikte woord. Dat geldt voor elke taal; voor een stapel mails, de bijbel, een scheikundeboek, of mijn verzameling van tien miljard woorden.

„Nog zo’n wetmatigheid: woorden die vaak voorkomen, zijn korter. Dat is de economie van taal. Lidwoorden, voorzetsels en verwijzingen vormen het cement in onze zinnen. Op langere woorden is de meeste winst in toetsaanslagen te behalen. Maar voorspellen is moeilijker: als iemand aan het begin van een tekst ‘De’ heeft getikt, wat komt er dan? Dat kan van alles zijn.”

Is het Nederlands extra lastig te voorspellen?

„Wij gebruiken veel scheidbare werkwoorden. Bijvoorbeeld: ‘ik belde hem gisteravond op’. Het Nederlands heeft veel van die langeafstandsrelaties tussen woorden. Eenvoudige taalmodellen hebben daar moeite mee. Je moet een soort geheugen openen, een buffer, waarin je vastlegt: pas op, ik verwacht nu ‘belde’ en straks nog ergens een keer ‘op’.”

Bij de suggestie van volgende woorden kunnen de resultaten op onverwachte manier afwijken, door het gebruik van andere woordenlijsten. Zo suggereert het Britse toetsenbord van Windows Phone na de woorden „Can I touch your…” voornamelijk vrouwelijke lichaamsdelen. De iPhone schijnt er ook een handje van te hebben. Blijkbaar zijn Britten pervers, want de Amerikaanse taalversies zijn een stuk neutraler van toon – Google Android ook.

Wie gebruikt de beste technologie? Daarop kan Van den Bosch geen antwoord geven. De systemen van de Amerikaanse techbedrijven zijn niet transparant; de Nijmeegse taalwetenschappers kunnen alleen hun eigen systemen testen. Daarbij tellen ze hoeveel toetsaanslagen je bespaart met woordsuggesties of autocompletion. Voor de test wordt een ideale gebruiker nagebootst die meteen op ‘OK’ klikt als het juiste woord verschijnt. Een standaard taalmodel bespaart 25 procent toetsaanslagen.

Elk programma, elk besturingssysteem gebruikt een andere techniek. Dus je moet overal het wiel opnieuw uitvinden?

„Een persoonlijk taalmodel dat gebruikt wordt door alle applicaties zou een mooie oplossing zijn. Als je het taalmodel personaliseert, kun je 35 procent of soms zelfs 50 procent op je toetsaanslagen besparen. Vorig jaar gebruikten we Twitter als basis voor een onderzoek. Sommige mensen genereren zoveel tweets – duizenden tot tienduizenden – dat je daarop een betrouwbaar individueel taalmodel kunt trainen.

„Als je de teksten van één twitteraar uitbreidt met de mensen met wie een wederzijdse volgrelatie bestaat, wordt de score nog beter. Want jij en je vrienden spreken een eigen sociolect, een eigen variant van het Nederlands.”

Als je taalmodellen zo persoonlijk maakt zit je wel in iemands psyche te wroeten.

„De woorden die we het meest gebruiken vatten onze psyche ook goed samen. Het woordje ‘de’ komt het vaakst voor in geschreven tekst. En als je spraak uitschrijft, is het meest gebruikte woord niet ‘eh’ maar ‘ja’ – we wisselen in gesprekken continu onderlinge bevestiging uit.

„We werken samen met neurowetenschappers van het Donders Instituut, ook in Nijmegen. Met een MRI-scanner en MEG-metingen leggen we hersenactiviteit vast van mensen die naar audioboeken luisteren. De verrassing die we meten in de hersenen lijkt erg veel op hoe verrast het statistisch taalmodel is over woorden in hun context.”

Dus onze hersens werken net als een taalmodel?

„Taalmodellen zeggen continu: hoe zeker of onzeker ben ik over welk woord er nu komt. Het brein doet dat ook. We maken voortdurend elkaars zinnen af in ons hoofd. Als ik even stop, dan zou jij probleemloos mijn… zin kunnen afmaken. Dat past bij het idee dat het brein niet alleen een verwerkende machine is, maar ook een voorspellende machine. Het brein loopt op de zaken vooruit. Omdat als je het goed hebt, je je verder alleen maar hoeft te concentreren op de dingen die afwijken van je verwachting.”

Zou je ook kunnen meten aan welk woord iemand denkt?

„We beginnen volgend jaar een nieuw project. Stel, je laat mensen in MRI-scanners luisteren naar meerdere teksten. Als we tientallen proefpersonen naar duizenden woorden laten luisteren, is het dan mogelijk om hun breinactiviteit te decoderen?

„Collega’s van Carnegie Mellon University vroegen eerder al aan proefpersonen in een scanner: denk aan groente of onderdelen van een huis. Met een redelijke kans kun je dat hersensignaal correct decoderen. Je ziet dus aan het signaal: oh, die persoon dacht aan dat woord.”