Stekker, chef, airbag; Hoeveel leenwoorden heeft het Nederlands?

In 1931 werd het Genootschap Onze Taal opgericht, met als doel 'de onzuiverheden in de Nederlandsche taal te bestrijden, welke bestrijding zich in het bijzonder - in dit tijdsgewricht - keert tegen het gebruik van Germanismen'. Een enkele ijveraar stelde zelfs voor in spoorwegstations borden te plaatsen met opschriften als 'Let op uw taal!', 'Gedoog geen germanismen!' en 'Steun de degermanisatie!'. Dit voorstel is nooit ten uitvoer gebracht, wel heeft de Bond tegen het vloeken het idee kennelijk overgenomen met zijn leus 'Wees geen naprater'.

De bestrijding van germanismen stoelde op een lange traditie, met in de negentiende eeuw voorvechters als Nicolaas Beets en Jacob van Lennep. Nicolaas Beets schreef een gedicht getiteld 'Germanismen', dat als volgt begint: Gij hebt mij, lieve Buren! Uw toonstuk niet te sturen; Ik zing niet gaarne op Duitsch; Houdt, daar gij mij door 't oor boort Met uw afgrijslijk voorwoord, Uw liedertafels thuis. Verlost mij van de daadzaak, Waarover ik mij kwaadmaak, Gewis niet zonder grond!

In 1932 verscheeen het eerste nummer van het tijdschrift Onze Taal, en sinds de oprichting is er geen nummer voorbijgegaan zonder dat lezers ingezonden brieven schreven tegen het gebruik van vreemde woorden. Anno 1994 vragen lezers naar een goed Nederlands woord voor airbag. Hieruit blijkt dat de strijd tegen germanismen uit de negentiende en begin twintigste eeuw na de Tweede Wereldoorlog geleidelijk is overgegaan in een strijd tegen anglicismen.

Natuurlijk heeft men zich nooit tegen àlle leenwoorden gericht, maar alleen tegen woorden die - zoals Van Dale formuleert onder barbarisme - 'in strijd [zijn] met het inheemse taaleigen' (middels), en tegen woorden die 'een duidelijk vreemd' karakter hebben behouden (überhaupt). Jammer genoeg verstaat niet iedereen hetzelfde onder 'in strijd met' en 'taaleigen'. Sommige mensen zijn zo allergisch voor alles wat van buiten komt, dat ze ieder woord dat ze als leenwoord herkennen, afwijzen. En er zijn zelfs die gaan spitten in de taalgeschiedenis en opdelven dat sommige volkomen ingeburgerde woorden niet van vreemde smetten vrij zijn. Deze mensen wijzen erop dat woorden als naslagwerk, rauwkost, stekker, opname, overname, voorwoord uit het Duits afkomstig zijn, en dat we in plaats daarvan de goed Nederlandse woorden naslawerk, rauwe kost, steker, opneming, overneming, voorrede zouden moeten gebruiken.

Als een leenwoord maar lang genoeg in een taal voorkomt, slijt de weerzin ertegen. Maar woorden die inmiddels niet meer strijdig zijn met het 'taaleigen' worden altijd weer opgevolgd door nieuwe woorden die er wel strijdig mee zijn, en zo is de cirkel rond en blijft de strijd doorgaan - voor wie daar behoefte aan heeft.

Door alle aandacht die aan vreemde woorden en leenwoorden is geschonken, mag je veronderstellen dat exact bekend zal zijn hoeveel leenwoorden er in het Nederlands zijn. Niets is minder waar. De uitspraken die hierover worden gedaan, lijken voornamelijk gebaseerd op intuïties en het aantal leenwoorden dat wordt genoemd varieert van 50% tot een grote meerderheid. Dat is wel erg vaag. Daarom besloot ik een steekproef te nemen om tot een bevredigender antwoord te komen. Het eerste probleem daarbij was welke tekst gebruikt moest worden. Hèt Nederlands bestaat niet, en het percentage leenwoorden zal zeker beïnvloed worden door de aard van de gekozen tekst: een medische of juridische tekst zal waarschijnlijk meer leenwoorden bevatten dan een streekroman. Ik besloot een krantestuk te nemen, omdat kranteartikelen actuele problemen behandelen in begrijpelijke, eigentijdse taal. NRC Handelsblad was zo vriendelijk de krant van 7 april 1994 digitaal ter beschikking te stellen. Daarvan heb ik de eerste vier pagina's nagevlooid op leenwoorden, met het onderstaande resultaat.

Het totale aantal woorden op de eerste vier pagina's van NRC Handelsblad van 7 april 1994 bedraagt 11.872; hiervan zijn 996 persoons- of plaatsnamen, die niet meetellen. Veel woorden zijn verbogen vormen zoals liep, loop, loopt, liepen, gelopen. Deze heb ik onder het hoofdwoord lopen verzameld. Dan blijven er 2.311 verschillende woorden over. Hiervan vormen 324 een samenstelling, dus een koppeling van twee of meer woorden zoals alcoholgebruik, asielprocedure, autobom, beurstransactie, bevolkingsgroep. Deze woorden heb ik gesplitst in twee delen (alcohol en gebruik enz.), zodat beide delen meedoen bij de telling. Het is mogelijk dat één deel een leenwoord is, en het andere een erfwoord. (Niet gesplitst heb ik woorden die beginnen met een voorzetsel zoals aandeel en toenemen). Na splitsing kwam het totale aantal woorden op 2.144.

Erfwoorden

Hoeveel van de 2.144 woorden zijn leenwoorden? Precies 658, ofte wel 30,7%. En dan heb ik leenwoorden zeer ruim gedefinieerd: hele oude leenwoorden die allang niet meer herkend worden, zoals aantal, koppelen, kust, pijn, prijzen, school, schrijven, trachten, voogd, heb ik net zo goed meegerekend als herkenbare ontleningen als affaire, chef, circa, deal, drugs, gouverneur, journaal.

Zo komen we dus niet op minstens 50% leenwoorden. Maar misschien komt dat doordat we geen rekening hebben gehouden met het aantal keren dat een woord in de tekst voorkwam, en komen leenwoorden veel frequenter voor dan erfwoorden? Van ieder woord heb ik bijgehouden hoe vaak het in het bestand voorkomt. De tien meest frequente woorden waren: de, van, het, in, met, zijn, een, en, op, dat. De komt 915 maal voor, oftewel 8% van alle woorden luidt de; van komt 450 maal voor en vormt 4% van alle woorden; en het komt 360 maal voor, 3% van alle woorden. Daartegenover staat dat 1.110 woorden, dus iets meer dan 50%, slechts eenmaal voorkomen.

Bij de top-10 zit geen enkel leenwoord. Sterker nog, het eerste leenwoord staat op de 30ste plaats. Het is het woord partij (niet verwonderlijk zo vlak voor de verkiezingen) en deelt de 30ste plaats met het erfwoord ons. Partij en ons hebben beide een frequentie van 40. Bij de 100 meest frequente woorden zijn slechts 15 leenwoord, dus 6,7%. We raken steeds verder van de 50% verwijderd!

Misschien moeten we dan naar de totale frequentie van alle woorden kijken? Die is 11.314. De totale frequentie van de leenwoorden is 1.836, dus 16,2%. Lang geen 50% dus.

Tot nu toe heb ik alle leenwoorden met een ruim gebaar bij elkaar geveegd. Het is interessant om de herkomst van de leenwoorden nader te bekijken. Verreweg het grootste aantal komt uit de Romaanse talen, dus Latijn, Frans, Italiaans, Spaans. Het gaat om 540 woorden, 82% van de leenwoorden of 25,2% van alle woorden. Voorbeelden zijn: centrum, coalitie, collega, rapport. Ook woorden die via het Romaans geleend zijn maar een andere oorsprong hebben, heb ik onder de Romaanse leenwoorden gerangschikt. Zo staan basis, bijbel onder de Romaanse woorden, maar het Romaans heeft ze natuurlijk uit het Grieks.

Blunderen

Aanzienlijk minder woorden komen uit het Duits en Engels. Uit het Duits komen welgeteld 45 woorden, 6,8% van de leenwoorden of 2,1% van alle woorden. Voorbeelden hiervan: aantal, deelname, gehalte, wetenschapper. Uit het Engels komen 49 woorden, 7,4% van de leenwoorden en 2,3% van alle woorden: baby, blunderen, computer, drugs, shoppen. Uit overige talen stammen maar 24 woorden, 3,7% van de leenwoorden. Het gaat om woorden uit het Grieks: allochtoon, amnestie, embryo, kerk; uit het Arabisch: moslim, safari; uit het Hebreeuws: rabbijn, shoa; uit het Turks: koffie en ten slotte het heel oude leenwoord uit het Keltisch ambt.

De meeste van deze leenwoorden zijn volkomen ingeburgerd. Slechts een klein percentage is nog 'vreemd', dat wil zeggen niet aangepast aan het Nederlands. Omdat er bij de taalgebruikers geen overeenstemming bestaat over welke woorden 'vreemd' zijn en welke niet (meer) - zoals de reacties op het laatste spellingvoorstel pijnlijk duidelijk hebben gemaakt - kan ik slechts een globale aanduiding geven van het aantal vreemde woorden. Een persoonlijke schatting is dat slechts 25 woorden 'vreemd' zijn. Deze komen voornamelijk uit het Engels (holocaust, intake, shoppen), wat logisch is, omdat de Engelse leenwoorden het meest recent zijn, dus maar kort de tijd hebben gehad zich aan te passen.

De conclusie is onontkoombaar: het aantal leenwoorden is in de meest 'gunstige' telling ruim 30%, en in de meest 'ongunstige' telling 6,7%. Al met al lijkt de bedreiging van het Nederlands door een invasie van leenwoorden, waar sommigen zo bang voor zijn, nogal mee te vallen. Er zullen wel mensen zijn die vinden dat het gekozen stuk niet representatief is, dat de steekproef te klein is, enzovoort. Toch geeft het een indicatie, en het zal toch niet toevallig zijn dat de meest frequente woorden uit het boek Woordfrequenties, dat in 1975 onder redactie van P.C. uit den Boogaart is verschenen, ook de meest frequente in het NRC-bestand zijn.