Dertigduizend woorden

November 1997 zal in de geschiedenis van de Nederlandse taal voortleven als een gedenkwaardige maand, want vanaf vandaag weten we opeens veel meer over de ouderdom van onze woordenschat dan gisteren. Dat komt omdat zojuist de tweede, ingrijpend herziene editie van het Etymologisch woordenboek van Van Dale is verschenen. Nieuw is onder andere dat bij alle 30.524 trefwoorden staat wanneer ze voor het eerst op schrift zijn aangetroffen.

De meeste mensen zal het worst zijn hoe oud een woord is, maar voor etymologen ligt dat anders: een goede, wetenschappelijke woordstudie hoort bij het kraambed te beginnen. Aan het begin van dit jaar stonden op deze plaats enkele stukken over de gereedschappen die wetenschappers gebruiken om naar de ouderdom van woorden te spitten. Kort gezegd is een en ander onwaarschijnlijk moeilijk en tijdrovend. Men moet meestal genoegen nemen met registers op historische teksten en oude woordenboeken. De belangrijkste hulpbron voor de taal na 1500 is momenteel de cd-rom van het Woordenboek der Nederlandsche Taal (WNT). Dit is niet alleen als woordenboek te raadplegen, maar ook als een gigantisch tekstcorpus met ruim veertig miljoen woorden. Het is een zeer complexe bron, vol hindernissen, voetangels en valkuilen, maar toch, het WNT is de moeder van alle moderne Nederlandse woordenboeken en ook een van de belangrijkste bronnen voor de dateringen in het Etymologisch woordenboek van Van Dale.

Het werk aan die dateringen is gedaan onder leiding van de Utrechtse slaviste en etymologe Nicoline van der Sijs. Zij is de opvolgster van dr. P.A.F. van Veen, de oorspronkelijke samensteller van het Etymologisch woordenboek, die vorig jaar is overleden. Afgelopen donderdag werd op een borrel voor medewerkers aan het woordenboek onthuld wat Van der Sijs heeft gedaan. Tot stomme verbazing van diegenen die haar werk bij Van Dale in de computer invoerden, produceerde zij in haar eentje in vijf maanden tijd zo'n 250 kilo papier. De stapel groeide tot een hoogte van ruim vijf meter, samen meer dan 40.000 A4-tjes, een prestatie die niet zou misstaan in het Guinness Book of Records.

Natuurlijk is er meer gedaan dan alleen die dateringen. Er zijn vierduizend nieuwe ingangen opgenomen, talloze oude lemma's zijn herzien en er is meer aandacht besteed aan de herkomst van uitdrukkingen, maar wetenschappelijk gezien zijn die dateringen het spectaculairst. Zoals ook Van der Sijs opmerkt, loopt het Nederlands wat dit betreft erg achter op het Engels en Frans. In Engeland en Frankrijk wordt al sinds de 19de eeuw systematisch onderzoek gedaan naar de ouderdom van woorden. In Nederland wordt hier pas sinds een jaar of vijftien serieus werk van gemaakt, en dan nog maar door enkelingen die bij elkaar van een paar duizend woorden het geboortejaar hebben nageplozen.

Een en ander maakt het voor het eerst mogelijk om statistisch historisch onderzoek naar de Nederlandse woordenschat te doen. In haar inleiding geeft Van der Sijs hiertoe een aanzet. Terecht houdt zij veel slagen om de arm. Zo wijst zij erop dat de trefwoordenlijst van de Grote Van Dale als uitgangspunt is genomen, dat er daardoor veel leenwoorden en veel vreemde woorden in staan, dat vrijwel alle samenstellingen zijn weggelaten en dat dateringen slechts een indicatie geven van het eerste optreden van een woord. Maar toch, op basis van ruim 30.000 dateringen moeten conclusies te trekken zijn en dat doet zij ook, met de grootst mogelijke voorzichtigheid.

Zo laat zij in kolommen en grafieken zien hoe de Nederlandse woordenschat is gegroeid. Uit de tweede en derde eeuw zijn slechts twee woorden overgeleverd. Het gaat om de plaatsnaam Twente en om wad ('doorwaadbare plaats'), woorden die in Romeinse bronnen zijn gevonden. Dat er zo weinig woorden vóór het jaar duizend zijn gevonden, komt omdat er uit die periode nauwelijks bronnen zijn overgeleverd. Uit het Middelnederlands, de verzameling dialecten zoals die werd gesproken van ruwweg 1200 tot 1500, zijn ruim 6100 woorden overgebleven.

Tussen 1500 en 1700 stijgt het aantal dateringen met ruim 6400. Dat komt onder meer doordat mensen als Simon Stevin, Hugo de Groot en P.C. Hooft uit puristische overwegingen vreemde woorden vervingen door nieuwe woorden die nog altijd standhouden, zoals omtrek, toppunt en stelling. In deze periode reisden de Nederlanders de hele wereld rond. Uit verre landen namen ze talloze nieuwe producten, zaken en dus woorden mee. “De 17de eeuw wordt de Gouden Eeuw genoemd, en dat weerspiegelt zich in de gedateerde woorden”, aldus Van der Sijs. Tussen 1700 en 1800 is in de dateringen een inzinking te zien die overeenkomt met de culturele en economische stagnatie in die periode. Van 1800 tot nu neemt het aantal nieuwe woorden explosief toe. Het Etymologisch woordenboek bevat uit de 19de eeuw ruim 7600 woorden. Er komen vooral enorm veel wetenschappelijke woorden bij, die voordien vaak door de woordenboeken werden genegeerd.

Op sommige vakgebieden bevat het Etymologisch woordenboek veel nieuws. Een onderzoek naar rekenboekjes uit de periode 1450-1600 leverde bijvoorbeeld 65 vroegere dateringen op voor rekenkundige begrippen. Zo was de vroegste datering van biljoen tot nu toe 1824; die is nu teruggebracht tot 1591.

Van der Sijs is de eerste om erop te wijzen dat het zoeken van dateringen een nooit-eindigende bezigheid is. Dat is trouwens ook zo in het buitenland. Zij geeft als voorbeeld de Petit Robert. In dit uitmuntende Franse woordenboek worden de dateringen zo nu en dan per druk naar voren of naar achteren bijgesteld. Soms gaat het slechts om een heel klein verschil. Zo meldt de Robert van 1990 dat apartheid, een Nederlands woord dat internationaal furore heeft gemaakt, in 1957 voor het eerst in het Frans is aangetroffen; in de druk van 1993 is dit gewijzigd in 1954.

Niet iedereen zal het nut of de lol van dit alles inzien, maar historisch-taalkundigen worden er heel blij van en ze doen verder niemand kwaad.

    • Ewoud Sanders