Het verleden op floppy

Tijdschrift voor Geschiedenis, no 2: geschiedenis en informatica, Wolters-Noordhoff, Groningen 1990, ISSN 0040-7518.

O. W. A. Boonstra, L. Breure en P. K. Doorn: Historische informatiekunde; inleiding tot het gebruik van de computer bij historische studies. Uitgeverij Verloren, Hilversum 1990, ISBN 90 65503366.

Historici ontdekken met behulp van de computer nieuwe patronen en verbanden in het verleden. De analyse gaat dan bliksemsnel - maar de invoer van de gegevens is tijdrovend en kostbaar.

Volgens een Amerikaanse sociologische theorie heeft de industrialisatie in de negentiende eeuw een grote invloed gehad op de samenstelling van huishoudens. Het kerngezin, met alleen ouders en kinderen, zou de plaats zijn gaan innemen van het zogeheten samengestelde huishouden, waarin ook andere familieleden zijn opgenomen. Het kerngezin zou meer individuele vrijheid en persoonlijke ambitie toestaan en daardoor succesvoller zijn in een geindustrialiseerde maatschappij. Op deze theorie hebben historisch demografen vaker aanvallen gericht, maar zelden is dat zo effectief gedaan als door Angelique Janssens. Haar onderzoek naar 800 Tilburgse huishoudens geeft de theorie op geen enkele manier steun. Nieuw in Janssens onderzoek is dat zij de 800 huishoudens over een grote tijdspanne, van 1840 tot 1920, van jaar tot jaar heeft gevolgd. Dit levert een veel genuanceerder beeld op van de ontwikkeling van huishoudens dan de momentopnamen, waarmee men tot nu toe heeft gewerkt.

In tegenspraak met de theorie vormde het overgrote deel van de Tilburgse huishoudens tijdens bepaalde fasen van hun 'levenscyclus' een uitgebreid gezin. Vooral aan het begin van de levenscyclus, als de kinderen introuwen, en aan het eind, als ouders bij de kinderen intrekken. Het uitgebreide gezin kwam bij fabrieksarbeiders even vaak voor als bij thuiswerkers. Bovendien waren samengestelde gezinnen maatschappelijk ten minste even succesvol als kerngezinnen.

Het onderzoek van Janssens, waarop ze in december aan de Nijmeegse universiteit promoveert, had zonder computer niet uitgevoerd kunnen worden. Haar voornaamste bron was het Tilburgse bevolkingsregister. Hierin wordt sinds het midden van de vorige eeuw bijgehouden wie waar woont, met naam, sekse, geboortedatum en -plaats, beroep, religie en sterftedatum van alle bewoners en hun relatie ten opzichte van elkaar, evenals de datum van binnenkomst in het huishouden en de datum van vertrek.

Dat levert - alle 800 huishoudens over tachtig jaar bij elkaar opgeteld - zo'n rijkdom aan gegevens op dat ze zonder computer niet te analyseren zijn.

De computer is pas laat het historische onderzoek binnengedrongen, maar rond 1980 is het apparaat aan een niet meer te stuiten opmars begonnen. Studenten groeien ermee op en assistenten-in-opleiding kunnen er niet meer buiten.

Het feit dat het traditionele Tijdschrift voor Geschiedenis zijn jongste nummer geheel aan het thema informatica heeft gewijd wordt door computer-adepten als een doorbraak beschouwd. Een tweede wapenfeit is het verschijnen vorige week van het handboek Historische informatiekunde. Het is het eerste boek dat een overzicht geeft van de mogelijkheden van de computer bij historisch onderzoek. 'Historisch-culturele informatiekunde' is inmiddels een normaal onderdeel van de studie geschiedenis, maar adequaat lesmateriaal was nog niet aanwezig.

In Groningen is historisch-culturele informatiekunde al een afstudeerrichting die deze maand de eerste studente aflevert. In deze studie is de nadruk steeds meer komen te liggen op informatica-vakken, zegt George Welling, die het onderwijsprogramma heeft ontwikkeld. “ Of het nu om historische gegevens of andere gegevens gaat, de methoden en technieken van informatie-analyse zijn dezelfde. De opleiding bestaat nu nog voor de helft uit geschiedenis-vakken, voornamelijk om vaardigheden bij te brengen die je nodig hebt in de geschiedwetenschap, zoals bronnenkennis en handschriftkunde.”

Database

Het aanleggen van een database is het grootste probleem voor de historicus die de computer wil gebruiken. Een database is te beschouwen als een verzameling van kaartenbakken, in computertermen bestanden geheten, die aan elkaar zijn gekoppeld. Zo heeft Angelique Janssens een database aangelegd van vier bestanden, twee met gegevens over de 800 Tilburgse huishoudens en twee met persoonsgegevens.

Elke categorie heeft een 'statisch' bestand, dat constante gegevens bevat (bijvoorbeeld de naam van een persoon) en een 'dynamisch' bestand met gegevens die aan veranderingen onderhevig zijn (bijvoorbeeld het aantal personen dat een huishouden telt). Doordat de computer de gegevens uit die vier 'kaartenbakken' met elkaar in verband kan brengen is hij in staat om antwoord te geven op vragen als: Hoeveel hoofden van huishoudens, met als beroep wever, hebben in de eerste tien jaar van het huishouden inwonende familieleden gehad? Of: Wat is het beroep van de zoons van de huishoudens die ooit eens een uitbreiding met andere familieleden hebben gehad?

Volgens een recente inventarisatie is het aantal historische databases in Nederland gegroeid van 45 in 1980 tot 131 in 1990. Voor het overgrote deel gaat het om sociaal-historisch en historisch-economisch materiaal - cijfermatige gegevens lenen zich het beste voor computerbewerkingen. De databases bevatten gegevens uit allerlei soorten bronnen, van klassiek latijnse teksten tot middeleeuwse handschriften, van zeventiende-eeuwse schepenarchieven tot juridische documenten uit de eerste helft van deze eeuw.

De middeleeuwen zijn met 29 databases vertegenwoordigd. Ook hier gaat het voornamelijk om economisch materiaal. Zo bouwt Leiden, in samenwerking met Belgie en de Verenigde Staten, aan een databank van middeleeuwse munteenheden. Veel steden hadden hun eigen munten die overal in Europa circuleerden en een geldig betaalmiddel waren. Een ramp voor de middeleeuwse onderzoeker die prijzen, lonen of welke financiele transacties dan ook wil vergelijken. De databank kan antwoord geven op vragen als: Hoeveel is een florentijnse ducaat in 1423 in Brugge waard ? Via een 'on-line' verbinding (via het telefoonnet) kan men rechtstreeks en op afstand, ook vanuit het buitenland, de database raadplegen.

De meeste historische databases betreffen de negentiende en twintigste eeuw, zo blijkt uit de inventarisatie. Voor deze periode zijn de bronnen het talrijkst en het meest systematisch bijgehouden en daardoor gemakkelijker te bewerken voor de computer. Zo heeft Anton Schuurman, universitair docent agrarische geschiedenis in Wageningen, een database aangelegd van 700 boedelbeschrijvingen in een onderzoek naar de 'materiele cultuur' op het negentiende-eeuwse platteland.

Boedelbeschrijvingen werden door de notaris opgemaakt om de aanspraken van minderjarige kinderen op de erfenis te beschermen na het overlijden van een van de ouders. Ze bevatten doorgaans een lijst van al het roerend goed per vertrek en aparte beschrijvingen van het aanwezige goud, zilver, vee, gewassen, handelswaar, geld en waardepapieren. Boedelbeschrijvingen zijn dus een goede indicatie van welvaart en levensstijl.

Schuurman heeft onder meer onderzocht in hoeverre die varieerde per sociale klasse. Hij constateerde dat er in het begin van de negentiende eeuw een duidelijk verschil is tussen boeren en burgerij. Staken boeren hun geld vooral in sieraden, de burgerij kocht dure huishoudelijke goederen als tafelzilver. De boeren lieten hun welvaart buitenshuis zien, terwijl de burgerij die liever binnenshuis aan groepsgenoten toonde.

Tegelijkertijd bespeurt Schuurman een toenemende huiselijkheid bij alle sociale klassen in de loop van de negentiende eeuw. De boedelbeschrijvingen bevatten steeds meer voorwerpen die waren gekocht om het thuis gezellig te maken, zoals tafel- en vloerkleden, ornamenten, spiegels en klokken.

Prostitutie

Een geheel ander onderwerp betreft het onderzoek van Sophie de Schaepdrijver, werkzaam aan het Postdoctoraal Instituut voor de Sociologie in Amsterdam: De prostitutie in Brussel tussen 1844 en 1877. Ze ontdekte dat er drie categorieen bordelen waren. In de laagste categorie werkten de Vlaamse meisjes, in de middelste klasse immigranten die uit het Franstalige Wallonie afkomstig waren en in de sjiekste bordelen waren de prostituees Francaisaises. Hoe Franstalighoe hoger de sociale status.

Niet bekend

Prostitutie was in de onderzochte periode legaal in Brussel. Bordeelhouders werden bij de politie geregistreerd. Op basis van politiegegevens kon De Schaepdrijver 370 dossiers van bordeelhouders samenstellen die ze in de computer invoerde, elk met zo'n honderd variabelen, zoals afkomst, leeftijd van intree in de prostitutie, reden van uittreden en taalgebruik. Zo kon ze de computer laten uitrekenen of er een samenhang bestond tussen deze kenmerken en de mate van succes in de prostitutie.

In alle genoemde voorbeelden wordt de computer gebruikt om in een gigantische berg van gegevens naar samenhangen te zoeken. Dat is niet nieuw. Sociale wetenschappers en economen doen het al twintig jaar. De achterstand van historici heeft grotendeels te maken met de complexiteit van het bronnenmateriaal, zegt Onno Boonstra, docent historische informatiekunde in Nijmegen. Historische bronnen zijn immers vaak onvolledig, bevatten dikwijls onjuistheden (bijvoorbeeld een verkeerd opgetelde tabel in een belastingregister) of varianten in spelling, maten, gewichten en munteenheden. Is de Laureijsen die in een doopakte van 1785 staat vermeld, dezelfde als de Lavrijse die in een trouwboek van 1815 voorkomt?

” Sociale wetenschappers hebben het veel gemakkelijker”, meent Boonstra, zelf van oorsprong socioloog. “ Ze kunnen de mensen selecteren die ze willen onderzoeken en hen precies naar datgene vragen wat ze willen weten. Historici moeten het doen met een verzameling van gegevens, een gemeente-archief bijvoorbeeld, die ooit voor een heel ander doel is aangelegd dan waarvoor zij hem nu als onderzoeker willen gebruiken.”

Historici willen bronnen integraal, zoveel mogelijk in hun oorspronkelijke vorm, in de computer invoeren, inclusief de gegevens die ze voor het onderzoek in eerste instantie niet nodig denken te hebben. Integrale invoering is noodzakelijk voor de wetenschappelijke controle: collega-historici moeten kunnen nagaan of de onderzoeker op de juiste wijze met de gegevens is omgesprongen. Integrale invoering heeft nog twee enorme voordelen: je kunt op de oorspronkelijke gegevens terugvallen als zich tijdens het onderzoek nieuwe vragen voordoen en dezelfde gegevens kunnen opnieuw worden gebruikt voor een anderssoortig onderzoek.

Het is echter zeer tijdrovend en daardoor kostbaar om de bron letterlijk in de computer in te tikken. Daar komt bij dat in tweede instantie altijd een gestandaardiseerde versie van de bron moet worden gemaakt, wil je er computerbewerkingen op kunnen loslaten. Hiervoor moeten zogeheten hulptabellen worden geschreven, waardoor de computer bijvoorbeeld weet dat bouwman, landarbeider en landbouwer alle drie een agrarisch beroep zijn. Of dat Viipuri, Wijburg en Wiborg naar een en dezelfde Finse plaats verwijzen.

Historische databases bevatten al gauw tientallen van dergelijke hulptabellen, die aan alle gegevensbestanden zijn gerelateerd. “ Een historische database is daardoor meestal erg ingewikkeld”, zegt Boonstra. Hij wil dan ook beslist niet alle onderzoekers een computer aanpraten. “ De tijd die je wint bij het analyseren van de gegevens compenseert lang niet altijd de tijd die het kost om een database op te zetten en de gegevens in te voeren. Ik heb weleens studenten bij zo'n onderzoek begeleid. Er is een hele mooie scriptie uit voortgekomen. Maar het heeft zoveel tijd gekost dat ik achteraf dacht, we hadden er niet aan moeten beginnen.”

Onderzoek dat erop gericht is methoden en technieken te ontwikkelen waarmee de computer efficienter en effectiever kan worden gebruikt in de historische wetenschap, wordt nog onvoldoende uitgevoerd. De meest voor de hand liggende geldschieter, de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO), wordt verweten hiervoor te weinig aandacht te hebben.

Zelf financieren

George Welling, docent bij de vakgroep alfa-informatica in Groningen, moet zijn promotie-onderzoek zelf financieren. “ Ik kan natuurlijk de apparatuur van de universiteit gebruiken, maar de belangrijkste kosten, de invoerkosten, betaal ik zelf. Een werkloze musicoloog voert de gegevens voor me in. Voor een tientje per uur. Dat hakt er stevig in.”

Welling doet onderzoek naar de economische situatie van Nederland in de achttiende eeuw: “ De theorie is dat er sprake is van een grote economische achteruitgang. Dat de Republiek werd voorbijgestreefd door zijn handelsconcurrenten Engeland, Frankrijk en - in mindere mate - Hamburg. In een recent boek beweert Jonathan Israel zelfs dat de Hollandse handel niet alleen relatief achteruitging, maar ook in absolute zin. Nederland zou bijvoorbeeld het marktaandeel in koloniale waren verloren hebben. Uit mijn onderzoek blijkt dat hier niets van klopt.”

Welling baseert zich op een betrekkelijk nieuwe bron, de paalgeldregisters. Deze zijn niet alleen vollediger, maar ook meer specifiek dan de bronnen die in eerder onderzoek zijn gebruikt. “ Daardoor heb ik een veel gedetailleerder en completer beeld van de Hollandse handel dan bekend was”, aldus Welling.

Paalgeld is een belasting waaruit de betonning en bebakening van de Zuiderzee werden bekostigd. Het werd geheven op alle schepen die de Zuiderzeehavens binnenkwamen, met uitzondering van de Oostindische Compagnie. In de paalgeldregisters is nauwkeurig bijgehouden hoeveel belasting die schepen moesten betalen, met datum, naam van de schipper, hoeveelheid lading en soort produkten.

Welling beperkt zich in zijn onderzoek tot de schepen die de Amsterdamse haven binnenvoeren in 1742 en in de jaren zeventig van de achttiende eeuw. In die periode is het aantal schepen aanzienlijk toegenomen, van 2700 in 1742 tot 3600 in 1778, wat al een indicatie is van een bloeiende handel.

Van alle schepen en hun lading heeft Welling 250.000 gegevens in de computer ingevoerd. Uit voorlopige analyses blijkt dat Amsterdam een zeer grote verscheidenheid aan produkten importeerde. Welling: “ Sommige schepen hadden zelfs veertien verschillende produkten aan boord, waaronder ook dure koloniale waren. Allemaal aanwijzingen dat Amsterdam een zeer bloeiende handelsstad was.”

Hergebruik

Het grote voordeel van databestanden is de mogelijkheid tot hergebruik. Bestanden die op verschillende perioden of landen betrekking hebben, kunnen bijvoorbeeld worden gebruikt voor een vergelijkend onderzoek. Bestanden die over eenzelfde onderwerp anderssoortige gegevens bevatten, kunnen elkaar aanvullen. Veel floppies en systeembanden liggen echter te verstoffen in archieven, universiteiten en onderzoeksinstellingen en zijn voor derden ontoegankelijk. Ook het gebruik van verschillende systemen en programma's bemoeilijkt de uitwisseling. De vereniging voor Geschiedenis en Informatica, die zo'n 250 leden telt in Nederland en Vlaanderen, ijvert dan ook al jaren voor een Nederlands Historisch Data Archief (NHDA ), waar alle particuliere computerbestanden centraal worden gearchiveerd.

Na jaren van gebakkelei over financiering en vestigingsplaats en vier rapporten die de noodzaak van een NHDA onderstrepen, ziet het er nu naar uit dat er volgend jaar een begin mee wordt gemaakt.

Alleen al vanwege de enorme tijdsinvestering die gemoeid is met het invoeren van de gegevens is het wenselijk dat er een centraal data-archief komt dat heranalyses van het materiaal aanmoedigt. De NDHA- werkgroep stelt in een van haar rapporten dat gegevensverzameling teveel aandacht opeist, wat ten koste gaat van het analyseren van het materiaal.

Welling is al acht jaar met zijn onderzoek bezig en hij heeft zeker nog twee jaar te gaan om het databestand te voltooien. “ Ik ben er mee doorgegaan om te laten zien dat het een zinnig project is en niet een megalomane actie van een computerfanaat. Wie bijvoorbeeld geinteresseerd is in schippersgedrag, in de import van een bepaald produkt of in handelscontacten tussen Amsterdam en Spanje, kan die database van mij heel goed gebruiken.”

” Maar hij zou nog moeten worden uitgebreid”, aldus Welling. “ De paalgeldregisters lopen door tot 1836. Iedereen roept dat na de Franse tijd de Nederlandse handel helemaal in de versukkeling is geraakt. Nu hebben we een bron waarmee we dit met harde gegevens kunnen checken. Laten we hem dan ook gebruiken. Maar op eigen kosten doe ik dat niet meer. NWO moet maar bijspringen.”

    • José van Vonderen