Heb meelij met de biografen van 2116

Data en historische archieven

De blik van de historici in de toekomst wordt bepaald door wat archivarissen nu bewaren. Hoe gaan zij te werk in tijden van digitale overvloed?

De Fabeltjekrant is zeer ten dele gedigitaliseerd: van de 1.640 afleveringen zijn er slechts 198 opgeslagen. Dat zijn de latere jaargangen (1985-1992). De eerste jaargangen (1968-1973) staan op 16mm-film en worden bewaard in filmblikken – niet in te zien door leken. Beeld Lynne Brouwer

Het scheelde weinig, of de wereld had dit nooit kunnen lezen: „We hebben zojuist een vliegtuig neergehaald, een AN-26.” Die boodschap zette Igor Girkin op 17 juli 2014 ’s middags online. Girkin, alias Strelkov, was een separatistenleider in Oost-Oekraïne. Een Antonov-26 is een transportvliegtuig, in dienst bij de Oekraïense luchtmacht. Toen het een Boeing 777 van Malaysia Airlines bleek te zijn, was de post verdwenen.

Dat historici (en justitie) de tekst nog hebben, is dankzij Anatol Shmelev, beheerder van het Rusland-archief van het Hoover-instituut in Stanford. Kort daarvoor had hij het Internet Archive gewezen op Strelkov, omdat die een belangrijke figuur in het conflict zou zijn. Het Internet Archive, een digitale bibliotheek in San Francisco die wereldwijd kopieën van websites verzamelt, bewaarde sindsdien automatisch een paar keer per dag een screenshot van Strelkovs pagina op het Russische sociale netwerk VKontakte.

De Strelkov-casus geldt intussen als klassiek voorbeeld van de urgentie om het internet in al zijn vluchtigheid te kunnen vastleggen. Het toont ook dat dat nog steeds min of meer toevallig gebeurt.

Lees ook: Onze bestanden kwijnen weg

„De blik van toekomstige historici wordt bepaald door wat archivarissen en bibliothecarissen nu bewaren”, zegt Charles Jeurgens, hoogleraar Archiefwetenschap aan de Universiteit van Amsterdam. „Hun werk verandert fundamenteel. Vroeger kon je de tijd nemen om bronnen te ordenen; in de digitale werkelijkheid moet je steeds vaker meteen beslissen wat later wel of geen betekenis zal hebben.” Anders is het te laat.

Tweets van Trump

Neem Twitter, dat een belangrijke rol speelt in het publieke debat. Maar kan het bedrijf overleven? Gelukkig bewaart de Library of Congress alle tweets die ooit zijn verstuurd. Handig voor wie later onder de hersenpan van Donald Trump wil kijken.

Maar het is een druppel op een gloeiende plaat. Data vergaan of verdwijnen. Ze worden onleesbaar; dragers gaan kapot, formats verouderen. Correspondentie gaat niet meer per brief, maar zit weggestopt in ontoegankelijke e-mailaccounts en gesloten apps. Heb meelij met de biografen van 2116. De tijd waarin we alles op servers opslaan, kan de tijd van het grote vergeten worden.

Wat te bewaren? Dat is een fysieke en intellectuele uitdaging, zegt ook Huibert Crijns, collectiespecialist Geschiedenis bij de Koninklijke Bibliotheek (KB) in Den Haag. „Het is een poging te denken voor de toekomst: wat wil men later over ons weten?”

De KB verzamelt wat er in Nederland verschijnt aan boeken, kranten en tijdschriften. Het wetenschappelijke focus van vroeger is nu breder. Via veilingen en rommelmarkten probeert de KB nu ook triviale literatuur – de Bouquet-reeks, detectives en pornografie – binnen te halen, omdat dat ook veel over onze tijd zegt.

De site van V&D

Digitaal moet je nóg scherper kiezen. „Webcultuur wordt steeds belangrijker”, zegt Crijns. Maar websites archiveren is dweilen met de kraan open. Hoewel Nederland ruim 2,5 miljoen authentieke domeinnamen telt, volgt de KB er ‘maar’ 20.000. Van het Tilburgse poppodium 013 tot de Zwolse Historische Vereniging. V&D stond al op de lijst, Marks & Spencer, dat ook gaat sluiten, is sindsdien toegevoegd.

Een archivaris moet kunnen leven met het idee voortdurend informatie te verliezen, zegt Crijns. Dat is op papier niet anders. Jan Wolkers en Willem Oltmans bewaarden alles. Maar anderen gooien alles weg.

Selectie is de grootste uitdaging, zegt ook Jeurgens. Nu ons openbare leven naar het internet verhuist, is het bronnenmateriaal voor historici oneindig. „Mediëvisten kunnen betekenis ontlenen aan een paar snippers papier. De schaarste is nu omgeslagen in digitale overvloed.” Om betekenis te kunnen zien moet je schiften. Dat is, zegt hij, „de informatieparadox” waarmee archivarissen nu worstelen.

Stapeltje brieven

Extra complicatie: zonder context heb je niet veel aan data. Vroeger was het vanzelfsprekender, zegt hij. Een brief heeft een afzender en wordt misschien bewaard in een stapeltje met een lint eromheen. Je snapt meteen wat het is. In het datatijdperk is context minder vanzelfsprekend. Dezelfde informatie is op meer manieren te lezen; zie de nepnieuwsdiscussie.

En je moet begrijpen waarom iets juist zó is vastgelegd. Onder druk van de roep om ‘transparantie’ gaan overheden juist verhulder rapporteren, door informatie te anonimiseren of zelfs weg te laten, om later niet in de problemen te komen.

Intussen zorgt digitalisering ook voor een revolutie in de geschiedwetenschap zelf. Digital humanities, uit grote databestanden iets nuttigs destilleren op het gebied van de geesteswetenschappen, nemen een hoge vlucht. Nu ook steeds meer oudere teksten worden gedigitaliseerd, groeien de mogelijkheden. Zo onderzoeken Utrechtse historici – om één voorbeeld te noemen – hoe Amerikaanse ideeën over gezondheid of bedrijfsvoering vanaf 1890 bekend werden in Nederland én of ze een goede of slechte connotatie hebben. Het komt neer op het automatisch tellen van woorden en woordpatronen in teksten. Dat kan „uiterst geraffineerd”, zegt Joris van Eijnatten, hoogleraar Cultuurgeschiedenis in Utrecht. „Je ziet zo eigenlijk wat Nederlanders van zichzelf vinden door zich te spiegelen aan Amerika.”

Stoomtreintjes

Wat zijn de historische bronnen over een eeuw? Lastige vraag.

In de film Metropolis fantaseerde Fritz Lang in 1926 over een stad in de verre toekomst. Maar over de viaducten tussen zijn wolkenkrabbers rijden stoomtreintjes. Futuristen blijven altijd gevangenen van hun tijd.

Crijns waagt toch een poging: „Onze hele collectie is dan gedigitaliseerd en online beschikbaar. De bibliotheek zal vooral een bewaarplaats zijn, geen bezoekplaats. Misschien is er nog een klein leeszaaltje voor heel bijzondere dingen. Het maakt ook niet meer uit waar de collectie staat, misschien is het wel een serverpark ergens op goedkope grond.”

Maar dan onderbreekt hij zichzelf. „Honderd jaar is écht te ver vooruit. Wat ik schets is misschien over twintig jaar al een feit. Eigenlijk”, zegt Crijns, „hebben we geen idee waar we over honderd jaar zitten.”

    • Hans Steketee