'Regel de digitalisering van erfgoed centraal'

Opinie Bij de digitalisering van oude boeken, kranten en tijdschriften is veel geld verspild. Een pleidooi voor verbetering in 7 punten.

Sinds 2004 is er tussen de 50 en 200 miljoen euro uitgegeven aan de digitalisering van oude kranten, boeken en tijdschriften. De betrokken partijen wisten het al langer, maar in het artikel ‘Digitaal drama’ (Wetenschapsbijlage 10 & 11 september) kon iedereen het lezen: er wordt niet of slecht samengewerkt, er is onvoldoende standaardisering en ook bij de ontsluiting gaat van alles mis.

De Nederlandse Taalunie wil dit najaar een congres beleggen met de verantwoordelijke beleidsmakers om de situatie te verbeteren. Dat is een mooi initiatief, maar de Taalunie kan niks afdwingen en daarom is de kans levensgroot dat het bij mooie beloftes blijft. Wat er volgens mij zou moeten gebeuren is dit:

1 Al het geld voor digitalisering van papieren erfgoed zou uit een centrale pot moeten komen. Daardoor kan de subsidieverstrekker eisen stellen aan de kwaliteit van de digitalisering. Nu krijgen instellingen het geld en mogen ze vervolgens zelf uitzoeken hoe ze de digitalisering precies aanpakken.

2 Een instelling krijgt alleen subsidie als ze toezegt de digitalisering volgens vastgelegde technische specificaties te laten verlopen. Ook de zogenoemde metadata – allerlei extra gegevens over de bron – moeten volgens een bepaalde standaard worden aangeleverd. Alleen op die manier kunnen gedigitaliseerde bronnen uiteindelijk worden samengebracht: in deelcollecties – voor een bepaald wetenschappelijk onderzoek – of in portals. Die internationaal ontwikkelde standaarden zijn er al, maar ze zijn niet verplicht gesteld, met als gevolg dat er miljoenen euro’s over de balk zijn gesmeten.

3 Er moet een koppeling komen tussen het verstrekken van subsidie en de kwaliteit van de tekst van een gedigitaliseerde bron. De meeste oude bronnen worden gelezen met behulp van optical character recognition (ocr): software die de letters op een plaatje van een pagina omzet in bewerkbare en doorzoekbare tekst. Hoe ouder de tekst, hoe meer daarbij misgaat, maar de tekstkwaliteit van de huidige gedigitaliseerde bronnen loopt onnodig ver uiteen. Ontegenzeggelijk levert de Digitale Bibliotheek voor de Nederlandse Letteren (DBNL) momenteel de beste kwaliteit, ook bij oude teksten. Daar staan andere projecten tegenover waarbij geen enkele vorm van ocr-correctie wordt toegepast, zelfs niet bij evidente en makkelijk te corrigeren fouten (zoals‘ fch’ voor ‘sch’).

4 Wetenschappers, onderzoekers en andere gebruikers moeten nauwer worden betrokken bij de ontwikkeling van grote en belangrijke websites op dit terrein. Betere samenwerking kan veel van de huidige problemen (slechte en onduidelijke interfaces, fouten in handleidingen) voorkomen.

5 Er moet een centraal register komen waarin wordt vastgelegd wat er tot nu toe is gedigitaliseerd en wie waarmee bezig is. Dit kan grotendeels worden gerealiseerd door bestaande databanken aan elkaar te koppelen. Astrid Verheusen, hoofd innovatieve projecten bij de Koninklijke Bibliotheek (KB), toonde enkele jaren geleden op een congres waar ook veel van de verantwoordelijke beleidsmakers aanwezig waren, met voorbeelden aan hoeveel dubbel werk er werd verricht. Het heeft niet geholpen. Enige remedie: alleen geld geven aan instellingen die eerst nakijken wat er al gedaan is en die registreren wat ze zelf gaan doen.

6 Dat centrale register moet ook toegankelijk worden voor het publiek. Dit geeft mensen de gelegenheid om boeken te schenken. Jaarlijks gooien antiquaren, veilinghuizen, tweedehandswinkels, serviceclubs en particulieren honderdduizenden boeken en tijdschriften weg – vaak met pijn in het hart. Richt bij alle universiteitsbibliotheken en de KB een depot in waar je die boeken kunt inleveren: in de eerste plaats voor boeken en tijdschriften van voor 1900 (een makkelijk criterium, met als voordeel dat bijna alle titels rechtenvrij zijn).

Ik heb zelf ervaring met dit soort schenkingen: de afgelopen jaren heb ik duizenden oude boeken en tijdschriften, uit mijn eigen collectie en uit collecties van kennissen, ter digitalisering geschonken aan de DBNL. Voordeel: deze boeken en tijdschriften mogen worden versneden. Dat is de enige manier om goedkoop te digitaliseren (10 of 15 cent per pagina in plaats van 1 à 1,50 euro).

7 Er moet een nationaal plan komen om tegen de laagste kosten binnen tien jaar alle belangrijke bronnen op een professionele manier te digitaliseren. Het initiatief hiertoe zou moeten worden genomen door de KB, de DBNL en de universiteitsbibliotheken van Amsterdam, Leiden en Utrecht. Zij zijn wat dit betreft de grootste partijen dus dat schiet veel meer op dan een congres van de Taalunie, hoe goed bedoeld ook.

Het maatschappelijk belang lijkt mij ondertussen zonneklaar: massadigitalisering is een hoofdrol gaan spelen in de ontsluiting van cultureel erfgoed.

Ewoud Sanders is medewerker van deze krant. Hij beschikt zelf over een grote collectie gedigitaliseerde bronnen.

    • Ewoud Sanders