Zoeken naar opa in 81 miljoen digitale artikelen

De Koninklijke Bibliotheek in Den Haag gaat alle edities van NRC Handelsblad van 1970 tot en met 1995 digitaliseren. Vandaag tekenen KB en NRC Media een akkoord.

Jasper Faase kan niet kiezen. Welke krant beschouwt hij als het pronkstuk van de digitale verzameling van dagbladen die de Koninklijke Bibliotheek opbouwt? De oudste nog beschikbare krant van Nederland uit 1618? De zeldzame exemplaren uit de zeventiende en achttiende eeuw afkomstig uit archieven in onder meer Rusland en Vaticaanstad? Of de Juinensche Courant, een parodie van Kees van Kooten en Wim de Bie?

„Het totaal”, zegt de projectleider digitalisering van de Koninklijke Bibliotheek dan maar. Faase is trots op het totaal van 3,4 miljoen krantenpagina’s – 30,6 miljoen artikelen – die de KB sinds 2008 heeft gescand en doorzoekbaar heeft gemaakt. In 2012, het laatste jaar van het door NWO en Agentschap NL gefinancierde project, moet het digitale krantenarchief uitgroeien tot 9 miljoen pagina’s en 81 miljoen artikelen. „Het is een enorme schat aan informatie, zowel voor professionele onderzoekers als algemeen geïnteresseerden, en veel gemakkelijker te doorzoeken dan op papier of microfiche. Je kunt door full text te zoeken zo maar je opa tegenkomen in een artikel.”

Heel blij is Faase ook met het feit dat NRC Handelsblad alsnog onderdeel gaat uitmaken van de Databank Digitale Kranten van de KB. Vandaag ondertekenen beide partijen hun samenwerking. Faase had de hoop eigenlijk al opgegeven. De KB heeft enkele jaren geleden lang onderhandeld met PCM Uitgevers, de toenmalig uitgever van onder meer NRC Handelsblad, de Volkskrant en Trouw, maar de uitgever wilde liever zelf zijn archieven proberen te exploiteren.

De KB weigert met publiek geld kranten te scannen voor commerciële exploitatie. „Wij zijn een bibliotheek”, zegt Faase. „We willen informatie gratis en voor iedereen ter beschikking stellen. De scans mogen niet achter een of andere betaalmuur verdwijnen. Wij snappen natuurlijk ook dat uitgevers in financieel moeilijke tijden naar alle mogelijkheden kijken om business uit hun archieven te halen.”

En dat bleek nog niet mee te vallen. Merkte bijvoorbeeld De Telegraaf, die ook zelf zijn oude kranten te gelde wilde maken, maar uiteindelijk toch koos voor samenwerking met de KB. En dat merkte NRC Handelsblad, inmiddels niet meer van PCM maar van investeringsmaatschappij Egeria en mediaondernemer Derk Sauer. Met de Persgroep (de Volkskrant) wordt onderhandeld maar er is nog geen akkoord.

Voor NRC Media is het nu duidelijk dat „wat voor exploitatie je ook bedenkt voor de oude kranten, die de kosten van digitalisering nooit zal kunnen dragen”. „De erfgoedwaarde van die kranten is groter dan de commerciële waarde.” De krant besloot aansluiting te zoeken bij de digitale collectie van de KB „gezien de omvang en de kwaliteit daarvan”. NRC Media brengt de kranten in, van het eerste exemplaar van fusiekrant NRC Handelsblad in 1970 tot en met de jaargang 1995, het eindjaar van het digitaliseringsproject. Verder steekt NRC Media geen geld in het project.

Naar verwachting zullen de circa 300.000 pagina’s uit NRC Handelsblad in de loop van 2014 beschikbaar komen. Het streven is ook de nummers van beide voorgangers, het Algemeen Handelsblad en de Nieuwe Rotterdamse Courant, van 1940 tot 1970 te digitaliseren. Het Algemeen Handelsblad van 1828 tot 1940 maakt al deel uit van het archief.

De KB, die zich ten doel heeft gesteld de komende jaren alle Nederlandse boeken, kranten en tijdschriften te digitaliseren, scant al kranten sinds de jaren negentig. Het huidige, met 12,5 miljoen euro gesubsidieerde project, loopt sinds 2006. Dat is een internationalere operatie dan je zou verwachten bij een Nederlandse bibliotheek van Nederlandse kranten. In Kampen worden kranten gescand, vaak unieke exemplaren uit instellingen vanuit heel Europa. De scans worden verwerkt in Duitsland, in India worden de afbeeldingen automatisch omgezet in tekst (via optical character recognition, OCR) en in Cambodja wordt aanvullend handwerk gedaan. Na controle door de KB zelf komen de dagbladen beschikbaar op de website kranten.kb.nl.

„Het heeft een jaar geduurd voordat deze werkwijze op de rit stond”, zegt Faase. De KB blijft scannen, onder meer in het project Metamorfoze. Dat moet onder meer publicaties redden uit de periode 1840 tot 1950 die zijn gedrukt op papier dat dreigt te vergaan. Metamorfoze is echter een stuk kleiner dan de digitale krantenbank. Faase: „Er is tegenwoordig veel minder geld beschikbaar voor dergelijke digitaliseringsprojecten. Het wordt snel lastiger om geld bij elkaar te harken. Grote subsidiestromen zoals de programma’s Digitaliseren met beleid en het Geheugen van Nederland zijn er steeds minder. Er is flinke druk op de middelen die erfgoedinstellingen ter beschikking hebben.”

Digitale krantenarchief KB:http://kranten.kb.nl

    • Jan Benjamin