Digitalisering bibliotheek is een uitstekend middel

Het valt me in diverse artikelen op dat tegenstanders van bibliotheek-digitalisering kennelijk niet weten wat digitalisering van boeken precies betekent. Er wordt gesteld dat digitalisering niet mogelijk is vanwege de niet 100 procent foutloze tekstherkenning. Zo zou er bij digitalisering - mogelijk zeer cruciale - tekst verloren gaan. Echter, de tekstherkenning wordt slechts gebruikt om een gemakkelijke zoekfunctie naar tekst te verkrijgen; iets wat men nu in de ouderwetse bibliotheek met papieren boeken helemaal niet heeft.

Digitalisering van boeken betekent dat elke bladzijde wordt gescand en dat er een bitmap - of zo u wilt foto - van de pagina wordt gemaakt. Deze foto is pixel voor pixel gelijk aan wat er op de scanner ligt. In één moeite door - de bladzijde ligt immers toch op de scanner - wordt er met tekstherkenning een bestand gemaakt van de woorden op de pagina t.b.v. de zoekfunctie. Uiteraard worden via een algoritme alleen de significante woorden als referentie naar de betreffende pagina opgeslagen in het zoekbestand.

Elke pagina is dus zonder verlies als digitale foto beschikbaar, inclusief alle notities die vroegere eigenaars met pen, potlood etc. hebben aangebracht, zowel tekst als tekeningetjes. Er was iemand die beweerde dat dit soort ”interessante” toevoegingen zou verdwijnen. Niet dus. Slechts de als bladwijzer gebruikte bh-bandjes, die de betreffende criticus zei te zullen missen, zullen wellicht niet op de foto worden gezet.

Digitalisering van de bibliotheek is een uitstekend middel om de collectie voor de toekomst veilig te stellen. Bovendien wordt de toegankelijkheid van de boeken aanzienlijk vergroot door de bij de digitalisering gemaakte zoekmachine. Een goed voorbeeld van zulke digitalisering is de etymologie-dvd van Onze Taal”, die enige tijd geleden door Ewoud Sanders in zijn column is behandeld. Op deze dvd staan veertig woordenboeken, elk compleet per pagina weergegeven met pdf-bestanden, inclusief titelpagina`s en dergelijke. Bovendien is er een goed werkende index.

De critici van de bibliotheek-digitalisering doen mij denken aan critici van hetzelfde type, die in 1982 bij invoering van de cd beweerden dat digitale muziekopslag niet mogelijk was. Hun argument was o.a. dat er tussen de bemonsteringen van het signaal `muziek verloren zou gaan`. Deze mensen deden geen enkele moeite om zich in het onderwerp te verdiepen maar probeerden om hun bedreigde status van deskundige met alle macht overeind te houden. Ik hoop maar dat dit niet de drijfveer is van de critici van de bibliotheek-digitalisering.