Papier in de computer

COMPUTERS EN MENSEN kunnen maar moeizaam met elkaar communiceren. Met wat ik op een papier schrijf of teken kan hij niets beginnen, en aan de diskettes waarop hij zich zo in zijn element voelt is voor een mensenoog niets interessants te zien. Er moet dus vertaald worden: bytes in letters en plaatjes, letters en plaatjes in bytes. Het eerste lukt al heel lang behoorlijk goed.

Het beeldscherm maakt voor mensenogen zichtbaar wat er in de ingewanden van de computer omgaat, de printer zet die informatie zelfs op ons favoriete medium, papier. Het omgekeerde gaat een stuk minder gemakkelijk. Het toetsenbord is onze tolk als we een computer iets willen mededelen, maar met papier kan de computer niets beginnen. Tegelijk is papier onvervangbaar gebleken. Het is goedkoop, houdbaar, stevig en flexibel tegelijk, en je kunt er met niet meer dan een pennetje van een piek elke gewenste soort informatie op kwijt, op elke manier die je maar wilt. Daar kan geen computer tegenop.

Papier wil niet in de computer, maar het moet dus toch. Over dat probleem hebben al heel wat mensen zich het hoofd gebroken. Een flinke stap in de goede richting betekende de scanner. Daarmee kon papieren informatie omgezet worden in een computerbestand, een digitaal plaatje. Leuk, maar als het om tekst, getallen of aangekruiste vakjes op een bestel- of enquêteformulier, gaat, dan schiet je daar weinig mee op. Of beter: de computer schiet er niets mee op. Voor hem blijft zo'n plaatje zonder betekenis.

Tot nu toe waren er twee manieren om met zulke informatie toch iets te doen. De meest gebruikte manier is het inschakelen van mensen. Bij heel wat postorderbedrijven en andere grootgebruikers worden alle binnengekomen formulieren meteen in de postkamer in de computer ingescand, waarna nijvere personeelsleden achter hun terminals met de hand de gegevens van de afbeeldingen van de formulieren op hun scherm in het 'echte' systeem overtypen. Dat heet dan een digitale orderadministratie, iets dat alleen klopt in de letterlijke, direct uit het Latijnse 'digitis' afgeleide betekenis van 'digitaal': met de vingers.

De andere manier heet OCR, een afkorting die in het Engels staat voor optische karakterherkenning. OCR-programma's kunnen uit een digitaal plaatje van een pagina tekst de letters destilleren, en zo het plaatje tot een echt tekstbestand reduceren, dat bijvoorbeeld weer met een gewone tekstverwerker bewerkt kan worden. Maar OCR is traag, eist een sloot werkgeheugen, en is behalve bij netjes gedrukte koeien van letters en cijfers behoorlijk onnauwkeurig. Bovendien kunnen OCR-programma's niets beginnen met typische formulierelementen als aankruisvakjes. Maar inmiddels hebben de immer creatieve geesten van de onderzoekslaboratoria van Rank Xerox iets beters bedacht. Xerox' laboratorium in het Californische Palo Alto werd indertijd beroemd - en Apple, dat er als eerste de kunst afkeek, schatrijk - door de uitvinding van nu doodgewone zaken als de muis en de grafische interface zoals we die kennen van de Macintosh en Windows. Een van de nieuwste uitvindingen, maar inmiddels al echt verkrijgbaar, is Smartpaper. Slim papier, dat veel beter met computers overweg kan dan we gewend zijn.

Anders dan de naam doet vermoeden, is er met het papier zelf niets bijzonders aan de hand. Smartpaper is een combinatie van extra, voor de computer hanteerbare informatie op een stuk papier, en software die die informatie kan verwerken. De extra informatie ziet eruit als een grijzig vlakje, dat op een willekeurige plek op het papier mag staan. Wie goed kijkt, ziet dat het vlakje is opgebouwd uit minieme schuine streepjes, 'glyphs' in het Xerox-jargon, die elk staan voor een bit: een nul of een één. Maximaal passen op die manier zo'n 150 bytes op een vierkante centimeter. Niet veel als je het met de dichtheid van een harde schijf vergelijkt, maar toch heel wat, en veel meer dan met echte tekst haalbaar is.

De bijbehorende software zoekt op gescande pagina's naar zo'n blokje glyphs, en verwerkt ze, al naar gelang hun betekenis. Er kan bijvoorbeeld een stukje tekst in staan, of een plaatje. Dat kan van nut zijn voor indentiteitspapieren, bijvoorbeeld. Het is een stuk lastiger om een paspoort van een andere pasfoto te voorzien, als die foto ook nog eens in een grijs blokje glyphs verstopt op dezelfde pagina staat. Ook kun je met glyphs aangeven waar op de pagina aankruisvakjes te vinden zijn, waarna de software automatisch kijkt of die vakjes al of niet zijn aangekruist, zwartgemaakt of van een vinkje voorzien, dat maakt niet uit. Er kan zelfs informatie in staan die automatisch andere programma's start, zodat een eenvoudig stuk papier een hele computer kan aansturen. Op die manier kun je bijvoorbeeld formulieren echt automatisch verwerken: ingevuld papier in de scanner, en de gegevens gaan volautomatisch naar het archief, de orderadminstratie, de juiste database, of wat ook.

Het werkt uiteraard alleen met papier dat van de juiste instructies in glyphs is voorzien, maar ook dat is niet moeilijk. Je geeft met behulp van de software de instructies op, zegt waar op de pagina je ze wilt hebben, en printen maar. Dat kan ook met al voorgedrukte formulieren. Ook aan ezelsoren, vouwen en kreuken, omvallende koffiekopjes, inktvlekken en nietjes is gedacht. Het systeem bevat voldoende correctiemechanismen om heel wat beschadiging te kunnen overleven. Papier met glyphs kun je kopiëren en, mits een lage resolutie wordt gebruikt, 'grove glyphs' dus, zelfs faxen. Je kunt er zelfs, mits je het niet te dol maakt, dwars overheen schrijven.

Het leukste aan glyphs is misschien wel dat ze zo flexibel en onopvallend zijn. Je kunt ze bijvoorbeeld als een grijs balkje tussen kolommen op een formulier zetten, of zelfs in het logo verwerken. Dat is nu goede automatisering: er is aan de mens gedacht. De gegevens zijn er voor de computer, de papiergebruiker merkt er vrijwel niets van.

    • Rik Smits