Het web moet denken

Het World Wide Web bestaat tien jaar. Tim Berners-Lee, uitvinder van de markeertaal html, schreef een boek over verleden, heden en toekomst van www. Inmiddels werkt hij aan de volgende informatierevolutie: het semantische Web.

TIM BERNERS-LEE heeft het licht gezien. In zijn boek `Weaving The Web' schrijft de 44-jarige informaticus dat hij zich heeft aangesloten bij de `verenigde denominatie van Amerikaanse unitariërs en universalisten', die elementen uit onder meer het christendom en het hindoeïsme combineert tot wat Berners-Lee `een religie zonder dogma' noemt. Het herinnert hem aan de manier waarop het World Wide Web is georganiseerd: zonder centraal bestuur.

Tien jaar geleden had Berners-Lee een meer praktische kijk op het World Wide Web. Het doel was om wetenschappelijke onderzoeksresultaten op een overzichtelijke manier beschikbaar te stellen aan onderzoekers van het Europese Laboratorium voor Deeltjesfysica (CERN) in Genève, waar hij destijds als adviseur werkte. Omdat hij moeilijk inzicht kon krijgen in alle projecten besloot Berners-Lee, in eerste instantie voor eigen gebruik, een elektronische kaartenbak te ontwikkelen waarin projecten via verwijzingen aan elkaar gekoppeld waren. Eind jaren tachtig besloot Berners-Lee dat programma via het interne computernetwerk van CERN openbaar te maken. Daarbij kwam hij op het idee om literatuurverwijzingen te koppelen aan de documenten van die literatuur zelf. Dat idee was niet nieuw. Wetenschappers voor Berners-Lee waren al bezig geweest met hypertekst, een organisatiestructuur waarin documenten naar elkaar verwijzen. Nieuw was echter wel het idee om de verwijzingen of hyperlinks met een andere kleur te markeren.

Samen met de Belg Robert Cailleau ontwikkelde Berners-Lee begin jaren negentig de van SGML afgeleide markeertaal Hypertext Markup Language (HTML) en de eerste rudimentaire browsers of bladerprogramma's, waarmee de HTML-documenten bekeken kunnen worden.

In maart 1991 was het World Wide Web slechts toegankelijk voor een beperkt aantal CERN-medewerkers, maar korte tijd later kon de webserver – de computer met de webpagina's – ook door wetenschappers buiten CERN worden geraadpleegd. Vanuit universiteiten nam de belangstelling voor het World Wide Web toe, en studenten in Helsinki en de Verenigde Staten begonnen hun eigen navigatieprogramma's te ontwikkelen. De doorbraak kwam toen aan het National Center for Supercomputing Applications (NCSA) van de Universiteit van Illinois Mosaic werd ontwikkeld, de eerste webbrowser die plaatjes in HTML-documenten kon weergeven. Mosaic was de voorloper van Netscape Navigator.

GOPHER

Het Web moest destijds nog wel concurreren met een ander (menugestuurd) navigatiesysteem voor Internet, Gopher. Dat project werd echter om zeep geholpen toen de initiatiefnemers, onderzoekers van de Universiteit van Minnesota, geld begonnen te vragen voor het commerciële gebruik van deze technologie. Kort daarna lieten bedrijven Gopher massaal vallen. Om te voorkomen dat iets dergelijks ook met het Web zou gaan gebeuren, stelde Berners-Lee voor een organisatie in het leven te roepen die open technische standaarden zou ontwikkelen, oftewel technieken waarvoor geen gebruiksrechten hoeven worden afgedragen. Dat is het World Wide Web Consortium (WC3) geworden, waarvan Berners-Lee nu directeur is. Een van de standaarden die het WC3 heeft helpen ontwikkelen is de markeertaal XML, die de beperkingen van de huidige lingua franca HTML moet wegnemen. Ook zal binnenkort een heel nieuw bestandsformaat voor grafische afbeeldingen worden geïntroduceerd. Door plaatjes als abstracte vormen te beschrijven, kunnen browsers zelf het aantal beeldpunten invullen en kunnen grafische afbeeldingen haarscherp op allerlei beeldschermen worden weergegeven, van mobiele telefoons tot pc's.

Een project waaraan Berners-Lee zelf leiding geeft, heeft betrekking op het schrijven en annoteren van webpagina's. Webpagina's worden geschreven met behulp van een soort tekstverwerkers of HTML-editors. Rechtstreeks veranderingen aanbrengen op webpagina's is niet mogelijk, omdat die pagina's op een afgeschermde server staan. Berners-Lee wil dat gebruikers straks gezamenlijk aan documenten kunnen werken, waarbij veranderingen ook meteen zichtbaar gemaakt kunnen worden. Servers onthouden dan wie welke veranderingen heeft aangebracht. Een eerste stap in die richting is reeds gezet met de Amaya-browser.

Nog ambitieuzer is het idee van een semantisch Web, waarin niet alleen documenten, maar ook conceptuele gegevens aan elkaar gekoppeld zouden kunnen worden. Informatie op het Web zou daardoor veel makkelijker te vinden zijn. Zoekmotoren leveren momenteel hoofdzakelijk kwantiteit, geen kwaliteit, omdat ze niet `begrijpen' wat er op de webpagina's staat. Het Web moet volgens Berners-Lee veel meer een relationele database worden, waarin documenten opgeslagen worden die met sleutelwoorden en sleutelwaarden aan elkaar zijn gerelateerd. De technologie die deze revolutie moet inluiden is het deels op XML gebaseerde Resource Description Framework (RDF).

METADATA

In de huidige markeertaal HTML ontbreekt iedere vorm van contextuele of conceptuele informatie. Een computerprogramma kan niet zien of cijfers in een webdocument een bedrag, een leeftijd of een datum voorstellen. De computer heeft hiervoor metadata nodig, coderingen die vertellen wat men in een document kan verwachten. Met die coderingen kunnen computerprogramma's bepaalde handelingen verrichten, zoals het rangschikken van adressen en telefoonnummers. Onder ontwikkelaars bestaat de vrees dat RDF wel eens tot een volwaardige programmeertaal zou kunnen uitgroeien. Hoewel daarmee prachtige applicaties te ontwikkelen zijn, kan de taal ook voor kwaadaardige doeleinden worden aangewend. Vandaar dat men RDF beperkingen wil opleggen door aan een document `schema's' toe te wijzen die aangeven voor welke doeleinden de gegevens gebruikt mogen worden.

Maar Berners-Lee wil meer. Er zijn hogere computertalen nodig die deze gegevens zodanig kunnen interpreteren dat ze begrijpen dat een woord in het ene document dezelfde betekenis heeft als een woord in een ander document, ook al staat er iets anders. Daarbij hoeft men de betekenis van het woord zelf niet te kennen, zolang maar wordt aangegeven dat het woord tot een bepaald concept kan worden gerekend. `Whately' en `Gonnet' zijn bijvoorbeeld beide `Familienamen'. Volgens Berners-Lee is dit een veel betere manier van kennisrepresentatie dan wanneer computers moeten afgaan op beschrijvingen van individuele woorden als `Een wiel is een ding en een auto heeft vier wielen'. Door verbindingen te leggen tussen conceptuele informatie kan het semantische Web volgens Berners-Lee gaandeweg kennis over zijn eigen domein vergaren. Waar dat precies toe zal leiden kan moeilijk worden voorspeld. Als met RDF informatie op het Web doeltreffender gevonden kan worden, lijkt hypertekst als navigatiestructuur in elk geval geen lang leven beschoren. Wanneer slimme programma's alle informatie kunnen vergaren die de gebruiker wenst, is surfen eigenlijk niet meer nodig.

Weaving The Web; Tim Berners-Lee. Uitgever Harper Collins. ISBN 0-06-251586-1. Prijs: $26.

    • Jan Libbenga