Link II

Zonder hyperlinks, de `klikplekken' waarmee je van pagina naar pagina springt, had het World Wide Web niet bestaan. Die links, die er uitzien als een plaatje of als een stukje onderstreepte tekst, vormen de bruggen tussen de miljoenen losse pagina's die als eilandjes in de webzee liggen. Links maken het Web tot web.

Daarbij zijn het ook nog eens verbazend eenvoudige dingetjes. Staat op een webpagina het volgende stukje HTML-code:

<a href=``www.fla.nl'' hierheen </a

dan laat de browser het woordje `hierheen' blauw onderstreept zien, en weet hij dat een klik daarop betekent dat hij de pagina op het adres www.fla.nl moet ophalen en vertonen. Die letter a betekent dus `hier begint een link', de term `href' is HTML-bargoens voor adres, en /a betekent `hier eindigt een link'. De vishaken vertellen de browser dat het om een code gaat, niet om gewone tekst. In plaats van een linktekstje als `hierheen' mag je ook een plaatje gebruiken, maar dat is dan ook alles. Op dit ene trucje draait heel het World Wide Web, al het andere is maar bijzaak.

Links kunnen naar elk willekeurig adres verwijzen, afstand speelt zoals bekend geen enkele rol. Dat is mooi - er is geen enkel ander medium waarmee je zo moeiteloos in een oogwenk van Uddel naar Ullapool en van Hengelo naar Halifax kunt springen - maar het levert ook allerlei problemen op. Links kunnen je voeren naar verdwenen adressen en naar niet-bestaande of ongewenste adressen.

Verdwenen adressen kom je vooral veel tegen via zoekmachines, zoals Altavista of Ilse. Wat zoekmachines doen, is niets anders dan op trefwoord adressen verzamelen, en die adressen als een lijst links presenteren. Het bijhouden van zo'n bestandendatabase is een gigantisch karwei dat naarmate het Web groeit steeds moeilijker is bij te benen. Daardoor duurt het niet alleen gemiddeld steeds langer voordat nieuwe webpagina's door een zoekmachine worden opgepikt, maar ook voordat pagina's die niet meer bestaan uit de verzameling worden gegooid. En dat zijn er nogal wat. Heel wat mensen die ooit enthousiast aan een homepage of heuse site begonnen, beseften onvoldoende hoeveel tijd en moeite het onderhoud ervan vergt, en gaven het op. Anderen hebben na een tijdje een eigen domeinnaam aangeschaft of een account bij een andere provider genomen, zodat hun site naar een nieuw adres verhuisde, terwijl lang niet iedereen een verhuisbericht handhaaft dat eventueel ongemerkt doorverbindt naar het nieuwe adres. Ten slotte zijn er nog tijdschrift-achtige sites met periodiek vernieuwde pagina's. Die pagina's krijgen vaak telkens een nieuwe naamcode terwijl de pagina's van de vorige editie worden weggegooid.

In al die gevallen leveren bestaande links in zoekmachines en op pagina's van anderen steevast een barse melding op dat HTTP-fout 404 is opgetreden (HTTP staat voor HyperText Transfer Protocol, het mechaniek waarmee webpagina's verstuurd worden): het gevraagde adres, of eigenlijk het bestand met dat adres, bestaat niet. De gastheercomputer waarop dat bestand zou moeten staan bestaat dan trouwens wel, want die stuurt die 404-melding terug.

Als zelfs de computer waarnaar een link verwijst niet bestaat, krijgt u een mededeling van uw browser zelf dat hij de gevraagde `host' of `server' niet kan vinden. Zulke fouten zult u niet gauw tegenkomen via de lijsten links die zoekmachines ophoesten, hooguit is de gevraagde `server' tijdelijk buiten gevecht. Wel komen ze geregeld voor bij links op gewone door mensen geschreven webpagina's, en gaat het om een tikfout. Browserfabrikanten weten dat ook, dus bedachten ze een handigheidje om gemakkelijk het juiste adres van een pagina of plaatje te kopiëren. Klik maar eens ergens op met de rechter muisknop, en kies iets als `lokatie kopiëren' uit het menuutje dat verschijnt. Nu hoef je het gekopieerde alleen nog maar in een linkcode achter `href=' op je webpagina te plakken, en er staat een link met een gegarandeerd correct adres.

Zo ontstaan min of meer onbedoeld heel wat van die `deep links' waar uitgever PCM zich, zoals we vorige week zagen, zo boos over maakt: links die niet naar de voorpagina van een site verwijzen, maar rechtstreeks naar een pagina diep binnenin. Díe was immers interessant, dus daarvan kopieerde de linkmaker met een klikje het adres. Dat zo de door de sitehouder bedoelde route naar die bewuste pagina omzeild wordt, is zijn zorg niet, maar die van de sitehouder. Die laatste heeft, als hij geen deep links wil toestaan ook genoeg mogelijkheden om bezoekers die langs zo'n sluipweggetje binnenkomen toch linea recta voor de voordeur te zetten. Dat kan als de site met een wachtwoord is afgeschermd, maar het kan net zo gemakkelijk zonder.

Een wel serieus probleem is framing, een vorm van pronken met andermans veren. Links vormen niet alleen de verbindingen tussen verschillende websites, maar ook tussen de pagina's van één site. Het Web kent wat dat betreft geen verschil tussen mijn en dijn. Het is dus een fluitje van een cent om door middel van doodgewone links in je eigen site complete pagina's op te nemen die bij de site van heel iemand anders behoren. Deze krant zou dus bijvoorbeeld artikelen uit het Web-Parool in de NRC-website kunnen opnemen alsof ze daar horen.

Dat heet framing, omdat zulk jatwerk gewoonlijk in een eigen frame, een onafhankelijk stuk van het browserscherm, wordt ingelast, omdat anders de dief de besturing over zijn eigen site kwijtraakt aan de geplunderde site. Maar omdat in zo'n frame ook eigen werk kan staan, kun je toch niet zomaar zien dat het om een `site in een site' gaat. Framing is daarom diefstal, kort en goed. Iets tussen een roofdruk en plagiaat in, ook als het met de beste bedoelingen gebeurt.

Overigens kun je je net als tegen deep linking tegen framing redelijk goed beschermen, op ongeveer dezelfde manieren. Het verschil is dat bescherming tegen deep links echt alleen je eigen keuze en verantwoordelijkheid is, terwijl bij framing de framer duidelijk in overtreding is.

En, tja, behalve technisch, commercieel of auteursrechtelijk ongewenste links zijn er natuurlijk ook nog links die ongewenst zijn vanwege datgene waar ze naar verwijzen. Daarover, ijs en weder dienende, volgende keer.

    • Rik Smits