Onze bestanden kwijnen weg

Opslagtechnologie Wat gebeurt er met onze data als de huidige opslagtechnologieën zijn vergaan en als Apple, Microsoft of Facebook niet meer bestaan? We hebben toegang tot meer kennis dan ooit, maar die kennis is ook veel kwetsbaarder.

Beeld Lynne Brouwer

Buiten raast het verkeer over de snelweg 101 door Mountain View, achter de deuren van het Computer History Museum wandel je door de digitale revolutie. Langs houten ‘computers’: kerfstokken, telramen en rekenlinialen. Langs mechanische calculators, ponskaartsystemen en analoge computers. Langs de enorme IBM-mainframes en ten slotte de minuscule supercomputers in onze telefoons.

Dit museum staat in het hart van Silicon Valley, om de hoek bij Google en Facebook. Terwijl de grootste databedrijven ter wereld telkens meer gegevens van ons oogsten, waarschuwt het Computer History Museum juist dat data vergaan.

Lees ook: Heb meelij met de biografen van 2116

Het lijkt alsof we onze digitale herinneringen, berichten, foto’s en video’s nauwgezet vastleggen in een oneindig groeiende cloud. Vergeet het maar. Op termijn zal veel belangrijke of dierbare informatie niet meer toegankelijk zijn. Bits kwijnen weg op vervaagde cd-roms en verkleefde magnetische banden en ook de cloud is kwetsbaar. Waarom gaan je data dood? En wat is er aan te doen?

1. Bits zijn beperkt houdbaar

Vergeleken met een kleitablet uit Mesopotamië of papier is de levensduur van een harddisk, cd-rom of flashdrive beperkt. Ook een magnetische tape gaat niet langer dan twintig of dertig jaar mee, omdat die zijn magnetische eigenschappen verliest.

Natuurlijk kun je gegevens in de cloud opslaan, waar de harde schijven in een datacenter tijdig worden vervangen. Maar ook een datacenter is kwetsbaar: denk aan een aardbeving of vloedgolf. Daarnaast wordt er gewaarschuwd voor zonnestormen, die op aarde geomagnetische stralingen veroorzaken en de elektriciteits- en communicatienetwerken langdurig platleggen.

Ook de formaten van de opslagmedia en de afspeelapparatuur zijn vergankelijk. Wie kan nog informatie uitlezen van een cassettebandje, een 8 inch floppy, een zip-drive of een compact flash-kaartje? Zelfs het einde van de USB-geheugenstick kondigt zich aan: de eerste laptops zonder oude USB-aansluiting zijn al verkrijgbaar.

2. De software verandert

Niet alleen opslagtechniek verandert, ook de software waarmee we bestanden maken en openen. Documentformaten, compressiemethodes voor digitale media en besturingssystemen wisselen om de paar jaar.

Daarnaast sterven programmeertalen uit. Er is nu al een gebrek aan programmeurs van Cobol, uit de jaren 60 en nog altijd in gebruik bij financiële instellingen. IT’ers die deze stokoude computertaal beheersen behoren tot de best betaalde.

Internetpionier Vint Cerf waarschuwt voor een ‘Digital Dark Age’ als alle softwarestandaarden veranderd zijn. Om onze herinneringen te bewaren zouden we volgens Cerf een ‘snapshot’ moeten nemen van de applicatie, het besturingssysteem en de machine waarop het werkt.

Lees ook: Leuk, die vakantiefoto’s. Maar wat als Instagram failliet gaat?

3. De economische waarde verdwijnt

Het is de vraag of Amazon, Google, Microsoft of Apple over honderd jaar nog bestaan. Er zijn grotere bedrijven ten onder gegaan en de gebruiksvoorwaarden van een clouddienst bieden geen garantie dat je data intact blijft. Weliswaar kun je gegevens exporteren, maar dat kost moeite. Data verwijderen daarentegen vergt slechts één druk op de knop.

In het Computer History Museum hangt Deleted City, een interactieve visualisatie van GeoCities, een van de eerste sociale netwerken. Het netwerk werd door Yahoo gekocht en in 2009 uitgeschakeld, toen het economisch niet langer interessant was. Vijftien jaar internetgeschiedenis dreigde verloren te gaan. The Archive Team, een groep vrijwilligers die bedreigde webdiensten probeert te redden, wist de data veilig te stellen.

Nederlander Richard Vijgen ontwierp de Deleted City-visualisatie. „GeoCities heeft historische waarde”, zegt Vijgen. „Het web werd begin jaren negentig gezien als een digitale stad, een onontgonnen stuk cyberspace waar iedereen een plek verwierf.” Het lot van GeoCities is een voorbode voor andere bedrijven, denkt hij. „De kans is klein dat Facebook tot het einde der tijden het meest relevante platform blijft. We hebben daar met z’n allen zoveel tijd en werk en data in gestopt en het is niemands taak dat te bewaren.”

Dag Spicer, hoofdconservator van het Computer History Museum, houdt zich ook bezig met dit vraagstuk. „We kunnen Facebook niet bewaren. Het is een gesloten netwerk, hun code is niet toegankelijk voor buitenstaanders.” Om toch iets bewaren voor het nageslacht – tenslotte brengen 1,8 miljard mensen gemiddeld vijftig minuten per dag door op Facebook – filmt het museum Facebook-gebruikers in actie. In plaats van data wordt een indruk van de gebruikerservaring bewaard.

4. Data wordt diffuus

We hebben steeds meer opslagcapaciteit tot onze beschikking, maar het is niet erg tastbaar. „Toen ik in de jaren 90 een computer wilde gebruiken, liep ik naar mijn pc en ging erachter zitten”, zegt Richard Vijgen. „Computers zijn sindsdien dichterbij gekomen – ze zitten in je broekzak – maar het is onduidelijk waar je je gegevens bewaart.”

Staat die notificatie van Facebook nou op je telefoon of op een server? Staat de foto op je iPhone of in iCloud? Heb je het origineel of een backup? In het verleden was het ondenkbaar dat je informatie kreeg zonder na te denken over het medium, zegt Vijgen. „Je kon niet een boek lezen zonder te realiseren dat je papier in handen hield. De computer had een floppy en op het web hadden bestanden nog een webadres. Dat is nu volkomen diffuus.”

Omdat ‘bewaren’ onzichtbaar wordt – verpakt in gesloten diensten, draaiend in gesloten datacentra – verliezen we de controle over onze gegevens.

5. Big Data wordt Big Troep

Omdat opslagcapaciteit weinig kost, is er geen economische reden om informatie te verwijderen. Een sommetje van IBM: we creëren dagelijks 2,5 triljoen (één met 18 nullen) bytes aan data – informatie van sensoren, berichten op sociale netwerken, foto’s, video’s, betaalverkeer of telefoongegevens. 90 procent van alle data is er de laatste twee jaar bij gekomen; de databerg groeit almaar sneller.

Tussen al die Big Data zit veel troep – ‘Dark Data’ – omdat bedrijven eerst van alles verzamelen en daarna pas kijken wat ze nodig hebben. De kans is klein dat generaties na ons doorgronden wat belangrijk is en wat niet.

Ook consumenten hebben een selectieprobleem, zegt Dag Spicer. „Als je nu je kat fotografeert neem je rustig vijftien foto’s. Dan moet je daarna uitzoeken welke de beste is. Een filmrolletje met 36 foto’s dwong ons betere foto’s te maken.” Digitale opslag kent geen schaarste; ons digitale fotoalbum zit vol met mislukkingen.

We laten de selectie van waardevolle herinneringen aan machines over, zoals de beeldherkenningssoftware in Google Photos. Onverstandig, vindt geschiedkundige Abby Smith Rumsey, auteur van het boek When we are no more. Je moet zelf snoeien en filteren, wil je waardevolle informatie voor latere generaties achterlaten. Dat is een bewust en actief proces.

6. Weggooien is het nieuwe bewaren

Lang was bewaren heilig in de computerwereld. Niet voor niets vraagt de prullenbak van je pc wel twee keer of je dit bestand wilt verwijderen.

Maar er is een kentering gaande. Op sociaal netwerk Snapchat zijn foto’s en filmpjes 24 uur houdbaar. Snapchatters gebruiken hun camera zoals anderen de telefoon pakken: voor tijdelijke communicatie. Het voorkomt dat je de rest van je leven wordt achtervolgd door foto’s van dat ene wilde avondje. Het is precies het tegenovergestelde van de levenslange documentaire die Facebook je wil laten maken.

In navolging van Snapchat maken ook Instagram en chatdiensten berichten tijdelijk houdbaar. Zoekmachines moeten zich in Europa houden aan het recht vergeten te worden. Als personen achtervolgd worden door gegevens uit het verleden, kunnen ze Google vragen de zoekresultaten aan te passen. De digitale kerfstok bestaat niet meer.

7. Zo houden we data levend

Bewaar informatie die belangrijk voor je is, adviseren conservators. Blijf snoeien en filteren, blijf elke vijf jaar data kopiëren en migreren naar nieuwe opslagmedia.

Abby Smith Rumsey pleit er voor dat webdiensten contracten afsluiten met archieven. Zodra de economische waarde is afgeschreven heeft data nog een culturele waarde, vindt ze. Zo heeft Twitter een deel van zijn nalatenschap al geregeld: alle tweets worden geschonken aan de Amerikaanse nationale bibliotheek. Vrijwilligers, zoals die The Internet Archive en The Archive Team, proberen zoveel mogelijk online data vast te leggen.

En consumenten? Dag Spicer van het Computer History Museum: „Als je wilt dat jouw foto’s nog door de generaties na je bekeken kunnen worden, dan moet je ze printen op zuurvrij papier. Het fotoboek van je grootmoeder dat al veertig jaar op zolder ligt, is nog prima te bekijken. Je hebt alleen je ogen nodig.”