Dit is een artikel uit het NRC-archief De artikelen in het archief zijn met behulp van geautomatiseerde technieken voorzien van metadata die de inhoud beschrijven. De resultaten van deze technieken zijn niet altijd correct, we werken aan verbetering. Meer informatie.
Bekijk hele krant

NRC Handelsblad

Wetenschap

Hier mag u wel even kijken, maar niet graven

Datamining

Uitgevers botsen met wetenschap over toegang tot elektronische archieven.

De omvangrijke koelinstallaties van een datacentrum van Google in Douglas County in de Amerikaanse staat Georgia.
De omvangrijke koelinstallaties van een datacentrum van Google in Douglas County in de Amerikaanse staat Georgia. Foto Connie Zhou, AP/Google

Casey Bergman is geneticus aan de universiteit van Manchester, en zwaar gefrustreerd. Omdat uitgevers van wetenschappelijke tijdschriften hem niet geven wat hij wil. Of alleen na heel veel moeite. Al drie jaar probeert Bergman, samen met collega Max Häussler, toegang te krijgen tot de digitale archieven van vele tientallen uitgevers. Om de daarin opgeslagen miljoenen wetenschappelijke artikelen over genetica te screenen met een computerprogramma. Ze zoeken naar DNA-sequenties. Alle artikelen die over een en hetzelfde stuk DNA gaan, koppelen ze vervolgens aan elkaar. “Zo kan je per stuk DNA snel alle informatie verzamelen die er de afgelopen decennia over is verschenen”, legt Bergman uit aan de telefoon. Dat versnelt het onderzoek naar DNA-sequenties, hun werking en functie. En dat kan bijvoorbeeld weer aanknopingspunten bieden voor nieuwe medicijnen. Maar dan moet je wel toegang krijgen tot die archieven.

De grote, Duitse uitgever Springer heeft die toegang nog niet gegeven. Häussler heeft het bedrijf het afgelopen jaar wel twaalf keer een mail gestuurd. Om precies te zijn: aan Wim van der Stelt, plaatsvervangend directeur van het onderdeel bedrijfsstrategie. Vergeefs. Andere uitgevers hebben Bergman en Häussler inmiddels wel toegang verleend. Maar pas na maanden aandringen. Of, in het geval van bijvoorbeeld Elsevier, na twee jaar. “Je bent onderhand meer tijd kwijt met die verzoeken dan met wetenschappelijk onderzoek”, zegt Bergman. Het houdt enorm op.

Gevecht

Het is een gevecht dat inmiddels op Europees niveau wordt uitgevochten. Nature besteedde de afgelopen maand twee keer aandacht aan die strijd tussen de uitgevers aan de ene kant, en wetenschappers en universiteitsbibliotheken aan de andere kant. Die laatste groep ijvert voor makkelijkere toegang tot de digitale archieven. Om er met computerprogramma’s allerlei soorten onderzoek op uit te kunnen voeren – een techniek die data and text mining wordt genoemd. Snel en geautomatiseerd. Maar de meeste uitgevers willen die toegang alleen verlenen via een officiële aanvraagprocedure en extra licenties. Dat duurt wetenschappers echter te lang. Bovendien, waarom zouden ze nog een keer betalen voor het mogen screenen van artikelen als ze eerder al via hun universiteitsbibliotheek abonnementsgeld hebben betaald om die artikelen te kunnen lezen en downloaden? “Onze opvatting is: het recht om te lezen is het recht om te mijnen”, zegt Susan Reilly, projectmanager bij Liber, de associatie van Europese onderzoeksbibliotheken, die kantoor houdt in de Nationale Bibliotheek van Nederland in Den Haag.

Liber was een van de initiatiefnemers van de brandbrief die vorige maand werd geschreven aan de Europese Commissie. Daarin werden ‘serieuze en diep gevoelde zorgen’ geuit over de opstelling van uitgevers. Dat wetenschappers in Europa slechts met veel moeite toegang krijgen tot hun archieven zet hen op een achterstand ten opzichte van collega’s in de VS, Japan, Israël, Taiwan en Zuid-Korea, stelde de brief. Er moeten zo min mogelijk barrières zijn voor wetenschappers om archieven te screenen. De brief werd mede ondertekend door de vereniging van Nederlandse universiteiten, en de verstrekker van onderzoeksubsidies NWO.

Auteursrecht

Achtergrond van de nu uitgebroken loopgravenoorlog is de mogelijke verandering van het auteursrecht in Europa. De Europese Commissie buigt zich daar over, gezien de snelle opkomst van open access – het digitaal en gratis beschikbaar stellen van informatie. Eind dit jaar wordt een uitspraak van de commissie verwacht. Als ze besluit het auteursrecht bij wet aan te passen volgt een politiek traject dat naar verwachting jaren zal duren. Als overbrugging wil de commissie dat wordt nagedacht over tijdelijke pragmatische oplossingen die de beschikbaarheid van informatie kunnen vergemakkelijken. Daarvoor zijn vier werkgroepen in het leven geroepen, waarvan eentje zich bezighoudt met de problematiek rond data and text mining.

De werkgroep is tot nu toe twee keer bij elkaar gekomen, de laatste keer op 8 maart. Volgens Reilly willen de uitgevers alleen maar praten vanuit de huidige situatie, die uitgaat van een officiële aanvraagprocedure en extra licenties. Maar dat zal de beschikbaarheid van informatie niet vergemakkelijken, zoals de Europese Commissie voor ogen heeft.

Volgens Eefke Smit valt het wel mee met de starre houding van de uitgevers. Ze is consultant van wetenschappelijke uitgevers en voerde vorig jaar een onderzoek onder hen uit. Dertig procent zegt zonder meer toestemming te geven voor data and text mining, ook zonder licentie. “Bij de overige moet je formeel toestemming vragen, maar de meeste geven dat wel”, zegt Smit.

Geneticus Bergman zegt dat het niet alleen om die toestemming sec gaat. Ook om alle moeite die je ervoor moet doen. “Je stuurt een mail. Krijg je te horen dat ze er over moeten denken. Dan is het maanden stil. Dan probeer je diezelfde persoon weer te bereiken. Blijkt die verhuisd naar een andere afdeling”, zegt Bergman.

En als de toestemming er dan is, volgt meteen een volgende discussie. In zijn geval moet Bergman bijvoorbeeld steeds vragen of hij gebruikte DNA-sequenties opnieuw mag publiceren. “Dan krijg je weer te horen dat ze het niet weten, dat ze moeten overleggen, en dan hoor je weer maanden niks.”

Volgens consultant Smit is het inderdaad een vraag die uitgevers veel bezig houdt. Van wie zijn nieuwe bevindingen als die zijn gebaseerd op eigendom van de uitgevers? Moeten die dan niet ook weer bij de benaderde uitgevers worden gepubliceerd? Reilly, van bibliotheekorganisatie Liber vraagt zich af waarom dat zou moeten. “De toegevoegde waarde van al die gebundelde artikelen komt niet van de uitgevers.”

Max trekt nu de kar

Liber wil dat er in Europa voor het mijnen van archieven een uitzondering komt voor wetenschappelijk onderzoek, zoals het Verenigd Koninkrijk overweegt. Dat onderzoekers dus zonder meer toegang krijgen. Geen aanvraagprocedure, geen licenties. Maar de meeste uitgevers in Europa houden voorlopig vast aan hun licentiemodel. In reactie daarop verschijnen de laatste jaren her en der commerciële bureaus die de verzoeken van onderzoekers om te mijnen verzamelen en afhandelen.

Geneticus Bergman vindt dit geen oplossing. Hij vertelt dat hij pasgeleden is gestopt om aan uitgevers te trekken. “Het kost me teveel energie.” Zijn collega Max Häussler, die in 2011 is verhuisd naar de universiteit Californië, waar een soortgelijk DNA-project loopt, trekt nu de kar.

Volgens Reilly, van Liber, voeren de uitgevers een achterhoedegevecht. In Nederland stellen NWO en KNAW sinds 2005 een groeiend aantal datasets en artikelen gratis beschikbaar op het gebied van sociale en geesteswetenschappen. De Europese Commissie wil voor het onderzoeksprogramma Horizon 2020, dat van 2014 tot 2020 loopt, alle resultaten via open access beschikbaar maken.

De door Brussel ingestelde werkgroep heeft zijn volgende bijeenkomst op 22 april. Reilly twijfelt of haar organisatie, Liber, er deze keer bij zal zijn. In ieder geval niet als de commissie nog geen antwoord heeft gegeven op de brandbrief.