Yahoo in de polder

Een zoekmachine van Nederlandse origine voor informatiebemiddeling en kennismanagement. Zit daar brood in? Kennelijk wel want het prestigieuze wetenschappelijke tijdschrift Nature gaat er mee in zee. net als grote ICT-bedrijven. Hoe een initiatief voor de Derde Wereld leidt tot een commerciële start-up.

De tegenstelling kan bijna niet groter zijn. We hebben al bijna drie uur zitten praten als Peter van Praag, directeur van Collexis, zegt dat het zijn streven is om ,,echt groot'' te worden. ,,Het lijkt me prachtig als er in Nederland in een klein dorpje als Geldermalsen een Yahoo geboren zou worden." Barend Mons, geestelijke vader van het programma waarmee Collexis groot wil worden, gaat daar direct overheen: ,,Het echte grote geld schrikt me af.'' Beide uitspraken zijn kenmerkend voor dit bedrijf dat nog geen jaar oud is. En hoewel het in de Nieuwe Economie allemaal niet snel genoeg kan gaan, hebben Van Praag en zijn mensen een weloverwogen route uitgestippeld: ze zoeken naar partners met een toegevoegde waarde, willen voorzichtig groeien en vooral vanaf het eerste moment winst maken. En dat allemaal met een unieke zoekmachine, al hebben ze liever niet dat je het zo noemt.

Collexis doet aan `informatiebemiddeling' en `kennismanagement' en waar dat voor staat illustreert Van Praag aan de hand van een uitspraak van Lew Platt, voormalig topman van Hewlett Packard: ,,Als Hewlett Packard wist wat het weet, dan zou het op de beurs drie keer zo veel waard zijn''. Uit onderzoek blijkt dat Fortune-500 bedrijven alleen al in de Verenigde Staten vorig jaar zo'n twaalf miljard dollar verlies leden, omdat werk onnodig dubbel werd uitgevoerd, bestaande kennis niet werd gebruikt of onvindbaar bleek. Van Praag: ,,Bij een grote bank komen per dag een paar honderd e-mail berichten binnen waarin bijvoorbeeld onroerend goed te koop wordt aangeboden. Het blijkt in een grote organisatie bijna onmogelijk te zijn om die snel op het juiste bureau te hebben, zodat er adequaat op kan worden gereageerd.'' Het is dit soort problemen waar Collexis een eind aan denkt te kunnen maken. Maar even goed lijkt het grote veranderingen teweeg te gaan brengen in de manier waarop in de wetenschappelijke wereld met kennis wordt omgegaan. Helemaal nu het prestigieuze wetenschappelijke tijdschrift Nature besloten heeft de technologie te gaan toepassen.

De ontstaansgeschiedenis van de zoekmachine leest als een jongensboek. Het begon allemaal zo'n vier jaar geleden, toen medisch bioloog Barend Mons het malaria-onderzoek ,,tijdelijk'' verliet om drie jaar als expert national détaché in Brussel bij de Europese Commissie te gaan werken. Mons: ,,Dat was een mooie uitdaging. Ik had al een aantal projecten bij de Europese Commissie lopen, en kende het wereldje daar goed. Het was de bedoeling dat ik wetenschappelijke samenwerkingsprogramma's tussen Europese en Derdewereldlanden zou gaan coördineren. Het kostte echter erg veel tijd om mensen bij elkaar te brengen. Bovendien wilde ik stimuleren dat het initiatief nu eens uit Afrika zou komen. Maar het circuit van uitwisselingen en samenwerking is voor wetenschappers uit ontwikkelingslanden zo goed als gesloten.''

Hij zette zijn ideeën voor een nieuw soort zoekmachine op papier en hoewel die door de meeste van zijn collega's als `Monsens' werden afgedaan – ,,net geen onzin, maar het zit er dicht tegenaan''– kreeg hij toch van de Europese Commissie financiële steun om samen met vertegenwoordigers uit een aantal Europese en Afrikaanse landen zijn ideeën uit te werken. Uiteindelijk rolden er een aantal specificaties uit, maar op dat moment was Mons al weer terug in Nederland, waar hij in dienst was getreden van de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO). Daar zag men de waarde van zijn plannen in en zo kon hij niet alleen secretaris blijven van SHARED, zoals zijn initiatief – en het programma – inmiddels was gedoopt, maar was er ook een nieuwe partner gevonden die bereid was er in te investeren.

Het was Mons inmiddels duidelijk geworden dat het programma een waardevol stuk gereedschap kon zijn voor kennismanagement binnen bedrijven. Dat vermoeden werd bevestigd toen de top van het ICT-bedrijf ICL na een demonstratie besloot het programma te gaan toepassen. Van Praag vertelt dat het daar ondanks herhaalde pogingen nooit was gelukt om wereldwijd het CV van alle 25.000 werknemers voor elkaar toegankelijk te maken.

Van Praag: ,,Met ons systeem kan iedereen straks via een simpele druk op de knop een profiel van zichzelf aanmaken, niet alleen aan de hand van een ingevoerd CV, maar ook van voortgangsverslagen, artikelen of voorstellen die de betrokken werknemer geschreven heeft.'' Om de software verder te ontwikkelen en te commercialiseren werd Collexis opgericht, maar niet nadat met NWO een overeenkomst was gesloten. Mons: ,,NWO heeft bedongen dat het gratis licenties kan weggeven in de publieke sector en dat een deel van de inkomsten terugvloeit naar sociale doelen, waar de technologie oorspronkelijk voor is ontwikkeld.'' Collexis kan professionele ondersteuning garanderen, iets wat NWO niet kan doen.

Collexis – het commerciële broertje dus van SHARED – heeft een unieke methode om met informatie in bestaande databases om te gaan. Mons: ,,Het programma denkt als jij en ik. Uit onderzoek blijkt dat 70 procent van de mensen die gebruik maken van zoekmachines maar één enkele zoekterm invoeren. Daardoor krijg je lange lijsten met zinloze verwijzingen.'' Het idee achter Collexis is dan ook dat je geen zoekwoorden invoert, maar hele teksten. Dat kunnen documenten zijn uit een tekstverwerkingsprogramma, maar ook hele webpagina's, gewoon door te knippen en te plakken. Het programma maakt daar vervolgens binnen fracties van seconden een profiel van, dat de tekst beschrijft aan de hand van een aantal relevante concepten. De auteur kan in dat profiel nog wel wat wijzigingen aanbrengen, want Mons gelooft niet dat ,,de computer alles kan''. Wanneer iemand in een door deze technologie aangedreven database wil zoeken, wordt een match gezocht met profielen van teksten uit de database. En als de ingevoerde zoektermen niet voldoende duidelijk zijn, vraagt het programma om meer specifieke informatie en doet daarvoor zelfs een aantal suggesties.

Mons heeft inmiddels al meer dan tachtig demonstraties gegeven en de reacties waren overweldigend positief. Eén van de belangrijkste eerste klanten is het wetenschappelijke tijdschrift Nature, dat het programma op dit moment aan een zware test onderwerpt. Door verschillende databases met elkaar te combineren verkrijgt het tijdschrift automatisch `kennisprofielen' voor een groot aantal onderzoekers. Universiteiten of bedrijven die op zoek zijn naar personeel zouden deze profielen als databank kunnen gebruiken. Mons: ,,Als er in de nabije toekomst een nieuw artikel ter publicatie bij Nature wordt aangeboden – en dat zijn er zo'n tienduizend per jaar – wordt daar ook een profiel van gemaakt en kunnen er automatisch referenten bij worden gezocht om de kwaliteit te beoordelen. Want uiteindelijk kan maar 10 procent worden gepubliceerd. Met al deze administratieve rompslomp zijn op dit moment een aantal editors een veelvoud aan tijd kwijt. Er zijn veel meer mogelijkheden, al wil Declan Butler, bij Nature verantwoordelijk voor het Collexis-project, daar nog niet al te veel over loslaten zolang de testperiode nog niet ten einde is. Butler: ,,Het mooie aan Collexis is dat het community software is, dat het mensen, organisaties en projecten met elkaar verbindt. Een potentieel nadeel is wel dat het gebaseerd is op thesauri. Dat betekent dat voor elk nieuw vakgebied een behoorlijke inspanning verricht moet worden. Maar misschien is dat in de wetenschappelijke wereld juist een voordeel. Wetenschappers kennen hun vakgebied als hun broekzak.'' Naast Nature zullen er dit jaar nog vier toonaangevende klanten – door Van Praag als lighthouses bestempeld – worden gepresenteerd, onder wie NWO zelf, maar bijvoorbeeld ook een grote internationaal opererende bank. Verder staat er een project met het ministerie van Economische Zaken op stapel om het bedrijfsleven een beter inzicht te geven in wat er aan kennis binnen de Nederlandse wetenschap beschikbaar is. Ook internationaal krijgt de technologie veel aandacht en zijn er voor verschillende applicaties sponsors verworven als de Wereldbank, de Wereldgezondheidsorganisatie en de Rockefeller Foundation.

Inmiddels zijn in verschillende landen zestien hoog gekwalificeerde medewerkers voor de komende jaren vastgelegd om Collexis in de eerste fase te runnen. Eind volgend jaar moet er voor het eerst winst gemaakt worden, terwijl de verwachting is dat de omzet binnen drie jaar zal oplopen tot zo'n vijftig miljoen euro. Het komende jaar is er echter nog een investering nodig van ongeveer één miljoen euro.

Op dit moment zijn onderhandelingen gaande met een aantal mogelijke partners, die elk voor 10 tot 20 procent moeten gaan deelnemen. Van Praag: ,,We zijn niet op zoek naar kapitaal, maar naar partners met een toegevoegde waarde op deelgebieden die voor ons van belang zijn, zoals de telecomsector, en zeker ook op het gebied van electronic publishing, omdat we daar een enorme groeimarkt zien.'' Dat laatste wordt in elk geval onderschreven door de grote belangstelling die er bij de Holtzbrinck Holding, de moedermaatschappij van Nature, bestaat om die rol te gaan invullen.

Van Praag realiseert zich dat Collexis met een imagoprobleem zit. In de ogen van velen is het de zoveelste Internet start-up die beweert het helemaal te gaan maken. ,,Maar wij zijn het keukentafelniveau inmiddels ontgroeid. We hebben een goed product waarop patent is aangevraagd en een aantal gerenommeerde klanten. En dat allemaal op eigen kracht en zonder dat we er veel ruchtbaarheid aan hebben gegeven. Helaas blijft iedereen ongelofelijk voorzichtig. Uitgevers, banken en andere grote concerns mogen dan vele honderden miljoenen gaan besteden aan internetactiviteiten, het is voor hen blijkbaar moeilijk het kaf van het koren te scheiden: de besluitvorming gaat tergend langzaam.'' Enige haast is geboden, want Collexis is niet alleen op de markt. Volgens Declan Butler beweegt het bedrijf zich in een enorm competitieve omgeving: ,,Er zijn de afgelopen twee jaar verscheidene bedrijven gekomen die zich met ongeveer hetzelfde bezig houden. Maar de behoefte is dan ook heel divers, de vraag naar heel specialistische producten neemt explosief toe.''

Het bekendst op dit gebied is het Britse Autonomy. Mons: ,,Hun software analyseert een tekst ook op concepten, maar maakt daarvoor gebruik van neurale netwerken. Dat is in zekere zin minder flexibel dan Collexis, zeker waar het termen betreft die het programma nog nooit eerder heeft gezien. Het moet steeds opnieuw beginnen met leren, omdat het geen gebruik maakt van al in thesauri vastgelegde kennis.'' Dat heeft de belangstelling ervoor in elk geval niet in de weg gestaan. Procter & Gamble, Volkswagen en Lucent Technologies hebben het inmiddels geïntroduceerd. Autonomy, dat zowel op de Easdaq als Nasdaq genoteerd staat, is in drie jaar tijd meer dan zeven miljard dollar waard geworden. Hoe kan een bedrijfje uit Nederland daar ooit tegenop? Van Praag: ,,Vergeet niet dat Autonomy pas vier jaar geleden werd opgericht – ook vanuit een universitaire achtergrond – en dat de markt groot genoeg is voor wel tien bedrijven. Collexis kan binnen een jaar de eerste serieuze bedreiging voor het huidige monopolie van Autonomy zijn. Nature heeft niet voor niets voor ons gekozen''. De tijd is er blijkbaar rijp voor. Die Nederlandse Yahoo komt er wel.

Collexis: www.collexis.nl

    • Rob van den Berg