Ik wil morgen om elf uur in Sneek zijn

Een reisadvies opvragen, of een lijstje met tweedehands auto’s? Op internet moet je dan eerst een berg gegevens invoeren. Dat kan simpeler, vindt Kien Tjin-Kam-Jet.

Vul maar in, in het invoerveld hierboven: „Ik wil morgen om 15:00 uur naar Purmerend Overwhere.” ‘Geen vertrekstation gevonden.’ Oh, vergeten. „Ik wil morgen om 15:00 uur naar Purmerend Overwhere vanaf Houten Castellum.” Daar verschijnt de juiste reis al op het scherm.

Braaf alle invoervelden invullen op de NS-site hoeft niet meer. De experimentele treinplanner die promovendus Kien Tjin-Kam-Jet (29) ontwikkelt, is te commanderen in het Nederlands. Als de treinplanner je niet begrijpt, geeft hij suggesties.

Tjin-Kam-Jet (hij is Nederlander) werkt bij de database-onderzoeksgroep van de Universiteit Twente. Zijn einddoel: zorgen dat internetgebruikers efficiënter kunnen zoeken. En niet alleen bij de NS, maar het liefst gewoon vanuit een algemene zoekmachine zoals Google.

Wat is er zo inefficiënt aan zoeken op internet?

„Veel nuttige informatie op het internet wordt pas toegankelijk na het invullen van een webformulier. De gegevens zelf staan in een database, in het deep web. De reisgegevens van de NS, maar ook informatie van een hotel-boekingsite bijvoorbeeld. Als je nu in Google intypt: ‘ik wil woensdag om 12:00 uur naar Amsterdam’, krijg je het juiste antwoord niet.

„Ik werk aan een systeem dat dat soort vragen vertaalt naar een ingevuld webformulier. Zo kan je dan vanuit een algemene zoekmachine eenvoudig ‘gedistribueerd zoeken’ naar informatie in databases. Dus in allerlei websites tegelijk.

„Wat ik voor de NS heb gemaakt, is een demo om te kijken of deze manier van zoeken werkt. Ik had die al getest op de universiteit, bij 17 gebruikers. Toen hoorde ik via een kennis dat de NS geïnteresseerd was in een grotere proef. Sinds woensdag heb ik al 9.000 unieke bezoekers.”

Hoe goed werkt het?

„Supergoed, lijkt het. De 17 eerste gebruikers konden er snel mee omgaan. Nu de test online staat, zie ik wel dat mensen ook formuleringen kiezen waar ik zelf niet op zou komen. Zoals: ‘Ik wil morgen om tien uur in Utrecht zijn.’ Dat gaat fout. Mijn systeem is regel-gebaseerd. Maar de regel ‘in x zijn betekent x is aankomststation’ zit er niet in.

„Rule based is de simpelste manier om zo’n zoekfunctie te bouwen. Ik heb alle NS-stations in het systeem geladen, alle woorden uit het woordenboek, en allerlei veelvoorkomende zinsnedes en patronen. Maar ik moet dus nog wat regels toevoegen. En ik moet spellingscorrectie inbouwen, want niet iedereen spelt goed.”

Het lijkt wel wat op Siri, het programma waarmee je je iPhone sprekend kan commanderen.

„Dat ken ik eerlijk gezegd niet. Ik heb naar soortgelijke systemen gezocht, maar tot mijn verrassing vond ik heel weinig.”

Wat wordt uw volgende stap?

„Ik wil een systeem bouwen dat zelf leert, zodat ik niet álle regels hoef in te voeren. En ik wil dat mijn zoeksysteem ook gemakkelijk te configureren is voor iets anders, bijvoorbeeld een auto-verkoopsite. Dat heb ik al geprobeerd. Dan laad je er alle automerken en -modellen in. En formuleringen zoals voor x euro. Ik hoop dat aanbieders van complexe websites mijn systeem in hun site willen inbouwen. Zodat ze vanuit Google gemakkelijker te doorzoeken zijn.”

Autohandelaren moeten dan wel zelf een lijst leveren met veelgebruikte formuleringen in hun branche?

„Ja. Maar dat kunnen ze wel.”

De experimentele Treinplanner staat op http://treinplanner.info