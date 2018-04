Elke dag vers. Bij de visboer is dat een voordeel, voor algoritmes een probleem. De digitale kiosk Blendle selecteert elke dag duizenden nieuwe verhalen uit kranten en tijdschriften ‘op maat’, zonder dat tevoren bekend is wat in die stukken staat. „Voor personalisatie is dat moeilijk”, zegt Daan Odijk. Hij leidt het data-onderzoek bij Blendle, het bedrijf dat artikelen uit Duitse, Nederlandse en Amerikaanse media op maat aanbiedt aan anderhalf miljoen gebruikers.

Blendle verkoopt losse artikelen en een Premium-abonnement, een geautomatiseerde selectie van dagelijks 20 artikelen. De eigen redactie selecteert ‘must read’-stukken, algoritmes vullen dat aan met een aanbod op maat. Maar hoe weet Blendles aanbevelingssoftware (roepnaam: ‘Kevin’) wat je wil lezen?

In tegenstelling tot Spotify en Netflix – hun algoritmes zoeken onder meer overeenkomsten tussen jouw smaak en die van andere gebruikers – doet Blendle geen aanbevelingen op basis van populariteit. Immers, aan het begin van de dag heeft nog niemand de stukken gelezen. De inhoud is bovendien actueel, dus beperkt houdbaar.

In plaats daarvan ‘matcht’ Blendle het profiel van de gebruiker met de aard van het artikel. Het algoritme analyseert van elk artikel behalve tekst en onderwerp ook de schrijfstijl, de lengte, het aantal plaatjes, de auteur en de titel. Zelfs naar het sentiment van het artikel wordt gekeken. ‘Generaliseren over de content heen’, noemt Daan Odijk dat. De computer probeert zoveel mogelijk te begrijpen over het onderwerp en artikelen te koppelen met Wikipedia-lemma’s.

Uit de filterbubbel

Om je leesprofiel op te bouwen meet Blendle vanaf het eerste gebruik je interesses – je kunt je eigen thema’s opgeven, zoals wetenschap of tech. Na vijf gelezen artikelen neemt ‘machine learning’ het over: de software stelt een selectie samen op basis van door de lezer gegenereerde signalen. Die signalen zijn bijvoorbeeld welk stuk je leest, wat je terugruilt (je kunt in Blendle artikelen teruggeven, als je ze niet goed vindt), of je iets deelt of een artikel bewaart. Bladeren door de digitale kiosk wordt niet meegeteld en als je heel snel je artikel wegklikt (dan krijg je je geld terug), telt dat ook niet mee.

Al deze signalen worden gebruikt om artikelen te vinden die bij de gebruiker passen. Maar helemaal perfect moet die match niet zijn. Juist niet. Filterbubbels, onderwerpen en zienswijzen die bevestigen wat je al weet of interesseert, zijn een bekend verschijnsel op Twitter en Facebook. „Wij willen gebruikers juist uit die bubbel halen. Als je over onderwerpen leest die je verrassen, keer je vaker terug en zul je langer abonnee blijven”, zegt Odijk.

Blendle houdt er niet van om onderwerpen of titels te beperken. Odijk: „Zelfs als je nooit de LINDA leest, kan er toch een tof stuk in staan dat we je graag aanbevelen.” Het algoritme stuurt je een aantal stukken; als je die niet leest, onthoudt je profiel dat je dit onderwerp niet blieft. Na drie tot vijf keer proberen ligt dat vast.

Om lezers te verrassen wordt het ‘maximum marginal relevance’-algoritme op de lijst met potentiële artikelen losgelaten. Dat werkt als een wiskundig magneetje: als het onderwerp erg overeenkomt met dat van de andere artikelen, wordt het weggeduwd. Odijk: „We stoppen je eerst in een bubbel en halen je er daarna uit.”

Ook dubbelingen in onderwerp worden eruit gehaald of „naar beneden gedrukt”, zoals Odijk het zegt. Zodat je niet zes artikelen over de extreem lange file van gisteren hoeft te lezen.

Bij het verbeteren van de algoritmes laat Odijk twee varianten (modellen) tegen elkaar opbieden. Om beurten selecteren ze hun beste artikel. Odijk: „Vergelijk het maar met de gymles, waarbij twee partijen een team kiezen uit een groep kandidaten.” Als met het nieuwe model 3 tot 4 procent meer gelezen wordt – gemeten in minuten – dan wint de nieuwe versie.

Wat lees ik?

Samen met Daan Odijk bekijk ik mijn eigen profiel, gezien vanuit Blendle. „Je hebt geen artikelen geruild of geld teruggevraagd en je houdt van langere stukken – mensen lezen ’s ochtends liever korte stukken en ’s avonds de longreads.”

Ik hoor niet bij een of andere groep gebruikers met soortgelijke smaak of achtergrond – iedereen heeft zijn eigen profiel op Blendle. In het mijne staat de berekening van wat ik ‘aan de voorkant’ zie op mijn Blendle-pagina: er is 94,8 procent kans dat ik wetenschap een leuk thema vind, 98 procent dat ik tech interessant vind. Veelgelezen persoonsnamen blijven ook bewaard, zoals Ahmed Marcouch en Alexa (van Amazon).

Blendle schat daarnaast in welke titel je interessant vindt. Odijk: „Er is 97 procent kans dat je een artikel uit de Volkskrant leuk zult vinden, 92 procent voor Het Parool. Ook De Standaard en De Telegraaf scoren hoog.

De Telegraaf? Odijk kijkt nog eens naar mijn profiel: „Bij de laatste vijftien artikelen die je las, zaten drie stukken uit de categorie Achterklap.”