Hoe weet Netflix welke serie je wil zien?

De Formule Van actiekomedie tot zombiehorror: Netflix deelt zijn abonnees op in ‘smaakclusters’. Automatisch een goed script schrijven voor een serie lukt nog niet.

Illustratie Midas van Son

Je kunt de wereld opdelen in landen, continenten, talen of klimaten. Videodienst Netflix verdeelt de mensheid in smaakclusters. „Je buurman kan een beroerde smaak in tv-programma’s hebben en waarschijnlijk denkt hij ook zo over jou. Maar wie weet vinden een vrouw in Stockholm, een man in Sao Paulo en een kind in Johannesburg dezelfde series leuk als jij.”

Todd Yellin heeft als manager bij Netflix maar één taak: zorgen dat kijkers op ‘play’ drukken en pas op ‘stop’ als het programma is afgelopen. De smaakclusters vormen een belangrijk hulpmiddel om je de juiste tv-programma’s voor te schotelen.

Welke programma’s je kijkt, hoe lang je kijkt, wanneer je afhaakt: al die gegevens worden geanalyseerd door algoritmes die Netflix telkens verfijnt. Het is de basis van de aanbevelingen die je op je beginscherm ziet, vaak met daarbij de kans (gevat in een percentage) dat je het programma bij je past.

Wat is een algoritme eigenlijk? In deze animatie leggen we het uit.

Pseudo play

Netflix wil je smaak weten. Yellin: „Nieuwe klanten laten we veertig of vijftig titels zien. We vragen je er drie te kiezen die je interessant vindt. We behandelen dat als pseudo plays. Nog niet zo waardevol als wanneer je echt op play drukt: voor hetzelfde geld misleid je jezelf; je kiest een natuurdocumentaire en een serieus drama over onderdrukte kinderen in Congo. In werkelijkheid kijk je liefst films met Adam Sandler.”

Netflix gebruikt de pseudo plays voor aanbevelingen totdat je echt gaat kijken. „De eerste keer dat je op play drukt, is dat een krachtig signaal. Na een stuk of vijf plays gaan we gokken en je in smaakclusters stoppen. De vertrouwensscore is nog laag, maar groeit naarmate je meer bekijkt.”

Smaakclusters zijn groepen van gebruikers met overlappend kijkgedrag. Waar je woont, speelt geen rol, zegt Yellin: „We weten ook niet of je een man of vrouw bent, hoe oud je bent of je rijk bent of arm. Het maakt ons niet uit, want we verkopen toch geen advertenties.” Mensen zijn niet eendimensionaal, maar bestaan uit ‘combinaties’ van smaak. Yellin: „Je hebt verschillende stemmingen, dus stoppen we 30 procent van jou in het ene smaakcluster, 50 procent in een ander, en 20 procent in weer een derde cluster.”

Je kiest een natuurdocumentaire en een serieus drama over onderdrukte kinderen in Congo. In werkelijkheid kijk je liefst films met Adam Sandler

De Netflix-catalogus – het aanbod in Nederland bestaat uit een paar duizend titels – is verdeeld over ruim honderd categorieën, van actiekomedie tot zombiehorror. Yellin: „Vroeger maakten we de vergissing dat we één signaal overwaardeerden. Bijvoorbeeld: als je een romantische tv-show ziet, zijn de aanbevelingen alleen romantische programma’s. Dan ontstaat een echokamer. We bieden nu variatie met overlappende categorieën. Het naburige genre van romantisch drama is de romantische komedie, of algemeen drama, en we kiezen wat programma’s met dezelfde acteur en voegen iets nieuws toe, bijvoorbeeld documentaires. Onze algoritmes stoppen er bewust wat toeval in.”

Netflix had een waarderingssysteem met één tot vijf sterren, maar weinig gebruikers namen de moeite een waardering te geven. Nu volstaat een duimpje omhoog of omlaag. De meest waardevolle signalen zijn echter plays. Zelfs als je maar vijf minuten kijkt van een programma, kan dat een blijk van interesse zijn. Yellin: „Als je vijf minuten ziet van een film over astronauten en dan al afhaakt, vond je misschien het thema ‘ruimte’ interessant, maar het verhaal niet goed.”

Het algoritme zoekt andere gebruikers die na vijf minuten afhaakten. Welke programma’s hebben zij al gekeken en gaan ze nog kijken – misschien een sciencefictionserie? Yellin: „Onze algoritmes zuigen een hoop data op en geven een indicatie of het een positief of negatief signaal is. Elke keer probeert het algoritme iets. Als het niet lukt, probeert het iets anders. Zo kan het steeds nauwkeuriger voorspellen.”

Een rokende chimpansee

Netflix betaalt tv- en filmexperts om programma’s te analyseren en tags – labels – toe te voegen. Ze registreren of er geweld in een scène zit, of iemand rookt of vloekt, of er bloed vloeit. Yellin: „Er zijn honderden tags en tienduizenden combinaties. We duiken er dieper en dieper in. We labelen bij wijze van spreken ook een chimpansee die rookt en een corrupte agent is.” De tags geven aan welke elementen een kijker aan een tv-serie gekleefd houden, en zijn weer voer voor nieuwe aanbevelingen.

Deze inhoudelijke analyse lijkt op die van muziekdienst Pandora, dat muziekkenners meer dan een miljoen liedjes liet labelen in het Music Genome Project. Muziekdiensten gebruiken, net als Netflix, smaakclusters voor aanbevelingen. Maar er is een verschil. Spotify, Deezer of Apple Music bieden miljoenen liedjes, en weten dat de luisteraar zijn favoriete artiesten tot in den treure blijft herhalen. Daarom zijn hun algoritmes erop gericht je nieuwe muziek te laten ontdekken in het onbeperkte aanbod.

De algoritmes willen de indruk wekken dat het serie-aanbod op jouw smaak is toegesneden, zodat je niet zelf op zoek gaat naar iets nieuws en tot de ontdekking komt dat de opties gelimiteerd zijn

Netflix is juist niet onbeperkt; het biedt een paar duizend titels die tijdelijk beschikbaar zijn. De algoritmes willen de indruk wekken dat het serie-aanbod op jouw smaak is toegesneden, zodat je niet zelf op zoek gaat naar iets nieuws en tot de ontdekking komt dat de opties gelimiteerd zijn.

Het algoritme is niet alleen belangrijk voor de kijker. Netflix gebruikt kijkdata om te bepalen wat een licentie of productie mag gaan kosten. Het geheime recept van Netflix zit ’m volgens Yellin in het toekennen van gewicht aan „alle verschillende inputs en waarderingen”. Dat recept is nog niet perfect en het is zeker geen formule die blockbusters garandeert. De zelfgeproduceerde serie House of Cards werd een hit, mede omdat data aantoonden dat mensen (toen nog) graag keken naar Kevin Spacey en werk van regisseur David Fincher. Maar de peperdure serie Marco Polo faalde, en kostte Netflix 200 miljoen dollar.

Yellin: „Computers kunnen mensen met schaken verslaan, maar ze kunnen geen betere scripts maken. Ik denk dat wij al jaren onder de grond liggen voordat je met kunstmatige intelligentie een goed verhaal kunt maken.”

Hoe algoritmes ons dagelijks leven bepalen

Ons leven wordt bestuurd door algoritmes, regeltjes achter de schermen. Deze wiskundige formules, gevoed door grote hoeveelheden data, sturen onze selectie van nieuws, entertainment en aankopen, vissen automatisch dieven en verdachten uit de massa. Lees de inleiding: Hoe algoritmes ons dagelijks leven sturen ›

Vervoer

Techbedrijven zijn dol op locatiedata en bewegings­gegevens, hoe gedetailleerder hoe beter. Zo ‘ziet’ Google hoe lang mensen op zoek zijn naar een parkeerplaats en leert Apple van je iPhone waar je werkt. Je kunt bewijzen dat je veilig rijdt en erop vertrouwen dat je om de file geleid wordt, of de snelste liftcabine voorgeschoteld krijgt. Maar welke algoritmes bepalen wat veilig is of wie er voorrang krijgt in de de file of in lift?

Lees ook:

  1. Hoe omzeilt TomTom de files?

  2. Hoe bepaalt de verzekeraar hoe veilig jij rijdt?

  3. Hoe bepaalt de lift wie voorrang krijgt?

  4. Hoe weet Google hoe lang je moet wachten?

Media

Kun je smaak in statistiek vatten? De grote streaming-diensten doen niet anders. Ze proberen een breed publiek inhoud op maat aan te bieden met behulp van algoritmes. Spotify en Netflix doen het door mensen met dezelfde voorkeuren te clusteren. Nieuwsdienst Blendle probeert er juist voor te zorgen dat je andere dingen ziet dan je zou verwachten. Apple laat personificatie grotendeels achterwege: Apple News is gebaseerd op locatie, niet of nauwelijks op je klikgedrag.

Lees ook:

  1. Hoe weet Netflix welke serie je wilt zien?

  2. Hoe weet Blendle wat jij wilt lezen?

  3. Hoe stelt Apple jouw nieuws samen?

  4. Waarom is dit het volgende liedje dat Spotify je laat horen?

Shoppen

Amazon is de webwinkel die groot werd met het doen van aanbevelingen op basis van wat anderen kochten. Wat zijn de trucs waarmee online winkels en reisbureaus je tot een aankoop verlokken? Achter de schermen wordt consumentengedrag in datapatronen gegoten, om beter in te schatten wat je wilt of hoe je te beïnvloeden bent. Ieder mens is uniek, maar bij elkaar zijn we toch redelijk voorspelbaar.

Lees ook:

  1. Hoe verleidt Booking.com je snel een hotelkamer te boeken?

  2. Hoe weet Bol.com wat je wilt kopen?

  3. Retargeting: hoe lang blijven mijn schoenen me achtervolgen?

  4. Hoe Facebook advertenties héél precies op maat maakt

Fraude

Algoritmes zijn bij uitstek geschikt om conclusies te trekken uit grote hoeveelheden data. Daardoor kunnen ze sneller ‘verdachte’ elementen opsporen, of het nou gaat om betalingsverkeer, uitkeringsgerechtigden of winkeldiefstal. De regels voor wat nou eigenlijk verdacht gedrag is, worden echter wel door mensen bepaald.

Lees ook:

  1. Hoe beschermt de bank je tegen oplichters?

  2. Hoe controleert de gemeente of jij fraudeert?

  3. Hoe bepaalt de zelfscankassa welke klanten gecontroleerd worden?

Naar aanleiding van deze productie organiseerde NRC op donderdag 12 april een avond in Pakhuis de Zwijger in Amsterdam. Terugkijken kan hier.

Redactie Marc Hijink en Eva de Valk, animatie Midas van Son, Harrison van der Vliet en Elze van Driel, illustraties Midas van Son, vorm Koen Smeets.

    • Marc Hijink