We hebben alle muziek die je maar kunt bedenken binnen handbereik. Toch luisteren we steeds weer naar dezelfde nummers. Hoe komt dat? Muziekkenners van NRC lichten de aanbevelingen van muziekdiensten door.

Waarom is dit het volgende liedje dat Spotify je laat horen?

Next Song

Muziekdiensten. We hebben alle muziek die je maar kunt bedenken binnen handbereik. Toch luisteren we steeds weer naar dezelfde nummers. Hoe komt dat? Muziekkenners van NRC lichten de aanbevelingen van muziekdiensten door.

Grote getallen, daar draait het om in de wereld van muziekabonnementen. Diensten als Spotify en Apple Music tellen bij elkaar zo’n 100 miljoen betalende gebruikers. Zij hebben toegang tot een muziekverzameling van meer dan 30 miljoen liedjes. Ook in Nederland streamen we er op los: volgens onderzoeksbureau Telecompaper staat Spotify op 3,7 miljoen Nederlandse smart­phones. In het kielzog daarvan komen Apple Music, Deezer, Tidal en Google Play Music – allemaal voor een tientje per maand. Zo krabbelt de muziek­industrie weer op, na eerder gehalveerd te zijn door de internetrevolutie.

Er is één probleem. Zelfs met de hele populaire muziek­geschiedenis binnen hand­bereik, maken de meeste gebruikers een armoedige keuze uit het rijke aanbod. De vuistregel is dat 5 procent van het wereldwijde repertoire goed is voor 95 procent van alle muziekstreams. Deezer zegt dat 90 procent van de luisterbeurten van slechts 100.000 nummers komt – minder dan een half procent van alle liedjes. Je betaalt geen 120 euro per jaar om muziek te horen die je toch al op cd hebt, of hebt gedownload.

Om je te blijven boeien, proberen muziekdiensten luisteraars met geautomatiseerde suggesties te loodsen naar nieuw repertoire. Dat lukt nog niet echt. Uit een steekproef die NRC’s muziekrecensenten hielden bij vijf verschillende streamingdiensten, blijkt dat computergegeneerde lijsten veel te veel herhaling bieden, en amper verrassende pareltjes. Vaak slaan suggesties als een tang op een varken of zijn ze zelfs „reden om de afspeellijst uit te zetten”, zoals recensent Amanda Kuyper het verwoordt.

Wat gaat er mis?

Muziek is een kwestie van smaak, maar vooral van statistiek. De suggesties worden gepresenteerd als een ‘radiostation op maat’; in feite zijn het intelligente filters – wiskundige formules die de kans berekenen dat je een volgend nummer op prijs zult stellen. Ze zijn gebaseerd op een reusachtige matrix die én miljoenen liedjes én miljoenen gebruikersvoorkeuren bevat. Spotify bouwde een indrukwekkende computerinfrastructuur die dagelijks een terabyte aan gebruikersinformatie toevoegt. Dat cijfer stamt uit 2014 – inmiddels is het aantal Spotify-gebruikers meer dan verdubbeld.

De filters houden rekening met de liedjes en artiesten die je eerder draaide. Ook zoeken ze naar overeenkomsten met de liedjes die andere luisteraars waarderen of aan hun afspeellijst toevoegden. Daardoor krijg je wel nieuwe liedjes te horen, maar blijf je in de buurt van je eigen voorkeuren rondhangen.

De aanbevelingstechniek lijkt op de manier waarop bijvoorbeeld Netflix je films voorschotelt, of Amazon en Bol.com boeken suggereren die aansluiten bij je interesses. Amazon (en tot voor kort ook Netflix) gebruiken waarderingen van 1 tot 5 sterren, bij muziek geldt een draaibeurt of aankoop als een positieve waardering.

Er zijn meer aanknopingspunten: elke muziekdienst vraagt nieuwe gebruikers om een paar favoriete genres en artiesten te kiezen. Sommige diensten laten je ook je eigen mp3-tjes en afspeellijsten importeren en destilleren daaruit informatie. Zo wordt een gedetailleerd profiel van de luisteraar samengesteld.

Herkenning en herhaling

Een tv-serie of een boek ‘consumeer’ je meestal één keer, bij liedjes speelt herkenning en herhaling een grote rol. Vaak hebben luisteraars geen zin om iets nieuws te ontdekken. Ze houden vast aan de muziek die ze in hun tienerjaren hoorden en willen meezingen met de nummers die ze al kennen. Vandaar dat veel algoritmes radiostations creëren waarbij de eerder gedraaide liedjes ook weer terugkomen.

Daily Mix, van Spotify, heeft twee weken nodig om je luistergedrag te herkennen en serveert op basis daarvan artiesten die je al kent, aangevuld met nieuw repertoire. Je kunt aangeven of je een nummer leuk vindt of vreselijk, data die Spotify in je smaakprofiel opslaat voor een volgende keer.

Deezers ‘Flow’, een radiostation op maat, maakt een mix van 50 procent nieuwe liedjes (die je niet eerder bij Deezer hoorde), en 50 procent bekend materiaal. Alexander Holland van Deezer: „Het algoritme van Flow probeert te voorspellen wat je leuk vindt op basis van je eerdere luistergedrag. Daarbij tellen recente draaibeurten zwaarder mee dan liedjes die je heel lang geleden hoorde. We houden ook rekening met liedjes die populair zijn in je land, die andere mensen in hun speellijst hebben staan.” De locatie is een belangrijke filter, aldus Holland: „We zijn er niet op uit om Egyptische fluitmuziek overal ter wereld populair te maken.”

Van Slayer naar André Hazes

Het wordt lastiger als je van uiteenlopende genres houdt – heavy metal en Nederlands­talige muziek. Je wilt niet binnen een afspeellijst continu heen en weer stuiteren tussen Slayer en André Hazes. Op de achtergrond voert Deezer daarom voortdurend testen uit om te kijken of de suggesties van Flow wel aanslaan.

Het succes van een afspeellijst wordt bepaald door het aantal minuten dat de gebruiker luistert. Ook het aantal ‘skips’ - een nummer overslaan – telt mee. „Maar dat verschilt per genre”, zegt Alexander Holland. „Hiphop-liefhebbers zijn vaak nieuwsgieriger naar nieuwe muziek en spoelen vaak door. Een skip wil ook niet zeggen dat je het liedje niet mooi vindt. Misschien heb je er nú even geen zin in.”

Wanneer heb je zin in muziek?

De stemming van de luisteraar wordt meegenomen in de aanbevelingen. Is het een vrijdagmiddag, een zondagavond of zit je op de sportschool? Muziekdiensten bieden handmatig samengestelde afspeellijsten aan die inspelen op zulke activiteiten. Google Play Music gebruikt ook je locatie – de dienst ziet dat je op een doordeweekse dag thuis achter de computer zit en suggereert daarom een ‘thuiswerk-lijst’ met pianomuziek.

Zulke handmatig samengestelde afspeellijsten zijn populair; de meeste muziekdiensten hebben tientallen specialisten in dienst die selecties maken, per genre of per stemming. Zij zijn de dj’s van het streamingtijdperk en platenmaatschappijen vechten om een goede notering te krijgen bij de best beluisterde playlists.

Deze menselijke curatoren hebben één nadeel: ze kunnen nooit een keuze maken uit al die tientallen miljoenen liedjes (waar er maandelijks nog 100.000 bij komen). Vandaar dat decomputer noodzakelijk is om suggesties te automatiseren.

Beoordelingen niet mals

Om te kijken hoe goed de automatische suggesties zijn, schakelen we de hulp van de muziekrecensenten van NRC in. Muziekdiensten laten je radiostations samenstellen op basis van één liedje. Bij Spotify heet dat ‘Nummer­radio’, Apple noemt het ‘Station’ en Deezer biedt een ‘Artist Mix’. Het is een objectieve manier om de suggesties te vergelijken, omdat geen rekening gehouden wordt gehouden met wat je eerder beluisterde – dat verschilt immers per persoon.

De recensenten suggereren één liedje, de zogeheten seed track, en beoordelen vervolgens de afspeellijst die Apple Music, Spotify, Deezer, Tidal en Google Play Music genereren. Voor de test kiezen we tien uiteenlopende genres en beperken de playlists tot twintig liedjes.

De oordelen van de recensenten zijn niet mals. De afspeellijsten bieden te veel herhaling en te weinig relevantie. Armoe troef, zeker als ook de oorspronkelijke seed track weer opnieuw wordt afgespeeld. „Wil Spotify me beledigen of doodvervelen?” vraagt metal-kenner Peter van der Ploeg zich af.

Jan Vollaard krijgt op basis van The times they are a-changin van Bob Dylan voornamelijk ‘oubollige ouwemannenmuziek’ voorgeschoteld: „De meeste keuzes stemmen mij tot grote droefenis.” Leendert van der Valk is teleurgesteld hoe beperkt de afrobeat van Fela Kuti wordt geïnterpreteerd. „Spotify presteert het om zes keer dezelfde artiest in de lijst te zetten.”

Peter van der Ploeg beoordeelt de suggesties na Atlas Rise! van Metallica: „In plaats van moderne genregenoten, krijg je vooral belegen generatiegenoten.”

Similarity index

De automatische suggesties schieten tekort omdat ze zich hoofdzakelijk lijken te baseren op de categorisering die de platenmaatschappij of distributeur meelevert. Die is niet erg gedetailleerd; dat verklaart waarom één ballad van een rockband hoofdzakelijk rocksuggesties oplevert – niet andere rustige ballads. Ook het jaar van de release en de bezetting speelt een rol – zo komen voormalige bandleden terug in de afspeellijsten, zelfs al lijkt hun muziek niet meer op het origineel.

Alexander Holland van Deezer: „We houden een similarity index van artiesten bij, gebaseerd op gegevens van distributeurs. Zij leveren niet altijd goede data.” Soms vergissen muziekdiensten zich: Afrobeat en Afrobeats zijn twee uiteenlopende genres, maar worden door Apple Music door elkaar gehaald, concludeert Leendert van der Valk.

In de test blijkt dat de seed track soms opnieuw in de afspeellijst verschijnt. De vermoedelijke verklaring: er zitten ook doublures tussen de 30 miljoen liedjes – een liedje verschijnt bijvoorbeeld op verschillende verzamelalbums. In de muziekdatabase worden er voor al die versies verschillende identificatie-codes gebruikt. Het lijken dus verschillende liedjes.

Uit de test blijkt dat de muziekdiensten nog te weinig weten van de liedjes zelf om een slimme geautomatiseerde lijst te genereren. Er zijn een paar initiatieven die dat euvel proberen te verhelpen.

Het Music Genome Project van de Amerikaanse muziekdienst Pandora (niet in Nederland verkrijgbaar) analyseerde miljoenen liedjes op 450 verschillende muzikale eigenschappen. Een heidens karwei dat door vrijwilligers wordt uitgevoerd en al meer dan tien jaar duurt.

Je kunt het audiosignaal ook analyseren met een computer om eigenschappen als tempo, gebruikte instrumenten en type stem te bepalen. Dat levert vaak voldoende informatie op om een genre te typeren. Hoewel die aanpak niet foutloos is, kun je het in ieder geval automatiseren.

De emotionele lading van liedjes

De Europese startup Musimap bouwt een zelflerende database die al 1,6 miljoen liedjes indeelde op genre en artiest en daarbij rekening houdt met de emotionele lading van het liedje. Het is nogal een mondvol, dit emotion-sensitive cognitive music intelligence platform. Oprichter Vincent Favrat: „We gebruiken meer dan honderd eigenschappen om een liedje te typeren. Een nummer kan bij ons 22 procent gospel zijn, met een vleugje elektronica en a capella. Wie weet is er een rockabilly-band uit Oslo die aansluit op jouw voorkeuren. Die zou je met statistische suggesties nooit kunnen vinden, maar met Musimap wel.”

Musimap gebruikt een combinatie van technieken, waaronder analyse van audio en songteksten, om 390 stemmingen te onderscheiden – niet alleen die van de liedjes maar ook die van gebruikers. „Twee derde van je psychologische profiel is stabiel, de rest is afhankelijk van je sociale context. Bijvoorbeeld: luister je naar muziek in je eentje of met vrienden, zit je in de auto of bij een etentje – en eet je met je geliefde of met je ouders.”

Musimap wil ook je stemming aflezen met sensoren, bijvoorbeeld een camera in de auto die aan je gezicht ziet of je opbeurende liedjes kunt gebruiken of juist iets rustigs. Creepy? Favrat vergelijkt Musimap met de plaatselijke platenboer die je persoonlijke voorkeuren precies kent. Hij denkt dat de meeste luisteraars huiverig zijn nieuwe muziek te ontdekken omdat hun ontdekkingsreis tot nu toe niet erg aangenaam was, precies zoals de muziekrecensenten ervoeren. „De muziekindustrie wil onze aandacht concentreren, hits produceren. We zijn daardoor gewend geraakt aan hits, net zoals sommige mensen telkens hetzelfde restaurant bezoeken om hetzelfde gerecht te eten. Wij kunnen je meer diversiteit bieden, met dezelfde ingrediënten.”

Musimap staat erop eigen afspeellijsten (hieronder aanklikbaar als Spotify-lijst) aan te leveren om te bewijzen dat hun smaak-algoritmes beter werken. Maar de NRC-recensenten zijn niet overtuigd. Klassiek en wereldmuziek komen beter uit de verf; de andere genres zijn ‘marginaal beter’ of even beroerd. Smaak laat zich nog niet door statistiek, noch door een emotion-sensitive cognitive music intelligence vangen.

Bekijk het Excel-sheet met alle afspeellijsten die gebruikt zijn voor deze beoordelingen.

Illustraties Aron Vellekoop Léon. Infographic Yordi Dam. Vorm Koen Smeets.