Niet te volgen, maar een algoritme schreef dit songfestivallied

Algoritmes Donderdag zingt Waylon voor Nederland op het Eurovisie Songfestival. NRC liet de computer een eigen songtekst schrijven, met de meest voorkomende woorden uit tien jaar songfestival.

Yodel it! van Ilinca en Alex Florea was de Roemeense inzending voor het Eurovisie Songfestival 2017. “Yodeleio” en “Yodeleeii” komen samen slechts twintig keer voor in tien jaar songfestival en staan dus niet in de gegenereerde songtekst. Eurovision

Kan een computer liedjes voor het Eurovisie Songfestival schrijven? NRC voedde een simpel algoritme met bijna tweehonderd songteksten van de afgelopen tien finales van het songfestival. Daarmee kon het algoritme een nieuwe en bedriegelijk coherente liedtekst schrijven.

Het algoritme, de Markov-ketting, wordt veel gebruikt om willekeurig teksten te genereren. Het zit ook in het slimme toetsenbord van smartphones, waar het helpt – en soms frustreert – bij automatische correcties. In de simpelste vorm werkt het algoritme door een brontekst op te knippen in losse woorden. Vervolgens bekijkt het algoritme alle unieke woorden in de tekst, waarvan het alle woorden verzamelt die direct na dat ene woord in de tekst volgen. Op basis van die informatie kan het algoritme tekst genereren.

De resulterende tekst is vaak verrassend coherent. Zeker als er genoeg brontekst is zodat veel combinaties gevonden kunnen worden, produceert het algoritme grammaticaal kloppende tekst. Enige logica is toeval: het algoritme heeft geen benul wat het schrijft en het heeft ook bijna geen geheugen. Het enige wat het ‘weet’ is dat de combinaties vaak samen voorkomen.

Onze songfestivalgenerator keek ook naar woordparen. De tweehonderd Engelstalige songteksten uit de afgelopen tien finales (en eentje uit 1996, maar daarover later meer) van het Eurovisie Songfestival resulteerden in zo’n 45.000 paren. Een strofe liedtekst is zo’n 25 woorden. Vragen we het algoritme om 100 woorden per keer te genereren dan is dit het lied dat ontstaat:

Life won’t breathe

Life won’t breathe! I no fear
This is showtime
Yeah, I’ll always lead her now
And make you miss you.

And I so distant
When I say
Everything has done it?
We have done

Sound of your eyes and can’t change
When there
If I’m gonna get together

Between the dice.
Our dreams.
Oh oh oh so intoxicated.
You see how I stand today

Hands down
We are homeless
My life
We’re higher I can I

Niet te volgen, maar toch op plaatsen grammaticaal.

De pijnlijkste misser in de tekst is de combinatie van ‘I’ en ‘so’ in de zin “And I so distant”. Dat specifieke woordpaar met “I” komt slechts 1 op 1.502 keer voor. De bron van dit alles is de zin “Am I wrong am I so unkind” uit het lied Ooh…Aah…Just A Little Bit van Gina G., de inzending van het Verenigd Koninkrijk in 1996, die per abuis aan de brontekst werd toegevoegd.

Toch zal deze computergegenereerde songtekst vast niet het vreemdste lied zijn dat ooit op een Songfestival gezongen is. In 2003 werd België tweede met een lied gezongen in een taal die überhaupt niet bestond. Het kwam slechts twee punten te kort om eerste te worden.