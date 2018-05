Kan een computer liedjes voor het Eurovisie Songfestival schrijven? NRC voedde een simpel algoritme met bijna tweehonderd songteksten van de afgelopen tien finales van het songfestival. Daarmee kon het algoritme een nieuwe en bedriegelijk coherente liedtekst schrijven.

Het algoritme, de Markov-ketting, wordt veel gebruikt om willekeurig teksten te genereren. Het zit ook in het slimme toetsenbord van smartphones, waar het helpt – en soms frustreert – bij automatische correcties. In de simpelste vorm werkt het algoritme door een brontekst op te knippen in losse woorden. Vervolgens bekijkt het algoritme alle unieke woorden in de tekst, waarvan het alle woorden verzamelt die direct na dat ene woord in de tekst volgen. Op basis van die informatie kan het algoritme tekst generen.

De resulterende tekst is vaak verrassend coherent. Zeker als er genoeg brontekst is zodat veel combinaties gevonden kunnen worden, produceert het algoritme grammaticaal kloppende tekst. Enige logica is toeval: het algoritme heeft geen benul wat het schrijft en het heeft ook bijna geen geheugen. Het enige wat het ‘weet’ is dat de combinaties vaak samen voorkomen.

Onze songfestivalgenerator keek ook naar woordparen. De tweehonderd Engelstalige songteksten uit de afgelopen tien finales (en eentje uit 1996, maar daarover later meer) van het Eurovisie Songfestival resulteerden in zo’n 45.000 paren. Een strofe liedtekst is zo’n 25 woorden. Vragen we het algoritme om 100 woorden per keer te genereren dan is dit het lied dat ontstaat:

Life won’t breathe

Life won’t breathe! I no fear

This is showtime

Yeah, I’ll always lead her now

And make you miss you.

And I so distant

When I say

Everything has done it?

We have done

Sound of your eyes and can’t change

When there

If I’m gonna get together

Between the dice.

Our dreams.

Oh oh oh so intoxicated.

You see how I stand today

Hands down

We are homeless

My life

We’re higher I can I

Niet te volgen, maar toch op plaatsen grammaticaal.

De pijnlijkste misser in de tekst is de combinatie van ‘I’ en ‘so’ in de zin “And I so distant”. Dat specifieke woordpaar met “I” komt slechts 1 op 1.502 keer voor. De bron van dit alles is de zin “Am I wrong am I so unkind” uit het lied Ooh…Aah…Just A Little Bit van Gina G., de inzending van het Verenigd Koninkrijk in 1996, die per abuis aan de brontekst werd toegevoegd.

Toch zal deze computergegenereerde songtekst vast niet het vreemdste lied zijn dat ooit op een Songfestival gezongen is. In 2003 werd België tweede met een lied gezongen in een taal die überhaupt niet bestond. Het kwam slechts twee punten te kort om eerste te worden.