Opinie

Een stiltefilter voor de videovergadering

Marc Hijink

Na drie maanden gedwongen thuiswerken zijn de meeste kantoorgangers gepokt en gemazeld in het videovergaderen, meer dan ze lief is waarschijnlijk. Op het eerste gezicht lijkt beeldbellen om de camera te draaien – kam je haren, recht je schouders – maar geluid, merkte ik, is minstens zo belangrijk. Laat je bijvoorbeeld de mute-knop open staan, om een beetje spontaniteit tussen de deelnemers te creëren, dan ergert iedereen zich al snel aan stiekem typende collega’s, hun spelende kinderen of een tuin vol enthousiaste vogels.

Achtergrondgeluid leidt meer af dan een rommelige werkkamer. Die kun je nog met een videofilter aanpassen. Blaffende honden of klussende buurmannen zijn een stuk moeilijker weg te poetsen.

Vergader-apps Microsoft Teams en Google Meet krijgen binnenkort allebei een nieuwe functie om de stilte terug te brengen in videomeetings. De gebruikelijke methodes van geluidsonderdrukking, zoals je die vindt in noisecancelling koptelefoons, zijn daarvoor niet voldoende. Die werken alleen bij gebrom en gesuis, bijvoorbeeld in een vliegtuig of trein. Zulke aanhoudende geluidsgolven zijn redelijk voorspelbaar en kun je met anti-geluid onderdrukken: een speaker die hetzelfde geluid maakt, maar dan met de geluidsgolven die net ‘uit fase’ staan.

Bij videogesprekken moeten de algoritmes leren om onverwachte geluiden te onderscheiden van de menselijke stem. Dat lukt al heel aardig: Google-technicus Serge Lachapelle gaf onlangs een demonstratie van de Cloud Denoiser, waarbij de computer het geluid van een krakende zak chips wegfiltert en de stem van spreker intact laat. Ook Microsofts chatexpert Robert Aichner demonstreerde realtime noise suppression met een zak chips – blijkbaar is snacken tijdens het vergaderen gebruikelijk in de techsector.

De software wordt getraind op honderden soorten van bijgeluiden, variërend van muziekinstrumenten tot dichtklappende deuren en spontaan applaus. Hoe abrupter het geluid, hoe lastiger het is te onderdrukken. Zo laat een blaffende hond zich moeilijker wegpoetsen dan een passerende stofzuiger. Is zo’n algoritme tegen blaffen te rigoureus, dan wordt misschien ook de bulderlach van je collega onderdrukt.

De stiltefilters van Microsoft en Google zijn nog werk in uitvoering, maar soortgelijke techniek kun je al als losse app uitproberen, via Krisp. Ook bij Krisp helpt een deep neural network – oftewel kunstmatige intelligentie – de menselijke stem te scheiden van zijn omgeving.

De bijgeluiden die de audio-onderzoekers analyseren vertonen veel overeenkomsten met de ‘triggers’ die de vereniging Misofonie Nederland noemt: klikken met een pen, typen op een toetsenbord, weer die chipszakken en lepeltjes die te lang in een beker blijven roeren. Ting-ting-ting, heel irritant.

Misofonie – letterlijk: de haat voor geluid – is een aandoening waarbij alledaagse, vaak menselijke geluiden, „extreme gevoelens van woede, walging of haat opwekken.”

Zo erg is het nou ook weer niet, dat videovergaderen. Maar alles wat helpt om onnodig leed in webmeetings te voorkomen, is mooi meegenomen.

Marc Hijink schrijft over technologie.

Reageren

Reageren op dit artikel kan alleen met een abonnement. Heeft u al een abonnement, log dan hieronder in.