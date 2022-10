„Hey Google, zet de tafellamp aan.” „ZET... DE... TAFEL... LAMP... AAAAN!” Een slimme speaker die reageert op spraak is handig, maar in de praktijk herkent het ding je stem vaak niet. Omdat je iets te ver weg staat, de afwasmachine bromt of je kinderen geluid maken.

De afgelopen jaren is de technologie van microfoons flink verbeterd, maar stemmen herkennen en verstaan met achtergrondgeluid blijft lastig. Ook de moderne geluidssensoren die stemmen onderscheiden tijdens een conference call raken vaak in de war van gerommel of gemompel op de achtergrond.

De problemen ontstaan als verschillende geluiden de microfoon ongeveer gelijktijdig bereiken waardoor de signalen met elkaar vermengd raken. Het is lastig om die van elkaar te scheiden in de digitale signaalverwerking.

Een Chinese onderzoeksgroep heeft nu een sensor ontwikkeld om dit te verbeteren, met een slim ontworpen zogeheten metamateriaal. In een publicatie die onlangs verscheen in Science Advances, laten ze zien dat deze sensor met 96 procent nauwkeurigheid spraak kan herkennen. Verder kan het apparaat de stemmen onderscheiden van twee mensen die naast elkaar zitten te praten. Ook kan het de positie volgen van iemand die al rondlopend om hulp roept in een gesimuleerde fabriek met luidruchtige pompen en loeiende machinealarmen.

Wiebelige paaltjes

De sensor waarmee ze dit voor elkaar krijgen, is zo groot als een meloen. Het oppervlak bestaat uit elf vijfhoekige vlakken van metamateriaal en één kaal vlak waarmee het ergens bevestigd kan worden. Het metamateriaal op elk vlak is opgebouwd uit een aluminium plaatje met dertig 10 millimeter hoge, wiebelige paaltjes van roestvrij staal op siliconenrubber. In het midden van elke vijfhoek zit een kleine holte met een apparaatje dat de binnenkomende geluiden omzet in elektrische signalen. Het metamateriaal zorgt ervoor dat het binnenkomende geluid in de holtes geconcentreerd wordt. Door te kijken op welk van de vlakken het signaal het sterkst is, kan de richting bepaald worden.

Het metamateriaal is zo ontworpen dat het het sterkst reageert op geluid met frequenties die overeenkomen met de frequenties van stemgeluid, mailt Lei Shao van de Chinese Shanghai Jiao Tong University. „Daardoor filtert de sensor vanzelf de lager frequente achtergrondgeluiden weg.”

De sensor kan verschillende stemmen onderscheiden. Als iedereen om de beurt praat en ver uit elkaar zit, dan kan de sensor simpelweg kijken wanneer en waarvandaan de stemgeluiden komen. Dat werkt niet als mensen door elkaar heen praten en vlak bij elkaar zitten. Daarvoor hebben de onderzoekers een computersysteem ontwikkeld dat de toonhoogte en bijvoorbeeld het timbre van verschillende stemmen leert onderscheiden.

„We hopen dat onze sensor gebruikt kan worden in nieuwe slimme speakers”, zegt Shao. „Dan zou je tijdens het afwassen met stromend water in de keuken, naar de slimme speaker in de eetkamer kunnen schreeuwen voor wat kindermuziek om je huilende baby te kalmeren. Onze ervaring is dat dat met de huidige slimme speakers nog niet lukt.”