Hoe je voorkomt dat ze je bespioneren

Computerwetenschappers van Columbia Engineering hebben een algoritme gebouwd dat ervoor zorgt dat een malafide microfoon je woorden 80% van de tijd niet correct kan horen. Tenminste, in het Engels (tot nu toe).

Is het je ooit opgevallen dat je online advertenties te zien krijgt die griezelig dicht in de buurt komen van iets waar je onlangs met je vrienden en familie over hebt gepraat? Microfoons zitten tegenwoordig bijna overal in, van onze telefoons, horloges en televisies tot stemassistenten, en ze luisteren altijd naar je. Computers gebruiken voortdurend neurale netwerken en AI om je spraak te verwerken, om informatie over je te verkrijgen. Hoe kan je dit voorkomen?

Vroeger zette je de muziek hard of liet je de kraan lopen in de badkamer. Maar wat als je niet constant over de muziek wilt schreeuwen om te communiceren? Onderzoekers van Columbia Engineering hebben een systeem ontwikkeld dat fluisterstille geluiden genereert die je in elke kamer en in elke situatie kunt afspelen om te voorkomen dat slimme apparaten je bespioneren. En het is eenvoudig te implementeren op hardware als computers en smartphones.

"Een belangrijke technische uitdaging was om het allemaal snel genoeg te laten werken", zegt Carl Vondrick, assistent-professor informatica. "Ons algoritme, dat erin slaagt om 80% van de tijd te voorkomen dat een malafide microfoon je woorden correct hoort, is de snelste en meest nauwkeurige in onze testbank. Het werkt zelfs als we niets weten over de malafide microfoon, zoals de locatie ervan, of de software die erop draait. Het camoufleert in feite de stem van een persoon via de ether, verbergt het voor deze luistersystemen en zonder het gesprek tussen mensen in de kamer te hinderen."

Gesprekken voorblijven

Hoewel het in theorie al een tijdje mogelijk is om automatische spraakherkenningssystemen te corrumperen, was de snelheid een groot knelpunt. Het probleem was dat een geluid dat op een specifiek moment iemands spraak verbreekt, anders is dan het geluid een seconde later. Terwijl mensen praten, verandert hun stem voortdurend omdat ze verschillende woorden zeggen en heel snel spreken. Dit is voor een machine moeilijk bij te houden.

‘Voorspellende aanvallen’

"Ons algoritme kan gelijke tred houden door de kenmerken te voorspellen van wat een persoon zal gaan zeggen, waardoor het genoeg tijd heeft om de juiste fluistering te genereren", zegt hoofdauteur Mia Chiquier. "Tot nu toe werkt onze methode voor het grootste deel van de Engelse woordenschat, en we zijn van plan het algoritme op meer talen toe te passen en uiteindelijk het fluistergeluid volledig onmerkbaar te maken." Het algoritme zorgt bovendien van de geluiden hard genoeg zijn om elke malafide ‘meeluistermicrofoon’, die ver weg zou kunnen zijn, te verstoren. Het volume is vergelijkbaar is met normaal achtergrondgeluid, waardoor mensen in een kamer op natuurlijke wijze kunnen converseren en zonder succesvol te worden gecontroleerd door een automatisch spraakherkenningssysteem.

De methode is bewezen in echte kamers met natuurlijk omgevingsgeluid en complexe scènegeometrieën.

 Het paper ‘REAL-TIME NEURAL VOICE CAMOUFLAGE’