Ook de computer schat emoties soms verkeerd in

Gespeelde en overdreven emoties zijn voor een computer nog wel te herkennen. Maar om écht natuurlijke mens-machine interactie te bereiken, moet de machine ook de subtiele emotionele uitingen uit bijvoorbeeld spraak of gezichtsuitdrukkingen kunnen halen. Promovendus Khiet Truong van de Universiteit Twente heeft daarom proefpersonen met videogames aan het werk gezet, om de meest uiteenlopende emoties te kunnen vastleggen in een database. Toch blijft de interpretatie van emoties door een machine lastig, concludeert zij. Truong promoveert vorige maand aan de faculteit Elektrotechniek, Wiskunde en Informatica.

Een robot die de emoties van mensen aanvoelt en hierop reageert, een spraakcomputer die een boze beller automatisch doorverbindt met een medewerker, de verlichting in huis die zich aanpast aan je stemming: natuurlijke mens-machine interactie vraagt om een computer ‘met gevoel’. Maar hoe herkent de machine emoties in de communicatie met de mens? Khiet Truong heeft onderzoek gedaan naar de automatische herkenning van emotie in spraak door machines. Zij constateert dat databases die uitgaan van een set geacteerde standaardemoties niet voldoen. Daarom heeft zij proefpersonen ingeschakeld om de meest uiteenlopende emoties te kunnen vastleggen.

Standaardemoties, zoals boosheid, verveling, walging, blijheid en droevigheid, zijn gemakkelijk na te spelen. Deze geacteerde uitingen hebben als voordeel dat ze gemakkelijk te herkennen zijn, maar als nadeel dat deze, vaak overdreven, uitingen niet zo in de werkelijkheid voorkomen. Truong zocht naar een manier om ‘echte’ emotie te vangen en deze vervolgens te labelen voor een automatische emotieherkenner. Hiervoor vroeg ze proefpersonen een gemanipuleerde computergame te laten spelen, waarbij zoveel mogelijk verschillende emoties werden uitgelokt. Na afloop moesten de proefpersonen hun eigen emoties beoordelen.

Uit de eigen beoordelingen en beoordelingen van anderen bleek dat de gevoelde emoties veel moeilijker te herkennen zijn dan de waargenomen emoties. Daarom is het niet altijd even gemakkelijk om de goede emotie te herkennen.

De resultaten van het onderzoek laten zien dat de automatische herkenning van emotie in spraak erg moeilijk is. Dit komt doordat ‘echte’ emotie, zoals voorkomt in de werkelijkheid, een erg complex fenomeen is, dat soms niet zo beschreven kan worden dat het ook bruikbaar is voor informatici. Als het voor mensen al lastig is om de emotie te herkennen, is het voor een computer helemaal lastig.

Khiet Truong promoveerde op 27 augustus in de vakgroep Human Media Interaction van de faculteit Elektrotechniek, Wiskunde en Informatica en het onderzoeksinstituut CTIT. Zij werd begeleid door prof. dr. Franciska de Jong en prof. dr. ir. David van Leeuwen. Haar proefschrift How does real affect affect affect recognition in speech is op verzoek digitaal beschikbaar. Haar onderzoek werd uitgevoerd bij TNO (Soesterberg), waar ze ook werkzaam was. Het onderzoek werd gefinancierd door het MultimediaN-project.