Artificiële Intelligentie leert beter dankzij afleiding

Hoe train je een AI systeem? Computerwetenschappers uit Nederland en Spanje hebben nu vastgesteld hoe een systeem dat geschikt is voor beeldherkenning de omgeving leert herkennen. Daarmee wisten ze het leerproces te vereenvoudigen door het systeem te dwingen zich ook te richten op minder belangrijke informatie.

Het gaat om Convolutional Neural Networks (CCNs), een op de biologie geïnspireerde vorm van deep learning binnen de Artificiële Intelligentie (AI). Dit systeem leert beelden herkennen dankzij de interactie van duizenden ‘neuronen’ die de werking van onze hersenen nabootsen. ‘Deze CNNs zijn erg nuttig, maar we begrijpen niet goed hoe ze werken’, zegt Estefania Talavera Martinez, docent-onderzoeker aan het Bernoulli Instituut voor Wiskunde, Computerwetenschap en Kunstmatige Intelligentie van de RUG.

Voedsel

Zij gebruikt zelf CNNs in onderzoek naar menselijk gedrag, om beelden te analyseren die gemaakt zijn met een draagbare camera. Talavera Martinez bestudeert onder meer onze interactie met voedsel, dus wilde ze dat het systeem verschillende situaties kan herkennen waarin mensen voedsel tegen komen. "Het viel mij daarbij op dat het systeem fouten maakte bij het goed identificeren van de omgeving op bepaalde foto’s, en ik wilde weten waarom dat gebeurde."

Aan de hand van ‘heat maps’ analyseerde zij welke delen van de beelden door de CNNs gebruikt zijn om de situatie te herkennen. "Dat leidde tot de hypothese dat het systeem niet voldoende details uit het beeld gebruikte", zegt zij . Wanneer een AI systeem bijvoorbeeld geleerd heeft om een mok te associëren met de keuken, zal het een woonkamer of kantoor, waar mokken ook worden gebruikt, verkeerd classificeren. De oplossing die Talavera Martinez hiervoor bedacht, samen met haar Spaanse collega’s David Morales (Andalusian Research Institute in Data Science and Computational Intelligence, Universiteit van Granada) en Beatriz Remeseiro (Department of Computer Science, Universiteit van Oviedo), ss om het systeem af te leiden van de primaire doelen.

Vervaagd

Zij trainden CNNs met standaardbeelden van vliegtuigen of auto’s en achterhaalden via heat maps welke delen waren gebruikt voor de classificatie. Vervolgens zijn deze delen van het beeld vervaagd, waarna een tweede trainingsronde volgde. "Dit dwingt het systeem om andere delen van het beeld te gebruiken voor identificatie. En door deze extra informatie mee te nemen, ontstaat een betere classificatie."

De aanpak werkte prima met standaard foto’s, en is vervolgens ok met succes toegepast op de beelden die Talavera Martinez had verzameld met de draagbare camera’s. "Onze manier van trainen levert een vergelijkbaar resultaat op met andere technieken, maar is veel eenvoudiger en kost minder rekentijd."

Eerdere pogingen om de classificatie van beelden te verbeteren gebruikten bijvoorbeeld een combinatie van verschillende soorten CNNs. De aanpak die Talavera Martinez en haar collega’s gebruikten is minder zwaar. "Dit onderzoek gaf ons een beter idee van hoe deze CNNs leren. En dat heeft ons geholpen het trainingsprogramma te verbeteren."