Robot puzzelt zich als mens uit doolhof (video)

Een doolhof is een populair instrument onder psychologen om het leervermogen van muizen of ratten te testen. Maar hoe zit dat met robots? Kunnen die leren om zelfstandig de uitgang van een labyrint te vinden?

Onderzoekers van de Technische Universiteit Eindhoven (TU/e) en het Max Planck Instituut in Mainz laten zien dat het kan. Hun neuromorfe robot baseert zijn beslissingen op hetzelfde systeem dat wij mensen gebruiken om te denken en te handelen: ons brein. De studie, die is gepubliceerd in Science Advances, biedt uitzicht op nieuwe toepassingen van neuromorfe apparaten in bijvoorbeeld de gezondheidszorg en edge computing.

Neurale netwerken en machine learning staan de laatste jaren in het middelpunt van de belangstelling. En dat is niet voor niks, gezien de vele successen op het gebied van beeldherkenning, medische diagnose, e-commerce en vele andere gebieden. Toch kleven er ook nadelen aan deze softwarematige benadering van machine-intelligentie, niet in het minst omdat er zoveel stroom nodig is om de algoritmen te trainen.

Menselijk brein als inspiratiebron

Dit energieprobleem is een van de redenen waarom onderzoekers hebben geprobeerd computers te ontwikkelen die veel zuiniger zijn. Daarbij laten ze zich inspireren door het menselijk brein, een denkende machine die door de slimme manier waarop geheugen en verwerking samenwerken juist erg weinig energie gebruikt.

Neuronen in onze hersenen communiceren met elkaar via zogeheten synapsen, die telkens als er informatie doorheen stroomt, sterker worden. Het is dit vermogen (dat bekend staat als plasticiteit) dat maakt dat mensen dingen kunnen onthouden en leren.

"In ons onderzoek hebben we dit model gebruikt om een robot te ontwikkelen die in staat is om te leren bewegen door een labyrint," zegt Imke Krauhausen, promovendus aan de faculteit Mechanical Engineering van de TU/e en hoofdauteur van het artikel."Net zoals een synaps in een muizenbrein wordt versterkt telkens wanneer het beestje de juiste kant opgaat in een doolhof, wordt ons apparaat ‘getuned’ door een bepaalde hoeveelheid elektriciteit toe te dienen. Door de weerstand in het apparaat te manipuleren, verander je de spanning die de motoren aanstuurt. Die bepalen op hun beurt of de robot naar rechts of naar links draait."

Hoe werkt het?

De robot die Krauhausen en haar collega’s voor hun onderzoek gebruikten, is een Mindstorms EV3, een robotica-kit gemaakt door Lego. Uitgerust met twee wielen, traditionele besturingssoftware om ervoor te zorgen dat hij een lijn kan volgen, en een aantal reflectie- en aanraaksensoren, werd hij een 2 m2 groot doolhof ingestuurd dat bestaat uit zwart omlijnde zeshoeken in een honingraatachtig patroon.

De robot is geprogrammeerd om standaard rechtsaf te slaan. Telkens wanneer hij een doodlopende weg bereikt of afwijkt van het aangegeven pad naar de uitgang (die wordt aangegeven door visuele signalen), wordt hem verteld om te keren of naar links te gaan. Deze corrigerende stimulans wordt vervolgens in het neuromorfische apparaat opgeslagen voor de volgende poging.Robot puzzelt zich als mens uit doolhof

"Uiteindelijk had onze robot 16 runs nodig om de uitgang te vinden," zegt Krauhausen (zìe afbeelding hierboven). "Het mooie is dat, als hij eenmaal heeft geleerd deze specifieke route (target path 1) te volgen, hij elk ander pad dat hem wordt opgegeven (target path 2) in één keer kan doorlopen. De kennis die hij heeft opgedaan is dus generaliseerbaar."

Een deel van het succes van de robot ligt in de unieke integratie van sensoren en motoren, aldus Krauhausen. "Deze sensorimotorische integratie, waarbij zintuig en beweging elkaar versterken, is ook heel erg hoe de natuur werkt, dus dit is wat we hebben geprobeerd na te bootsen in onze robot."

Slimme polymeren

Een ander slimmigheidje is het organische materiaal. Het gaat om een polymeer dat bekend staat als p(g2T-TT). Het materiaal is niet alleen stabiel, maar ook erg goed in het vasthouden van de specifieke toestanden waarin het is ‘getuned’ tijdens de verschillende runs door het labyrint. Dit zorgt ervoor dat het aangeleerde gedrag blijft ‘hangen’, net zoals neuronen en synapsen in een menselijk brein gebeurtenissen of handelingen onthouden.

Het gebruik van polymeer in plaats van silicium voor neuromorfe electronica werd ontwikkeld door Paschalis Gkoupidenis van het Max Planck Instituut voor Polymeeronderzoek in Mainz en Yoeri van de Burgt van de TU/e, beide co-auteurs van het paper. In eerder onderzoek lieten ze zien dat dit materiaal in een veel groter geleidingsbereik kan worden afgestemd dan anorganische materialen, en dat het in staat is om geleerde toestanden gedurende langere perioden te ‘onthouden’ of op te slaan. Sindsdien zijn organische apparaten een hot topic geworden in de wereld van hardware-gebaseerde kunstmatige neurale netwerken.

Bionische handen

Polymeren kunnen in talrijke biomedische toepassingen worden gebruikt. "Omdat ze organisch zijn, kunnen deze slimme apparaten worden geïntegreerd met echte zenuwcellen. Stel dat je je arm verliest door een ongeluk. Dan zou je deze apparaten in principe kunnen gebruiken om je lichaam te koppelen aan een bionische hand," zegt Krauhausen.

Een andere veelbelovende toepassing ligt in de wereld van de edge computing. Daarbij worden data van sensoren lokaal buiten de cloud om opgeslagen en verwerkt. Van de Burgt: "Daar zie ik echt een toekomst voor onze apparaten: ze zijn makkelijk te ‘tunen’, gebruiken veel minder stroom, en zijn ook nog eens goedkoop om te maken."