Robotici van de Duke universiteit (VS) presenteren Humac: een framework waarmee robots net als mensen kunnen samenwerken met slechts 40 minuten eenvoudige coaching.
De natuur wemelt van dieren die in grote aantallen samenwerken. Bijen bakenen de beste voedselplekken af en laten anderen weten waar ze zijn. Mieren bouwen complexe hiërarchische huizen, gebouwd ter verdediging. Zwermen spreeuwen bewegen zich in prachtige formaties door de lucht alsof ze één geheel vormen.
Geen van deze dieren werkt echter samen zoals mensen. Zwermgeestgedrag komt voort uit eenvoudige regels die door veel individuen worden gevolgd. Mensen hebben echter het vermogen om zich in elkaar te verplaatsen en elkaars acties te voorspellen – een eigenschap die bekend staat als Theory of Mind.
Nu heeft een groep onderzoekers van Duke University en Columbia University ontdekt hoe ze deze uniek menselijke eigenschap kunnen gebruiken om groepen robots snel te trainen om complexe taken uit te voeren. Waar andere besturingsalgoritmen robots aansturen via mechanismen die meer lijken op het gedrag van de zwermgeest, leert dit onlangs gedemonstreerde framework, genaamd Humac, groepen robots hoe ze moeten samenwerken met behulp van inzichten die door één enkele menselijke coach worden aangereikt.
Bosbranden
Het onderzoek toont aan hoe robots kunnen leren anticiperen op de acties van teamgenoten, strategieën in realtime kunnen aanpassen en uitdagingen kunnen oplossen die een mensachtige, gecoördineerde, collectieve intelligentie vereisen. Het werk zou een zegen kunnen zijn voor toepassingen zoals het reageren op bosbranden en overlevingstaken in de natuur, waarbij robots moeten samenwerken en samenwerken onder beperkingen, met hiërarchische teamstructuren, onzekerheid over de omgeving en beperkte communicatiebandbreedte.
“Mensen beginnen de vaardigheid Theory of Mind te ontwikkelen rond de leeftijd van vier jaar”, zegt onderzoekerVerstoppertje Boyuan Chen. “Het stelt ons in staat de intenties van anderen te interpreteren en te voorspellen, waardoor samenwerking kan ontstaan. Dit is een essentiële vaardigheid die onze huidige robots missen om ze in staat te stellen als team samen te werken met andere robots en mensen. We hebben Humac ontworpen om robots te helpen leren van hoe mensen denken en op een efficiënte manier te coördineren.”
De mens als coach
Tijdens de Humac-training stelt het framework één menselijke operator in staat om, indien nodig, kortstondig de controle over verschillende robots binnen een team over te nemen en ze te begeleiden op belangrijke strategische momenten, net zoals een coach gericht advies geeft tijdens een voetbalwedstrijd. Deze interacties laten de teams zien hoe ze geavanceerde samenwerkingstactieken kunnen uitvoeren, zoals hinderlagen en omsingelingen.
Na deze korte demonstraties integreert het systeem de menselijke interventies in de algoritmen van de robots. De kerngedachte is dat de robots, om te kunnen leren samenwerken, een mentale representatie moeten vormen om tegelijkertijd te voorspellen wat de plannen van hun teamgenoten zijn en wat hun tegenstanders zullen doen. Met andere woorden, het impliciet integreren van alle beslissingen van spelers in hun eigen plannen – Theory of Mind.
Verstoppertje 2.0
“Ons framework schetst de toekomst van samenwerking tussen mens en AI, waarbij mensen de leiders zijn”, aldus Chen. “In dit geval begeleidt één mens een groter aantal agenten op een snelle en aanpasbare manier, iets wat nog nooit eerder is gedaan.”
Het team testte Humac in een dynamisch verstoppertje-spel, waarbij een team van drie zoekrobots een team van drie sneller bewegende verstoppertje-robots probeert te vangen in een begrensde vierkante arena vol willekeurige obstakels, waarbij ze uitsluitend vertrouwen op gedeeltelijke visuele observaties.
Deze setting is uitdagend, omdat niet-collaboratieve zoekrobots die de dichtstbijzijnde verstoppers blijven achtervolgen, slechts een succespercentage van 36% kunnen behalen.
Met Humac neemt een menselijke coach selectief de controle over individuele robots over wanneer dat nodig is. Na slechts 40 minuten begeleiding vertoont het robotteam sterk collaboratief gedrag, zoals hinderlagen en omsingelingen. In simulaties steeg het succespercentage naar 84%, en zelfs bij fysieke tests met grondvoertuigen bleef het succespercentage 80%.
“We zagen robots zich als echte teamgenoten gedragen”, aldus Zhengran Ji, de hoofdauteur en promovendus in Chens lab. “Ze voorspelden elkaars bewegingen en coördineerden op natuurlijke wijze, zonder expliciete commando’s.”