DeepMinds RoboCat lærer å utføre en rekke robotoppgaver
DeepMind sier at de har utviklet en AI-modell, kalt RoboCat, som kan utføre en rekke oppgaver på tvers av forskjellige modeller av robotarmer. Det alene er ikke spesielt nytt. Men DeepMind hevder at modellen er den første som kan løse og tilpasse seg flere oppgaver og gjøre det ved å bruke forskjellige, virkelige roboter.
“Vi demonstrerer at en enkelt stor modell kan løse et mangfoldig sett med oppgaver på flere ekte robotutførelser og raskt kan tilpasse seg nye oppgaver og utførelsesformer,” Alex Lee, en forsker ved DeepMind og en medbidragsyter i teamet bak RoboCat, fortalte TechCrunch i et e-postintervju.
RoboCat – som var inspirert av Gato, en DeepMind AI-modell som kan analysere og handle på tekst, bilder og hendelser – ble trent på bilder og handlingsdata samlet inn fra robotikk både i simulering og i det virkelige liv. Dataene, sier Lee, kom fra en kombinasjon av andre robotkontrollerende modeller i virtuelle miljøer, mennesker som kontrollerer roboter og tidligere iterasjoner av selve RoboCat.
For å trene RoboCat samlet forskere ved DeepMind først mellom 100 til 1000 demonstrasjoner av en oppgave eller robot ved hjelp av en robotarm kontrollert av et menneske. (Tenk at en robotarm plukker opp gir eller stablet blokker.) Deretter finjusterte de RoboCat på oppgaven, og skapte en spesialisert “spin-off”-modell som øvde på oppgaven i gjennomsnitt 10 000 ganger.
Ved å utnytte både dataene generert av spin-off-modellene og demonstrasjonsdataene, vokste forskerne kontinuerlig RoboCats treningsdatasett – og trente opp påfølgende nye versjoner av RoboCat.
Bildekreditt: DeepMind
Den endelige versjonen av RoboCat-modellen ble trent på totalt 253 oppgaver og benchmarked på et sett med 141 varianter av disse oppgavene, både i simulering og i den virkelige verden. DeepMind hevder at etter å ha observert 1000 menneskekontrollerte demonstrasjoner samlet over flere timer, lærte RoboCat å betjene forskjellige robotarmer.
Mens RoboCat hadde blitt trent på fire typer roboter med to-grenede armer, var modellen i stand til å tilpasse seg en mer kompleks arm med en tre-fingret griper og dobbelt så mange kontrollerbare innganger.
For at RoboCat ikke skal bli utropt som siste av robotkontrollerende AI-modeller, varierte suksessraten på tvers av oppgaver drastisk i DeepMinds testing – fra 13 % på den lave enden til 99 % på den høye enden. Det er med 1000 demonstrasjoner i treningsdataene; suksessene var forutsigbart mindre vanlige med halvparten så mange demonstrasjoner.
Likevel, i noen scenarier, hevder DeepMind at RoboCat var i stand til å lære nye oppgaver med så få som 100 demonstrasjoner.
Sett videre, mener Lee at RoboCat kan varsle en senking av barrieren for å løse nye oppgaver innen robotikk.
“Forsynt med et begrenset antall demonstrasjoner for en ny oppgave, kan RoboCat finjusteres til de nye oppgavene og i sin tur selvgenerere mer data for å forbedre ytterligere,” la han til.
Fremover har forskerteamet som mål å redusere antallet demonstrasjoner som trengs for å lære RoboCat å fullføre en ny oppgave til færre enn 10.