DeepMind gjenbruker spill-AI-er for å optimalisere kode og infrastruktur

DeepMinds Alpha-serie med AI-er har gitt noen få verdensnyheter, som AlphaGo som slo verdensmesteren på Go. Nå har disse AI-ene som opprinnelig ble trent rundt å spille spill, blitt satt i gang med andre oppgaver, og viser en overraskende funksjon for dem.

Opprinnelig ble AlphaGo trent ved hjelp av menneskelig spilling, deretter lærte AlphaGo Zero bare ved å spille mot seg selv, deretter gjorde AlphaZero det samme, men mestret også sjakk og Shogi. MuZero gjorde alt det og mer uten engang å bli fortalt spillereglene, som hvis du tenker på det kan begrense måten den “tenker” på hvordan den skal utføre oppgaven sin.

Hos Google administrerer et system kalt Borg oppgavetildeling ved datasentre – i utgangspunktet analyserer forespørsler og tildeler ressurser med lyshastighet, slik at det enorme teknologiselskapet kan utføre arbeid og forskning i stor skala. Men Borg “bruker manuelt kodede regler for å planlegge oppgaver for å administrere denne arbeidsmengden. På Google-skala kan disse manuelt kodede reglene ikke ta hensyn til variasjonen av stadig skiftende arbeidsbelastningsfordelinger, og skaper ineffektiviteter som er like logisk uunngåelige som de er vanskelige å spore.

Men AlphaZero, utsatt for Borg-data, begynte å identifisere mønstre i datasenterbruk og innkommende oppgaver, og produserte nye måter å forutsi og administrere denne belastningen. Når det brukes i produksjon, “reduserer det[d] mengden underbrukt maskinvare med opptil 19 %,” som høres litt kirsebærplukket ut, men selv om halvt sant er en enorm forbedring “i Google-skala.”

På samme måte ble MuZero satt i gang med å se på YouTube-strømmer for å se om det kunne hjelpe med komprimering, et komplekst programvaredomene som gir store resultater for små optimaliseringer. Det var angivelig i stand til å redusere bithastigheten til videoer med 4 %, noe som igjen på YouTube-skalaer er ganske stort. MuZero går til og med inn i kompresjonens ugress, som rammegruppering.

AlphaDev – en slektning av AlphaZero’s – forbedret også sorteringsalgoritmer sammenlignet med standardene i biblioteket Google brukte. Og det gjorde en bedre hashing-funksjon for små byteområder (9-16), og reduserte belastningen med 30 %.

Disse forbedringene kommer ikke til å forandre verden på egen hånd; inkrementelle endringer i utviklersystemer gjøres hele tiden. Det som er interessant er at en AI som utviklet en problemløsningsmetode fokusert på å vinne spill, var i stand til å lære og generalisere tilnærmingen sin i helt urelaterte felt som komprimering.

Det er fortsatt en lang, lang vei å gå før vi har «generell AI», uansett hva det egentlig betyr, men det er lovende at det er en viss grad av fleksibilitet i de vi allerede har laget. Ikke bare fordi vi kan bruke dem på forskjellige felt, men fordi det antyder fleksibilitet og robusthet innenfor feltene de allerede jobber i.

Read More