Uken i AI: Apple gjør maskinlæringsbevegelser

Å holde tritt med en bransje som beveger seg like raskt som AI er en stor oppgave. Så inntil en AI kan gjøre det for deg, her er en praktisk oppsummering av forrige ukes historier i verden av maskinlæring, sammen med bemerkelsesverdig forskning og eksperimenter vi ikke dekket på egen hånd.

Det kan sies at Apple i forrige uke, veldig synlig og med intensjon, kastet hatten sin inn i det ultra-konkurransedyktige AI-løpet. Det er ikke det at selskapet ikke hadde signalisert sine investeringer i — og prioritering av — AI tidligere. Men på sitt WWDC-arrangement gjorde Apple det helt klart at AI sto bak mange av funksjonene i både den kommende maskinvaren og programvaren.

For eksempel kan iOS 17, som kommer senere i år, foreslå oppskrifter på lignende retter fra et iPhone-bilde ved hjelp av datasyn. AI driver også Journal, en ny interaktiv dagbok som gir personlige forslag basert på aktiviteter på tvers av andre apper.

iOS 17 vil også ha en oppgradert autokorrektur drevet av en AI-modell som mer nøyaktig kan forutsi de neste ordene og setningene som en bruker kan bruke. Over tid vil den bli skreddersydd, og lære en brukers mest brukte ord – inkludert banneord, underholdende.

AI er også sentralt i Apples Vision Pro augmented reality-headset – spesielt FaceTime på Vision Pro. Ved å bruke maskinlæring kan Vision Pro lage en virtuell avatar av brukeren, og interpolere ut et bredt spekter av ansiktsforvrengninger – ned til hudspenninger og muskelarbeid.

Bildekreditt: eple

Det er kanskje ikke generativ AI, som uten tvil er den hotteste underkategorien til AI i dag. Men Apples intensjon, ser det ut for meg, var å sette i gang et slags comeback – for å vise at det ikke er en som skal undervurderes etter år med flunkende maskinlæringsprosjekter, fra den underveldende Siri til den selvkjørende bilen i produksjonshelvete.

Å projisere styrke er ikke bare et markedsføringsknep. Apples historiske underprestasjoner innen AI har ført til alvorlig hjerneflukt, etter sigende, med The Information som rapporterte at talentfulle maskinlæringsforskere – inkludert et team som hadde jobbet med den typen teknologi som ligger til grunn for OpenAIs ChatGPT – forlot Apple for grønnere beitemarker.

Viser at det er seriøst med AI ved faktisk Shipping produkter med kunstig intelligens føles som et nødvendig trekk – og en målestokk som noen av Apples konkurrenter faktisk ikke har klart å møte i den siste tiden. (Her ser du på deg, Meta.) Etter alt å dømme gjorde Apple inntog forrige uke – selv om det ikke var spesielt høyt om det.

Her er de andre AI-overskriftene fra de siste dagene:

    Meta lager en musikkgenerator: For ikke å bli overgått av Google har Meta gitt ut sin egen AI-drevne musikkgenerator – og i motsetning til Google har den åpen kildekode. Metas musikkgenererende verktøy, kalt MusicGen, kan gjøre en tekstbeskrivelse til omtrent 12 sekunder med lyd.
    Regulatorer undersøker AI-sikkerhet: Etter den britiske regjeringens kunngjøring forrige uke om at de planlegger å arrangere et “globalt” AI-sikkerhetstoppmøte denne høsten, har OpenAI, Google DeepMind og Anthropic forpliktet seg til å gi “tidlig eller prioritert tilgang” til deres AI-modeller for å støtte forskning på evaluering og sikkerhet.
    AI, møt sky: Salesforce lanserer en ny serie med produkter som tar sikte på å styrke sin posisjon i det ultra-konkurransedyktige AI-området. Kalt AI Cloud, suiten, som inkluderer verktøy designet for å levere «bedriftsklar» AI, er Salesforces siste tverrfaglige forsøk på å utvide produktporteføljen med AI-funksjoner.
    Testing av tekst-til-video AI: TechCrunch gikk hands on med Gen-2, Runways AI som genererer korte videoklipp fra tekst. Dommen? Det er en lang vei å gå før teknologien kommer i nærheten av å generere opptak av filmkvalitet.
    Mer penger til enterprise AI: Som et tegn på at det er nok av penger å gå rundt for generative AI-startups, kunngjorde Cohere, som utvikler et AI-modelløkosystem for bedriften, forrige uke at de samlet inn 270 millioner dollar som en del av serie C-runden.
    Ingen GPT-5 for deg: OpenAI trener fortsatt ikke GPT-5, sa OpenAI-sjef Sam Altman på en nylig konferanse arrangert av Economic Times – måneder etter at den Microsoft-støttede oppstarten lovet å ikke jobbe med etterfølgeren til GPT-4 “på en stund” etter mange industriledere og akademikere uttrykte bekymring for den raske fremskritt av Altmans store språkmodeller.
    AI-skriveassistent for WordPress: Automattic, selskapet bak WordPress.com og hovedbidragsyteren til WordPress-prosjektet med åpen kildekode, lanserte forrige tirsdag en AI-assistent for det populære innholdsstyringssystemet.
    Instagram får en chatbot: Instagram jobber kanskje med en AI-chatbot, ifølge bilder lekket av appforsker Alessandro Paluzzi. I følge lekkasjene, som gjenspeiler pågående apputviklinger som kanskje ikke sendes, kan disse AI-agentene svare på spørsmål eller gi råd.

Annen maskinlæring

Hvis du er nysgjerrig på hvordan AI kan påvirke vitenskap og forskning i løpet av de neste årene, har et team på tvers av seks nasjonale laboratorier skrevet en rapport, basert på workshops gjennomført i fjor, om akkurat det. Man kan være fristet til å si at, basert på trender fra fjoråret og ikke denne, der ting har gått så fort, kan rapporten allerede være foreldet. Men mens ChatGPT har laget enorme bølger innen teknologi og forbrukerbevissthet, er sannheten at det ikke er spesielt relevant for seriøs forskning. De større trendene er, og de beveger seg i et annet tempo. Den 200 sider lange rapporten er definitivt ikke lettlest, men hver del er nyttig delt inn i fordøyelige biter.

Andre steder i det nasjonale laboratorieøkosystemet jobber Los Alamos-forskere hardt med å fremme feltet med memristorer, som kombinerer datalagring og prosessering – omtrent som våre egne nevroner gjør. Det er en fundamentalt annerledes tilnærming til beregning, men en som ennå ikke har båret frukt utenfor laboratoriet. Denne nye tilnærmingen ser ut til å flytte ballen fremover, i det minste.

AIs anlegg med språkanalyse vises i denne rapporten om politiets interaksjoner med folk de har stoppet. Naturlig språkbehandling ble brukt som en av flere faktorer for å identifisere språklige mønstre som forutsier eskalering av stopp – spesielt med svarte menn. Menneske- og maskinlæringsmetodene forsterker hverandre. (Les avisen her.)

Bildekreditt: Cyrille Verdon / Renaud Defrancesco BUREAU 141 / EPFL

DeepBreath er en modell som er trent på opptak av pust tatt fra pasienter i Sveits og Brasil, som skaperne ved EPFL hevder kan bidra til å identifisere luftveistilstander tidlig. Planen er å sette den ut der i en enhet kalt Pneumoscope, under spinout-selskapet Onescope. Vi kommer nok til å følge opp med dem for mer informasjon om hvordan selskapet gjør det.

Et annet AI-helsefremskritt kommer fra Purdue, hvor forskere har laget programvare som tilnærmer hyperspektrale bilder med et smarttelefonkamera, og sporer blodhemoglobin og andre målinger. Det er en interessant teknikk: ved å bruke telefonens super-slow-mo-modus, får den mye informasjon om hver piksel i bildet, noe som gir en modell nok data til å ekstrapolere fra. Det kan være en fin måte å få denne typen helseinformasjon uten spesiell maskinvare.

Bildekreditt: MIT

Jeg ville ikke stole på en autopilot for å ta unna manøvrer ennå, men MIT rykker teknologien nærmere med forskning som hjelper AI med å unngå hindringer og samtidig opprettholde en ønskelig flyvei. En hvilken som helst gammel algoritme kan foreslå ville retningsendringer for ikke å krasje, men det er vanskeligere å gjøre det mens du opprettholder stabiliteten og ikke trekker noe inni. Teamet klarte å få et simulert jetfly til å utføre noen Top Gun-lignende manøvrer autonomt og uten å miste stabilitet. Det er vanskeligere enn det høres ut.

Sist denne uken er Disney Research, som alltid kan regne med å vise frem noe interessant som også tilfeldigvis gjelder filmskaping eller fornøyelsesparker. På CVPR viste de frem et kraftig og allsidig “ansikts-landmerke-deteksjonsnettverk” som kan spore ansiktsbevegelser kontinuerlig og ved hjelp av mer vilkårlige referansepunkter. Motion capture fungerer allerede uten de små fangstpunktene, men dette burde gjøre det enda høyere kvalitet – og mer verdig for skuespillerne.

Read More