Stemmekloningsplattformen Resemble AI lander 8 millioner dollar

Resemble AI, en plattform som bruker generativ AI for å klone realistisk-klingende stemmer, kunngjorde i dag at den samlet inn $8 millioner i en serie A-runde ledet av Javelin Venture Partners, med deltakelse fra Craft Ventures og Ubiquity Ventures.

Transjen, som bringer oppstartens samlede innsamlede til 12 millioner dollar, vil bli brukt til å videreutvikle Resembles bedriftsprodukter og doble størrelsen på teamet til mer enn 40 personer innen utgangen av året, sier medgründer og administrerende direktør Zohaib Ahmed.

“Resembles teknologi blir brukt av noen av de største medieselskapene i verden for å lage innhold som tidligere var umulig,” sa Ahmed til TechCrunch i et e-postintervju.

Resemble ble grunnlagt i 2019 av Ahmed og Saqib Muhammad etter at de to observerte at stemmer i videospill ikke kunne holde tritt med hyppige versjonsoppdateringer til spillene selv. Ahmed jobbet tidligere i Magic Leap som en ledende programvareingeniør, fersk fra stints hos BlackBerry og Hipmunk.

Resemble startet i det små, og fokuserte mest på spillbruk. Men plattformen vokste til å tilby AI-teknologi som kan “overføre” stemmer til andre språk, generere personlige meldinger fra stemmeaktører og skape sanntids samtaleagenter.

Resemble er bare én aktør i det raskt voksende markedet for generativ stemme-AI. Papercup, Deepdub, ElevenLabs, Respeecher, Acapela og Voice.ai er blant de mer bemerkelsesverdige oppstartsleverandørene som tilbyr AI-verktøy for å klone og generere stemmer, for ikke å nevne Big Tech-bedrifter som AWS, Azure og Google Cloud.

Det er imidlertid kontroversiell teknologi – og ikke uten god grunn.

Motherboard skriver om hvordan stemmeskuespillere i økende grad blir bedt om å signere rettighetene til stemmene sine, slik at klienter kan utnytte AI til å generere syntetiske versjoner som til slutt kan erstatte dem – noen ganger uten kompensasjon.

Bildekreditt: Ligner på AI

Deepfakes er et annet problem.

Ondsinnede aktører bruker kunstig intelligens til å klone folks stemmer, og lurer ofre til å tro at de snakker med en slektning eller kunde. Og det er ikke bare det kriminelle potensialet som setter alarmklokkene i gang. I 2021 kom en dokumentar under ild for å ha ansatt et selskap for å klone Anthony Bourdains stemme posthumt – med samtykke fra Bourdains eiendom. I de mellomliggende årene har stemmedeepfakes tatt over sosiale medier, for det meste med ufarlig effekt – men noen ganger ikke.

Ahmed hevder at Resemble skiller seg ut innen etikkområdet.

“I tillegg til å kreve eksplisitt brukersamtykke for å klone stemmer, håndheves strenge retningslinjer for bruk for å forhindre ondsinnet bruk,” sa han.

For dette formål krever Resemble at brukerne gir et opptak av et “samtykkeklipp” i stemmen de prøver å klone. Hvis stemmen i klippet ikke samsvarer med de andre klippene, blokkerer Resemble brukeren fra å lage AI-stemmen.

I tillegg, for å forhindre misbruk under opptak, tvinger Resemble brukere til å si en rekke spesifikke setninger med sin egen stemme. Hvis de avviker fra manuset, flagger Resemble opptaket som potensielt misbruk.

“Når stemmen er opprettet, eier brukeren alle rettigheter til den stemmen,” sa Ahmed. “Vi bruker ikke disse stemmedataene til å lære opp andre modeller, og vi selger heller ikke taledataene videre til tredjepartsselskaper … For tilpassede løsninger jobber vi med selskaper gjennom en streng prosess for å sikre at stemmen de kloner er brukbar av dem og ha de riktige samtykkene på plass med stemmeskuespillere.»

Resemble har også utviklet et produkt, Resemble Detect, som er designet for å validere ektheten til lyddata ved å bruke en AI-modell som er trent til å skille falske fra ekte lyd. Modellen “ser” i hovedsak forskjellige frekvenser der artefakter som er et resultat av redigering eller manipulering av lyd kan inneholdes, og gir en prediksjon fra 0 % til 100 % sikkerhet for klippets “virkelighet”.

Detect er ment å utfylle Resembles lydvannmerketeknologi, PerTh Watermarker, som bruker en AI-modell for å produsere og sette inn lydtoner som er umerkelige for det menneskelige øret, med identifiserende informasjon. (Det er verdt å merke seg at PerTh Watermarker er litt av en plattformlåst lek – den kan bare merke og oppdage Resembles egen genererte tale, og er ikke kompatibel med andre kommersielle eller åpen kildekode-stemmegenererende AI-verktøy.)

Ahmed ser på disse verktøyene som viktige bidragsytere til Resembles suksess. Plattformen har mer enn en million brukere, sier han, som har generert 35 års lyd i løpet av de siste 12 månedene.

“Med regulering av AI som hovedrollen for offentlige tjenestemenn, gir Resemble innsikt og anbefalinger om ansvarlig bruk av generativ lyd,” sa Ahmed. “Med Resemble er det enklere enn noensinne å lage engasjerende stemmeinnhold av høy kvalitet, noe som gjør det mulig for innholdsskapere å legge til et helt nytt nivå av autentisitet til arbeidet sitt, og vil legge til et nytt nivå av fordypning for publikum.”

Read More