Kakao forbedrer spillet sitt i generativ AI med Karlo 2.0, en AI-bildegenerator
Den sørkoreanske teknologigiganten Kakao vil ha en del av handlingen i det generative AI-kappløpet, og i dag la den inn et bud på det, med store oppdateringer til sin AI-bildegenerator Karlo og den store KoGPT-modellen, samt et nytt fond å støtte AI-bildegenererende oppstarter.
Kakaos AI-divisjon Kakao Brains lansering av Karlo 2.0 – et AI-drevet verktøy som kan produsere bilder fra tekstmeldinger – gjør det mulig for brukere å generere et bilde på bare noen sekunder ved å skrive inn meldinger på engelsk eller koreansk.
KoGPT 2.0, i mellomtiden, kommer ikke til å bli utgitt før Q3 2023, men den vil bli trent på 30 milliarder forskjellige parametere.
Kakao Brain har også satt opp Karlo 100X, et fond på 10 milliarder vunnet ($7,7 millioner), for å støtte AI-startups som utvikler bildegenereringsteknologi.
Kakaos utgivelser understreker presset som selskapet, i likhet med alle eksisterende teknologispillere, har vært utsatt for for å holde tritt med tempoet i AI-fremgangen: nykommere som OpenAI, Midjourney og flere har gjort en stor sprut og kontrollert fortellingen om de største innovasjonene av øyeblikket. For eldre selskaper er trusselen alltid ikke bare at de ikke vil utnytte det som kommer neste gang, men de vil begynne å se gamle og foreldede ut.
Tellingly Karlo 2.0 kommer bare syv måneder etter selskapets forrige oppdatering (1.4). Kakao Brain har tidligere gitt ut en avansert tekst-til-bilde-generator RQ-Transformer og minDALL-E på GitHub.
Selskapet sier at Karlo 2.0 er trent på 300 millioner tekster og bilder og støtter en maksimal oppløsning på 2048×2048, noe som resulterer i bedre kvalitet og klarhet på bilder i ulike stiler og størrelser. Dette er et stort fremskritt i forhold til tidligere utgaver av Karlo: Den forrige versjonen ble trent på 180 millioner tekst- og bildedatapunkter.
Karlo 2.0 vil også være mer utviklervennlig, med et offentlig tilgjengelig API for Kakao-utviklere som gir dem tilgang til å lage 600 000 bilder per måned gratis.
Dens forgjenger, også kalt KoGPT, ble opprinnelig rullet ut i 2021 og trent på 200 milliarder tokens på bare 6 milliarder parametere, ved hjelp av koreanske data. Planen er nå å legge til engelsk, japansk og andre asiatiske språk, inkludert Bahasa Malaysia og vietnamesisk. Kakao Brain skal lansere KoGPT 2.0 med 30 milliarder parametere, rettet mot tredje kvartal 2023.
Bildekreditt: Kakao hjerne
Kakaos trekk er interessante, men de kommer ikke i et vakuum og vil møte mye etablert konkurranse. Bildegeneratorer er allerede tilgjengelig fra OpenAI (i form av DALL-E), Midjourney og Stable Diffusion’s Dream Studio. Bare forrige uke avduket den kinesiske teknologigiganten Alibaba en generativ AI-drevet tekst-til-bilde-modell Tongyi Wanxiang for bedriftskunder.
Som med selskapets regionalt ledende meldingsapp KakaoTalk, ser åpningen for et selskap som Kakao ut til å være en ledende aktør innen AI-bilder i markedet, i stedet for å sikte på verdensherredømme. Tidligere i år sa Eun-Taek Hong, administrerende direktør i Kakao, i sin inntektsmelding at det koreanske teknologiselskapet ville tilby generative AI-tjenester. Men i stedet for å konkurrere mot globale kolleger på feltet, ville Kakao utvikle AI-tilbud med fokus på det koreanske språket (for nå), sa Hong.
Det vil også være interessant å se hvordan og om Kakao bygger dette ut i takt med sine andre ambisjoner innen AI. For eksempel gjør det et inntog i helsevesenet. Selskapet utvikler et AI-generativt tilbud for å analysere et medisinsk bilde og skrive et førsteutkast til diagnose av en pasients røntgen av thorax for leger. Det utvikler også AI-teknologi for oppdagelse av legemidler.
“Vi er glade for å introdusere Karlo 2.0 gjennom en prosess med å lære forskjellige bildedata og teknologiske fremskritt, inkludert menneskelige proporsjoner og komposisjon, og perspektivvisninger som uttrykker en følelse av rom og tredimensjonalitet,” sa administrerende direktør i Kakao Brain Kim Ildoo i en uttalelse. “Vi vil bruke et vell av data og tilbakemeldinger fra brukere for å lage fotorealistiske bilder, samtidig som vi utvikler en bildegenereringsmodell som kan imøtekomme et bredere spekter av brukerbehov.”
Selv regionalt er det stor konkurranse for Kakao, med andre sørkoreanske selskaper som aggressivt utvikler sine egne AI-produkter for å kjempe om en posisjon i det generative AI-området.
Naver skal lansere en generativ AI-tjeneste kalt HyperCLOVA X og en AI-chatbot SearchGPT neste måned.
I desember 2021 avduket LG AI Research, en AI-tenketankenhet fra det koreanske teknologiselskapet LG, sin AI-drevne store språkmodell kalt Exaone med kapasiteter på 300 milliarder parametere. De fleste av LGs datterselskaper, inkludert LG Electronics, LG Energy Solution, LG U+ og LG Display, bruker Exaone. LG Electronics ga ut sin egen AI Chatbot i mai i kjølvannet av å blokkere bruken av generative AI-verktøy som ChatGPT, Google Bard og Microsofts Bing AI.
Og Samsung utvikler angivelig et privat generativt AI-verktøy for intern bruk bare etter å ha begrenset generative AI-verktøy etter sensitive datalekkasjer.
SK Telecom, et av Sør-Koreas største teleselskaper, la også Chat GPT-teknologi basert på Microsofts Azure OpenAI til sin AI-chatbot kalt A. [A dot]. To av Koreas største teleselskaper, KT og LGs U+, utvikler AI chatbots basert på ChatGPT-teknologi, per lokale medier.
Denne historien har blitt oppdatert for å gjenspeile at KoGPT 2.0 ikke vil være basert på OpenAIs GPT-3.5.