Microsoft lanserer vektorsøk i forhåndsvisning, stemmekloning generelt tilgjengelig

På sin årlige Inspire-konferanse kunngjorde Microsoft en rekke nye AI-funksjoner på vei til Azure, kanskje den mest bemerkelsesverdige av disse er Vector Search. Vector Search er tilgjengelig i forhåndsvisning gjennom Azure Cognitive Search, og bruker maskinlæring for å fange opp betydningen og konteksten til ustrukturerte data, inkludert bilder og tekst, for å gjøre søket raskere.

Vektorisering, en stadig mer populær teknikk i søk, innebærer å konvertere ord eller bilder til vektorer, eller serier av tall, som koder for betydningen deres – slik at de kan behandles matematisk. Vektorer gjør det mulig for maskiner å strukturere og gi mening med data, slik at de for eksempel kan forstå at ord tett sammen i “vektorrom” – som “konge” og “dronning” – er relatert og dukker dem raskt opp fra en database med millioner av ord.

Selskaper som Qdrant og SeMI Technologies bruker vektorsøk for å drive databasetjenestene sine, det samme gjør teknologigiganter som Amazon og Google.

Microsofts smak av vektorsøk tilbyr “rent” vektorsøk, hybrid gjenfinning og “sofistikert” omrangering. Selskapet bemerker at det kan brukes i apper og tjenester for å generere personlige svar på naturlig språk, levere produktanbefalinger og identifisere datamønstre.

«Vektorsøk er integrert med Azure AI, slik at kunder kan bygge søkeaktiverte, chat-baserte apper, konvertere bilder til vektorrepresentasjoner ved hjelp av Azure AI Vision [and] hente relevant informasjon fra store datasett for å hjelpe med å automatisere prosesser og arbeidsflyter», skriver selskapet i et blogginnlegg. “Integrasjonen av Vector Search strekker seg sømløst til andre funksjoner i Azure Cognitive Search, inkludert fasettert navigasjon, filtre og mer.”

Andre steder i Azure lanserer Microsoft det de kaller Document Generative AI-løsningen, som integrerer Microsofts eksisterende AI-drevne dokumentbehandlingstjenester, inkludert Azure Form Recognizer, med Azure OpenAI Service. (Husk at Azure OpenAI Service er Microsofts fullt administrerte, bedriftsfokuserte tilbud designet for å gi bedrifter tilgang til AI-teknologi fra OpenAI – som Microsoft har et nært kommersielt partnerskap med – med ekstra kontroller og styringsfunksjoner.)

Den Document Generative AI-løsningen – som utnytter OpenAIs nyeste AI-språkmodeller – inntar filer for oppgaver som rapportoppsummering, verdiutvinning, kunnskapsutvinning og generering av nye typer dokumenter. Det lar i hovedsak et selskap bygge en app som OpenAIs ChatGPT som kan lese dokumenter og bruke disse dokumentene som grunnlag for sine svar.

For eksempel, ved å bruke Document Generative AI, kan en kunde laste opp fakturaer, regninger og kontrakter for å la ansatte stille spørsmål om servicegarantier og spesifikke ordrelinjer. Document Generative AI-løsningen svarer på spørsmål i tekst så vel som bilder og tabeller, og gir sitater med en lenke til kildeinnholdet.

Microsoft forklarer:

“[Using the Document Generative AI solution, you can] samhandle med dokumenter ved hjelp av naturlig språk og generere nytt innhold fra eksisterende dokumenter, inkludert blogginnlegg, nyhetsbrev, sammendrag og bildetekster … Enten du trenger intelligente dokumentchat-funksjoner, skrivehjelp, spørringsstøtte, omfattende søkefunksjonalitet eller til og med dokumentoversettelse, Document Generative AI kan håndtere komplekse og mangfoldige dokumentoppgaver gjennom modeller fra OpenAI.”

I en relatert kunngjøring avslørte Microsoft at OpenAIs Whisper-modell, en automatisk talegjenkjenningsmodell, snart vil komme til Azure OpenAI-tjenesten så vel som Microsofts familie av AI-taletjenester. Enterprise-kunder vil kunne bruke Whisper til å transkribere og oversette lydinnhold samt produsere batch-transkripsjoner «i skala», sier Microsoft.

Som avrunding av AI-avdukingene på Inspire kunngjorde Microsoft den offentlige forhåndsvisningen av Real-time Diarization, en AI-drevet taletjeneste som kan identifisere hvem av flere personer som snakker i sanntid. Selskapet kunngjorde også den bredere tilgjengeligheten av Custom Neural Voice, som trykker på AI for å reprodusere en skuespillers stemme eller lage en original syntetisk stemme.

Tidligere var Custom Neural Voice i mer begrenset tilgang. Kunder må fortsatt søke og bli godkjent av Microsoft for å bruke den.

For at folk ikke skal være bekymret for deepfakes-potensialet, sier Microsoft at Custom Neural Voice inkluderer kontroller for å forhindre misbruk av tjenesten. Når en kunde sender inn et opptak, må stemmeskuespilleren – hvis en blir brukt – komme med en uttalelse som erkjenner at de forstår teknologien og er klar over at kunden får en stemme. Opptaket sammenlignes deretter via høyttalerverifisering for å sikre at stemmene stemmer før kunden kan begynne å lage en stemme.

Microsoft krever også kontraktsmessig at kundene får samtykke fra taletalenter, og kundene må godta en oppførselskodeks før de kan begynne å bruke Custom Neural Voice. I tillegg tilbyr Microsoft vannmerke- og deteksjonsverktøy som har som mål å gjøre det lettere å identifisere om et gitt lydklipp ble laget med Custom Neural Voice.

Disse kontrollene, forutsatt at de fungerer som annonsert, vil ikke nødvendigvis løse lisens- og samtykkekontroversene rundt stemmekloningsteknologi. Men Microsoft har tydeligvis bestemt seg for at det ikke er deres kamp å kjempe.

Read More