Dust bruker store språkmodeller på interne data for å forbedre teamets produktivitet
Dust er en ny AI-oppstart basert i Frankrike som jobber med å forbedre teamets produktivitet ved å bryte ned interne siloer, frembringe viktig kunnskap og tilby verktøy for å bygge tilpassede interne apper. I kjernen bruker Dust store språkmodeller (LLM) på interne bedriftsdata for å gi nye superkrefter til teammedlemmer.
Selskapet ble stiftet av Gabriel Hubert og Stanislas Polu, som har kjent hverandre i mer enn et tiår. Deres første oppstart het Totems og ble kjøpt opp av Stripe i 2015. Etter det brukte de begge noen år på å jobbe for Stripe før de skilte lag.
Stanislas Polu begynte i OpenAI, hvor han brukte tre år på å jobbe med LLMs resonneringsevner mens Gabriel Hubert ble produktsjef hos Alan.
De slo seg sammen igjen for å lage Dust. I motsetning til mange AI-startups, er ikke Dust fokusert på å lage nye store språkmodeller. I stedet ønsker selskapet å bygge applikasjoner på toppen av LLM-er utviklet av OpenAI, Cohere, AI21, etc.
Teamet jobbet først på en plattform som kan brukes til å designe og distribuere store språkmodellapper. Den har deretter fokusert innsatsen på ett brukstilfelle spesielt – sentralisering og indeksering av interne data slik at de kan brukes av LLM-er.
Fra en intern ChatGPT til neste generasjons programvare
Det er en håndfull kontakter som stadig henter interne data fra Notion, Slack, GitHub og Google Drive. Disse dataene blir deretter indeksert og kan brukes til semantiske søk. Når en bruker ønsker å gjøre noe med en Dust-drevet app, vil Dust finne de relevante interne dataene, bruke dem som konteksten for en LLM og returnere et svar.
La oss for eksempel si at du nettopp ble med i et selskap og du jobber med et prosjekt som ble startet for en stund tilbake. Hvis bedriften din fremmer kommunikasjonstransparens, vil du finne informasjon i eksisterende interne data. Men den interne kunnskapsbasen er kanskje ikke oppdatert. Eller det kan være vanskelig å finne årsaken til at noe gjøres på denne måten, ettersom det har blitt diskutert i en arkivert Slack-kanal.
Støv er ikke bare et bedre internt søkeverktøy, siden det ikke bare returnerer søkeresultater. Den kan finne informasjon på tvers av flere datakilder og formatere svar på en måte som er mye mer nyttig for deg. Den kan brukes som en slags intern ChatGPT, men den kan også brukes som grunnlag for nye interne verktøy.
“Vi er overbevist om at naturlig språkgrensesnitt kommer til å forstyrre programvare,” fortalte Gabriel Hubert meg. «Om fem år vil det være skuffende om du fortsatt må gå og klikke på rediger, innstillinger, preferanser for å bestemme at programvaren din skal oppføre seg annerledes. Vi ser at mye mer av programvaren vår tilpasser seg dine individuelle behov, fordi det er slik du er, men også fordi det er slik teamet ditt er – fordi det er slik bedriften din er.»
Selskapet jobber med designpartnere på flere måter å implementere og pakke Dust-plattformen på. “Vi tror det er mange forskjellige produkter som kan lages innen dette området av bedriftsdata, kunnskapsarbeidere og modeller som kan brukes til å støtte dem,” sa Polu til meg.
Det er fortsatt tidlig for Dust, men oppstarten utforsker et interessant problem. Det er mange utfordringer fremover når det gjelder datalagring, hallusinasjoner og alle problemene som følger med LLM-er. Kanskje hallusinasjoner vil bli mindre av et problem ettersom LLM-er utvikler seg. Kanskje Dust vil ende opp med å lage sin egen LLM av hensyn til personvern.
Dust har samlet inn 5,5 millioner dollar (5 millioner euro) i en seed-runde ledet av Sequoia med XYZ, GG1, Seedcamp, Connect, Motier Ventures, Tiny Supercomputer og AI Grant. Flere forretningsengler deltok også, som Olivier Pomel fra Datadog, Julien Codorniou, Julien Chaumond fra Hugging Face, Mathilde Collin fra Front, Charles Gorintin og Jean-Charles Samuelian-Werve fra Alan, Eléonore Crespo og Romain Niccoli fra Pigment, Nicolas Brusson fra BlaBlaCar, Howie Liu fra Airtable, Matthieu Rouif fra PhotoRoom, Igor Babuschkin og Irwan Bello.
Hvis du tar et skritt tilbake, satser Dust på at LLM-er i stor grad vil endre hvordan selskaper fungerer. Et produkt som Dust fungerer enda bedre i et selskap som fremmer radikal åpenhet i stedet for informasjonsoppbevaring, skriftlig kommunikasjon i stedet for endeløse møter, autonomi i stedet for toppstyrt ledelse.
Hvis LLM-er holder det de lover og forbedrer produktiviteten betraktelig, vil noen selskaper få en urettferdig fordel ved å ta i bruk disse verdiene, da Dust vil frigjøre mye uutnyttet potensial for kunnskapsarbeidere.