Hammerspace bruker 56 millioner dollar for en ny tilnærming til å jobbe med enorme mengder ustrukturerte data

Data kan være “den nye oljen”, men bare når den kan utvinnes og tas i bruk. I dag annonserer en fem år gammel startup kalt Hammerspace, som gir alle slags data som gir liv, 56 millioner dollar i finansiering – sin første institusjonelle investering – mens den utvider virksomheten.

Prosperity7 Ventures – venture-armen til Saudi Aramco – leder denne første eksterne runden, med ARK Invest, Pier 88 Hedge Fund og andre ikke navngitte investorer som også deltar.

Hammerspace ble opprinnelig finansiert, medstiftet og ledet av David Flynn, pionerteknologen kjent for sitt tidlige arbeid med Linux, superdatamaskiner og flash-databehandling. Og selv om det kanskje ikke er et kjent navn, jobber det allerede med en rekke veldig store selskaper og organisasjoner som du kjenner, som har gigantiske databehov.

Kundene deres inkluderer Jeff Bezos’ Blue Origin, National Science Foundation og Royal Caribbean Group. Store mediegrupper bruker det også til å administrere dataene sine rundt utvikling av spesialeffekter (det har blitt brukt til effekter i Star Wars og Stranger Things, blant andre store produksjoner).

Og minst én «superskalerer», med Flynns ord, som han nektet å navngi, bruker Hammerspace til å administrere mengder av ustrukturerte data som den for tiden bruker i bygging og opplæring av store språkmodeller på tvers av titusenvis av GPUer. (Merk: Jeg har en sterk anelse om hvem dette er basert på hans svar på et navn jeg ga ham, og de andre partnerne Hammerspace jobber med.)

“Hvis du skal betale store penger for GPU-hestekrefter, er det siste du vil ha at siden skal stå inaktiv og vente på at data skal strømme inn og strømme ut av disse systemene,” sa Flynn. “Vi gir radikale input for å mate data inn og ut av disse treningssystemene. Det er en datapipeline som mates inn og ut av disse modellene i høy hastighet og med bekvemmeligheten til et ekte filsystem.»

Hammerspace er oppkalt etter konseptet først laget fra tegneserier og tegneserier der karakterer trekker gjenstander de trenger ut av løse luften, og uten å bli for teknisk, kan det også være den beste måten å forklare hva oppstarten gjør. I hovedsak gir det en måte å gjøre store mengder data – uavhengig av hvor de bor eller hvordan de blir brukt – tilgjengelige og tilgjengelige for en organisasjon akkurat når de trenger det, og holde dem ute av veien når de ikke gjør det.

Flynn avviste først å beskrive oppstarten som i området dataorkestrering, eller filhåndtering, eller en pipeline, eller databehandling – han er veldig personlig og tilgjengelig, men også rask til å være teknisk og dermed veldig nøyaktig i språket sitt – men ærlig talt dekker det alle disse til en viss grad.

Bedrifter som trenger å bruke enorme mengder data i et prosjekt som å bygge en ny AI, vil vanligvis oppleve det som en utfordring å få tilgang til og administrere dataene de trenger, ikke bare på grunn av det store volumet, men fordi det er ustrukturert, og også bor i mange forskjellige steder, på tvers av skyer, lokale servere og mer — hybridarkitekturer for svært rotete mengder informasjon.

Selv om selskaper som Snowflake har gjort en ryddig forretning med å administrere strukturerte data i slike arkitekturer for forretningsintelligens formål, gjelder ikke det samme i de ustrukturerte datasettene som Hammerspace spesialiserer seg på, og for den typen applikasjoner som denne typen data brukes for, som kan inkludere business intelligence, men kan også være for AI-behandling.

Hammerspaces teknologigjennombrudd for å takle dette er delvis takket være Flynns erkjennelser tidlig, da han jobbet med flash-lagring på Fusion.io, om hvordan dette ville utgjøre et problem for bedrifter. Og delvis er det takket være det grunnleggende arbeidet til hans medgründer og CTO, Trond Myklebust, selv litt av en legende i dataverdenen, med sin merittliste inkludert å være vedlikeholder og hovedutvikler av Linux-kjerne NFS-klienten . “Filsystemet” som Hammerspace har bygget for å administrere, flytte og orkestrere data er basert på en spesiell implementering i Linux; og hva det gjør, sa Flynn, “er unikt i bransjen.”

Tanken er at ustrukturert potensielt er der forretningsmuligheten ligger for disse applikasjonene og mer. Hammerspace siterer data fra IDC som anslår at mer enn 90 % av forretningsinformasjonen “sannsynligvis vil være dannet av ustrukturerte data innen 2025.” Og det er delvis derfor investorer er interessert.

“Informasjonen i vår verden blir stadig mer desentralisert, og bedrifter trenger nå mer enn noen gang å få tilgang til og flytte ustrukturerte data ut av siloer og på tvers av plattformer, noe som gjør disse dataene mer nyttige og verdifulle,” sa Cathie Wood, administrerende direktør i ARK Invest. i en uttalelse. «Vårt oppdrag er å utnytte teknologisk konvergens på tvers av markeder og bransjer, og dermed endre måten verden fungerer på. Hammerspace er på linje med dette oppdraget, og låser opp nye innovasjoner på tvers av bedriften.»

Read More