Fractile raccoglie 220 milioni di dollari per la produzione di chip di inference in-memory

Fractile ottiene 220 milioni di dollari per i chip di inference in-memory

Fractile, la startup londinese specializzata nella progettazione di chip di inference, ha annunciato di aver chiuso un round di finanziamento da 220 milioni di dollari. L'operazione è stata guidata da Accel, con la partecipazione di Pat Gelsinger in qualità di angel investor. Questo significativo investimento è destinato a supportare l'azienda nel portare i suoi innovativi hardware alla fase di produzione, un passo cruciale per la commercializzazione delle sue soluzioni.

L'interesse del mercato per le tecnicie di Fractile è palpabile, come dimostrato dalle prime discussioni riportate con Anthropic, un attore di spicco nel panorama degli LLM. Questo potenziale rapporto cliente-fornitore sottolinea la crescente domanda di hardware specializzato in grado di gestire i carichi di lavoro intensivi dell'intelligenza artificiale, in particolare per l'inference.

L'innovazione dei chip con calcolo e memoria integrati

Il cuore della proposta tecnicica di Fractile risiede nei suoi chip di inference che adottano un approccio di in-memory compute, integrando le capacità di calcolo e la memoria sullo stesso die. Questa architettura è progettata per affrontare una delle principali sfide nell'esecuzione degli LLM: il cosiddetto "memory wall" o "bottleneck della memoria". Tradizionalmente, la separazione tra unità di elaborazione (GPU o CPU) e memoria esterna (VRAM o RAM) può causare ritardi significativi nel trasferimento dei dati, limitando le performance e aumentando la latenza, specialmente con modelli di grandi dimensioni.

L'integrazione di calcolo e memoria direttamente sul silicio mira a ridurre drasticamente la distanza che i dati devono percorrere, accelerando l'accesso e l'elaborazione. Questo può tradursi in un throughput superiore e una latenza inferiore per le operazioni di inference, rendendo i chip di Fractile particolarmente attraenti per scenari che richiedono risposte rapide e un'elevata efficienza energetica. Tali soluzioni sono fondamentali per chi valuta deployment on-premise o edge, dove il controllo sulle performance e il TCO sono prioritari.

Implicazioni per i deployment on-premise e la sovranità dei dati

Lo sviluppo di chip di inference specializzati come quelli di Fractile ha profonde implicazioni per le aziende che considerano architetture self-hosted per i loro carichi di lavoro AI. La possibilità di disporre di hardware ottimizzato per l'inference direttamente nei propri data center offre vantaggi significativi in termini di controllo, sicurezza e sovranità dei dati. In ambienti air-gapped o con stringenti requisiti di compliance (come il GDPR), l'hardware dedicato consente di mantenere i dati sensibili all'interno dei confini aziendali, senza dipendere da servizi cloud esterni.

Inoltre, l'ottimizzazione delle performance a livello di silicio può contribuire a un migliore TCO nel lungo periodo. Sebbene l'investimento iniziale in hardware bare metal possa essere più elevato rispetto a un modello OpEx basato sul cloud, la riduzione dei costi operativi legati all'energia e alla banda, unita a un controllo più granulare sulle risorse, può generare risparmi considerevoli. Per chi valuta i trade-off tra deployment on-premise e cloud, AI-RADAR offre framework analitici su /llm-onpremise per confrontare i costi e i benefici delle diverse strategie.

Il futuro dell'inference AI e la competizione hardware

Il finanziamento di Fractile si inserisce in un contesto di crescente competizione nel settore dell'hardware per l'intelligenza artificiale. Mentre i giganti del settore continuano a dominare con GPU general-purpose, emerge una chiara tendenza verso soluzioni più specializzate, ottimizzate per specifici carichi di lavoro come l'inference degli LLM. L'approccio in-memory compute di Fractile rappresenta una delle diverse architetture innovative che cercano di superare i limiti delle soluzioni esistenti.

Il successo di queste nuove architetture dipenderà dalla loro capacità di offrire un equilibrio convincente tra performance, efficienza energetica e costi, oltre alla facilità di integrazione nelle pipeline di sviluppo e deployment esistenti. La messa in produzione dei chip di Fractile segnerà un momento importante per valutare l'impatto reale di questa tecnicia sul mercato e la sua adozione da parte di aziende che cercano alternative performanti e controllabili per le loro esigenze di AI.

Fractile raccoglie 220 milioni di dollari per la produzione di chip di inference in-memory

Fractile ottiene 220 milioni di dollari per i chip di inference in-memory

L'innovazione dei chip con calcolo e memoria integrati

Implicazioni per i deployment on-premise e la sovranità dei dati

Il futuro dell'inference AI e la competizione hardware

💻 Hai bisogno di infrastruttura GPU cloud?

💬 Commenti (0)

🔍 Continua a esplorare

Approfondisci su LLM On-Premise

UK punta sull'AI: chipmaker Fractile investe 100 milioni di sterline

Nexperia ottiene prestito da 60 milioni per aumentare la produzione di chip

Inferact raccoglie 150 milioni di dollari per commercializzare vLLM

👥 Unisciti a 160+ appassionati di AI