Anthropic, la società dietro il modello Claude, starebbe esplorando la strada del silicio personalizzato. Secondo indiscrezioni, l’azienda ha avviato discussioni con Samsung per sviluppare un chip su misura per l’inference e l’addestramento dei propri large language models (LLM). La notizia – riportata a distanza di circa una settimana dall’annuncio di OpenAI, che ha scelto Broadcom per la realizzazione del suo primo chip custom – segna un’ulteriore tappa nella corsa all’autonomia hardware nel settore dell’intelligenza artificiale.

Per anni il dominio di NVIDIA con le sue GPU è stato pressoché incontrastato. Ma i costi stratosferici, le catene di fornitura sotto pressione e la necessità di ottimizzare le architetture per specifici carichi di lavoro stanno spingendo i principali attori a cercare alternative. Google con i suoi TPU, Amazon con Trainium, Microsoft con Maia: ognuno sta investendo in silicio progettato internamente, convinto che l’efficienza passi anche dal controllo dell’hardware. Anthropic, oggi sostenuta da investimenti miliardari, non fa eccezione.

Un chip custom permetterebbe di calibrare ogni aspetto dell’architettura – dal numero di core alla banda di memoria, fino alla precisione dei calcoli – sulle esigenze dei modelli Claude. Significa poter ridurre la latenza dell’inference, aumentare il throughput e, potenzialmente, tagliare i consumi energetici. Ma l’aspetto forse più rilevante per chi guarda al deployment on-premise è il controllo: un acceleratore proprietario può essere integrato in server che risiedono fisicamente nei datacenter dell’organizzazione, senza vincoli di licenza o dipendenze da provider cloud. In scenari dove la sovranità dei dati e la conformità normativa (si pensi al GDPR) sono prioritarie, contare su hardware indipendente diventa un fattore competitivo.

Non è ancora chiaro se la collaborazione con Samsung mirerà a un chip per l’addestramento, per l’inference o per entrambi. Né sono trapelati dettagli su nodo produttivo, architettura o tempi di realizzazione. Tuttavia, la scelta di un partner come Samsung – che ha già esperienza nella produzione di chip per l’AI e una fonderia avanzata – indica un percorso differente rispetto a quello di OpenAI, che con Broadcom punta su un design di rete neurale specializzato senza entrare in prima persona nella manifattura.

Per le aziende che valutano stack locali, questa tendenza alla frammentazione dell’offerta hardware rappresenta un’opportunità ma anche una complessità. Da un lato, chip ottimizzati per modelli specifici potrebbero rendere economicamente sostenibili deployment on-premise che oggi richiedono investimenti proibitivi. Dall’altro, la proliferazione di piattaforme proprietarie rischia di complicare la standardizzazione e la portabilità del software. Chi progetta infrastrutture LLM dovrà familiarizzare con un ecosistema sempre più variegato, dove la compatibilità tra framework, librerie e acceleratori non è scontata.

AI-RADAR segue da vicino queste evoluzioni, consapevole che la partita dell’AI passa anche dalla capacità di scegliere l’hardware giusto per ogni contesto operativo.