Il mercato Foundry 2.0 ha messo a segno una crescita del 23% nel primo trimestre del 2026, secondo i dati diffusi da Counterpoint Research. A spingere i ricavi è stata la domanda di chip per l’intelligenza artificiale, un settore che continua a chiedere volumi massicci di silicio avanzato, packaging eterogeneo e memoria ad alta banda. Il dato, pur essendo una fotografia di un trimestre ben preciso, racconta una storia più lunga: l’industria dei semiconduttori sta accelerando gli investimenti per servire l’era dell’AI, con implicazioni concrete per chi sceglie di portare l’inference e il training dei modelli linguistici dentro i propri data center.
Nodi sotto pressione, ma in espansione
Il concetto di Foundry 2.0 va oltre il semplice processo litografico. Include l’integrazione di chiplet, le connessioni ad alta densità e le tecniche di stacking che consentono di mettere insieme GPU, CPU e memoria su un unico substrato. La crescita del 23% indica che le fonderie stanno aumentando la produzione di wafer su nodi come i 3 nm e i 5 nm, e che la capacità per il packaging 3D sta scalando. Tuttavia, la pressione rimane altissima: i lead time per gli acceleratori destinati ai carichi di lavoro AI si misurano ancora in molte settimane, e la concorrenza tra grandi hyperscaler e aziende enterprise si riflette sui prezzi.
L’on-premise nell’epoca della penuria di silicio
Per un’organizzazione che valuta un deployment on-premise di LLM, la disponibilità di hardware è il primo vincolo. Cluster di inference basati su NVIDIA H100 o H200, oppure su soluzioni alternative come gli acceleratori custom, dipendono da una supply chain che oggi è satura. Un mercato foundry in crescita del 23% è un segnale che la capacità produttiva si sta allargando, ma non cancella i colli di bottiglia su componenti critici come le memorie HBM3e e gli interposer. Chi pianifica una infrastruttura locale deve quindi inserire nei propri piani finanziari non solo il costo delle GPU, ma anche un buffer per eventuali ritardi di consegne e per l’aumento del TCO legato alla volatilità dell’offerta.
Costi, supply chain e la leva della programmabilità
La crescita dei ricavi delle fonderie non si traduce automaticamente in un calo dei prezzi per l’utente finale. Al contrario, se la domanda continua a superare l’offerta, i valori di listino possono restare elevati. Tuttavia, un ampliamento della capacità produttiva getta le basi per una graduale stabilizzazione che, sul medio periodo, potrebbe rendere l’on-premise più accessibile anche per realtà di medie dimensioni. In attesa di quel momento, le organizzazioni possono lavorare sulla programmabilità: tecniche di quantization spinta, l’uso di framework come vLLM per ottimizzare la capacità delle GPU, e un’attenta valutazione dei carichi di lavoro tra inference locale e cloud permettono di contenere il capitale immobilizzato in hardware. Su AI-RADAR, l’analisi dei trade-off tra cloud e on-premise aiuta a mappare questi scenari senza suggestioni commerciali, ma con il rigore che un investimento in capitale fisso richiede.
La prospettiva: verso un parco hardware più elastico
L’espansione del mercato Foundry 2.0 segnala che l’industria sta scommettendo su una domanda di AI strutturale, non episodica. Questo è un dato incoraggiante per chi guarda all’on-premise come a una scelta di sovranità e di controllo a lungo termine: se la capacità produttiva diventa più ampia e diversificata, anche le architetture proprietarie potranno essere realizzate con costi più bassi e lead time più brevi. Nel frattempo, chi gestisce data center deve tenere d’occhio non solo le roadmap delle GPU, ma anche i report sulle fonderie, perché il silicio a monte è il primo termometro di ciò che arriverà nei rack.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!