Sabato Micron Technology ha dato il primo colpo di benna su un’espansione da 1.500 miliardi di yen – circa 9,3 miliardi di dollari – del suo stabilimento di Hiroshima, nel Giappone occidentale. L’impianto sarà dedicato alla produzione di High-Bandwidth Memory, la DRAM impilata che oggi alimenta gli acceleratori su cui girano i modelli di linguaggio più esigenti.

L’operazione arriva mentre il mercato dei chip per AI spinge la capitalizzazione di Micron oltre i mille miliardi di dollari, segno che la partita si gioca sempre più a valle della pura potenza di calcolo. L’HBM non è una commodity qualunque: impacchetta più strati di memoria collegati da un bus larghissimo, riducendo la distanza tra i dati e le unità di calcolo. Questo si traduce in bandwidth verticali che superano il terabyte al secondo per stack – un fattore determinante per ridurre la latenza nell’inference e per tenere occupati i core durante il training di LLM con contesti lunghi.

Per chi gestisce carichi AI on-premise, la notizia ha un peso concreto. La disponibilità di HBM condiziona la produzione di GPU e acceleratori: ogni collo di bottiglia a monte si riverbera sui tempi di consegna e sul costo finale delle macchine. Le organizzazioni che valutano un parco hardware self-hosted sanno che i listini non dipendono solo dall’architettura del silicio, ma anche dalla capacità produttiva delle fonderie di memoria. Un’espansione da 9 miliardi non è una scommessa timida: segnala che la domanda di HBM crescerà ancora, sostenuta da workload sempre più affamati di banda e da finestre di contesto che nei nuovi modelli si allungano fino a centinaia di migliaia di token.

Dal punto di vista architetturale, la scelta di Micron rafforza un ecosistema in cui la vicinanza fisica tra memoria e processore diventa il vero discriminante. I progressi nella tecnicia di packaging – interposer in silicio, stacking 3D – permettono di impilare fino a 12 strati di DRAM, contenendo i consumi e il footprint termico. Per i deployment on-premise, questo significa poter far girare modelli più grandi senza espandere a dismisura il numero di server, ma anche dover fare i conti con un mercato concentrato: pochi player, tra cui Micron, SK hynix e Samsung, controllano l’offerta di HBM. Il rischio di shortage non è teorico, e i tempi di attesa possono trasformare una decisione di deployment in un esercizio di timing finanziario.

L’impianto di Hiroshima entrerà in produzione gradualmente, e quando sarà a regime contribuirà a riequilibrare un mercato che oggi vede la domanda correre più veloce dell’offerta. Nel frattempo, i responsabili delle infrastrutture AI stanno già modellando scenari di TCO che includono variabili come la durata dei contratti di fornitura e l’eventuale necessità di prenotare lotti di memoria con mesi di anticipo. La sabbia giapponese su cui Micron ha appena posato la prima pietra è diventata, nel giro di un sabato, una tessera fondamentale della geopolitica dei chip e della partita che si gioca nei data center di chi ha scelto di tenersi i dati in casa.