SK Hynix ha annunciato un investimento di 80 trilioni di won (circa 51,46 miliardi di dollari) per costruire una nuova fabbrica di memorie NAND a Cheongju, in Corea del Sud. Il nuovo impianto, denominato M17, dovrebbe entrare in produzione nella prima metà del 2029. L’annuncio è stato dato oggi dal CEO Kwak Noh-jung durante un evento alla presenza del presidente sudcoreano Lee Jae-myung, a sottolineare l’importanza strategica del progetto per l’intero ecosistema tecnicico nazionale.

La cifra colpisce, ma a rendere l’investimento particolarmente interessante per chi lavora sul deployment di modelli AI è la sua collocazione nel più ampio puzzle della memoria per intelligenza artificiale. Fino a oggi i riflettori sono stati puntati quasi esclusivamente sulla memoria a elevata larghezza di banda, come le HBM che alimentano le GPU per il training degli LLM. Tuttavia, la crescita esplosiva dei dataset e la diffusione di architetture RAG, che richiedono accessi rapidi a database vettoriali e file di grandi dimensioni, stanno spostando parte dell’attenzione anche sulla memoria NAND ad alte prestazioni.

Per chi gestisce infrastrutture on-premise, la questione dello storage non è mai solo un dettaglio. Un cluster GPU per il fine-tuning di modelli open source, per esempio, ha bisogno di caricare rapidamente gli asset dalla memoria di massa. Se lo storage non tiene il passo, le GPU più veloci restano in attesa, vanificando parte dell’investimento in calcolo. Inoltre, in contesti dove la sovranità dei dati è un requisito imprescindibile – si pensi a settori come la sanità, la difesa o la finanza – lo storage locale diventa il fondamento stesso della catena di valore, perché i dati non possono transitare su cloud pubblici e devono essere lavorati integralmente on-premise.

L’iniziativa di SK Hynix suggerisce che il mercato prevede una domanda sostenuta di memoria NAND per applicazioni AI su un orizzonte di lungo periodo. Costruire un impianto da oltre 50 miliardi di dollari significa scommettere su un ciclo di crescita che va ben oltre l’attuale boom delle GPU. Con l’avanzare dei modelli multimodali e l’aumento delle dimensioni dei checkpoint – alcuni modelli arrivano già a pesare centinaia di gigabyte – la necessità di storage veloce, denso e affidabile non potrà che crescere. E per i team che valutano il TCO di un’infrastruttura AI on-premise, includere la componente storage nel calcolo fin dall’inizio non è più opzionale, ma obbligatorio.

La timeline del 2029 segnala che l’impatto diretto non sarà immediato, ma la direzione è tracciata: la memoria flash diventerà un asset sempre più critico nella pipeline AI, alla pari di compute e networking. Per i decisori tecnici, il messaggio è chiaro: mentre si selezionano le GPU e si progettano i rack, vale la pena domandarsi se lo storage in uso oggi sarà all’altezza dei carichi di lavoro che arriveranno tra tre o quattro anni.