Phison, colosso taiwanese nella produzione di controller per memorie NAND flash, ha lanciato un allarme che rischia di raffreddare gli entusiasmi di chi pianifica deployment on-premise: la carenza di chip NAND non ha fine all’orizzonte. Gli ordini sono già prenotati fino al secondo trimestre del 2027, prolungando una situazione di fornitura stretta che molti speravano si risolvesse entro il 2025.

La notizia arriva da DIGITIMES, testata che segue da vicino la catena di approvvigionamento asiatica, e si inserisce in un contesto di domanda crescente di storage veloce, trainata dall’espansione dei data center, dall’intelligenza artificiale e dall’edge computing. Per chi progetta architetture on-premise, dove ogni componente viene scelto e acquistato direttamente, l’allungamento dei tempi di consegna è un campanello d’allarme: gli SSD basati su NAND sono ormai una risorsa critica per accelerare i carichi di lavoro di training e inference di modelli linguistici.

NAND e AI: un legame più profondo di quanto sembri

La memoria flash non è solo un magazzino per i dataset: nei sistemi pensati per l’AI on-premise, gli SSD NVMe riducono i colli di bottiglia nell’accesso ai dati durante il fine-tuning e la fase di inference. Con modelli che spesso superano i cento miliardi di parametri, la latenza di lettura e scrittura incide direttamente sul throughput. Inoltre, i database vettoriali e le pipeline di chunking per applicazioni RAG (Retrieval-Augmented Generation) esigono storage a bassa latenza sempre disponibile. Una contrazione dell’offerta si traduce in prezzi più alti e in finestre di approvvigionamento allungate, fattori che possono far lievitare il TCO di una soluzione self-hosted.

Pianificare l’on-premise in tempi di scarsità

Le aziende che stanno valutando di portare l’inference all’interno dei propri data center devono ora confrontarsi con orizzonti temporali imprevisti. Ordinare oggi significa ricevere forse nel 2026, con il rischio di bloccare progetti di espansione. Ciò obbliga i responsabili infrastruttura a ripensare la capacità storage, considerando alternative come l’uso più aggressivo della quantization per ridurre la dimensione dei modelli o l’adozione di formati di compressione che alleggeriscano il carico sugli SSD. Sul fronte hardware, alcuni stanno già valutando un mix di dischi SATA per il cold storage e NVMe per l’hot data, pur sapendo che il divario prestazionale può penalizzare i flussi di lavoro più esigenti.

Oltre il chip: una riflessione sulla supply chain

La dichiarazione di Phison non è un caso isolato: altri produttori di memorie hanno segnalato difficoltà nel tenere il passo con la domanda, specialmente per le generazioni più avanzate (da 176 strati in su). Per il mondo dell’AI on-premise, dove la sovranità dei dati e il controllo diretto dell’hardware restano vantaggi irrinunciabili, l’attuale scenario impone una flessibilità progettuale che va oltre la semplice scelta della GPU. Chi intende espandere la propria capacità dovrà probabilmente prenotare con largo anticipo, oppure considerare approcci ibridi in cui parte dello storage risieda su cloud, bilanciando così la scarsità di componenti senza perdere del tutto il controllo dei dati. Una strada che, nonostante le apparenze, spesso porta a una complessità gestionale tangibile.

L’assenza di margini di trasparenza nella supply chain NAND rende difficile prevedere un allentamento prima del 2027, e ciò segnala una trasformazione strutturale più che un picco congiunturale. Chi costruisce infrastrutture AI farebbe bene a leggerla come l’ennesima riprova che la maturità del ciclo hardware non è ancora alle spalle.