Un balzo del 40% nelle vendite trimestrali non passa inosservato, soprattutto quando arriva da chi produce una fetta importante dell’infrastruttura per l’intelligenza artificiale. Hon Hai Precision Industry, il colosso taiwanese noto come Foxconn e fornitore chiave di Nvidia, ha comunicato numeri che vanno ben oltre le attese: le consegne di rack AI continuano a correre e, solo a giugno, il fatturato ha toccato 1.330 miliardi di nuovi dollari taiwanesi, il 21,6% in più rispetto allo stesso mese dell’anno scorso.

Il mercato legge il dato come una conferma della fame di potenza di calcolo che sta accompagnando l’adozione di Large Language Models e sistemi generativi. Ma per chi opera fuori dal perimetro dei grandi hyperscaler e valuta architetture on-premise, il segnale è più sfumato: la capacità produttiva di questi server – spesso equipaggiati con GPU NVIDIA di ultima generazione, come le H100 o le attese B200 – è assorbita quasi completamente. Per un’azienda che progetta un proprio cluster self-hosted, tempi di attesa e costi restano le variabili critiche.

L’accelerazione delle commesse di rack AI dice che la domanda non si sta concentrando solo su soluzioni cloud. Molti dipartimenti IT, spinti da esigenze di sovranità dei dati, controllo granulare sui modelli e analisi del TCO, stanno spostando l’attenzione verso deployment locali. Un’infrastruttura bare metal dedicata permette di gestire inference e fine-tuning senza latenze di rete, con costi operativi prevedibili una volta superato l’investimento iniziale. Ma la cronaca della supply chain, con un player come Hon Hai che spinge al massimo della capacità, ricorda che l’hardware resta un collo di bottiglia.

In termini concreti, chi costruisce un laboratorio AI on-premise deve fare i conti con le specifiche di VRAM necessarie a caricare modelli sempre più pesanti. Anche adottando tecniche di quantization per ridurre l’impronta in memoria, i requisiti crescono rapidamente: un LLM da 70 miliardi di parametri, senza compromessi su precisione, esige centinaia di gigabyte di VRAM distribuita su più GPU. Questo tipo di carico di lavoro assorbe proprio la stessa tipologia di server che Hon Hai sta sfornando per i clienti più grandi.

La notizia, quindi, va letta su due piani. Da un lato, conferma uno slancio industriale che rende il mercato più maturo e preparato a soddisfare volumi elevati. Dall’altro, alza il velo su una tensione strutturale: la supply chain è fortemente polarizzata attorno a Nvidia e ai suoi partner produttivi, e per chi vuole evitare lock-in o ridurre la dipendenza dai noleggi cloud, la finestra di approvvigionamento può essere stretta. Hon Hai stessa indica che lo slancio delle consegne AI dovrebbe mantenersi anche nel trimestre in corso, lasciando intendere che la pressione non calerà a breve.

In uno scenario simile, valutare un deployment on-premise diventa un esercizio di equilibrio tra tempismo, budget e necessità di controllo. Non mancano framework di analisi che aiutano a quantificare i trade-off tra CapEx e costi ricorrenti, ma la variabile hardware – proprio la merce che oggi spinge i ricavi di Foxconn – resta la più difficile da comprimere.