Il gigante dei semiconduttori Qualcomm sta preparando una nuova offensiva nel settore dei data center, ma questa volta con un chiaro target geografico: la Cina. La linea di chip Dragonfly, secondo indiscrezioni, sarà dotata di acceleratori AI intenzionalmente depotenziate per rimanere al di sotto delle soglie di prestazione fissate dai regolamenti statunitensi sull'esportazione di tecnicia avanzata. Una scelta che racconta molto dello stato attuale della guerra fredda tecnicica tra Washington e Pechino, e che avrà conseguenze dirette per le aziende che in Cina gestiscono infrastrutture AI on-premise.

Le regole del gioco: chip più lenti, mercato aperto

Dal 2022, gli Stati Uniti hanno progressivamente inasprito i controlli sull'esportazione di semiconduttori verso la Cina, definendo soglie basate sulla potenza di calcolo e sulla larghezza di banda di interconnessione. Per poter continuare a vendere in quel mercato, i produttori sono costretti a progettare varianti che non superano tali limiti. Non è un'operazione inedita: Nvidia ha già fatto lo stesso con le GPU A800 e H800, versioni a bandwidth ridotta delle ben più potenti A100 e H100. Nel caso dei chip Dragonfly di Qualcomm, è probabile che il depotenziamento riguardi il numero di core attivi o la banda di memoria per l'inference, così da rispettare le restrizioni senza rinunciare del tutto all'architettura di base. L'obiettivo è chiaro: offrire acceleratori che, seppur meno performanti dei modelli "pieni", siano comunque utili per training e inference di LLM di medie dimensioni, mantenendo un accesso al mercato cinese che altrimenti sarebbe precluso.

Cosa significa per chi fa AI in Cina su infrastruttura propria

Per i data center cinesi e le imprese che puntano sul self-hosted, questi chip rappresentano una via di mezzo necessaria. Da un lato, permettono di costruire cluster on-premise per l'addestramento e l'esecuzione di modelli, garantendo la sovranità dei dati e il controllo diretto sull'infrastruttura, aspetto cruciale in ambito regolamentare. Dall'altro, le prestazioni ridotte impongono una riflessione sul TCO: per raggiungere lo stesso throughput di calcolo servono più chip, con conseguente impatto su consumi energetici e costi operativi. Tuttavia, per molte applicazioni come il fine-tuning o l'inference su modelli quantizzati (ad esempio INT8), la differenza di performance potrebbe essere accettabile, soprattutto se confrontata con l'alternativa di non avere accesso a tecnicie avanzate. Inoltre, l'uso di acceleratori locali evita la dipendenza da servizi cloud di provider stranieri, aspetto che le autorità cinesi vedono con favore. Per chi sta valutando deployment on-premise in Cina, la scelta del fornitore hardware introduce quindi un ulteriore trade-off tra prestazioni e conformità normativa.

La frammentazione dell'hardware AI: due mondi paralleli

La mossa di Qualcomm si inserisce in un fenomeno più ampio di biforcazione del mercato globale dei semiconduttori per AI. L'amministrazione americana intende rallentare il progresso tecnicico cinese nel campo dell'intelligenza artificiale, ma la risposta di Pechino è un'accelerazione degli investimenti in chip maker domestici come Biren e Moore Thread. Il risultato è una sorta di "cortina di silicio" che separa due ecosistemi hardware: uno basato sui prodotti NVIDIA, AMD e Intel a piena potenza per il resto del mondo, e uno fatto di versioni depotenziate o di progettazione locale per la Cina. Per le aziende multinazionali con operazioni in Cina, questo scenario introduce complessità: gestire flotte di server hardware diverse, con driver e framework ottimizzati in modo differente, può aumentare i costi di manutenzione e ridurre la portabilità del software. Inoltre, la frammentazione rischia di rallentare l'adozione di standard condivisi, creando isole di competenza separate.

Prospettive: un equilibrio precario tra commercio e sicurezza

La strategia delle versioni depotenziate tiene aperta la porta del mercato cinese, ma è un equilibrio instabile. Le autorità statunitensi potrebbero inasprire ulteriormente i parametri, rendendo obsoleti anche i chip "nerfed" appena introdotti. Allo stesso tempo, la Cina sta investendo massicciamente per colmare il gap tecnicico, il che potrebbe portare a medio termine a soluzioni locali competitive, riducendo la dipendenza dall'import. Per i responsabili IT e i decision maker che operano in Cina nel settore AI, questa incertezza normativa e tecnicica diventa una variabile chiave nella pianificazione delle infrastrutture on-premise. L'analisi dei trade-off tra prestazioni, TCO e rischio di fornitura sarà sempre più centrale. In AI-RADAR continueremo a monitorare questi sviluppi, perché la scelta dell'hardware per l'inference e il training non è mai solo una questione di specifiche: è un fattore strategico che incide sulla sostenibilità a lungo termine dei progetti.