LineShine cinese in vetta al TOP500: petaflop tradizionali, ma l’AI resta fuori classifica

Dopo tre anni di assenza volontaria, la Cina ritorna a pubblicare i propri sistemi sulla classifica TOP500 e lo fa prendendosi la prima posizione. LineShine, ospitato presso il National Supercomputing Centre di Shenzhen, ha totalizzato 2,198 exaflops sul benchmark HPL, scalzando El Capitan del Lawrence Livermore National Laboratory, fermo a 1,809 exaflops. Un risultato che riaccende il confronto geopolitico sui semiconduttori, ma che dice poco o nulla sulle capacità reali nel campo dell’intelligenza artificiale.

L’architettura senza acceleratori: vince il calcolo lineare, perde il mixed-precision

I tecnici del TOP500 descrivono LineShine come un sistema basato su piattaforma LingKun, con processori LX2 a 304 core, interconnect LingQi e sistema operativo Kylin OS. Oltre 13,7 milioni di core a 1,55 GHz, per un assorbimento di circa 42,2 megawatt e un’efficienza di 52,07 gigaflops per watt. Sulla carta sono numeri impressionanti, ma il dato chiave è l’assenza di acceleratori dedicati a bassa precisione. LineShine è una macchina CPU-only: sull’HPL-MxP, il benchmark a precisione mista rilevante per i carichi AI, scivola al quarto posto con 7,92 exaflops, mentre sul tradizionale HPCG si conferma primo con 22 petaflops.

Questo dettaglio architetturale segna una differenza sostanziale per chi valuta infrastrutture on-premise destinate al serving o al fine-tuning di LLM. I modelli linguistici più recenti sfruttano massicciamente il calcolo a bassa precisione (FP16, INT8) e richiedono GPU o altri acceleratori con elevata larghezza di banda della memoria. Senza unità specializzate, anche un supercomputer da record può essere meno adatto di una cluster di GPU consumer per l’inference o l’addestramento di modelli di grandi dimensioni. Il caso LineShine è emblematico: illustra come la potenza bruta misurata in HPL non si traduca automaticamente in competitività AI, un trade-off che qualsiasi organizzazione deve soppesare quando sceglie tra TCO, sovranità dei dati e prestazioni effettive sul proprio carico di lavoro.

La mossa politica dietro la classifica

A colpire gli analisti non è tanto la performance di LineShine, quanto la scelta di Pechino di sottoporre il sistema alla rilevazione pubblica. Addison Snell, CEO di Intersect360 Research, interpreta la mossa come una ricerca di legittimazione esterna per il design domestico dei chip, in un momento in cui i controlli all’export statunitensi stringono sulla capacità cinese di produrre semiconduttori avanzati. Le specifiche diffuse non mostrano l’impiego di chip AI all’avanguardia, verosimilmente perché gli strumenti per fabbricarli restano soggetti alle restrizioni.

La classifica TOP500, peraltro, NON fotografa l’intero panorama del supercalcolo AI. Buona parte degli hyperscaler – Microsoft, Amazon, Google – e aziende come xAI non inviano i propri cluster alla rilevazione. Uno studio di Epoch AI del 2025 stima che l’80% della potenza di calcolo AI misurata nel proprio dataset provenga dal settore privato, e che gli Stati Uniti detengano circa il 75% della capacità, contro il 15% della Cina. Colossus, il sistema di xAI con 200.000 chip, rappresenta il vertice rilevato a marzo 2025. Jimmy Goodrich, esperto dell’Università della California, sottolinea che se gli hyperscaler sottoponessero le proprie macchine, LineShine NON entrerebbe nemmeno nella top five. Per chi gestisce deployment on-premise, questo scenario ribadisce un punto fondamentale: le metriche pubbliche contano fino a un certo punto. Le scelte architetturali vanno calibrate sul carico di lavoro reale – LLM, RAG, fine-tuning – e non sulla rincorsa ai petaflop lineari.

Sovranità tecnicica e limiti del fai-da-te hardware

La vicenda LineShine riapre il dibattito sulla sovranità dei dati e sull’autonomia tecnicica. L’uso di processori e interconnect sviluppati internamente rappresenta un passo verso l’indipendenza dalle catene di fornitura occidentali, ma i limiti nell’accelerazione per AI mostrano la profondità del divario. Per un’azienda che valuti un’infrastruttura completamente self-hosted e air-gapped, il caso cinese offre una lezione: progettare hardware domestico è possibile, ma richiede anni e compromessi che possono rendere l’architettura inadatta ai modelli più recenti, a meno di non investire pesantemente in co-progettazione software-hardware e in pipeline di quantization efficienti.

La pista dei “sistemi privati non dichiarati” complica ulteriormente il framework. Mentre i vendor di cloud ribadiscono l’agilità del loro modello, la scelta on-premise si gioca sul controllo granulare dei dati e sulla prevedibilità dei costi nel lungo periodo – elementi che sfuggono alle classifiche pubbliche ma che pesano nelle decisioni reali. AI-RADAR continuerà a monitorare queste dinamiche, offrendo framework di analisi per chi è chiamato a valutare trade-off tra hardware, software e vincoli di deployment locale.