Huawei sfida i paradigmi con la "Legge di Her" per i chip AI
Huawei ha presentato un nuovo principio per la progettazione di chip, denominato "Tau Scaling Law" o "Legge di Her", dal nome dell'executive He Tingbo. Questa iniziativa emerge in un momento cruciale per le aziende tecniciche cinesi, impegnate a ridurre la dipendenza dagli acceleratori AI di Nvidia e a rafforzare la propria autonomia nel settore. Il contesto è quello delle continue restrizioni tecniciche imposte dagli Stati Uniti, che spingono Pechino a investire massicciamente nello sviluppo di capacità domestiche.
La "Legge di Her" si propone come un'alternativa alla consolidata Legge di Moore, che ha guidato l'industria dei semiconduttori per decenni basandosi sulla miniaturizzazione dei transistor. Mentre la Legge di Moore incontra limiti fisici sempre più stringenti, l'approccio di Huawei sposta il focus dalle dimensioni del singolo transistor alle prestazioni complessive del sistema. Questo include l'ottimizzazione della connessione e dell'integrazione tra gruppi di chip all'interno di cluster AI e data center, un aspetto fondamentale per i deployment su larga scala.
Innovazione a livello di sistema e efficienza energetica
Il cuore della "Tau Scaling Law" risiede nell'obiettivo di ridurre la costante di tempo nelle operazioni dei chip, con l'intento di migliorare significativamente sia le prestazioni che l'efficienza energetica su più livelli della progettazione. Tra le tecnicie chiave sviluppate nell'ambito di questo approccio, Huawei cita LogicFolding, un elemento che contribuisce a ottimizzare il flusso di dati. L'azienda ha dichiarato che questo principio le consentirà di raggiungere un'equivalenza nella densità dei transistor pari a 1.4 nanometri entro il 2031, un traguardo ambizioso se confrontato con le previsioni di Taiwan Semiconductor Manufacturing Co (TSMC), che prevede di avviare la produzione di chip a 1.4nm nel 2028.
L'adozione di tecniche legate alla "Legge di Her" è prevista per i chip destinati ai telefoni già entro la fine dell'anno, con una piena integrazione negli acceleratori AI della serie Ascend entro il 2030. L'obiettivo primario di questa metodologia è minimizzare il tempo e l'energia necessari per lo spostamento dei dati sia all'interno dei singoli chip che tra di essi. Per i CTO e gli architetti di infrastruttura che valutano soluzioni self-hosted, la promessa di maggiore efficienza energetica e throughput a livello di sistema rappresenta un fattore critico per il TCO e la sostenibilità dei deployment on-premise.
Il panorama competitivo cinese e le sfide aperte
L'annuncio di Huawei si inserisce in un mercato cinese degli acceleratori AI in rapida espansione e sempre più competitivo. Aziende come Alibaba, con la sua unità di progettazione chip T-Head, stanno intensificando gli sforzi. Alibaba ha recentemente presentato il chip AI Zhenwu M890, delineando una roadmap pluriennale per futuri miglioramenti prestazionali. A differenza di Huawei, Alibaba non è soggetta alle stesse sanzioni statunitensi, il che le offre un margine di manovra differente.
I dati IDC, esaminati da Reuters, evidenziano la dinamica di questo mercato. Nel 2025, in Cina sono state spedite circa 4 milioni di schede acceleratrici AI. Nvidia ha mantenuto la leadership con circa 2.2 milioni di unità, pari a una quota di mercato del 55%. Tuttavia, i fornitori cinesi hanno complessivamente spedito 1.65 milioni di chip AI, conquistando circa il 41% del mercato. Huawei ha guidato i fornitori domestici con 812.000 unità, seguita da Alibaba T-Head con circa 265.000, e poi da Baidu Kunlunxin e Cambricon, ciascuno con circa 116.000 unità. Nonostante i progressi, Huawei non ha ancora fornito una spiegazione completa su come il suo approccio affronterà questioni ingegneristiche complesse come la dissipazione del calore, né come le proiezioni sulla densità dei transistor si tradurranno in prestazioni reali per i chip AI.
Implicazioni per la sovranità tecnicica e i deployment on-premise
La spinta di Huawei e di altre aziende cinesi verso l'autosufficienza nel settore dei semiconduttori è una risposta diretta alle politiche di restrizione tecnicica. Questo scenario evidenzia l'importanza della sovranità dei dati e del controllo sull'intera pipeline tecnicica, aspetti cruciali per le organizzazioni che operano in ambienti air-gapped o con stringenti requisiti di compliance. La capacità di sviluppare e produrre hardware AI a livello nazionale riduce la dipendenza da catene di approvvigionamento esterne, mitigando i rischi geopolitici e garantendo maggiore resilienza.
Per i decision-maker che valutano l'implementazione di LLM on-premise, l'emergere di alternative hardware domestiche, sebbene ancora in fase di sviluppo e con sfide da superare, rappresenta un fattore da considerare. La disponibilità di un ecosistema di chip e soluzioni locali può influenzare significativamente il TCO, la flessibilità architetturale e la capacità di personalizzazione. AI-RADAR offre framework analitici per valutare i trade-off tra soluzioni self-hosted e cloud, considerando fattori come le specifiche hardware concrete, i requisiti di VRAM, il throughput e la latenza, elementi che la "Legge di Her" mira a ottimizzare a livello di sistema.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!