Huawei lancia openPangu 2.0: un LLM open source ottimizzato per Ascend

Huawei presenta openPangu 2.0: un LLM open source ottimizzato per Ascend

Durante la Huawei Developer Conference (HDC 2026), tenutasi il 12 giugno, Richard Yu, Executive Director di Huawei, ha annunciato ufficialmente il lancio di openPangu 2.0. Si tratta di un Large Language Model (LLM) completamente open source, progettato per integrarsi nell'ecosistema HarmonyOS e ottimizzato in modo specifico per la potenza di calcolo Ascend dell'azienda. Questa mossa sottolinea l'impegno di Huawei nel fornire soluzioni AI robuste e controllabili, particolarmente rilevanti per scenari di deployment on-premise.

L'annuncio segna un passo significativo per Huawei nel panorama degli LLM, offrendo una piattaforma che combina flessibilità open source con ottimizzazioni hardware proprietarie. La disponibilità progressiva dei componenti core, a partire dal 30 giugno, mira a potenziare gli sviluppatori con gli strumenti necessari per costruire e personalizzare applicazioni AI, mantenendo al contempo il controllo sui dati e sull'infrastruttura.

Dettagli Tecnici e Architetturali di openPangu 2.0

openPangu 2.0 si distingue per una capacità di elaborazione del contesto di 512K token, un valore che lo posiziona tra i modelli con le finestre di contesto più ampie disponibili. Il modello è offerto in due versioni, pensate per diversi scenari applicativi: openPangu 2.0 Pro e openPangu 2.0 Flash. La versione Pro vanta un totale di 505 miliardi di parametri, con 18 miliardi di parametri attivati, mentre la versione Flash presenta 92 miliardi di parametri totali e 6 miliardi attivati. Un aspetto notevole è il rapporto di sparsità record di 28:1 nella categoria dei modelli con centinaia di miliardi di parametri.

Le presentazioni e le dimostrazioni dal vivo alla conferenza hanno evidenziato un aggiornamento completo delle performance. openPangu 2.0, grazie all'ottimizzazione per la potenza di calcolo Ascend, raggiunge un throughput utente su singola scheda fino a due volte superiore rispetto ai modelli open source mainstream del settore. L'efficienza di training è stata migliorata del 30% grazie all'ottimizzazione per hyper-node, mentre il throughput per il training di sequenze lunghe da 512K è aumentato del 50%, con una consistenza di training che supera il 99%. A livello architetturale, il modello impiega una struttura ad alta precisione (mHC | Muon | ModAttn) e introduce un'architettura ibrida a strati indipendente DSA+SWA (ultra-sparse attention) per un'allocazione più precisa della potenza di calcolo.

Implicazioni per il Deployment On-Premise e la Sovranità dei Dati

L'approccio di Huawei con openPangu 2.0 è particolarmente interessante per le organizzazioni che valutano deployment di LLM on-premise o in ambienti ibridi. L'ottimizzazione profonda per l'hardware Ascend suggerisce che le massime prestazioni e l'efficienza energetica saranno raggiunte su infrastrutture proprietarie Huawei, offrendo un percorso chiaro per chi cerca soluzioni integrate hardware-software. Il focus dichiarato sull'ottenimento di miglioramenti sostanziali in latenza e throughput, unito alla menzione degli "elevati costi del computing AI", riflette una chiara attenzione al Total Cost of Ownership (TCO) e all'efficienza operativa, fattori critici per i decision-maker tecnici.

La decisione di rendere open source i componenti core, inclusi il codice di pre-training, post-training e gli operatori di training, offre alle aziende un controllo senza precedenti. Questo permette non solo la personalizzazione e il fine-tuning dei modelli in base a dataset proprietari, ma anche la garanzia della sovranità dei dati, un aspetto fondamentale per settori regolamentati o per ambienti air-gapped. Per chi valuta deployment on-premise, la disponibilità di un framework analitico come quello offerto da AI-RADAR su /llm-onpremise può aiutare a valutare i trade-off tra performance, costi e controllo.

Prospettive Future e Strategia di Huawei

La strategia di Huawei con openPangu 2.0 sembra mirare a consolidare la propria posizione come fornitore di soluzioni AI complete, dall'hardware al software, con un'enfasi sulla sovranità e l'efficienza. La spiegazione di Richard Yu riguardo all'ampio numero di parametri totali della versione Pro (505B), attribuita alla necessità di allocare gran parte della potenza di calcolo di Huawei per supportare altre imprese cinesi, evidenzia una realtà di risorse computazionali limitate e una strategia che privilegia l'ottimizzazione intensiva per massimizzare il valore delle risorse disponibili.

Questo posizionamento rende openPangu 2.0 una proposta attraente per le aziende che cercano alternative ai servizi cloud per LLM, desiderose di mantenere il controllo completo sulla propria infrastruttura AI e sui propri dati. L'impegno nell'open source, unito alle ottimizzazioni hardware-specifiche, potrebbe favorire l'adozione di openPangu 2.0 all'interno dell'ecosistema HarmonyOS e oltre, specialmente in contesti dove la performance, il controllo e il TCO sono prioritari.