ZLUDA v6 porta PhysX su GPU AMD, ma perde il finanziamento commerciale

Il progetto ZLUDA continua a scrivere una delle storie più tormentate dell’ecosistema open source legato al calcolo su GPU. Nato come tentativo di far girare applicazioni CUDA su hardware Intel, poi passato sotto l’ala di AMD per diventare un ponte verso le schede Radeon, il codice è stato più volte rimbalzato tra finanziamenti incerti e brusche interruzioni. L’ultimo capitolo arriva con la versione 6, che porta una notizia agrodolce: PhysX funziona finalmente su GPU AMD, ma il finanziatore commerciale di cui ZLUDA beneficiava ha tagliato i fondi.

La genesi di un traduttore universale

ZLUDA è, in sintesi, un framework che permette di eseguire codice CUDA su GPU non NVIDIA senza modificare il sorgente. La sua prima incarnazione mirava ai processori grafici integrati di Intel, ma fu la collaborazione silenziosa con AMD a dare al progetto una vera spinta, con anni di sviluppo dedicati a far girare workload CUDA su Radeon. Quando quel finanziamento cessò, il codice venne reso open source e poi temporaneamente rimosso. Sul finire del 2024 una nuova iniezione di capitale — da un attore mai nominato — ha permesso di orientare ZLUDA verso l’intelligenza artificiale su configurazioni multi-GPU, salvo poi vedere quel sostegno evaporare di nuovo.

PhysX e Windows: la nuova direzione

Con la sesta major release, il team ha scelto di puntare su un terreno più classico: il gaming. Il supporto a PhysX, il motore fisico di NVIDIA storicamente legato alle schede GeForce, diventa realtà su GPU AMD grazie a ZLUDA, insieme a una migliore integrazione con Windows. È un segnale di ripiegamento tattico — meno AI, più compatibilità desktop — che però ha un suo significato tecnico: dimostra che il layer può gestire librerie complesse anche fuori dal perimetro del machine learning, ampliando le possibilità per chiunque abbia bisogno di eseguire codice originariamente vincolato all’ecosistema CUDA.

Cosa significa per i carichi on-premise

Per chi progetta deployment on-premise di modelli linguistici, la notizia ha un sapore ambiguo. Da un lato, ZLUDA resta un esempio concreto di come si possa aggirare la dipendenza da NVIDIA senza rifattorizzare intere pipeline: usare GPU AMD per l’inference di LLM, mantenendo la compatibilità con il software scritto per CUDA, abbasserebbe il TCO e aprirebbe opzioni per data center con vincoli di fornitura. Dall’altro, la cronica instabilità dei finanziamenti rende il progetto difficile da adottare in produzione. Una piattaforma open source che cambia rotta ogni sei mesi non offre la prevedibilità richiesta da ambienti che trattano dati sensibili o devono rispettare norme di sovranità.

Oltre il riflettore: la dipendenza nascosta

La vicenda ZLUDA mette in luce una tensione che AI-RADAR osserva da tempo: l’intero ecosistema AI è cresciuto attorno a CUDA e alle architetture NVIDIA, creando una dipendenza che frena l’adozione di alternative hardware. Progetti come ZLUDA rappresentano valvole di sfogo, ma la loro sostenibilità economica è fragile. Per le organizzazioni che valutano stack self-hosted, il trade-off tra controllo e flessibilità va esaminato con pragmatismo: un layer di traduzione può ridurre il vendor lock-in, ma introduce nuove variabili di rischio. La domanda aperta è se l’industria saprà finanziare in modo stabile queste infrastrutture software, trasformandole in opzioni produttive serie.