Intel ha iniziato a inviare le prime modifiche del driver grafico per il kernel Linux 7.3, puntando dritto alla futura piattaforma Nova Lake e al suo motore grafico integrato Xe3P. La serie di patch, parte del ramo "drm-intel-next", si concentra su display e rendering, ma racconta in realtà una storia più ampia per chi lavora sugli stack locali di intelligenza artificiale.

Da anni il produttore americano ha scelto di spingere l’open source come leva competitiva sulla sua GPU integrata. Il driver i915 prima e il nuovo driver Xe poi sono diventati la spina dorsale del supporto grafico su Linux, eliminando la necessità di blob proprietari anche per le funzioni di calcolo. Con Nova Lake e l’architettura Xe3P – successore atteso delle IP grafiche già viste su Meteor Lake e Arrow Lake – Intel prosegue su questa strada e inizia a preparare il terreno con largo anticipo.

Per chi valuta deployment on-premise di LLM, l’aggiornamento Linux non è una mera nota tecnica. Le GPU integrate, finora relegate a compiti di visualizzazione o a carichi modesti, stanno cambiando pelle. L’introduzione di unità XMX (Xe Matrix eXtensions) nelle ultime generazioni delle discrete Arc e l’attesa estensione alle iGPU con Xe3P fanno sì che anche il silicio integrato possa gestire operazioni di inference con un’efficienza interessante. Non si parla di sostituirsi alle GPU discrete da data center, ma di abilitare scenari edge, piccole istanze server o postazioni di lavoro dove il modello deve restare in azienda e ogni watt conta.

L’arrivo delle patch nel kernel ufficiale Linux 7.3 – previsto nei prossimi mesi – significa che quando le prime macchine Nova Lake arriveranno sul mercato, il sistema operativo sarà già pronto a sfruttare l’accelerazione grafica via API standard come Vulkan e SYCL/oneAPI. Framework come llama.cpp, che già supportano il backend Vulkan, o Intel OpenVINO potranno appoggiarsi direttamente al driver open senza installare componenti aggiuntivi. È la condizione ideale per chi vuole una filiera software interamente controllabile, dalla base del sistema operativo fino al runtime di inference.

In termini di TCO, una iGPU con sufficiente banda di memoria di sistema e un buon numero di unità di calcolo può gestire modelli quantizzati da 7–8 miliardi di parametri senza pretendere una scheda dedicata costosa e assetata di energia. Questo abbassa la soglia per architetture distribuite, dove ciascun nodo contribuisce a una porzione del carico, o per backoffice aziendali che vogliono servizi di completamento del testo, analisi documentale o chat interna senza passare dal cloud pubblico.

Ovviamente il driver grafico da solo non fa miracoli: il vero salto dipenderà dalle capacità hardware definitive di Xe3P, dalla quantità di VRAM condivisa con il sistema e dalla maturità dello stack di calcolo Intel, ancora in evoluzione rispetto all’ecosistema CUDA. Ma il segnale è chiaro: l’integrazione tempestiva su Linux dimostra che Intel considera la piattaforma open un pilastro, non un ripensamento, e per chi architetta infrastrutture on-premise questo vuol dire poter contare su un hardware pronto all’uso, senza i ritardi tipici del supporto post-lancio.