Un ingegnere ha ricevuto un server dotato di due GPU Nvidia H200 con un totale di 282GB di VRAM HBM3e. L'obiettivo è testare modelli LLM avanzati, con un focus sull'intelligenza del modello piuttosto che sulla velocità pura. L'utilizzo specifico sarà lo sviluppo di codice locale, con funzionalità di completamento, generazione e revisione del codice, oltre alla valutazione di agenti AI.
Nvidia sta collaborando con diversi produttori di chip per accelerare lo sviluppo di soluzioni di robotica industriale avanzata. Questa partnership mira a sfruttare le capacità di calcolo di Nvidia per migliorare l'automazione e l'efficienza nei processi industriali.
La startup svizzera Rhonexum ha ottenuto un finanziamento pre-seed di 1 milione di dollari per sviluppare elettronica criogenica destinata al calcolo quantistico. La tecnicia permette di operare a temperature prossime allo zero assoluto, superando i limiti dell'elettronica convenzionale e aprendo la strada a sistemi quantistici più efficienti e compatti.
Samsung collabora con Nvidia e Groq per ottimizzare le prestazioni nell'inference AI. La sinergia tra i tre colossi punta a migliorare l'efficienza e la velocità delle consegne nei carichi di lavoro di intelligenza artificiale, sfruttando le rispettive competenze in hardware e produzione.
Secondo Digitimes, Nvidia sta esplorando un futuro in cui le interconnessioni tra componenti hardware sfrutteranno sia il rame che la fibra ottica. Questa strategia potrebbe avere implicazioni significative per le architetture di calcolo ad alte prestazioni e i data center del futuro.
Il produttore Dreame ha annunciato un piano ambizioso per lo sviluppo di cinque chip. L'azienda, nota per le soluzioni di robotica, punta ora a espandere il proprio raggio d'azione verso i data center AI, con una visione a lungo termine che include applicazioni in orbita.
Il produttore cinese di server Sugon ha presentato una nuova soluzione di interconnessione per data center AI, con velocità fino a 400G. Questa tecnicia mira a competere con le soluzioni InfiniBand di Nvidia, offrendo un'alternativa per le infrastrutture di calcolo ad alte prestazioni.
Nvidia aggiorna la sua roadmap per i data center, introducendo la CPU Rosa e le GPU Feynman. L'azienda punta su NVLink ottico e Groq LPUs con NVFP4, oltre a nuove versioni di NVLink. Queste innovazioni promettono di migliorare significativamente le prestazioni e l'efficienza dei carichi di lavoro AI.
Durante il GTC 2026, Jensen Huang, CEO di Nvidia, ha risposto alle critiche riguardanti la tecnicia DLSS 5. I dettagli specifici della risposta e le argomentazioni presentate non sono esplicitate nella fonte, ma l'evento ha offerto una piattaforma per affrontare le preoccupazioni degli utenti e della comunità dei videogiocatori.
Nvidia lancia la nuova DGX Station, equipaggiata con il superchip GB300 Grace Blackwell. Già disponibile per l'ordine, le consegne inizieranno nei prossimi mesi. Questa workstation ad alte prestazioni punta a fornire potenza di calcolo per carichi di lavoro di intelligenza artificiale direttamente in locale.
Nvidia ha progettato un modulo, denominato Vera Rubin Space-1, destinato all'elaborazione dati direttamente nello spazio. Nonostante alcune perplessità del settore, l'azienda vede un futuro per i datacenter orbitali e propone una soluzione hardware specifica per operare al di fuori dell'atmosfera terrestre, aprendo nuove frontiere per il calcolo ad alte prestazioni.
Nvidia presenta Vera Rubin POD, un supercomputer AI da 60 exaflop alimentato da sette chip Rubin. La soluzione, alloggiata in 40 rack, rappresenta un'infrastruttura di calcolo avanzata per carichi di lavoro di intelligenza artificiale complessi.
NVIDIA integrerà le LPU di Groq nella sua architettura rackscale Vera Rubin. Questa mossa rappresenta una significativa espansione oltre l'uso esclusivo di GPU per l'inference AI, aprendo nuove possibilità per carichi di lavoro a bassa latenza. La piattaforma Vera Rubin punta a migliorare le consegne e ridurre i colli di bottiglia nell'inference.
Nvidia ha presentato DLSS 5, la nuova versione della sua tecnicia di upscaling basata su intelligenza artificiale. I primi risultati appaiono promettenti, ma lo sviluppo è ancora in corso. DLSS (Deep Learning Super Sampling) è una tecnica che utilizza reti neurali per migliorare la qualità visiva dei giochi, offrendo al contempo un incremento delle performance.
System76 ha annunciato la disponibilità del nuovo desktop Linux Thelio Mira, caratterizzato da un chassis completamente riprogettato e alimentato dai recenti processori AMD Ryzen serie 9000. Questa workstation è pensata per offrire elevate prestazioni in ambito professionale e di sviluppo.
Niv-AI ha raccolto 12 milioni di dollari per sviluppare soluzioni di misurazione e gestione dei picchi di consumo energetico delle GPU. L'obiettivo è migliorare le prestazioni riducendo gli sprechi e ottimizzando l'utilizzo delle risorse hardware esistenti.
La nuova versione di Blender, la 5.1, introduce notevoli miglioramenti per questo software open-source di modellazione 3D. Tra le novità principali, l'abilitazione predefinita del ray-tracing hardware per GPU AMD e un supporto Vulkan più maturo, che promette un incremento delle performance.
Un appassionato di Airflow ha realizzato un sistema di raffreddamento per CPU unico nel suo genere, stampando in 3D 15 mini-ventole all'interno di una cornice Noctua NF-A12x25. Il bizzarro 'Progetto Fanhattan' offre prestazioni di raffreddamento paragonabili a quelle di una ventola tradizionale.
Nvidia ha presentato Rubin Ultra, la prima GPU AI al mondo dotata di 1TB di memoria HBM4E. I nuovi chip saranno integrati nei rack Kyber, aprendo nuove frontiere per le prestazioni nell'inference e nel training di modelli di grandi dimensioni. Questa innovazione promette di accelerare significativamente i carichi di lavoro AI.
Nvidia ha eliminato gli acceleratori Rubin CPX dalla sua roadmap. Al loro posto, si prevede che le LPU di Groq guadagnino maggiore rilevanza nel panorama degli acceleratori per carichi di lavoro di intelligenza artificiale.