Un'analisi di settore prevede che Samsung si posizionerà come leader globale nei profitti del settore chip, trainata dalla crescente domanda di memoria specializzata per l'intelligenza artificiale. L'espansione dei Large Language Models (LLM) e dei carichi di lavoro AI sta rendendo la VRAM un componente critico per le infrastrutture on-premise e cloud.
AMD ha rilasciato ROCm 7.2.2, un aggiornamento minore del suo stack di calcolo GPU open source. La novità principale è una guida all'ottimizzazione mirata all'hardware Ryzen AI e RDNA 3.5. Questo rilascio è significativo per gli architetti di infrastrutture che implementano carichi di lavoro AI on-premise, poiché le ottimizzazioni software sono cruciali per massimizzare l'efficienza e il TCO delle soluzioni hardware locali.
Nvidia propone l'impiego dei suoi modelli di intelligenza artificiale per migliorare l'affidabilità dei computer quantistici. L'obiettivo è ridurre l'elevato tasso di errore che attualmente limita l'applicazione di queste tecnicie in settori come la scienza dei materiali, la logistica e la modellazione finanziaria, evidenziando la convergenza tra AI e calcolo quantistico.
I test preliminari di Ubuntu 26.04 rivelano significativi incrementi di performance per i processori AMD Strix Point, in particolare per la grafica RDNA 3.5. Questi risultati, emersi da benchmark comparativi con Ubuntu 24.04.4 LTS su un ASUS Zenbook S16, indicano un potenziale ottimizzazione per le piattaforme hardware più recenti, estendendo i benefici già osservati su Strix Halo.
Science Corp., l'azienda fondata da Max Hodak, sta sviluppando un sensore ibrido destinato all'impianto nel cervello umano. L'iniziativa segna un passo significativo nel campo delle interfacce cervello-computer, con le prime sperimentazioni sull'uomo previste nei prossimi anni. Questo sviluppo solleva interrogativi cruciali su sovranità dei dati e infrastrutture di elaborazione per carichi di lavoro altamente sensibili.
Una recente fuga di notizie rivela dettagli sulla prossima linea Intel Nova Lake-S, che includerebbe una CPU midrange a 16 core con una potente grafica integrata (iGPU) dotata di 12 core Xe3P. Questa configurazione potrebbe avere implicazioni significative per i deployment di Large Language Models (LLM) su edge e on-premise, offrendo un'alternativa per carichi di lavoro AI che richiedono efficienza e sovranità dei dati.
Le recenti versioni 50.1 di GNOME Shell e Mutter sono state rilasciate, segnando i primi aggiornamenti puntuali della serie GNOME 50. L'aggiornamento di Mutter è particolarmente rilevante per gli utenti che impiegano driver NVIDIA, poiché introduce una correzione mirata a una regressione di performance che aveva impattato alcune configurazioni. Questo intervento mira a ripristinare la stabilità e l'efficienza del sistema grafico.
Nvidia sta integrando l'intelligenza artificiale nel processo di progettazione delle proprie GPU, riducendo drasticamente i tempi e le risorse umane necessarie per compiti complessi. Un'attività che prima richiedeva otto ingegneri e dieci mesi può ora essere completata in una sola notte. L'azienda sottolinea però che l'intervento umano rimane cruciale, indicando che la progettazione autonoma di chip da parte dell'IA è ancora un obiettivo lontano.
Uber e Nuro hanno iniziato a San Francisco i test interni per un servizio di robotaxi premium. I veicoli, SUV Lucid Gravity, integrano il sistema di guida autonoma di Nuro, basato sulla piattaforma Nvidia Drive AGX Thor. Un operatore umano supervisiona la sicurezza. Uber ha annunciato l'intenzione di acquisire almeno 20.000 di questi veicoli nei prossimi sei anni, segnando un passo significativo nell'espansione della mobilità autonoma.
La Cina ha annunciato lo sviluppo di un prototipo di GPU per intelligenza artificiale basato su un processo produttivo a 2 nanometri. Sebbene il raggiungimento di questa soglia tecnicica rappresenti un traguardo significativo, lo stato della produzione di massa rimane incerto. Questo sviluppo potrebbe avere implicazioni future per la catena di fornitura globale e per le strategie di deployment on-premise di carichi di lavoro AI.
Peak Quantum, una startup di calcolo quantistico con sede a Monaco, ha ottenuto oltre 5 milioni di euro in finanziamenti totali, inclusi 2,2 milioni di euro in pre-seed. L'azienda, spin-off della Technical University of Munich, si concentra sullo sviluppo di processori quantistici superconduttori con resilienza agli errori intrinseca a livello hardware, un approccio che mira a semplificare i sistemi e a rendere i computer quantistici più pratici. Peak Quantum opererà anche una linea pilota europea per chip quantistici nell'ambito dell'EU Chips Act.
Samsung Electro-Mechanics starebbe pianificando un'espansione significativa della sua linea di produzione di substrati con MLCC integrati in Vietnam. Questa mossa mira a rafforzare le capacità di packaging per i chip AI, un componente cruciale per l'efficienza e le prestazioni dell'hardware dedicato all'intelligenza artificiale, con implicazioni per l'intera catena di fornitura e per i deployment on-premise di LLM.
Indiscrezioni suggeriscono che le rese produttive del processo a 2 nanometri di Samsung rimangano al di sotto dei livelli necessari per la produzione di massa. Questo scenario potrebbe avere implicazioni significative per la disponibilità e i costi dei chip di prossima generazione, cruciali per l'AI e i deployment on-premise, influenzando le strategie di approvvigionamento hardware.
JCET sta spingendo l'innovazione nel packaging avanzato per l'intelligenza artificiale, concentrandosi su tecnicie come il Co-Packaged Optics (CPO) e i substrati in vetro. Questi sviluppi mirano a soddisfare la crescente domanda di soluzioni di packaging ad alte prestazioni, fondamentali per l'efficienza e la potenza dei chip AI di prossima generazione, con implicazioni dirette per le infrastrutture on-premise.
Silicio Motion ha dato il via alla costruzione del suo nuovo quartier generale a Taipei, con un'apertura prevista per il 2030. La struttura è destinata a diventare il fulcro di una strategia operativa basata su due siti, un approccio che mira a rafforzare la resilienza e la capacità produttiva dell'azienda, fornitore chiave di controller NAND flash per l'infrastruttura tecnicica globale, inclusi i deployment di Large Language Models (LLM) on-premise.
Una recente innovazione tecnicica permette di osservare i transistor di una CPU in funzione, utilizzando radiazioni terahertz. Questa capacità solleva preoccupazioni significative riguardo alla sicurezza dei dati, poiché teoricamente consentirebbe il furto di informazioni direttamente dal chip mentre è operativo. La scoperta, che coinvolge attori come ASML nel contesto delle tecnicie avanzate per semiconduttori, evidenzia nuove sfide per la sovranità dei dati e la protezione delle infrastrutture on-premise.
L'ecosistema HighPoint CopprLink promette di ridefinire le prestazioni delle eGPU, superando gli standard attuali. Testato con una GPU RTX 5090, ha raggiunto livelli di performance quasi equivalenti a quelli nativi. Questa soluzione, sebbene innovativa, comporta un costo aggiuntivo di 2.300 dollari per l'hardware complementare, ponendo nuove considerazioni per chi cerca potenza grafica esterna con esigenze di controllo e sovranità dei dati.
Un aggiornamento significativo al driver RadeonSI di Mesa introduce un supporto migliorato per le capacità OpenCL 3.0 sulle APU e SoC AMD con grafica Radeon integrata. Questa novità, che sfrutta il driver Rusticl, anticipa il rilascio di Mesa 26.1 e mira a ottimizzare le performance e le funzionalità per gli sviluppatori e gli architetti che utilizzano queste piattaforme, specialmente in contesti di deployment on-premise e edge.
Il Giappone sta finanziando la creazione di un ecosistema nazionale per i chip dedicati all'intelligenza artificiale, con Rapidus al centro di questa iniziativa strategica. Il primo impianto dell'azienda, IIM-1, è in costruzione a Chitose, Hokkaido, segnando un passo significativo verso l'autonomia tecnicica nel settore dell'AI e rafforzando la sovranità dei dati.
Un recente benchmark ha esplorato le performance del Large Language Model MiniMax-M2.7, nella sua versione quantizzata NVFP4, su una configurazione self-hosted equipaggiata con due GPU NVIDIA RTX PRO 6000 Blackwell. I risultati evidenziano un throughput aggregato di picco di oltre 2800 token al secondo e offrono spunti cruciali per CTO e architetti che valutano deployment on-premise di LLM, fornendo dati concreti su decode e prefill in scenari di diversa concorrenza e lunghezza del contesto.