Intel ha annunciato l'ingresso di Alex Katouzian, ex dirigente di Qualcomm con 25 anni di esperienza, alla guida del suo gruppo di client computing. Katouzian sarà responsabile delle CPU consumer e dell'AI on-device, una mossa strategica che sottolinea l'impegno di Intel nel potenziare le capacità di intelligenza artificiale direttamente sui dispositivi degli utenti, con implicazioni significative per i deployment locali e la sovranità dei dati.
AMD ha svelato la APU Ryzen AI 5 435G, un processore a sei core basato sull'architettura Zen 5 con capacità AI integrate. Destinato a sistemi a basso costo, si confronta con il Ryzen 5 8600G, promettendo nuove opportunità per l'inference locale e l'elaborazione AI on-premise. Questo chip offre un equilibrio tra performance e TCO, rendendolo rilevante per deployment edge e per chi cerca soluzioni AI con maggiore sovranità dei dati.
La nuova GPU Intel Arc Pro B70, dotata di 32GB di VRAM, mostra prestazioni significative nei test. Con una velocità media circa doppia rispetto alla Arc B580 e la capacità di superare la RTX 5060 Ti in alcuni scenari, si posiziona come un'opzione interessante per workstation, specialmente per chi valuta carichi di lavoro che richiedono elevata memoria video e controllo locale.
Il rilascio del compilatore GCC 16.1 introduce significative novità, tra cui il supporto per le CPU AMD Zen 6 e Arm AGI, oltre a nuove funzionalità C++ e un front-end per Algol 68. I primi benchmark indicano un notevole miglioramento delle performance rispetto alla versione precedente, GCC 15. Questi progressi sono cruciali per ottimizzare l'esecuzione di carichi di lavoro complessi, inclusi quelli legati agli LLM, su infrastrutture on-premise, influenzando direttamente il TCO e l'efficienza operativa.
Nuovi benchmark PassMark trapelati suggeriscono l'arrivo della APU AMD Ryzen AI Max+ PRO 495. Questa nuova unità potrebbe integrare fino a 192GB di memoria unificata, rappresentando un aggiornamento rispetto alla serie Strix Halo. L'incremento della memoria è un fattore chiave per i carichi di lavoro AI on-premise, offrendo maggiore capacità per modelli complessi e inference locale, cruciale per la sovranità dei dati e il TCO.
Il progetto open source Mesa ha iniziato a mostrare le prime attività di sviluppo driver per l'architettura GPU GFX12.1 di AMD. Questa revisione, che segue la GFX12 (RDNA4 delle Radeon RX 9000), preannuncia una nuova generazione di prodotti hardware. L'impegno nello sviluppo open source è un segnale importante per il futuro delle soluzioni grafiche e di calcolo di AMD, con implicazioni per i deployment on-premise di carichi di lavoro AI.
Le recenti indiscrezioni suggeriscono che il prossimo APU AMD Strix Halo, noto come "Gorgon Halo 495 Max" o "Ryzen AI Max Pro 495", potrebbe integrare 192GB di memoria. Questa capacità, abbinata a una iGPU Radeon 8065S, rappresenterebbe un significativo passo avanti per l'esecuzione di Large Language Models (LLM) da 122B con Quantization a 8-bit e ampie finestre di contesto in ambienti self-hosted.
La capacità produttiva di TSMC sul nodo a 3nm è sotto pressione, con ripercussioni sulla fornitura di Mac Apple. Questa situazione evidenzia le sfide globali nell'approvvigionamento di silicio avanzato, cruciale per i deployment di Large Language Models (LLM) on-premise. Le aziende che pianificano infrastrutture AI devono considerare l'impatto dei vincoli di produzione sui tempi e sui costi.
L&T Semiconductor Technologies ha annunciato la sua adesione al programma imec dedicato ai chiplet per il settore automotive. L'iniziativa mira a definire gli standard e a influenzare lo sviluppo globale dell'elettronica veicolare, ponendo l'accento su soluzioni hardware modulari e ottimizzate per le crescenti esigenze di intelligenza artificiale a bordo veicolo. Questa collaborazione sottolinea l'importanza dell'innovazione nel silicio per l'AI all'edge e la sovranità dei dati.
SPIL (Silicioware Precision Industries Co.) ha acquisito diversi stabilimenti Nanke per espandere la propria capacità di packaging avanzato. Questa mossa strategica mira a soddisfare la crescente domanda di componenti hardware per l'intelligenza artificiale, sottolineando l'importanza delle tecnicie di integrazione dei chip per i carichi di lavoro AI più esigenti e le implicazioni per la catena di fornitura globale.
Holtek, noto produttore di microcontrollori, ha annunciato un aumento dei prezzi per i suoi MCU a basso margine. Contestualmente, l'azienda sta espandendo le proprie attività nei settori del raffreddamento per server AI e delle comunicazioni ottiche. Questa mossa strategica riflette un riposizionamento verso segmenti di mercato ad alto valore aggiunto, cruciali per l'infrastruttura di Large Language Models e carichi di lavoro di intelligenza artificiale.
Cenefom, divisione di BenQ Materials, ha fatto il suo ingresso nella catena di fornitura globale delle memorie. L'azienda si posiziona come fornitore di spazzole per la lucidatura chimico-meccanica (CMP), un componente cruciale per la produzione di semiconduttori avanzati. Questo passo evidenzia l'importanza dei materiali specializzati nell'ottimizzazione delle performance e dell'affidabilità dei chip di memoria, elementi fondamentali per l'infrastruttura AI on-premise.
La scheda madre ASUS ROG Crosshair X870E Hero, basata su socket AMD AM5, si posiziona come una soluzione robusta per chi intende costruire infrastrutture AI on-premise. Offrendo una base solida per processori di ultima generazione e connettività avanzata, questa piattaforma è ideale per ambienti che richiedono controllo sui dati e ottimizzazione del TCO.
Nvidia ha annunciato l'accelerazione del fine vita per alcuni processori Jetson AI, in particolare quelli basati su moduli DDR4. La decisione è dettata da carenze di memoria, un fattore che evidenzia le sfide attuali nella catena di approvvigionamento hardware e le sue ripercussioni sui cicli di vita dei prodotti dedicati all'edge AI. Questo scenario impone una riflessione strategica per i deployment on-premise.
Un nuovo studio presenta Hummingbird+, una soluzione basata su FPGA a basso costo progettata per l'inference di Large Language Models. Il sistema, con un costo di produzione stimato di 150 dollari, è in grado di eseguire il modello Qwen3-30B-A3B con quantization a 4 bit, raggiungendo una velocità di 18 token al secondo e utilizzando 24GB di memoria. Questa tecnicia potrebbe offrire un'alternativa economica per i deployment on-premise.
Un'implementazione di MicroGPT, un modello con soli 4.192 parametri, ha dimostrato prestazioni notevoli su FPGA, raggiungendo i 50.000 token al secondo. Questo risultato è attribuibile in parte all'architettura che integra i pesi del modello direttamente nella ROM on-board, riducendo la dipendenza dalla memoria esterna. L'esperimento evidenzia il potenziale degli FPGA per l'inference di Large Language Models di dimensioni contenute, suggerendo sviluppi futuri nell'hardware dedicato.
Silicio Motion ha annunciato ricavi record per il primo trimestre del 2026, un risultato attribuito principalmente alla crescente domanda nel settore dell'intelligenza artificiale. L'azienda prevede un'ulteriore espansione grazie all'introduzione di nuovi prodotti, sottolineando l'importanza dei componenti hardware sottostanti per l'infrastruttura AI, inclusi i deployment on-premise.
Yichen Shen, fisico del MIT e fondatore di Lightelligence, sta guidando la sua azienda, specializzata in chip fotonici per l'intelligenza artificiale, verso una quotazione in borsa a Hong Kong. Questa mossa evidenzia l'importanza crescente dell'hardware specializzato per supportare i carichi di lavoro AI, con implicazioni significative per le strategie di deployment on-premise e la sovranità dei dati.
La prossima release del kernel Linux, la versione 7.1-rc2, introduce una serie di aggiornamenti e correzioni per i driver Direct Rendering Manager (DRM). Questi interventi sono specificamente mirati a migliorare il supporto e la stabilità delle GPU AMD di generazione precedente, garantendo prestazioni più affidabili per l'hardware esistente e supportando strategie di deployment on-premise orientate al TCO.
Un rivenditore ha messo in commercio schede GeForce RTX 5090 Founders Edition danneggiate durante il trasporto, ma complete di tutti i componenti sulla PCB, a partire da 1.760 dollari. Questa situazione solleva interrogativi sulle strategie di acquisizione hardware e sull'analisi del TCO per i deployment di LLM on-premise, evidenziando i trade-off tra costo iniziale e potenziale necessità di riparazione o riutilizzo.