📁 Hardware

Questa sezione Hardware segue il lato pratico dell'infrastruttura AI locale: GPU, NPU, mini PC, acceleratori edge, banda memoria e compromessi energetici che incidono direttamente sulle prestazioni in inferenza. Privilegiamo aggiornamenti con benchmark e note operative utili a decisioni reali, dal laboratorio domestico ai cluster pilota in azienda. Qui puoi confrontare costo totale, vincoli termici e scenari modello-hardware, poi approfondire con la guida pillar hardware e la copertura LLM collegata.

Al GTC 2026, Gigabyte ha presentato le sue ultime innovazioni hardware, con un'enfasi particolare sulle nuove piattaforme basate sull'architettura NVIDIA Vera Rubin. Questi sistemi e componenti di nuova generazione sono progettati per affrontare i carichi di lavoro più intensivi legati ai Large Language Models, offrendo soluzioni cruciali per le aziende che cercano maggiore controllo e performance nei loro deployment AI on-premise.

2026-03-31 Fonte

L'industria automobilistica di Taiwan sta vivendo una profonda trasformazione digitale, con un'enfasi crescente sulla produzione e lo sviluppo di chip. Questo cambiamento strategico riflette una nuova priorità economica e tecnicica, dove il silicio assume un ruolo centrale rispetto all'assemblaggio tradizionale dei veicoli. La transizione evidenzia l'importanza critica dei semiconduttori nell'ecosistema tecnicico moderno e le sue implicazioni per i settori ad alta intensità di calcolo.

2026-03-31 Fonte

Nvidia sta ancora definendo il design del suo compute tray "Vera Rubin". Questa fase di sviluppo coincide con una strategia aziendale volta a diversificare la propria supply chain. La mossa di Nvidia sottolinea l'importanza di mitigare i rischi legati alla produzione di hardware critico per l'AI, un aspetto cruciale per le aziende che pianificano deployment on-premise e cercano maggiore resilienza nelle proprie infrastrutture.

2026-03-31 Fonte

La crescente domanda di chip personalizzati, noti come ASIC, sta spingendo le aziende taiwanesi a rafforzare la loro presenza in questo segmento di mercato. Questa tendenza riflette la necessità di soluzioni hardware più efficienti e specializzate per gestire i carichi di lavoro intensivi degli LLM e dell'intelligenza artificiale, con implicazioni significative per le strategie di deployment on-premise e il Total Cost of Ownership (TCO) delle infrastrutture AI.

2026-03-31 Fonte

La sudcoreana Rebellions, specializzata in chip AI fabless per l'Inference, ha chiuso un round di finanziamento pre-IPO da 400 milioni di dollari, raggiungendo una valutazione di 2,34 miliardi di dollari. L'azienda, sostenuta da colossi come Samsung e SK Hynix, mira a clienti statunitensi come Meta e xAI, consolidando la sua posizione nel mercato hardware per l'intelligenza artificiale.

2026-03-30 Fonte

AMD ha avviato il rilascio delle patch per il kernel Linux, introducendo il supporto iniziale per la sua piattaforma NPU di nuova generazione, denominata AIE4. Questo sviluppo include il fondamentale supporto per SR-IOV, una funzionalità chiave per l'efficienza e la virtualizzazione delle risorse hardware. L'integrazione precoce a livello di sistema operativo sottolinea l'impegno di AMD nel fornire soluzioni robuste per carichi di lavoro AI, specialmente in contesti di deployment on-premise e ibridi.

2026-03-30 Fonte

Un ex ingegnere di TSMC rischia fino a 20 anni di carcere per aver sottratto informazioni tecniche cruciali relative al processo produttivo a 2 nanometri. Il caso, senza precedenti, è atteso al verdetto il prossimo mese e rientra sotto la Legge sulla Sicurezza Nazionale di Taiwan, evidenziando le crescenti tensioni attorno alla proprietà intellettuale nel settore dei semiconduttori.

2026-03-30 Fonte

Test recenti su un desktop System76 Thelio Mira con processore AMD Ryzen 9 9950X hanno rivelato significativi miglioramenti nelle prestazioni di Ubuntu 26.04 (versione di sviluppo) rispetto a Ubuntu 25.10. Le analisi, che hanno confrontato anche Ubuntu 24.04 LTS, evidenziano un'evoluzione positiva delle performance del sistema operativo negli ultimi sei mesi, particolarmente rilevante per chi gestisce carichi di lavoro intensivi su hardware locale.

2026-03-30 Fonte

TSMC, leader nella produzione di semiconduttori, gioca un ruolo cruciale nella catena di fornitura per l'intelligenza artificiale. L'articolo esplora come la dipendenza da fonderie esterne influenzi le strategie di deployment on-premise e le ambizioni di integrazione verticale delle aziende tech. Vengono analizzati i vincoli e i trade-off per CTO e architetti infrastrutturali che valutano soluzioni self-hosted per i carichi di lavoro LLM, evidenziando l'importanza della sovranità dei dati e del TCO.

2026-03-30 Fonte

La startup sudcoreana Rebellions, specializzata in chip AI e sostenuta da SK Telecom, ha chiuso un round di finanziamento pre-IPO da 400 milioni di dollari. L'investimento mira a supportare l'espansione globale della sua nuova piattaforma di calcolo rack-scale, progettata per le esigenze di aziende e cloud sovrani, sottolineando l'importanza del controllo sui dati e dell'infrastruttura locale.

2026-03-30 Fonte

Un recente rapporto indica che Samsung punta ad avviare la produzione di massa di componenti basati su fotonica su silicio entro il 2028. Questa tecnicia promette di rivoluzionare le interconnessioni nei data center, offrendo maggiore larghezza di banda e minore consumo energetico, aspetti cruciali per i carichi di lavoro AI e LLM. L'innovazione potrebbe ridefinire l'architettura dell'infrastruttura on-premise, influenzando TCO e sovranità dei dati.

2026-03-30 Fonte

Arm sta ridefinendo il proprio modello di business, tradizionalmente basato sul licensing, per introdurre una piattaforma CPU innovativa specificamente progettata per carichi di lavoro di intelligenza artificiale. Questa mossa strategica mira a offrire soluzioni hardware ottimizzate per l'AI, potenzialmente influenzando le decisioni di deployment on-premise e le strategie di TCO per le aziende che sviluppano e gestiscono LLM.

2026-03-30 Fonte

Samsung ha annunciato un investimento strategico in una startup specializzata nella progettazione di chip per l'intelligenza artificiale. L'obiettivo principale è duplice: accelerare lo sviluppo di nuove soluzioni in silicio e ottimizzare drasticamente l'efficienza energetica. Questa mossa riflette la crescente domanda di hardware AI performante e a basso consumo, cruciale per i deployment on-premise e per la sostenibilità dei data center.

2026-03-30 Fonte

La scalabilità della DRAM sta raggiungendo i suoi limiti, mentre le memorie di nuova generazione affrontano ritardi. La tecnicia MST di Atomera promette di migliorare l'efficienza energetica e la larghezza di banda, offrendo vantaggi paragonabili a una transizione di nodo produttivo, un fattore chiave per i deployment LLM on-premise.

2026-03-30 Fonte

Quindici anni fa, AMD lanciava la Radeon HD 6990, una scheda grafica dual-GPU che all'epoca si fregiava del titolo di più veloce al mondo. Un mostro di potenza, calore e rumorosità, ma capace di prestazioni al top per i videogiocatori più esigenti. Ripercorriamo la storia di questa pietra miliare.

2026-03-29 Fonte

Un nuovo chip sviluppato a Cambridge promette di ridurre drasticamente il consumo energetico dei sistemi di intelligenza artificiale. Il componente utilizza un nuovo tipo di memristore con una corrente di commutazione circa un milione di volte inferiore rispetto ai dispositivi convenzionali.

2026-03-29 Fonte

Innodisk sottolinea come l'integrazione tra hardware e software sia cruciale per il successo delle implementazioni di intelligenza artificiale, specialmente in contesti edge e industriali. Questo approccio olistico è fondamentale per ottimizzare le prestazioni e l'efficienza dei sistemi AI.

2026-03-29 Fonte

La società svizzera Kandou AI, specializzata in tecnicie di interconnessione chip-to-chip basate su rame, ha ottenuto un finanziamento di Serie A da 225 milioni di dollari. L'investimento, guidato da Maverick Silicio, vede la partecipazione strategica di SoftBank, Synopsys, Cadence Design Systems e Alchip Technologies, valutando l'azienda 400 milioni di dollari.

2026-03-28 Fonte

Un appassionato ha montato un sistema di raffreddamento a liquido per server (AIO) da 360mm su una scheda grafica RTX 3080, ottenendo un abbassamento delle temperature della VRAM di circa il 50% e un incremento delle performance del 9%. La modifica impiega un dissipatore tipico da workstation.

2026-03-28 Fonte