📁 Hardware

Questa sezione Hardware segue il lato pratico dell'infrastruttura AI locale: GPU, NPU, mini PC, acceleratori edge, banda memoria e compromessi energetici che incidono direttamente sulle prestazioni in inferenza. Privilegiamo aggiornamenti con benchmark e note operative utili a decisioni reali, dal laboratorio domestico ai cluster pilota in azienda. Qui puoi confrontare costo totale, vincoli termici e scenari modello-hardware, poi approfondire con la guida pillar hardware e la copertura LLM collegata.

Il panorama competitivo dei Co-Packaged Optics (CPO) sta subendo una trasformazione, con FII che emerge come sfidante per giganti del settore come Broadcom e Nvidia. La competizione si sposta sempre più verso l'integrazione di sistema, un fattore cruciale per l'efficienza e la scalabilità delle infrastrutture AI, in particolare per i deployment on-premise. Questa evoluzione sottolinea l'importanza di soluzioni olistiche per ottimizzare le performance e il TCO nei data center moderni.

2026-05-21 Fonte

AMD introduce una nuova serie di chip Ryzen AI Max PRO 400, progettati per sistemi AI. Questi processori si distinguono per il supporto fino a 192GB di memoria, un fattore cruciale per l'esecuzione di Large Language Models (LLM) di dimensioni maggiori direttamente su infrastrutture locali. L'iniziativa di AMD risponde alla crescente domanda di capacità computazionali per deployment on-premise, offrendo maggiore controllo e sovranità dei dati.

2026-05-21 Fonte

AMD presenta il Ryzen AI Max 400 'Gorgon Halo', un'APU rinnovata che integra architetture Zen 5 e RDNA 3.5. Questo chip è progettato per carichi di lavoro AI, offrendo fino a 192GB di memoria unificata e una frequenza operativa fino a 5.2 GHz. La sua architettura lo rende particolarmente interessante per scenari di deployment on-premise ed edge, dove il controllo dei dati e l'efficienza sono prioritari per CTO e architetti infrastrutturali.

2026-05-21 Fonte

Il kernel Linux 7.2 si prepara ad accogliere il supporto per il Cache Aware Scheduling, una funzionalità attesa che promette di ottimizzare le prestazioni sui processori dotati di multiple cache di ultimo livello. Questa integrazione, prevista prima dell'apertura della finestra di merge, rappresenta un passo significativo per l'efficienza dei sistemi Linux, in particolare per i carichi di lavoro che richiedono un'attenta gestione delle risorse hardware on-premise.

2026-05-20 Fonte

Team Group ha raggiunto un accordo da 1,1 milioni di dollari in una causa per pubblicità ingannevole. La controversia riguarda le memorie T-Force Xtreem ARGB DDR4-3600 CL14, le cui velocità pubblicizzate richiedevano modifiche al BIOS e impostazioni di overclocking per essere raggiunte. Questo episodio solleva questioni sulla trasparenza delle specifiche hardware, un aspetto cruciale per i decision-maker che valutano infrastrutture on-premise per carichi di lavoro AI/LLM.

2026-05-20 Fonte

SpacemiT ha rilasciato i primi benchmark del suo SoC K3, basato su core RISC-V X100 e conforme allo standard RVA23. Questa piattaforma, disponibile anche in formato Pico-ITX, rappresenta una delle prime soluzioni RISC-V RVA23 pronte per l'uso con sistemi operativi come Ubuntu 26.04 LTS. L'introduzione di hardware RISC-V come il K3 è rilevante per le aziende che esplorano alternative on-premise per carichi di lavoro AI, offrendo nuove opzioni per il controllo e la sovranità dei dati.

2026-05-20 Fonte

AMD si prepara a lanciare il suo Ryzen AI Halo PC, un sistema desktop con 128GB di memoria di sistema e un prezzo di 3999 dollari. Questa configurazione mira a supportare carichi di lavoro AI e LLM in locale, offrendo una soluzione per le aziende che cercano maggiore controllo sui dati e latenza ridotta rispetto alle opzioni cloud.

2026-05-20 Fonte

Neurosoft Bioelectronics ha chiuso un round di finanziamento seed da 7,5 milioni di dollari, portando il totale a oltre 20 milioni. L'azienda svizzera sviluppa interfacce cervello-computer (BCI) minimamente invasive con elettrodi morbidi e scalabili. L'obiettivo è creare una piattaforma di dati neurali per modelli fondamentali della corteccia umana, migliorando le prestazioni delle BCI. I fondi supporteranno l'avanzamento clinico e la commercializzazione negli Stati Uniti.

2026-05-20 Fonte

Un'analisi approfondita delle prestazioni dei Large Language Models Qwen3.6 su una GPU RTX 5080 da 16GB rivela risultati sorprendenti. Il benchmark, focalizzato su scenari di deployment on-premise, evidenzia come il modello 35B MoE raggiunga 56 token/secondo con un contesto di 128k. Contrariamente alle aspettative, la funzionalità Multi-Token Prediction (MTP) di llama.cpp non offre vantaggi significativi in questo scenario, suggerendo ottimizzazioni diverse per massimizzare l'efficienza su hardware locale.

2026-05-20 Fonte

Alibaba ha presentato il processore AI Zhenwu M890, una roadmap pluriennale per il silicio e il nuovo LLM Qwen 3.7-Max. Questa mossa strategica mira a costruire uno stack AI integrato, focalizzato sugli AI agenti e sulla sovranità tecnicica, riducendo la dipendenza da fornitori esterni. L'investimento massiccio e l'esperienza di deployment preesistente evidenziano un impegno a lungo termine nel settore.

2026-05-20 Fonte

Alibaba T-Head, la divisione semiconduttori del colosso cinese, sta intensificando il proprio impegno nello sviluppo di infrastrutture dedicate all'intelligenza artificiale. L'introduzione del Zhenwu M890 segna un passo significativo in questa direzione, puntando a rafforzare le capacità di calcolo per carichi di lavoro AI. Questa mossa evidenzia la crescente importanza di soluzioni hardware proprietarie per gestire le esigenze computazionali degli LLM e dell'AI generativa, con implicazioni per le strategie di deployment on-premise e ibride.

2026-05-20 Fonte

ASML si prepara a consegnare i primi sistemi di litografia High-NA EUV nei prossimi mesi. Questa tecnicia è cruciale per la produzione di chip di nuova generazione, fondamentali per l'avanzamento dell'intelligenza artificiale e dei Large Language Models. Tuttavia, le preoccupazioni sui costi associati a questa innovazione sollevano interrogativi sul TCO per le infrastrutture AI on-premise.

2026-05-20 Fonte

Alibaba, tramite la sua divisione T-Head, ha svelato il Zhenwu M890, un nuovo chip AI di classe GPU. Questo sviluppo segna un passo significativo nella strategia cinese di creare alternative hardware domestiche ai prodotti NVIDIA, in un contesto di crescenti controlli sulle esportazioni. L'azienda ha dichiarato che il chip è già in produzione di massa su larga scala.

2026-05-20 Fonte

Al Tech Forum 2026, il raffreddamento a liquido è emerso come soluzione indispensabile per i server AI. La crescente densità di potenza degli stack hardware dedicati all'intelligenza artificiale, essenziali per i Large Language Models, spinge verso l'adozione di tecnicie di dissipazione termica più efficienti. Il Dr. Clyde Chu di META Green Cooling Technology ha evidenziato questa transizione, sottolineando l'importanza di affrontare le sfide termiche nei deployment on-premise.

2026-05-20 Fonte

Le case automobilistiche stanno intensificando la collaborazione con Taiwan per velocizzare lo sviluppo di elettronica avanzata per i veicoli. Questa mossa strategica riflette la crescente domanda di capacità di calcolo per l'intelligenza artificiale a bordo, i sistemi ADAS e l'infotainment. La scelta di Taiwan sottolinea il ruolo cruciale dell'isola nella catena di fornitura globale dei semiconduttori, fondamentale per l'innovazione e il deployment di soluzioni AI on-premise e edge.

2026-05-20 Fonte

Un utente ha espresso l'intenzione di aggiornare la propria VRAM da 32GB a 48GB per carichi di lavoro LLM locali. Questa mossa evidenzia l'importanza della memoria video per il deployment on-premise di Large Language Models, dove la capacità hardware è un fattore critico. L'articolo esplora i trade-off e le considerazioni tecniche per chi gestisce LLM su infrastrutture self-hosted, analizzando come la VRAM influenzi le scelte di modello e le performance.

2026-05-20 Fonte

L'introduzione della GPU Nvidia H200, un componente cruciale per i carichi di lavoro AI più esigenti, si scontra con un contesto geopolitico complesso, in particolare le restrizioni all'export verso la Cina. Questa situazione solleva interrogativi significativi per le aziende che pianificano deployment di Large Language Models (LLM) on-premise, influenzando la disponibilità hardware, i costi e le strategie di sovranità dei dati.

2026-05-20 Fonte

La crescente domanda di memoria ad alte prestazioni, spinta dall'espansione dell'intelligenza artificiale, sta creando una stretta sull'offerta globale. Secondo i media coreani, questa dinamica sta indebolendo il potere negoziale di aziende come Apple, che si trovano a fronteggiare costi più elevati e disponibilità ridotta per componenti cruciali. Il fenomeno evidenzia le sfide infrastrutturali e di supply chain che le aziende devono affrontare per sostenere lo sviluppo e il deployment di soluzioni AI.

2026-05-20 Fonte

Google ha annunciato a IO 2026 i suoi nuovi "audio glasses", occhiali smart che permettono agli utenti di interagire tramite comandi vocali. Questi dispositivi si integrano con l'ecosistema di app e servizi di Google, inclusa la piattaforma Gemini, per eseguire diverse operazioni. L'iniziativa segna un'espansione dell'intelligenza artificiale conversazionale verso dispositivi indossabili, evidenziando la tendenza a portare capacità AI avanzate direttamente all'utente finale, seppur con un backend cloud.

2026-05-19 Fonte

Un recente leak ha rivelato dettagli sul PCB della GPU Intel Xe3P, nome in codice "Crescent Island", destinata ai data center. La scheda integrerà 160GB di memoria LPDDR5X, distribuiti su 20 moduli da 8GB ciascuno, con una banda passante stimata tra 704 e 760 GB/s. Questa scelta strategica di Intel mira a mitigare le attuali carenze di memoria HBM, offrendo una soluzione alternativa per i carichi di lavoro LLM on-premise.

2026-05-19 Fonte