📁 Hardware

Questa sezione Hardware segue il lato pratico dell'infrastruttura AI locale: GPU, NPU, mini PC, acceleratori edge, banda memoria e compromessi energetici che incidono direttamente sulle prestazioni in inferenza. Privilegiamo aggiornamenti con benchmark e note operative utili a decisioni reali, dal laboratorio domestico ai cluster pilota in azienda. Qui puoi confrontare costo totale, vincoli termici e scenari modello-hardware, poi approfondire con la guida pillar hardware e la copertura LLM collegata.

Il kernel Linux 7.2 si prepara ad accogliere il supporto per il Cache Aware Scheduling, una funzionalità attesa che promette di ottimizzare le prestazioni sui processori dotati di multiple cache di ultimo livello. Questa integrazione, prevista prima dell'apertura della finestra di merge, rappresenta un passo significativo per l'efficienza dei sistemi Linux, in particolare per i carichi di lavoro che richiedono un'attenta gestione delle risorse hardware on-premise.

2026-05-20 Fonte

Team Group ha raggiunto un accordo da 1,1 milioni di dollari in una causa per pubblicità ingannevole. La controversia riguarda le memorie T-Force Xtreem ARGB DDR4-3600 CL14, le cui velocità pubblicizzate richiedevano modifiche al BIOS e impostazioni di overclocking per essere raggiunte. Questo episodio solleva questioni sulla trasparenza delle specifiche hardware, un aspetto cruciale per i decision-maker che valutano infrastrutture on-premise per carichi di lavoro AI/LLM.

2026-05-20 Fonte

SpacemiT ha rilasciato i primi benchmark del suo SoC K3, basato su core RISC-V X100 e conforme allo standard RVA23. Questa piattaforma, disponibile anche in formato Pico-ITX, rappresenta una delle prime soluzioni RISC-V RVA23 pronte per l'uso con sistemi operativi come Ubuntu 26.04 LTS. L'introduzione di hardware RISC-V come il K3 è rilevante per le aziende che esplorano alternative on-premise per carichi di lavoro AI, offrendo nuove opzioni per il controllo e la sovranità dei dati.

2026-05-20 Fonte

AMD si prepara a lanciare il suo Ryzen AI Halo PC, un sistema desktop con 128GB di memoria di sistema e un prezzo di 3999 dollari. Questa configurazione mira a supportare carichi di lavoro AI e LLM in locale, offrendo una soluzione per le aziende che cercano maggiore controllo sui dati e latenza ridotta rispetto alle opzioni cloud.

2026-05-20 Fonte

Neurosoft Bioelectronics ha chiuso un round di finanziamento seed da 7,5 milioni di dollari, portando il totale a oltre 20 milioni. L'azienda svizzera sviluppa interfacce cervello-computer (BCI) minimamente invasive con elettrodi morbidi e scalabili. L'obiettivo è creare una piattaforma di dati neurali per modelli fondamentali della corteccia umana, migliorando le prestazioni delle BCI. I fondi supporteranno l'avanzamento clinico e la commercializzazione negli Stati Uniti.

2026-05-20 Fonte

Un'analisi approfondita delle prestazioni dei Large Language Models Qwen3.6 su una GPU RTX 5080 da 16GB rivela risultati sorprendenti. Il benchmark, focalizzato su scenari di deployment on-premise, evidenzia come il modello 35B MoE raggiunga 56 token/secondo con un contesto di 128k. Contrariamente alle aspettative, la funzionalità Multi-Token Prediction (MTP) di llama.cpp non offre vantaggi significativi in questo scenario, suggerendo ottimizzazioni diverse per massimizzare l'efficienza su hardware locale.

2026-05-20 Fonte

Alibaba ha presentato il processore AI Zhenwu M890, una roadmap pluriennale per il silicio e il nuovo LLM Qwen 3.7-Max. Questa mossa strategica mira a costruire uno stack AI integrato, focalizzato sugli AI agenti e sulla sovranità tecnicica, riducendo la dipendenza da fornitori esterni. L'investimento massiccio e l'esperienza di deployment preesistente evidenziano un impegno a lungo termine nel settore.

2026-05-20 Fonte

Alibaba T-Head, la divisione semiconduttori del colosso cinese, sta intensificando il proprio impegno nello sviluppo di infrastrutture dedicate all'intelligenza artificiale. L'introduzione del Zhenwu M890 segna un passo significativo in questa direzione, puntando a rafforzare le capacità di calcolo per carichi di lavoro AI. Questa mossa evidenzia la crescente importanza di soluzioni hardware proprietarie per gestire le esigenze computazionali degli LLM e dell'AI generativa, con implicazioni per le strategie di deployment on-premise e ibride.

2026-05-20 Fonte

ASML si prepara a consegnare i primi sistemi di litografia High-NA EUV nei prossimi mesi. Questa tecnicia è cruciale per la produzione di chip di nuova generazione, fondamentali per l'avanzamento dell'intelligenza artificiale e dei Large Language Models. Tuttavia, le preoccupazioni sui costi associati a questa innovazione sollevano interrogativi sul TCO per le infrastrutture AI on-premise.

2026-05-20 Fonte

Alibaba, tramite la sua divisione T-Head, ha svelato il Zhenwu M890, un nuovo chip AI di classe GPU. Questo sviluppo segna un passo significativo nella strategia cinese di creare alternative hardware domestiche ai prodotti NVIDIA, in un contesto di crescenti controlli sulle esportazioni. L'azienda ha dichiarato che il chip è già in produzione di massa su larga scala.

2026-05-20 Fonte

Al Tech Forum 2026, il raffreddamento a liquido è emerso come soluzione indispensabile per i server AI. La crescente densità di potenza degli stack hardware dedicati all'intelligenza artificiale, essenziali per i Large Language Models, spinge verso l'adozione di tecnicie di dissipazione termica più efficienti. Il Dr. Clyde Chu di META Green Cooling Technology ha evidenziato questa transizione, sottolineando l'importanza di affrontare le sfide termiche nei deployment on-premise.

2026-05-20 Fonte

Le case automobilistiche stanno intensificando la collaborazione con Taiwan per velocizzare lo sviluppo di elettronica avanzata per i veicoli. Questa mossa strategica riflette la crescente domanda di capacità di calcolo per l'intelligenza artificiale a bordo, i sistemi ADAS e l'infotainment. La scelta di Taiwan sottolinea il ruolo cruciale dell'isola nella catena di fornitura globale dei semiconduttori, fondamentale per l'innovazione e il deployment di soluzioni AI on-premise e edge.

2026-05-20 Fonte

Un utente ha espresso l'intenzione di aggiornare la propria VRAM da 32GB a 48GB per carichi di lavoro LLM locali. Questa mossa evidenzia l'importanza della memoria video per il deployment on-premise di Large Language Models, dove la capacità hardware è un fattore critico. L'articolo esplora i trade-off e le considerazioni tecniche per chi gestisce LLM su infrastrutture self-hosted, analizzando come la VRAM influenzi le scelte di modello e le performance.

2026-05-20 Fonte

L'introduzione della GPU Nvidia H200, un componente cruciale per i carichi di lavoro AI più esigenti, si scontra con un contesto geopolitico complesso, in particolare le restrizioni all'export verso la Cina. Questa situazione solleva interrogativi significativi per le aziende che pianificano deployment di Large Language Models (LLM) on-premise, influenzando la disponibilità hardware, i costi e le strategie di sovranità dei dati.

2026-05-20 Fonte

La crescente domanda di memoria ad alte prestazioni, spinta dall'espansione dell'intelligenza artificiale, sta creando una stretta sull'offerta globale. Secondo i media coreani, questa dinamica sta indebolendo il potere negoziale di aziende come Apple, che si trovano a fronteggiare costi più elevati e disponibilità ridotta per componenti cruciali. Il fenomeno evidenzia le sfide infrastrutturali e di supply chain che le aziende devono affrontare per sostenere lo sviluppo e il deployment di soluzioni AI.

2026-05-20 Fonte

Google ha annunciato a IO 2026 i suoi nuovi "audio glasses", occhiali smart che permettono agli utenti di interagire tramite comandi vocali. Questi dispositivi si integrano con l'ecosistema di app e servizi di Google, inclusa la piattaforma Gemini, per eseguire diverse operazioni. L'iniziativa segna un'espansione dell'intelligenza artificiale conversazionale verso dispositivi indossabili, evidenziando la tendenza a portare capacità AI avanzate direttamente all'utente finale, seppur con un backend cloud.

2026-05-19 Fonte

Un recente leak ha rivelato dettagli sul PCB della GPU Intel Xe3P, nome in codice "Crescent Island", destinata ai data center. La scheda integrerà 160GB di memoria LPDDR5X, distribuiti su 20 moduli da 8GB ciascuno, con una banda passante stimata tra 704 e 760 GB/s. Questa scelta strategica di Intel mira a mitigare le attuali carenze di memoria HBM, offrendo una soluzione alternativa per i carichi di lavoro LLM on-premise.

2026-05-19 Fonte

AMD ha rilasciato i dettagli della sua nuova serie di processori EPYC 8005, basata su architettura Zen 5. Con configurazioni fino a 84 core e un TDP di 225W, questa linea rappresenta un'evoluzione significativa per i server, offrendo un equilibrio tra densità di core ed efficienza energetica. La serie è destinata a rafforzare le capacità per i deployment on-premise, supportando carichi di lavoro intensivi e rispondendo alle esigenze di sovranità dei dati e TCO.

2026-05-19 Fonte

AMD ha svelato ulteriori dettagli sulla serie di processori EPYC 8005 "Sorano", successore della EPYC 8004 "Siena". Con SKU che spaziano da 8 a 84 core, questi nuovi chip sono cruciali per le aziende che pianificano deployment on-premise di carichi di lavoro AI, offrendo maggiore controllo e ottimizzazione del TCO. La disponibilità di specifiche complete permette ora una valutazione approfondita per architetture self-hosted.

2026-05-19 Fonte

Amprius Technologies, specializzata in batterie ad anodo di silicio ad alta densità energetica, ha siglato una partnership con Matternet, azienda certificata per le consegne tramite droni. La collaborazione prevede la fornitura di celle agli ioni di litio SiCore® di Amprius per i droni autonomi di Matternet, con l'obiettivo di estendere significativamente la loro autonomia operativa. Questo progresso è cruciale per l'efficienza dei sistemi edge e per l'AI distribuita.

2026-05-19 Fonte