📁 Hardware

Questa sezione Hardware segue il lato pratico dell'infrastruttura AI locale: GPU, NPU, mini PC, acceleratori edge, banda memoria e compromessi energetici che incidono direttamente sulle prestazioni in inferenza. Privilegiamo aggiornamenti con benchmark e note operative utili a decisioni reali, dal laboratorio domestico ai cluster pilota in azienda. Qui puoi confrontare costo totale, vincoli termici e scenari modello-hardware, poi approfondire con la guida pillar hardware e la copertura LLM collegata.

📁 Hardware AI generated

ASE: la capacità di packaging sotto sforzo per l'AI fino al 2030

ASE Technology Holding avverte: la domanda di chip AI manterrà le linee di packaging avanzato sotto pressione per tutto il decennio. Un collo di bottiglia che si ripercuote sulla disponibilità e sul costo dell’hardware per chi pianifica deployment on-premise di modelli linguistici di grandi dimensioni.

2026-06-25 Fonte

📁 Hardware AI generated

LLM giganti su stack multi-GPU: la comunità interroga la tenuta del 4-bit

Un utente con un cluster da 4-8 GPU NVIDIA RTX 6000 Pro chiede esperienze concrete su modelli come DeepSeek V4 Pro e GLM 5.2 in quantization a 4 bit. Il dubbio: la compressione penalizza troppo i carichi agentici e di programmazione rispetto agli 8 bit? Un punto d’osservazione che riapre la partita fra densità di VRAM e fedeltà di ragionamento nei deployment on-premise.

2026-06-25 Fonte

📁 Hardware AI generated

Coplus sviluppa fari AI con il supporto di Nvidia: l'inference arriva sull'auto

L'azienda Coplus sta lavorando a fari anteriori intelligenti basati sull'AI, con il supporto tecnicico di Nvidia. L'obiettivo è integrare capacità di inference direttamente sul veicolo, per migliorare sicurezza e funzionalità di illuminazione. Una mossa che segnala l'accelerazione dell'edge computing nel settore automotive.

2026-06-25 Fonte

📁 Hardware AI generated

Nvidia punta su ottica co-packaged: la roadmap CPO incontra TSMC COUPE

Nvidia guarda all’ottica co-packaged come leva per la prossima generazione di infrastrutture AI. Al centro della roadmap c’è la piattaforma COUPE di TSMC, che integra fotonica e silicio per interconnessioni più efficienti. Per chi gestisce cluster on-premise, il passaggio a CPO promette densità, consumi ridotti e latenza minima, ridisegnando i vincoli progettuali dei data center dedicati ai modelli linguistici e al training su larga scala.

2026-06-25 Fonte

📁 Hardware AI generated

Micron e il buyback che svela la dipendenza dell’AI dalla memoria

Micron avvia un buyback miliardario mentre l’industria tech combatte una carenza di memoria ad alta larghezza di banda. Un segnale che la partita dell’AI si gioca su chip sempre più assetati di dati.

2026-06-25 Fonte

📁 Hardware AI generated

Qualcomm integra Dragonfly nel datacenter: partnership con Hugging Face si espande

Qualcomm rafforza la collaborazione con Hugging Face integrando i sistemi Dragonfly per data center. L’intesa facilita l’esecuzione di LLM open-source su hardware Qualcomm, con potenziali benefici in termini di efficienza, controllo dei dati e TCO per chi adotta strategie on-premise.

2026-06-25 Fonte

📁 Hardware AI generated

OpenAI debutta con il silicio Broadcom-TSMC: ora anche i creatori di modelli inseguono l’efficienza hardware

Il nuovo chip inferenziale progettato da Broadcom e costruito da TSMC segna l’ingresso di OpenAI nella corsa al silicio personalizzato. Una svolta che ridisegna gli equilibri nella supply chain e pone le basi per un futuro in cui anche i carichi on-premise potrebbero beneficiare di architetture ottimizzate, con TCO più basso e maggiore controllo sui dati.

2026-06-25 Fonte

📁 Hardware AI generated

Qualcomm sfida Nvidia con i chip Dragonfly e l'accordo con Meta

Qualcomm sbarca nei data center con la linea Dragonfly, un accordo con Meta e l’obiettivo di insidiare il dominio Nvidia. Un segnale per chi cerca alternative hardware nell'AI.

2026-06-25 Fonte

📁 Hardware AI generated

NAND, carenza fino al 2027: Phison avverte, ordini già pieni per il Q2

La controllante di flash memory Phison segnala che la carenza di chip NAND non accenna a finire, con ordini prenotati fino al secondo trimestre 2027. Uno scenario che impone alle aziende che gestiscono infrastrutture on-premise di rivedere tempistiche e costi per storage e server AI.

2026-06-25 Fonte

📁 Hardware AI generated

Jalapeño: il chip di OpenAI e Broadcom per l’inference LLM su scala industriale

OpenAI e Broadcom annunciano Jalapeño, un chip custom progettato per l'inference dei Large Language Model nei data center. Primo tassello di un progetto a lungo termine, punta a ridefinire efficienza e costi dell'inference su larga scala. AI-RADAR analizza le implicazioni per chi valuta stack on-premise.

2026-06-24 Fonte

📁 Hardware AI generated

Qualcomm Investor Day 2026: CPU Dragonfly C1000, memorie HBM alternative e acceleratori AI

Al suo Investor Day 2026 Qualcomm ha presentato la CPU Dragonfly C1000, una soluzione di memoria ad alta larghezza di banda proprietaria come alternativa all’HBM e nuovi acceleratori AI. L’incursione nei rack dei data center segnala un cambio di passo che potrebbe ridefinire gli equilibri per chi cerca stack on-premise ad alte prestazioni e maggiore sovranità sui carichi di inference.

2026-06-24 Fonte

📁 Hardware AI generated

Il primo chip di OpenAI: Jalapeño, ASIC inference reticle-size sviluppato con Broadcom in 9 mesi

Broadcom e OpenAI hanno presentato Jalapeño, il primo processore customizzato di OpenAI. È un ASIC gigantesco, grande quanto l’intero reticolo litografico, ottimizzato esclusivamente per l’inference, e realizzato in soli nove mesi. L'architettura su misura segna un’accelerazione nella corsa al silicio proprietario per carichi LLM, con implicazioni sui costi e sulla sovranità dei dati per chi gestisce deployment in sede.

2026-06-24 Fonte

📁 Hardware AI generated

xLight raccoglie 350 milioni per sfidare ASML nella litografia EUV

Una startup californiana sostenuta da capitali USA e guidata da Pat Gelsinger punta a costruire una sorgente di luce EUV concorrente. Il mercato dell'hardware per AI torna a scaldarsi, e questo investimento segnala un possibile allentamento della morsa di ASML sulla produzione di semiconduttori avanzati, con potenziali effetti a catena per chi fa deployment on-premise di LLM.

2026-06-24 Fonte

📁 Hardware AI generated

La Cina scala la classifica dei supercomputer con un colosso solo-CPU da 2,198 exaflops, senza GPU

Un sistema puramente a processori ha raggiunto 2,198 exaflops, scalzando El Capitan e segnando un punto di svolta per chi valuta infrastrutture di calcolo senza acceleratori. L'architettura completamente CPU riapre il confronto su costi, approvvigionamento e prestazioni per workload di inference e training on-premise.

2026-06-24 Fonte

📁 Hardware AI generated

SilverStone RM32: chassis 3U e PSU Platinum per costruire un server AI on-premise compatto

Il nuovo chassis rack 3U di SilverStone ospita schede madri E-ATX/SSI-EEB, un radiatore a liquido da 360 mm e fino a quattro schede di espansione full-size. Abbinato all'alimentatore 1000Rz Platinum da 1000 W, offre un telaio ad alta densità pensato per carichi AI self-hosted dove spazio e sovranità dei dati contano.

2026-06-24 Fonte

📁 Hardware AI generated

OpenAI presenta Jalapeño: il primo processore custom per l’inference LLM con Broadcom

OpenAI ha svelato Jalapeño, il suo primo chip custom progettato insieme a Broadcom per ottimizzare i carichi di inference dei Large Language Models. Una mossa che apre scenari inediti per l’hardware specializzato nell’AI, con potenziali ricadute su costi ed efficienza anche per chi valuta deployment on-premise.

2026-06-24 Fonte

📁 Hardware AI generated

AMD espone le curve Gamma 2.4 e 2.6 nel driver Linux: più precisione cromatica per le GPU open source

Mentre si avvicina il debutto dell’HDMI 2.1 per il driver open source AMDGPU, nuovi patch aggiungono il supporto alle curve Gamma 2.4 e 2.6. L’aggiornamento colma un divario nella gestione del colore su Linux, con ricadute per post-produzione, diagnostica per immagini e workstation locali usate anche per l’addestramento di modelli AI.

2026-06-24 Fonte

📁 Hardware AI generated

L'AI che progetta chip radio: algoritmi al posto dell'esperienza artigianale

Alla Princeton, i ricercatori usano apprendimento per rinforzo e modelli diffusivi per creare circuiti integrati RF da zero, battendo le prestazioni dei progetti umani e riducendo i tempi di sviluppo. La svolta esige ora dataset condivisi e un ecosistema aperto.

2026-06-24 Fonte

📁 Hardware AI generated

OpenAI e Broadcom svelano Jalapeño, il chip su misura per l’inference LLM

La collaborazione tra OpenAI e Broadcom dà vita a un processore custom ottimizzato per l’inference di modelli di linguaggio di grandi dimensioni. L’annuncio di Jalapeño segna un’accelerazione verso hardware specializzato, con possibili ricadute su efficienza e sovranità dei dati per i deployment aziendali.

2026-06-24 Fonte

📁 Hardware AI generated

Il supercomputer cinese LineShine guida la TOP500, ma il dominio AI è tutt'altro che scontato

Il sistema del National Supercomputing Centre di Shenzhen ha conquistato il primo posto nella classifica TOP500. Il primato conferma la potenza di calcolo cinese, ma gli analisti avvertono: la supremazia nell'intelligenza artificiale on-premise passa per scelte hardware e software ben più complesse.

2026-06-24 Fonte