📁 Hardware

Questa sezione Hardware segue il lato pratico dell'infrastruttura AI locale: GPU, NPU, mini PC, acceleratori edge, banda memoria e compromessi energetici che incidono direttamente sulle prestazioni in inferenza. Privilegiamo aggiornamenti con benchmark e note operative utili a decisioni reali, dal laboratorio domestico ai cluster pilota in azienda. Qui puoi confrontare costo totale, vincoli termici e scenari modello-hardware, poi approfondire con la guida pillar hardware e la copertura LLM collegata.

📁 Hardware AI generated

Apple cita OpenAI: accuse di furto di segreti hardware

Apple accusa OpenAI di aver incoraggiato ex dipendenti a portare con sé prototipi riservati, presentazioni confidenziali e dettagli critici sulla catena di fornitura. Una battaglia legale che mette in luce la posta in gioco per chi sviluppa hardware AI proprietario e il suo impatto sulle strategie di deployment on-premise e la sovranità tecnicica.

2026-07-10 Fonte

📁 Hardware AI generated

NVIDIA prepara la RTX 5090 SE: cosa significa per chi sceglie l'on-premise

Un rumor su un nuovo SKU consumer riapre il dibattito sull'uso delle GPU GeForce per fare inference LLM in locale. Senza specifiche ufficiali, AI-RADAR analizza perché ogni variante della fascia alta impatta VRAM, TCO e accessibilità del self-hosting.

2026-07-10 Fonte

📁 Hardware AI generated

ASUS Thermal Lab Tour 2026: i server AI fuori dalla comfort zone

Un viaggio nel centro di collaudo termico ASUS rivela come i server per l’AI vengono spinti al limite per garantirne affidabilità e durabilità. Un aspetto decisivo per chi valuta il self-hosting di carichi LLM, dove il controllo diretto sull’hardware è irrinunciabile.

2026-07-10 Fonte

📁 Hardware AI generated

SK hynix e TetraMem: chip memristivo per l'AI edge, ma le prestazioni restano un’incognita

La collaborazione tra il gigante delle memorie e la startup californiana promette efficienza energetica per l'inference a bordo macchina, ma i dati concreti sulla potenza di calcolo non ci sono ancora.

2026-07-10 Fonte

📁 Hardware AI generated

Strix Halo: inference LLM da 50 token/s a 48 centesimi al giorno

Un utente mostra come un sistema basato su APU Strix Halo gestisca un LLM da 35 miliardi di parametri in locale, consumando meno di 150W e con costi energetici irrisori. Un confronto con le GPU discrete illumina nuovi parametri di valutazione per il deployment on-premise.

2026-07-10 Fonte

📁 Hardware AI generated

SK hynix si quota negli USA e raccoglie 26,5 miliardi per la memoria HBM: cosa significa per l'AI on-premise

La maxi-IPO di SK hynix finanzierà l’espansione della produzione di High Bandwidth Memory, componente sempre più critico per l’addestramento e l’inference dei LLM. Per chi gestisce stack on-premise, l’annuncio segnala un tentativo di ridurre uno dei colli di bottiglia più persistenti: la disponibilità di VRAM a larga banda.

2026-07-10 Fonte

📁 Hardware AI generated

Linux 7.3, AMD accende la seconda pipeline grafica sugli APU: cosa cambia per i carichi AI locali

AMD ha inviato nuovi aggiornamenti ai driver AMDGPU e AMDKFD per Linux 7.3, puntando ad attivare una seconda pipeline grafica sugli APU più recenti. L’intervento, apparentemente di nicchia, può influenzare l’elaborazione visiva e parallela, con ricadute sugli scenari di inference locale basati su chip con grafica integrata.

2026-07-10 Fonte

📁 Hardware AI generated

HBM ribaltato: la sfida al calore della memoria AI riparte da Corea e Giappone

Due nuovi design coreani e giapponesi provano a superare i limiti termici della memoria impilata. Più banda e stack più densi senza friggere le GPU: un segnale per chi fa inference on-premise e deve domare consumi e raffreddamento.

2026-07-10 Fonte

📁 Hardware AI generated

Il microscopio di diamante che punta a diventare il nuovo ASML d’Europa

QuantumDiamonds, spin-off del Politecnico di Monaco, raccoglie 91 milioni per scalare un sistema di ispezione basato su centri NV nel diamante. L’obiettivo è ridurre il gap produttivo europeo nei chip, con ricadute concrete sulla disponibilità di hardware per l’AI on-premise.

2026-07-10 Fonte

📁 Hardware AI generated

Linux sbarca sui chip Apple M3 Pro, Max e Ultra: cosa significa per l'AI locale

Nuove patch per Device Tree permettono di avviare Linux anche sui SoC Apple M3 Pro, Max e Ultra. Per ora solo console, senza accelerazione grafica, ma il tassello avvicina il sogno di usare l’hardware Apple per carichi AI on-premise, sfruttando la memoria unificata. Chi segue il self-hosting di LLM prende appunti: la strada è lunga, ma i primi mattoni sono posati.

2026-07-10 Fonte

📁 Hardware AI generated

Driver Vulkan Intel su Linux: l’ottimizzazione HiZ plane regala qualche frame in più

Dopo due anni in coda, il driver open-source ANV Vulkan di Intel integra la compressione HiZ plane, portando un miglioramento dei frame rate fino a qualche punto percentuale nei carichi grafici su GPU Intel recenti. Un piccolo passo che segnala la maturazione dello stack open-source, rilevante anche per chi valuta hardware on-prem per carichi computazionali.

2026-07-10 Fonte

📁 Hardware AI generated

Samsung Gaia: l'NPU per PC testato da HP e Lenovo cambia l'AI locale

Samsung starebbe preparando il lancio dell'acceleratore Gaia per PC, con HP e Lenovo già impegnate nella validazione dell'NPU. L'arrivo di unità neurali dedicate sui dispositivi client segna un passo decisivo verso l'inference locale di LLM e modelli ridotti, spostando il baricentro del deployment dal cloud all'edge. L'analisi delle implicazioni per la sovranità dei dati, il TCO e l'architettura ibrida.

2026-07-10 Fonte

📁 Hardware AI generated

ASE Holdings vola: ricavi record e 40 milioni sulla Corea del Sud per il packaging AI

ASE Holdings registra ricavi record nel Q2 2026 e investe 40 milioni di dollari in Corea del Sud, cavalcando la domanda esplosiva di packaging avanzato per l’intelligenza artificiale. Un segnale che la capacità di assemblaggio dei chip AI sta diventando cruciale per le infrastrutture on-premise e la sovranità dei dati.

2026-07-10 Fonte

📁 Hardware AI generated

SK Hynix rompe il record di Alibaba in Borsa, ma la nuova memoria HBM slitta al 2028

SK Hynix ha infranto il record di Alibaba per la più grande quotazione statunitense, raccogliendo capitale fresco. Tuttavia i clienti che aspettano memoria HBM dovranno attendere fino al 2028 per vedere la capacità che quei fondi andranno a finanziare. Un segnale chiaro per chi pianifica infrastrutture AI: le strozzature hardware sono lontane dall’essere risolte.

2026-07-10 Fonte

📁 Hardware AI generated

LLVM Clang accoglie il core NVIDIA Rigel: la CPU Rosa si prepara al debutto

NVIDIA ha rilasciato il supporto iniziale per il nuovo core Arm "Rigel" in GCC e LLVM Clang, in vista del lancio della CPU Rosa. La mossa segnala un'accelerazione nella strategia di integrazione verticale per i carichi AI, con ricadute su efficienza e sovranità dei deployment on-premise.

2026-07-10 Fonte

📁 Hardware AI generated

JCET investe 1,4 miliardi di dollari nel packaging per l’AI: la Cina rafforza la filiera degli acceleratori

Il principale OSAT cinese punta sull’espansione della capacità di packaging avanzato per chip AI, sostenuto da ordini interni in forte crescita. Una mossa che ridisegna gli equilibri nella fornitura di hardware per LLM, con ripercussioni su costi, disponibilità e sovranità tecnicica per i deployment on-premise.

2026-07-10 Fonte

📁 Hardware AI generated

TSMC: 200mila wafer CoWoS nel 2027. Cosa cambia per l’AI on-premise

Secondo fonti di DIGITIMES, TSMC raggiungerà una capacità di 200mila wafer all’anno nel 2027 per il packaging CoWoS, un processo cruciale per i chip AI di Nvidia e non solo. L’espansione è colossale ma basterà a soddisfare la domanda di infrastrutture on-premise? L’analisi di AI-RADAR.

2026-07-10 Fonte

📁 Hardware AI generated

Prezzi HBM verso il raddoppio: l’impatto sui cluster AI e sul deployment on-premise

La domanda di AI e i contratti di fornitura stringono il mercato della memoria: le banche HBM, cruciali per GPU e training LLM, potrebbero costare il doppio entro il 2027. I costi dell’hardware on-premise cresceranno, ma le implicazioni strutturali vanno oltre il prezzo.

2026-07-10 Fonte

📁 Hardware AI generated

CHPT: l'IA metterà sotto pressione la capacità e ridisegnerà le priorità di Taiwan

Il presidente di CHPT ha dichiarato che la crescente domanda di IA metterà sotto pressione la capacità produttiva dei semiconduttori e forzerà una ridefinizione delle priorità industriali di Taiwan. Un segnale che ha implicazioni profonde per chi pianifica deployment on-premise e per l'intero ecosistema hardware dell'IA.

2026-07-10 Fonte

📁 Hardware AI generated

OLED 8.6G e PC AI: BOE accelera, il vero margine è nell'inference locale

Gli utili di BOE volano su recupero LCD e ramp-up dei pannelli OLED di ottava generazione per PC AI. Dietro i numeri, una scommessa hardware che sposta il baricentro dell'elaborazione LLM verso il dispositivo. Il boom di schermi efficienti e a costo decrescente ridisegna la convenienza del deployment on-premise e alimenta un ecosistema di laptop progettati per l'inference locale, con ricadute su sovranità dei dati e TCO.

2026-07-10 Fonte

1 2 3 … … 101 102 103 Succ →