📁 Hardware

Questa sezione Hardware segue il lato pratico dell'infrastruttura AI locale: GPU, NPU, mini PC, acceleratori edge, banda memoria e compromessi energetici che incidono direttamente sulle prestazioni in inferenza. Privilegiamo aggiornamenti con benchmark e note operative utili a decisioni reali, dal laboratorio domestico ai cluster pilota in azienda. Qui puoi confrontare costo totale, vincoli termici e scenari modello-hardware, poi approfondire con la guida pillar hardware e la copertura LLM collegata.

📁 Hardware AI generated

Qwen 3.6 27B: l'FP8 è il compromesso ideale per l'inference locale su Blackwell

Test sul campo con una RTX 6000 Pro 96 GB mostrano che la quantization FP8 offre il miglior equilibrio tra velocità di generazione e stabilità. L'NVFP4 spinge i token al massimo ma introduce instabilità in modalità agente, mentre BF16 è più lento. vLLM si conferma stabile e veloce grazie all'attenzione paginata.

2026-07-05 Fonte

📁 Hardware AI generated

Hon Hai vola a +40% di vendite: la spinta dell’AI server per Nvidia

Il colosso taiwanese Hon Hai (Foxconn) registra un balzo dei ricavi del 40% su base trimestrale, trainato dalla domanda di server AI per Nvidia. Il dato, superiore alle attese, mette in evidenza la pressione sulla catena di fornitura hardware e i riflessi per chi sta valutando deployment on-premise di Large Language Models.

2026-07-05 Fonte

📁 Hardware AI generated

DARPA punta su batterie nucleari da 30 anni per droni autonomi e AI off-grid

Il progetto SYMPHONEE sfrutta lo Stronzio-90 per alimentare droni militari persistenti per decenni. Una scelta che potrebbe cambiare i contorni del calcolo AI edge, riducendo la dipendenza dal cloud e abbattendo il TCO per missioni a lunga durata senza manutenzione energetica.

2026-07-05 Fonte

📁 Hardware AI generated

AMD prepara i driver grafici Linux 7.3: segnali per l'on-premise AI

AMD ha inviato le prime richieste di pull per i driver grafici destinati al kernel Linux 7.3. Il lavoro di staging riflette l’impegno continuativo sullo stack open source, con potenziali implicazioni per le infrastrutture on-premise che usano GPU AMD per inference LLM.

2026-07-05 Fonte

📁 Hardware AI generated

Qwen3.6-27B a Q8: finestra di contesto a 100K su 32 GB di VRAM

Un utente mostra come spingere la finestra di contesto di Qwen3.6-27B a 8 bit fino a 115.000 token su una singola GPU con 32 GB di VRAM, quantizzando la cache KV a diversi livelli. I benchmark su speculative decoding rivelano trade-off tra lunghezza del contesto, velocità d'inference e precisione. Un caso concreto per deployment on-premise su hardware consumer di fascia alta.

2026-07-05 Fonte

📁 Hardware AI generated

L'onda di AI e HPC spinge i ricavi di CHPT a un nuovo picco mensile

La domanda di interfacce di test per chip destinati a carichi AI e HPC ha fatto segnare a Chunghwa Precision Test Tech (CHPT) il fatturato mensile più alto di sempre a giugno. Il dato riflette la pressione sulla filiera dei semiconduttori avanzati, con possibili effetti per chi pianifica deployment on-premise di GPU e acceleratori.

2026-07-05 Fonte

📁 Hardware AI generated

Robot, visori AR e AI PC incidono sui display: l'inference locale cambia le regole

La triade AI PC, occhiali per realtà aumentata e robotica sta ridisegnando le tecnicie di visualizzazione, spostando carichi di inference su dispositivi edge e impattando le scelte hardware per deployment on-premise. Latenza, costi e sovranità dei dati guidano l’evoluzione.

2026-07-05 Fonte

📁 Hardware AI generated

Caldo record e DGX Spark: il comando che scongiura i crash estivi

Un utente Reddit ha condiviso una soluzione per prevenire i blocchi del DGX Spark durante le ondate di calore: underclock della GPU via nvidia-smi. Le temperature crollano da 85°C a 60°C, ripristinando la stabilità. L’episodio accende un riflettore su una sfida spesso trascurata del deployment on-premise: la gestione termica in ambienti non professionali.

2026-07-04 Fonte

📁 Hardware AI generated

Micron rompe il silicio a Hiroshima con 9 miliardi di dollari per la memoria dell’AI

L’azienda avvia l’espansione da 1.500 miliardi di yen per produrre HBM, la memoria impilata che accelera i carichi AI. L’investimento segnala una domanda che plasmerà la disponibilità di GPU e i calcoli del TCO per chi valuta deployment on-premise.

2026-07-04 Fonte

📁 Hardware AI generated

Un guru di Windows adatta un motore Stirling ottocentesco per raffreddare un Threadripper AMD

Un appassionato ha montato un motore Stirling da 40 dollari su un sistema AMD Threadripper 3970X, usando il calore di scarto della CPU per azionare il volano e ottenere raffreddamento ausiliario senza consumare elettricità. Un ritorno a una tecnicia del 1816 che solleva interrogativi sulla gestione termica nei PC ad alte prestazioni.

2026-07-04 Fonte

📁 Hardware AI generated

Linux 7.3 accoglie nuovi PCI ID per le GPU Intel Nova Lake S

Il ramo drm-xe-next del kernel Linux 7.3 inizia a includere gli identificatori PCI per le future GPU Intel Nova Lake S. L’enablement prosegue mentre cresce l’interesse verso soluzioni grafiche Intel per carichi di lavoro on-premise, anche se la strada per una maturità software competitiva è ancora lunga.

2026-07-04 Fonte

📁 Hardware AI generated

Linux 7.2-rc2 porta a 256 il limite di core CPU per RISC-V 64-bit

Una modifica nel kernel Linux, pronta per la prossima release candidate, innalza il tetto predefinito di core supportati per l’architettura RISC-V a 64 bit. Il nuovo valore di 256 core indica l’arrivo imminente di processori many-core pensati per server e carichi di lavoro paralleli.

2026-07-04 Fonte

📁 Hardware AI generated

HP OmniBook Ultra 14: Snapdragon e autonomia da record, ma il prezzo fa discutere

Il nuovo portatile HP con Snapdragon promette prestazioni brillanti e lunga durata, ma il posizionamento di prezzo solleva interrogativi. Per chi valuta l’esecuzione locale di LLM, il passaggio ad ARM modifica i vincoli tradizionali.

2026-07-03 Fonte

📁 Hardware AI generated

HP OmniBook Ultra 14: autonomia e Snapdragon spingono l’IA locale, ma il prezzo è premium

La recensione dell'OmniBook Ultra 14 conferma potenza Snapdragon e autonomia eccellente, ma il prezzo resta alto. Per chi valuta esecuzione di LLM in locale, il SoC ARM con NPU integrata apre scenari di edge inference a basso consumo, preservando la sovranità dei dati.

2026-07-03 Fonte

📁 Hardware AI generated

Intel accelera il supporto a Nova Lake con Xe3P per Linux 7.3

Le prime patch per il kernel Linux 7.3 concentrano gli sforzi sulla grafica integrata della futura architettura Nova Lake e sul motore Xe3P. L’abilitazione open source del driver diventa un tassello cruciale per chi valuta l’inference LLM on-premise su piattaforme Intel, dove il controllo dei dati e l’efficienza hardware contano più della potenza bruta.

2026-07-03 Fonte

📁 Hardware AI generated

NVIDIA abbraccia l'open source per la gestione dei server AI: ecco cosa cambia

Il colosso avvia l'upstreaming del Device Tree per il BMC della piattaforma Vera Rubin VR-NVL, segnando un passo importante verso il supporto a OpenBMC. Un'apertura che promette maggiore controllo infrastrutturale per chi fa deployment on-premise di LLM.

2026-07-03 Fonte

📁 Hardware AI generated

Intel 18A: risolti i problemi di resa, produzione a 15.000 wafer al mese

Secondo un report, Intel avrebbe superato i colli di bottiglia nella resa wafer-to-wafer del nodo 18A, portando la produzione a 15.000 wafer mensili in due stabilimenti. Un passo decisivo per la catena di fornitura di chip per server e acceleratori IA.

2026-07-03 Fonte

📁 Hardware AI generated

La giacca di Jensen Huang all'asta per 60.000 dollari: il simbolo del boom dell'hardware AI

Sotheby’s mette all’asta la giacca di pelle firmata indossata dal CEO NVIDIA al Foxconn Tech Day 2023. Un cimelio che riflette l’ascesa della domanda di infrastrutture per LLM on-premise e la centralità della catena produttiva taiwanese.

2026-07-03 Fonte

📁 Hardware AI generated

Infineon Cina contesta la rimozione dei GaN alla fiera di Shanghai

La filiale cinese di Infineon reagisce dopo che i suoi prodotti al nitruro di gallio sono stati tolti da un evento a Shanghai. La vicenda getta luce sul ruolo cruciale del GaN nell’efficienza energetica dei data center e sulle tensioni crescenti nelle filiere dei semiconduttori per l’AI.

2026-07-03 Fonte

📁 Hardware AI generated

Turvo punta sulla robotica: l’edge computing incontra l’inference locale

La taiwanese Turvo conferma il pieno controllo manageriale e rilancia i piani di espansione nella robotica. Un segnale che rafforza la convergenza tra automazione e AI on-premise, spingendo verso hardware specializzato per l’inference locale.

2026-07-03 Fonte