📁 Hardware

Questa sezione Hardware segue il lato pratico dell'infrastruttura AI locale: GPU, NPU, mini PC, acceleratori edge, banda memoria e compromessi energetici che incidono direttamente sulle prestazioni in inferenza. Privilegiamo aggiornamenti con benchmark e note operative utili a decisioni reali, dal laboratorio domestico ai cluster pilota in azienda. Qui puoi confrontare costo totale, vincoli termici e scenari modello-hardware, poi approfondire con la guida pillar hardware e la copertura LLM collegata.

Segnalato un significativo aumento di velocità nell'elaborazione dei prompt con llama.cpp e ROCm su Strix Halo (Ryzen AI Max). I test mostrano miglioramenti fino al 132% in alcuni modelli, aprendo nuove prospettive per l'inference di LLM su hardware AMD integrato. Tuttavia, è stato evidenziato che la performance elevata potrebbe essere dovuta a un bug temporaneo.

2026-02-16 Fonte

La Corsair AI Workstation 300 combina potenza e dimensioni ridotte, integrando il processore Strix Halo. Questo sistema si presenta come una soluzione elegante, sebbene con un prezzo non trascurabile. Ideale per chi cerca prestazioni elevate in un formato compatto.

2026-02-16 Fonte

Un tentativo di overclocking spinto all'estremo con azoto liquido ha danneggiato irreparabilmente una scheda grafica MSI RTX 5090 Lightning Z. L'eccessiva tensione fornita dal BIOS XOC da 2500W ha causato una rottura del core della GPU per shock termico.

2026-02-16 Fonte

Quattro aziende cinesi competono per fornire GPU ad alte prestazioni per l'inference di modelli di linguaggio di grandi dimensioni (LLM). La spinta è motivata dalla crescente domanda di soluzioni on-premise e dalla necessità di sovranità tecnicica nel settore dell'intelligenza artificiale.

2026-02-16 Fonte

Intel intensifica la competizione nel settore AI PC, con un occhio di riguardo alle memorie ZAM. Cresce la sfida tra le tecnicie HBM3 e HBM4, cruciali per le prestazioni dei carichi di lavoro di intelligenza artificiale. Il mercato è in rapida evoluzione.

2026-02-16 Fonte

Un utente esplora la configurazione di un ambiente LLM locale come progetto di apprendimento, chiedendo consigli su hardware, stack di inference, errori da evitare e modelli pratici su GPU consumer. La discussione mira a raccogliere esperienze dirette per ottimizzare la configurazione.

2026-02-15 Fonte

Ricercatori cinesi hanno sviluppato una tecnica di stampa 3D che utilizza campi di luce olografici per fabbricare oggetti complessi in scala millimetrica in tempi record. Questa tecnicia potrebbe rivoluzionare la microfabbricazione, aprendo nuove possibilità in diversi settori.

2026-02-15 Fonte

La NASA ha compiuto un ulteriore passo verso rover di superficie autonomi, utilizzando l'AI per generare i punti di passaggio del rover Perseverance. Il modello, basato su Claude AI di Anthropic, ha analizzato immagini orbitali e modelli digitali di elevazione per identificare pericoli e generare un percorso sicuro, permettendo al rover di percorrere 456 metri senza controllo umano. L'AI è destinata a svolgere un ruolo sempre più importante nell'esplorazione planetaria.

2026-02-15 Fonte

Un rapporto rivela che un'arma laser mobile del Pentagono, il LOCUST, ha abbattuto per errore dei palloncini. L'incidente ha causato la chiusura di un aeroporto dopo che la Customs and Border Protection ha erroneamente creduto che stesse prendendo di mira droni di cartelli messicani.

2026-02-15 Fonte

Una startup di San Francisco afferma di aver integrato neuroni viventi in sistemi di elaborazione AI moderni. Questa tecnicia biologica sarebbe in grado di migliorare la computer vision e la generazione di video. L'azienda, denominata Biological Computing Company, punta a rivoluzionare il campo dell'intelligenza artificiale attraverso l'utilizzo di componenti biologici.

2026-02-15 Fonte

Un utente di Reddit sta sperimentando una workstation locale dotata di 6 GPU (circa 200GB di VRAM) per l'esecuzione concorrente di modelli di ragionamento open-source. L'obiettivo è l'analisi di dati interni e l'automazione del flusso di lavoro. Si cercano consigli su colli di bottiglia, gestione di GPU miste e strategie di scheduling dei modelli.

2026-02-14 Fonte

Il modello OpenAI GPT-5.3-Codex-Spark è ora operativo su chip Cerebras WSE-3, raggiungendo velocità di inference superiori a 1000 token al secondo. Questa performance apre nuove prospettive per applicazioni che richiedono risposte rapide e a bassa latenza.

2026-02-14 Fonte

NVIDIA ha rilasciato un aggiornamento open-source per il driver Nouveau, focalizzato sul supporto della GPU GA100 tramite il processore di sistema GPU (GSP). Questa mossa mira a migliorare la compatibilità e le prestazioni delle GPU NVIDIA con driver open-source.

2026-02-13 Fonte

Un utente ha finalizzato le specifiche del proprio server domestico, dotato di 4 GPU MI50, 2 CPU 8260L e 2TB di RAM DDR4. La configurazione include una VBIOS personalizzata per Linux, aprendo interrogativi sulle possibili ottimizzazioni e carichi di lavoro ideali per tale setup.

2026-02-13 Fonte

Il modello GPT-5.3-Codex-Spark di OpenAI è stato ottimizzato per funzionare sui processori Cerebras WSE-3, raggiungendo una velocità di inference di oltre 1000 token al secondo. Questa performance apre nuove prospettive per applicazioni che richiedono risposte rapide e a bassa latenza.

2026-02-13 Fonte

La Radeon RX 9060 XT 8GB, basata su architettura Navi 44, si riposiziona sul mercato con un prezzo di listino di 299 dollari. Questa mossa mira a fornire una soluzione accessibile per i giocatori con budget limitato, in un contesto di crescente domanda e costi elevati per le GPU dedicate all'intelligenza artificiale.

2026-02-13 Fonte

OpenAI ha implementato GPT-5.3-Codex-Spark su architettura Cerebras, segnando la prima volta che l'azienda si allontana dall'infrastruttura Nvidia per un deployment di produzione. Questa mossa strategica potrebbe avere implicazioni significative per il futuro dell'inference di modelli linguistici di grandi dimensioni.

2026-02-13 Fonte