Segnalato un significativo aumento di velocità nell'elaborazione dei prompt con llama.cpp e ROCm su Strix Halo (Ryzen AI Max). I test mostrano miglioramenti fino al 132% in alcuni modelli, aprendo nuove prospettive per l'inference di LLM su hardware AMD integrato. Tuttavia, è stato evidenziato che la performance elevata potrebbe essere dovuta a un bug temporaneo.
La Corsair AI Workstation 300 combina potenza e dimensioni ridotte, integrando il processore Strix Halo. Questo sistema si presenta come una soluzione elegante, sebbene con un prezzo non trascurabile. Ideale per chi cerca prestazioni elevate in un formato compatto.
Un tentativo di overclocking spinto all'estremo con azoto liquido ha danneggiato irreparabilmente una scheda grafica MSI RTX 5090 Lightning Z. L'eccessiva tensione fornita dal BIOS XOC da 2500W ha causato una rottura del core della GPU per shock termico.
Quattro aziende cinesi competono per fornire GPU ad alte prestazioni per l'inference di modelli di linguaggio di grandi dimensioni (LLM). La spinta è motivata dalla crescente domanda di soluzioni on-premise e dalla necessità di sovranità tecnicica nel settore dell'intelligenza artificiale.
Intel intensifica la competizione nel settore AI PC, con un occhio di riguardo alle memorie ZAM. Cresce la sfida tra le tecnicie HBM3 e HBM4, cruciali per le prestazioni dei carichi di lavoro di intelligenza artificiale. Il mercato è in rapida evoluzione.
Un utente esplora la configurazione di un ambiente LLM locale come progetto di apprendimento, chiedendo consigli su hardware, stack di inference, errori da evitare e modelli pratici su GPU consumer. La discussione mira a raccogliere esperienze dirette per ottimizzare la configurazione.
Ricercatori cinesi hanno sviluppato una tecnica di stampa 3D che utilizza campi di luce olografici per fabbricare oggetti complessi in scala millimetrica in tempi record. Questa tecnicia potrebbe rivoluzionare la microfabbricazione, aprendo nuove possibilità in diversi settori.
La NASA ha compiuto un ulteriore passo verso rover di superficie autonomi, utilizzando l'AI per generare i punti di passaggio del rover Perseverance. Il modello, basato su Claude AI di Anthropic, ha analizzato immagini orbitali e modelli digitali di elevazione per identificare pericoli e generare un percorso sicuro, permettendo al rover di percorrere 456 metri senza controllo umano. L'AI è destinata a svolgere un ruolo sempre più importante nell'esplorazione planetaria.
Un rapporto rivela che un'arma laser mobile del Pentagono, il LOCUST, ha abbattuto per errore dei palloncini. L'incidente ha causato la chiusura di un aeroporto dopo che la Customs and Border Protection ha erroneamente creduto che stesse prendendo di mira droni di cartelli messicani.
Una startup di San Francisco afferma di aver integrato neuroni viventi in sistemi di elaborazione AI moderni. Questa tecnicia biologica sarebbe in grado di migliorare la computer vision e la generazione di video. L'azienda, denominata Biological Computing Company, punta a rivoluzionare il campo dell'intelligenza artificiale attraverso l'utilizzo di componenti biologici.
Un utente di Reddit sta sperimentando una workstation locale dotata di 6 GPU (circa 200GB di VRAM) per l'esecuzione concorrente di modelli di ragionamento open-source. L'obiettivo è l'analisi di dati interni e l'automazione del flusso di lavoro. Si cercano consigli su colli di bottiglia, gestione di GPU miste e strategie di scheduling dei modelli.
Un appassionato ha acquistato due schede grafiche Nvidia GTX Titan X (Maxwell) con sistema di raffreddamento a liquido personalizzato per soli 86 dollari. Si tratta di GPU di punta di precedente generazione, ancora valide per determinati carichi di lavoro.
In occasione del President's Day, MSI propone la GeForce RTX 5060 Ti 8GB Ventus 2X OC Plus al prezzo di listino di 379 dollari. L'offerta include anche la possibilità di acquistare una GPU Blackwell al prezzo consigliato e un alimentatore da 650W in omaggio.
Un esperimento ha messo alla prova audiofili esperti: impossibile distinguere segnali audio trasmessi attraverso cavi di rame, banane o persino fango umido. Il creatore del test si è detto sorpreso dal risultato.
Il modello OpenAI GPT-5.3-Codex-Spark è ora operativo su chip Cerebras WSE-3, raggiungendo velocità di inference superiori a 1000 token al secondo. Questa performance apre nuove prospettive per applicazioni che richiedono risposte rapide e a bassa latenza.
NVIDIA ha rilasciato un aggiornamento open-source per il driver Nouveau, focalizzato sul supporto della GPU GA100 tramite il processore di sistema GPU (GSP). Questa mossa mira a migliorare la compatibilità e le prestazioni delle GPU NVIDIA con driver open-source.
Un utente ha finalizzato le specifiche del proprio server domestico, dotato di 4 GPU MI50, 2 CPU 8260L e 2TB di RAM DDR4. La configurazione include una VBIOS personalizzata per Linux, aprendo interrogativi sulle possibili ottimizzazioni e carichi di lavoro ideali per tale setup.
Il modello GPT-5.3-Codex-Spark di OpenAI è stato ottimizzato per funzionare sui processori Cerebras WSE-3, raggiungendo una velocità di inference di oltre 1000 token al secondo. Questa performance apre nuove prospettive per applicazioni che richiedono risposte rapide e a bassa latenza.
La Radeon RX 9060 XT 8GB, basata su architettura Navi 44, si riposiziona sul mercato con un prezzo di listino di 299 dollari. Questa mossa mira a fornire una soluzione accessibile per i giocatori con budget limitato, in un contesto di crescente domanda e costi elevati per le GPU dedicate all'intelligenza artificiale.
OpenAI ha implementato GPT-5.3-Codex-Spark su architettura Cerebras, segnando la prima volta che l'azienda si allontana dall'infrastruttura Nvidia per un deployment di produzione. Questa mossa strategica potrebbe avere implicazioni significative per il futuro dell'inference di modelli linguistici di grandi dimensioni.