Tescan ha inaugurato un nuovo laboratorio dimostrativo a Seul, in Corea del Sud, per accelerare i test e la validazione di soluzioni di memoria per applicazioni di intelligenza artificiale e packaging avanzato. L'iniziativa mira a supportare più rapidamente i clienti nell'innovazione tecnicica.
Un post su Reddit celebra il ritorno in auge delle GPU dedicate (dGPU) per l'esecuzione di modelli linguistici di grandi dimensioni (LLM) in locale. La discussione sottolinea i vantaggi prestazionali e di controllo offerti dall'utilizzo di hardware dedicato per l'inference e il training di modelli AI, rispetto a soluzioni cloud o integrate.
Un utente ha sperimentato con un cluster di 9 GPU RTX 3090 per carichi di lavoro AI, riscontrando che scalare oltre 6 GPU porta a un degrado delle prestazioni a causa di limitazioni delle linee PCIe, problemi di stabilità e gestione termica. L'articolo evidenzia i trade-off tra l'utilizzo di servizi cloud e configurazioni locali per l'AI, sottolineando che l'hardware non è sempre la soluzione migliore.
Il CERN sviluppa chip AI dedicati per l'analisi dei dati scientifici, integrando l'intelligenza artificiale direttamente nel silicio per accelerare l'elaborazione ed eliminare i dati superflui. L'obiettivo è gestire l'enorme quantità di dati generata dagli esperimenti.
Il driver Direct Rendering Manager di Loongson, che gestisce il controller display sui SoC LS7A/LS2K, non è più senza manutentore. Nuovi ingegneri Loongson si sono fatti avanti per mantenere e sviluppare il codice.
Il presidente di TSMC, C.C. Wei, sottolinea come l'innovazione nella robotica sia intrinsecamente legata ai progressi nel campo dei semiconduttori. L'articolo evidenzia l'importanza del silicio come fondamento per lo sviluppo di sistemi robotici avanzati.
Delta Electronics si prepara a supportare i data center AI di prossima generazione con alimentazione a 800V DC e sistemi di raffreddamento a liquido. L'azienda mira a soddisfare le crescenti esigenze di potenza e raffreddamento delle infrastrutture dedicate all'intelligenza artificiale.
Sony introdurrà la frame generation basata su machine learning sulle console PlayStation. Questa funzionalità, pensata per migliorare le performance, potrebbe non essere disponibile prima del prossimo anno. La prima console a beneficiare di questa tecnicia dovrebbe essere la PlayStation 5 Pro.
La versione 7.0 del kernel Linux include una correzione per un bug che affliggeva le GPU AMD GCN 1.0 "Hainan". Il problema, segnalato nel 2021, causava blocchi del sistema. La patch verrà retro-portata anche alle versioni stabili del kernel Linux.
Un utente di Reddit chiede consigli sull'acquisto di hardware per l'esecuzione di modelli linguistici di grandi dimensioni (LLM) in locale. La discussione verte sull'usabilità, le velocità di elaborazione e il confronto tra l'utilizzo di un singolo modello di grandi dimensioni rispetto a più modelli più piccoli. La domanda solleva considerazioni importanti per chi desidera gestire carichi di lavoro AI on-premise.
Intel afferma di aver tentato più volte di collaborare con lo sviluppatore di Crimson Desert per l'utilizzo delle GPU Arc. L'azienda sostiene di aver fornito hardware, driver e risorse ingegneristiche in anticipo, ma senza successo.
Una nuova competizione all'interno di Fortnite Capitolo 7 Stagione 2 offre ai primi cinque giocatori la possibilità di vincere una scheda grafica RTX 5080. L'iniziativa mira a stimolare la competizione all'interno del gioco.
AMD ha annunciato FSR 4.1, una nuova versione della sua tecnicia di upscaling FidelityFX Super Resolution, destinata alle GPU RX 9000. L'aggiornamento promette Ray Regeneration superiore, dettagli più nitidi e frame rate più elevati, migliorando l'esperienza visiva nei giochi.
NVIDIA rende disponibili le DGX Station basate su architettura Grace Blackwell, incluse le versioni GB300 e GB200. Queste workstation desktop portano la potenza di calcolo necessaria per l'AI direttamente sulla scrivania degli sviluppatori e dei ricercatori.
Gli sviluppatori di Asahi Linux hanno inviato le prime patch per far avviare Linux sull'hardware Apple M3. Tuttavia, il supporto è ancora in fase iniziale e lontano dall'essere utilizzabile dagli utenti finali. Il lavoro di porting è in corso da tempo.
Dipendenti di Super Micro accusati di aver contrabbandato illegalmente hardware Nvidia per 2,5 miliardi di dollari in Cina, sostituendo i numeri di serie su migliaia di server fittizi. Le indagini si concentrano su un magazzino nel sud-est asiatico.
Nuovi dispositivi fisici utilizzano l'intelligenza artificiale per trascrivere l'audio in tempo reale durante le riunioni, fornendo riassunti automatici, identificazione delle consegne e, in alcuni casi, traduzione simultanea. Questi strumenti mirano a migliorare la produttività e l'accessibilità delle informazioni.
Un venditore su eBay è stato vittima di una truffa: una RTX 5090 da 4.000 dollari è stata restituita con il core GPU e i moduli di memoria mancanti. La scheda Zotac, apparentemente funzionante, era stata privata dei suoi componenti più costosi.
Un utente ha vinto una RTX 5090 firmata da Jensen Huang al GTC e chiede consigli sulla scelta del modello LLM più adatto da eseguire sulla nuova GPU. La domanda si concentra sull'utilizzo ottimale della scheda in ambito locale.
I server Nvidia Vera Rubin, progettati per carichi di lavoro intensivi, stanno aumentando la richiesta di sistemi di raffreddamento a liquido. Questa tendenza è guidata dalla necessità di gestire l'elevata densità di potenza e il calore generato dai componenti ad alte prestazioni, cruciali per applicazioni di intelligenza artificiale e calcolo accelerato.