Un post su Reddit mostra configurazioni hardware custom per l'inference di modelli LLM in Cina. L'immagine suggerisce un approccio orientato all'ottimizzazione dei costi e all'utilizzo di componenti disponibili localmente per carichi di lavoro di intelligenza artificiale.
ASML sta incrementando la potenza dei suoi sistemi EUV (Extreme Ultraviolet Lithography) a 1000W, con l'obiettivo di aumentare del 50% la produzione di chip entro il 2030. Questo progresso è cruciale per la fabbricazione di semiconduttori avanzati, essenziali per l'intelligenza artificiale e altre tecnicie emergenti.
Secondo indiscrezioni, Nvidia starebbe implementando una strategia di fornitura a livelli per la memoria HBM4. Samsung si posiziona come fornitore chiave per le GPU di fascia alta, beneficiando della nuova architettura di memoria. Questa mossa potrebbe avere implicazioni significative per il mercato delle GPU ad alte prestazioni e per i carichi di lavoro di intelligenza artificiale.
Il driver open-source PanVK, che fornisce supporto Vulkan per le moderne GPU Arm Mali, registra notevoli incrementi prestazionali nell'anti-aliasing multi-sample (MSAA) nei test Vulkan. Questo miglioramento è il risultato di nuovo codice integrato in Mesa 26.1.
Il driver open-source AMDGPU/AMDKFD ha superato i sei milioni di linee di codice C con il kernel Linux 7.0. Questo rappresenta un aumento significativo rispetto ai quattro milioni di linee di codice di soli quattro anni fa, evidenziando la crescente complessità dei driver grafici moderni e il loro impatto sul kernel Linux.
La scheda grafica in edizione limitata MSI RTX 5090 Lightning Z è apparsa su eBay a prezzi che superano di cinque volte il valore originale. La domanda elevata e la scarsità di esemplari alimentano il mercato dei rivenditori.
Il produttore di semiconduttori PSMC sta investendo in tecnicie di memoria avanzate per supportare le crescenti esigenze di calcolo dell'intelligenza artificiale. L'azienda si sposta dai nodi maturi per affrontare le sfide poste dai carichi di lavoro AI di nuova generazione.
Ricercatori del MIT hanno sviluppato una stampante 3D capace di produrre motori elettrici lineari completamente funzionanti in un singolo processo. Dopo la stampa, è necessaria solo la magnetizzazione. Il costo stimato per motore è di circa 50 centesimi.
Dell introduce un connettore di alimentazione custom a 16 pin per le GPU Nvidia nei suoi PC preassemblati, affrontando i problemi di surriscaldamento e fusione riscontrati con i connettori standard. La soluzione mira a garantire una connessione più stabile e sicura, riducendo i rischi di malfunzionamenti.
Timur Kristóf, parte del team di sviluppo open-source di Valve, sta continuando a migliorare il supporto per le GPU AMD Radeon meno recenti su Linux. I prossimi aggiornamenti promettono di ottimizzare ulteriormente le prestazioni e la stabilità per gli utenti che utilizzano hardware AMD datato.
Il kernel Linux si prepara per i processori Xeon Diamond Rapids di prossima generazione di Intel, successori di Granite Rapids. Il supporto driver è in gran parte definito, con l'aggiunta del supporto driver NTB nel kernel Linux 7.0.
Trapelano indiscrezioni su una nuova CPU Intel, la Bartlett Lake-S, dotata di 12 P-core e frequenza di boost fino a 5.8 GHz. Sembra però che questa CPU ad alte prestazioni non sarà disponibile per il mercato retail, limitandone l'accesso agli utenti finali.
Analisi del case ATX Corsair Makr Pro 75. L'articolo originale evidenzia come il prodotto non sia particolarmente economico e non si adatti perfettamente a configurazioni fai-da-te, pur offrendo caratteristiche interessanti per gli appassionati di PC.
Il kernel Linux 7.0 introduce una serie di correzioni per i driver grafici DRM, con particolare attenzione ai miglioramenti per le GPU Radeon meno recenti tramite il driver AMDGPU. Questi aggiornamenti mirano a ottimizzare le prestazioni e la stabilità su hardware meno recente.
Anche dopo 27 anni dal lancio, i server Apple continuano a fornire aggiornamenti legacy per la linea iBook. Un iBook G4 di 21 anni si connette al wireless e scarica aggiornamenti senza modifiche, dimostrando l'impegno di Apple verso la retrocompatibilità.
ChatJimmy.ai ha annunciato di aver raggiunto 15.000 token al secondo tramite un ASIC dedicato, incidendo i pesi del modello direttamente nel silicio. Questo approccio elimina i colli di bottiglia di HBM e VRAM, aprendo un dibattito sull'efficacia dei sistemi di inference basati su hardware general-purpose.
Cerebras Systems, nota per i suoi acceleratori AI di grandi dimensioni, progetta un nuovo supercomputer in India. La potenza di calcolo raggiungerà gli 8 exaFLOPS, aprendo nuove frontiere per l'intelligenza artificiale nel paese.
La startup Taalas adotta un approccio radicale: integrare modelli LLM e i relativi pesi direttamente in un chip di silicio. Questo permette di raggiungere latenze inferiori a 1 millisecondo e un'efficienza energetica 10 volte superiore, eliminando la necessità di HBM e packaging avanzato. Supporta il fine-tuning LoRA. Il primo dimostratore usa Llama 3.1 8B.
La domanda elevata per le GPU Nvidia dedicate all'intelligenza artificiale sta influenzando i prezzi di mercato. La RTX 5060 Ti 8GB rimane l'unica scheda della serie 50 ancora disponibile al prezzo di listino, mentre anche la RTX 5050 ha subito aumenti.
Un'anteprima dei test di benchmark per le GPU di prossima generazione, inclusi i modelli RTX 50 e RX 9000. L'articolo si concentra sulle metodologie di test e sulle aspettative di performance, escludendo upscaling e frame generation.