SK Hynix ha effettuato un ordine record da 8 miliardi di dollari per macchinari di litografia EUV (Extreme Ultraviolet) da ASML. L'investimento, spalmato su due anni, servirà a potenziare la produzione di memorie HBM (High Bandwidth Memory) e DRAM avanzate.
Hark, guidata da un ex-designer di Apple, sta sviluppando un sistema di intelligenza artificiale personale end-to-end. L'azienda progetta in parallelo modelli, hardware e interfacce per un'esperienza utente fluida e integrata.
Huawei presenta Atlas 350, un nuovo acceleratore AI che vanta 1.56 PFLOPS di potenza di calcolo FP4 e fino a 112 GB di memoria HBM. Huawei afferma che offre prestazioni 2.8 volte superiori rispetto all'Nvidia H20. Questo hardware è progettato per carichi di lavoro di inference AI ad alta intensità.
Una startup sostenuta da Microsoft ha raccolto 40 milioni di dollari per sviluppare una litografia a fascio di atomi di elio. Questa tecnicia promette di stampare chip con una risoluzione atomica di 0,1 nm, superando le attuali tecnicie EUV di ASML.
La Gigabyte X870 Aorus Stealth è una scheda madre AM5 che sposta tutte le connessioni sul retro, semplificando la gestione dei cavi e migliorando l'estetica del case. Pensata per chi cerca un sistema pulito e ordinato, offre un design innovativo.
Lace Lithography ha raccolto 40 milioni di dollari per una tecnicia litografica che utilizza un fascio di atomi di elio per incidere chip con dettagli fino a dieci volte più piccoli rispetto alle tecniche EUV attuali. Il round di finanziamento è stato guidato da Atomico, con la partecipazione di M12 (Microsoft).
AMD sta ampliando la famiglia RDNA 4m con nuove GPU identificate come GFX1171 e GFX1172. Queste nuove architetture, identificate tramite commit nel compilatore shader AMDGPU, seguono l'introduzione del target GFX1170 e presentano modifiche ISA che le distinguono dalle GPU RDNA 3 esistenti. L'espansione del portafoglio RDNA 4m suggerisce un focus su nuove capacità o mercati specifici.
Xerendipity presenta Vapor-Pad, un pad termico con camera a vapore integrata che promette una conduttività termica da 50 a 80 volte superiore rispetto ai pad tradizionali. Con una conduttività dichiarata di 1.200 W/m-K, Vapor-Pad è progettato per sostituire la pasta termica (TIM) nelle CPU, migliorando l'efficienza del raffreddamento.
Le GPU cinesi per l'intelligenza artificiale affrontano vincoli a livello di equipaggiamento e software. Tuttavia, un approccio di progettazione focalizzato sul sistema completo sta contribuendo a migliorare l'autosufficienza del paese in questo settore strategico.
Alibaba ha presentato i suoi nuovi processori XuanTie C950 e C925, basati su architettura RISC-V. Questi chip sono progettati per applicazioni di intelligenza artificiale (AI) e edge computing, ampliando le capacità di Alibaba in questi settori chiave.
Huawei presenta Ascend 950PR, una nuova soluzione per l'accelerazione di carichi di lavoro di intelligenza artificiale. La GPU promette prestazioni quasi tre volte superiori rispetto alla H20, puntando a colmare il divario computazionale nel mercato cinese. L'annuncio sottolinea l'impegno di Huawei nel settore AI e la sua competizione con soluzioni esistenti.
Cloudflare ha annunciato l'implementazione della sua piattaforma server "Gen 13", basata sui processori AMD EPYC Turin. Grazie a questi processori di ultima generazione e a ottimizzazioni software, Cloudflare dichiara di aver raddoppiato il throughput e migliorato del 50% l'efficienza energetica.
AMD delinea la futura offerta enterprise con le CPU Venice basate su architettura Zen 6 e le GPU Verano. La roadmap include anche Helios e CDNA, delineando l'evoluzione dell'azienda nel mercato dei processori ad alte prestazioni per data center e applicazioni enterprise.
Recensione del MacBook Air 13 pollici con chip M5. L'articolo analizza le prestazioni del dispositivo, focalizzandosi sull'esperienza utente e sull'efficienza del nuovo processore. Non vengono forniti dettagli su specifiche hardware per inference LLM o considerazioni sul deployment on-premise.
Un dottorando in nanofotonica ha progettato un chip fotonico per accelerare la selezione dei blocchi nella KV cache, un collo di bottiglia nelle applicazioni di modelli linguistici di grandi dimensioni (LLM). La soluzione, denominata PRISM, promette prestazioni superiori e consumi energetici drasticamente inferiori rispetto alle scansioni GPU tradizionali, specialmente in scenari con contesti ampi.
L'aumento della densità di potenza, l'integrazione 3D e i nuovi materiali nei semiconduttori richiedono un'evoluzione della metrologia termica. Le misurazioni tradizionali non sono più sufficienti per affrontare le sfide poste dai nuovi requisiti di progettazione, in particolare per quanto riguarda l'affidabilità e la gestione del calore.
L'integrazione notturna per Mesa 26.1 abilita l'Arm Ethos U85 NPU all'interno del driver EthosU Gallium3D. Grazie al framework TEFLON di Mesa, sarà possibile gestire carichi di lavoro di intelligenza artificiale.
Una scheda RTX 5060 è sopravvissuta a un incendio domestico con il PCB intatto, nonostante lo shroud e le ventole completamente fusi. Dopo una pulizia e la sostituzione del sistema di raffreddamento, la scheda è tornata a funzionare. Un esempio di resilienza in condizioni estreme.
Groq, azienda specializzata in unità di elaborazione del linguaggio (LPU), ha scelto Samsung per la fabbricazione dei suoi chip. Questa decisione strategica è legata alla scalabilità e alle esigenze di inference di Groq, che punta a ottimizzare le prestazioni e l'efficienza energetica per carichi di lavoro di intelligenza artificiale.
La Cina sviluppa DeepLink, una tecnicia per aggregare potenza di calcolo AI da chip diversi. L'obiettivo è superare le limitazioni imposte dalle sanzioni sull'export di tecnicie avanzate, creando un'alternativa con risorse di calcolo eterogenee.