Elon Musk ha annunciato l'intenzione di Tesla di produrre chip AI proprietari, affidandosi al processo produttivo 14A di Intel. Questa decisione rappresenta una scommessa significativa, dato che la tecnicia 14A è ancora in fase di sviluppo e non è ancora disponibile. L'iniziativa sottolinea la strategia di Tesla di integrare verticalmente la produzione di silicio per le proprie esigenze di intelligenza artificiale.
La Segretaria al Commercio degli Stati Uniti ha confermato che le GPU Nvidia H200 non sono state vendute alla Cina. Questa mossa riflette le restrizioni imposte dal governo cinese, volte a stimolare lo sviluppo della propria industria dei semiconduttori, con significative implicazioni per il mercato globale dell'AI e le strategie di deployment on-premise.
Bolt Graphics ha completato il "tape-out" del suo primo chip di test GPU, il Zeus 1c26-032, prodotto con processo TSMC a 12 nanometri. L'azienda dichiara che questa nuova architettura potrebbe offrire un costo di calcolo fino a 17 volte inferiore rispetto alle soluzioni attuali. Questo sviluppo segna un passo iniziale verso l'introduzione di nuove opzioni hardware per l'accelerazione dei carichi di lavoro AI, con potenziali implicazioni per i deployment on-premise.
Un sistema di progettazione di chip basato su intelligenza artificiale, denominato QiMeng, ha dimostrato la capacità di creare una CPU RISC-V completa. Partendo da una specifica di appena 219 parole, l'agente AI ha completato il design in sole 12 ore, evidenziando un notevole salto di efficienza rispetto ai metodi tradizionali o ai precedenti tentativi che richiedevano miliardi di token. Questo progresso suggerisce nuove frontiere nella creazione di silicio personalizzato.
SpaceX esplora l'espansione delle capacità GPU, mentre Tesla si affida a Samsung per l'aggiornamento dei chip. Queste mosse evidenziano la crescente importanza del controllo sull'hardware e della capacità di calcolo per le aziende tech, influenzando le decisioni di deployment on-premise e la gestione della supply chain nell'era dell'intelligenza artificiale.
SaiMemory ha ottenuto il sostegno di NEDO e stretto una partnership con Intel per lo sviluppo della memoria ZAM di prossima generazione. Questa tecnicia mira a superare i limiti delle attuali soluzioni di memoria, offrendo un potenziale significativo per l'accelerazione dei carichi di lavoro AI, in particolare per i Large Language Models, e per ottimizzare i deployment on-premise.
SK Hynix ha annunciato un significativo riorientamento della sua produzione di memoria NAND, destinando oltre la metà del volume ai nuovi chip a 321 strati. Questa mossa strategica sottolinea l'impegno dell'azienda verso l'innovazione nella densità di archiviazione, con implicazioni dirette per i data center e le infrastrutture AI che richiedono capacità e performance sempre maggiori per la gestione di dataset complessi e carichi di lavoro intensivi.
TSMC, leader mondiale nella produzione di semiconduttori, ha fissato il 2029 come obiettivo per l'avvio della produzione dei suoi prossimi nodi tecnicici A13 e A12. Questi processi produttivi avanzati sono destinati a diventare la base per la prossima generazione di chip dedicati all'intelligenza artificiale, sottolineando l'importanza della roadmap tecnicica per le future capacità di calcolo e le strategie di deployment on-premise, con implicazioni dirette su TCO e sovranità dei dati.
Google Cloud ha annunciato i nuovi processori TPU 8t e 8i, progettati per rispondere alla crescente diversificazione dei carichi di lavoro di intelligenza artificiale. Questa mossa sottolinea l'esigenza di soluzioni hardware specializzate, sia per il training che per l'inference, e riflette le complesse decisioni che le aziende devono affrontare nella scelta tra deployment cloud e on-premise per le proprie strategie AI.
SK Hynix sta costruendo un nuovo centro di packaging per memorie HBM a Cheongju, Corea del Sud. L'iniziativa mira a espandere significativamente la capacità produttiva di memorie ad alta larghezza di banda, essenziali per alimentare la crescente domanda di sistemi di intelligenza artificiale, sia per il training che per l'inference di Large Language Models. Questo investimento sottolinea l'importanza strategica dell'HBM nel panorama AI globale e le sue implicazioni per i deployment on-premise.
Google ha annunciato le sue nuove unità di elaborazione tensoriale (TPU) di ottava generazione, la TPU 8i e la TPU 8t. Progettate rispettivamente per l'inference e il training di modelli di intelligenza artificiale, queste soluzioni proprietarie mirano a ottimizzare i carichi di lavoro AI all'interno dell'ecosistema Google, offrendo capacità dedicate per le diverse fasi del ciclo di vita dei Large Language Models.
BMW ha presentato il restyling della i7 per il 2027, introducendo batterie cilindriche Gen6 di Rimac e motori privi di terre rare con inverter SiC. Il nuovo modello supporta la ricarica a 250 kW e mira a un'autonomia estesa, pur abbandonando la guida autonoma di Livello 3. Le innovazioni mirano a migliorare efficienza e sostenibilità nel segmento delle berline di lusso elettriche.
Google Cloud ha introdotto due nuovi chip AI, le Tensor Processing Unit (TPU), che promettono prestazioni superiori e costi inferiori rispetto alle generazioni precedenti. Questa mossa intensifica la competizione nel mercato degli acceleratori AI, tradizionalmente dominato da Nvidia, sebbene Google continui a integrare le GPU Nvidia nella propria infrastruttura cloud.
Google ha svelato la sua ottava generazione di Tensor Processing Units (TPU), distaccandosi dall'adozione prevalente di acceleratori Nvidia. Questi nuovi chip, denominati TPU 8t per il training e TPU 8i per l'inference, sono progettati per l'emergente "era degli agenti" nell'intelligenza artificiale. Google afferma che le nuove unità offrono maggiore velocità ed efficienza, con la TPU 8t capace di ridurre i tempi di addestramento dei modelli AI più avanzati da mesi a settimane.
Google ha annunciato la disponibilità generale della sua settima generazione di TPU, Ironwood, e ha svelato l'ottava, composta da TPU 8t (per il training) e TPU 8i (per l'inference). Questa nuova strategia prevede chip dedicati, progettati rispettivamente da Broadcom e MediaTek, e mira al processo TSMC a 2nm per un rilascio a fine 2027. Ironwood offre 4.6 petaFLOPS per chip e 42.5 exaFLOPS in configurazioni superpod.
Google ha svelato due nuovi acceleratori AI proprietari alla conferenza Cloud Next: uno per il training e uno per l'inference, con l'introduzione di core Axion basati su Arm. Questa mossa strategica evidenzia l'impegno di Google nello sviluppo di silicio personalizzato per ottimizzare le performance e ridurre i costi operativi dei carichi di lavoro AI.
Google ha presentato l'ottava generazione delle sue Tensor Processing Units (TPU), introducendo due chip specializzati progettati per supportare l'evoluzione dell'intelligenza artificiale verso l'era agentica. Questa mossa evidenzia la crescente necessità di hardware dedicato per carichi di lavoro AI complessi, un aspetto cruciale per le organizzazioni che valutano strategie di deployment on-premise o ibride, focalizzandosi su performance, TCO e sovranità dei dati.
Il kit di sviluppo (SDK) di AMD suggerisce l'introduzione di nuovi moltiplicatori 4x e 6x per la generazione di frame basata su intelligenza artificiale (AI). Questa ottimizzazione a livello di driver evidenzia la crescente tendenza a sfruttare la potenza di calcolo locale delle GPU per carichi di lavoro complessi, un aspetto cruciale per le strategie di deployment AI on-premise che mirano a massimizzare il controllo e l'efficienza.
Vexlum, azienda finlandese nata da decenni di ricerca, sta affrontando un collo di bottiglia critico per il computing quantistico e gli orologi atomici: la disponibilità di laser compatti, potenti ed economici con lunghezze d'onda precise. La sua tecnicia VECSEL, basata su semiconduttori III-V, offre prestazioni elevate e basso rumore, essenziali per il deployment industriale di questi sistemi. L'azienda sta espandendo la propria capacità produttiva con una nuova fabbrica.
TXC e Taitien, fornitori di componenti al quarzo, prevedono un aumento delle vendite nel primo trimestre 2026. La crescita è trainata dalla crescente domanda nel settore della comunicazione ottica per l'intelligenza artificiale e dal comparto automotive. Questo evidenzia l'importanza di componenti di base per l'infrastruttura AI e i sistemi veicolari avanzati, con implicazioni per i deployment on-premise.