📁 Hardware

Questa sezione Hardware segue il lato pratico dell'infrastruttura AI locale: GPU, NPU, mini PC, acceleratori edge, banda memoria e compromessi energetici che incidono direttamente sulle prestazioni in inferenza. Privilegiamo aggiornamenti con benchmark e note operative utili a decisioni reali, dal laboratorio domestico ai cluster pilota in azienda. Qui puoi confrontare costo totale, vincoli termici e scenari modello-hardware, poi approfondire con la guida pillar hardware e la copertura LLM collegata.

La collaborazione tra MediaTek e Marvell per la fornitura di Tensor Processing Units (TPU) per le prossime tre generazioni segna un passo significativo nel panorama dell'hardware AI. Questa intesa strategica sottolinea l'importanza crescente del silicio specializzato per l'accelerazione dei carichi di lavoro di intelligenza artificiale, con potenziali implicazioni per le strategie di deployment on-premise e la sovranità dei dati.

2026-04-22 Fonte

Apple sta riorganizzando le sue risorse interne per affrontare le sfide dell'era dell'intelligenza artificiale. L'azienda ha affidato a due figure chiave, già responsabili del successo di Apple Silicio, il compito di bilanciare lo sviluppo software e hardware. Questa mossa sottolinea l'importanza di un'integrazione profonda tra i due ambiti per ottimizzare le performance dei carichi di lavoro AI, un aspetto cruciale anche per le strategie di deployment on-premise che richiedono un'attenta valutazione dell'infrastruttura.

2026-04-22 Fonte

Intel ha annunciato l'intenzione di estendere le capacità di overclocking a una gamma più ampia di processori per piattaforme future, inclusi i modelli Core Ultra 200K Plus. Questa mossa mira a democratizzare funzionalità tradizionalmente riservate agli appassionati di fascia alta, rendendole accessibili anche a chi assembla sistemi con budget più contenuti. La strategia potrebbe influenzare le scelte hardware per deployment on-premise, offrendo nuove opportunità per ottimizzare il TCO e la sovranità dei dati.

2026-04-21 Fonte

Il driver open source RADV abilita di default il supporto per l'estensione Vulkan `VK_EXT_host_image_copy` sulle GPU AMD RDNA2 e successive. Questa funzionalità, introdotta nel 2023, consente il trasferimento diretto dei dati tra la memoria host e le immagini sul processore, eliminando la necessità di buffer intermedi. Il risultato è una riduzione dell'utilizzo della memoria durante il caricamento degli asset e un miglioramento complessivo di efficienza e performance, cruciale per i deployment on-premise.

2026-04-21 Fonte

Cerebras, azienda specializzata in hardware per l'intelligenza artificiale, ha depositato la documentazione per la sua offerta pubblica iniziale. Nonostante una crescita dei ricavi venti volte superiore, l'azienda rimane non redditizia. Al centro della sua offerta tecnicica si trova il sistema Cerebras Andromeda, progettato per accelerare il training di Large Language Models e altre applicazioni AI su larga scala, posizionandosi come un'alternativa per i deployment on-premise.

2026-04-21 Fonte

La startup olandese OrangeQS ha raccolto 15 milioni di euro, inclusa un'estensione di 3 milioni dal Fondo del Consiglio Europeo per l'Innovazione. L'azienda si distingue come l'unica a offrire una soluzione commerciale dedicata per il testing di chip quantistici. Il suo programma MAX Partnership mira a coinvolgere i produttori di hardware nella definizione della prossima generazione di attrezzature di test ad alto throughput, cruciali per l'avanzamento dell'informatica quantistica.

2026-04-21 Fonte

John Ternus, prossimo CEO di Apple dal 1° settembre, è un ingegnere meccanico con una solida esperienza nella gestione hardware, inclusa la transizione ad Apple Silicio. Ora, con la responsabilità di prodotti che generano l'80% dei ricavi, si trova ad affrontare la complessa sfida di integrare e sviluppare l'intelligenza artificiale, un campo che richiede specifiche competenze in termini di silicio e infrastrutture.

2026-04-21 Fonte

OrangeQS ha esteso il suo round di finanziamento seed a 15 milioni di euro, con il supporto dell'EIC Fund. L'annuncio coincide con il lancio del MAX Partnership Program, un'iniziativa volta ad accelerare e migliorare il testing dei chip quantistici. Il programma, che vede la partecipazione di Rigetti Computing, QuantWare e Peak Quantum, mira a sviluppare soluzioni di testing scalabili e precise, affrontando una delle principali sfide per la commercializzazione del computing quantistico.

2026-04-21 Fonte

Google intensifica lo sviluppo dei propri chip AI, puntando a capitalizzare l'espansione dell'inference. Questa mossa segna una nuova fase nella competizione con Nvidia, evidenziando l'importanza di soluzioni hardware dedicate per i carichi di lavoro di intelligenza artificiale, sia in cloud che in ambienti self-hosted.

2026-04-21 Fonte

UALink 2.0, lo standard di interconnessione per l'intelligenza artificiale, mostra progressi significativi sul fronte tecnico. Nonostante i miglioramenti, il suo deployment sul mercato fatica a tenere il passo con NVLink, il concorrente consolidato. Questo scenario evidenzia le sfide nell'adozione di nuove architetture per i carichi di lavoro AI, specialmente in contesti on-premise dove l'integrazione e la compatibilità sono cruciali per CTO e architetti infrastrutturali.

2026-04-20 Fonte

Vivo rafforza la sua offerta di fascia alta a Taiwan con la nuova serie X300, puntando a una crescita del 40% nelle vendite. Questo movimento di mercato evidenzia la crescente importanza dei dispositivi mobili avanzati, piattaforme sempre più capaci di eseguire carichi di lavoro di intelligenza artificiale direttamente sull'edge. L'articolo esplora le opportunità e i vincoli dell'inference AI on-device per le aziende che valutano strategie di deployment distribuite.

2026-04-20 Fonte

Samsung ha registrato progressi significativi nella produzione di memoria HBM4, un componente cruciale per gli acceleratori AI di prossima generazione. L'azienda ha anche implementato un aggiornamento del processo PMBIST a 4 nanometri, che ha ricevuto un riscontro positivo da Nvidia. Questi sviluppi sono fondamentali per la disponibilità e l'affidabilità delle GPU ad alte prestazioni, con implicazioni dirette per le strategie di deployment on-premise e la gestione del TCO per i carichi di lavoro LLM.

2026-04-20 Fonte

Dopo quasi quindici anni alla guida di Apple, Tim Cook si dimetterà il 1° settembre. Sotto la sua leadership, la capitalizzazione di mercato dell'azienda è cresciuta esponenzialmente, raggiungendo circa 4 trilioni di dollari. Il suo successore sarà John Ternus, attuale Senior Vice President dell'ingegneria hardware, responsabile di circa l'80% dei prodotti che generano ricavi per Apple. Questo cambio al vertice segna un'evoluzione strategica per il gigante tecnicico.

2026-04-20 Fonte

Il kernel Linux 7.1 integra importanti novità per i driver grafici DRM e gli acceleratori, con Intel e AMD in prima linea nello sviluppo open source. Questi aggiornamenti consolidano l'attività sui driver GPU e includono progressi verso l'adozione di driver basati su Rust, elementi cruciali per l'ottimizzazione delle performance hardware in ambienti on-premise.

2026-04-20 Fonte

Le aziende tessili taiwanesi si espandono nei settori aerospaziale e dei droni, sfruttando materiali avanzati. Questa tendenza evidenzia l'importanza critica di tali innovazioni per lo sviluppo di hardware robusto e performante, fondamentale per le infrastrutture AI on-premise. L'articolo esplora come la disponibilità e la qualità di questi materiali influenzino il TCO e la sovranità tecnicica nei deployment di Large Language Models.

2026-04-20 Fonte

Un comitato parlamentare nel Regno Unito ha avviato un'indagine sui design di chip emergenti e a basso consumo energetico. L'obiettivo è affrontare il crescente fabbisogno energetico dell'intelligenza artificiale, che rischia di sovraccaricare la rete elettrica nazionale. La ricerca si concentra su soluzioni innovative per i datacenter, mirando a ridurre il consumo e a garantire la sostenibilità delle infrastrutture AI, un tema cruciale per chi gestisce deployment on-premise e valuta il TCO.

2026-04-20 Fonte

L'azienda sudcoreana DeepX ha annunciato l'avvio della produzione di massa del suo chip AI DX-M1. Questa mossa strategica include la creazione di scorte significative, mirata a prevenire e gestire eventuali interruzioni nella catena di approvvigionamento. La decisione sottolinea l'importanza di una supply chain resiliente nel settore dell'hardware AI, cruciale per i deployment on-premise e per la continuità operativa, garantendo maggiore stabilità per le infrastrutture AI.

2026-04-20 Fonte

Il presidente di E Ink, Johnson Lee, ha dichiarato che i limiti energetici globali stanno per trasformare radicalmente il settore dei display. Questa evoluzione, che sposterà l'attenzione dai dispositivi alle superfici integrate, aprirà nuove opportunità di mercato, enfatizzando l'importanza di tecnicie a basso consumo come l'e-paper per applicazioni su vasta scala e in contesti critici.

2026-04-20 Fonte

Cerebras, azienda specializzata in hardware per l'intelligenza artificiale, ha riattivato la sua offerta pubblica iniziale (IPO). La mossa riflette la forte crescita del settore AI e l'importanza delle partnership strategiche, evidenziando la crescente domanda di soluzioni di calcolo dedicate per carichi di lavoro complessi, con implicazioni significative per le strategie di deployment on-premise e la sovranità dei dati.

2026-04-20 Fonte

Qilimanjaro sta sviluppando il quantum computing analogico con l'obiettivo di integrarlo nei data center dedicati all'intelligenza artificiale entro un decennio. Questa iniziativa mira a offrire nuove capacità di calcolo per carichi di lavoro AI complessi, ponendo le basi per future evoluzioni nell'infrastruttura IT e sollevando questioni cruciali per le strategie di deployment on-premise.

2026-04-19 Fonte