Archivio Notizie – Cronologia Completa Segnali AI

Jun 08 2026

Market

Shanghai Belling alza i prezzi: segnali di ripresa nel mercato dei chip

Shanghai Belling, produttore cinese di circuiti integrati analogici, ha annunciato un aumento dei prezzi fino al 30%. Questa mossa è interpretata come un indicatore di ripresa per il mercato globale dei chip. L'incremento, che segue un periodo di flessione, potrebbe influenzare i costi di approvvigionamento per l'hardware, con potenziali ripercussioni per le aziende che pianificano investimenti in infrastrutture on-premise per carichi di lavoro AI e LLM, dove la disponibilità e il costo dei componenti sono fattori critici.

→

Jun 08 2026

Market

L'alleanza Nvidia-Microsoft per gli AI PC e le sue implicazioni geopolitiche

L'alleanza strategica tra Nvidia e Microsoft per lo sviluppo di "AI PC" sta ridefinendo il panorama dell'intelligenza artificiale, spostando parte dell'elaborazione dal cloud ai dispositivi edge. Questa mossa solleva preoccupazioni significative per nazioni come la Corea del Sud, che temono di essere marginalizzate nella prossima era dell'AI. Per le aziende, l'emergere degli AI PC introduce nuove considerazioni su sovranità dei dati, TCO e requisiti hardware per deployment on-premise e ibridi.

→

Jun 08 2026

Market

L'Indice CEE AI 2026: la prontezza strategica dell'Europa centro-orientale nell'IA

L'Indice CEE AI 2026, frutto della collaborazione tra AI Chamber, The Recursive Media ed Europe Cloud, analizza la prontezza strategica di 11 paesi dell'Europa centro-orientale nell'ambito dell'intelligenza artificiale. Lo studio rivela una regione più avanzata del previsto, ma con una crescente disparità tra nazioni leader e quelle ancora in fase di costruzione delle fondamenta. Governance, infrastrutture digitali e talento emergono come fattori critici, con paesi più piccoli che superano economie maggiori grazie a investimenti mirati.

→

Jun 08 2026

LLM

Gemma-4 Quantizzati: Dettagli sulle Differenze tra Q4_0 di Google e Q4_K_XL di Unsloth

Un'analisi comparativa dei modelli Gemma-4 quantizzati rivela che le versioni Q4_0 di Google possono avere dimensioni maggiori e una composizione interna diversa rispetto alle Q4_K_XL di Unsloth. Questo suggerisce potenziali differenze in precisione e requisiti hardware per il deployment on-premise, evidenziando la complessità nella scelta del modello ottimale per carichi di lavoro AI/LLM.

→

Jun 08 2026

Altro

Uneec e l'espansione nei rack a raffreddamento liquido per l'AI on-premise

Uneec ha annunciato il suo ingresso nel settore IT, concentrandosi sui rack a raffreddamento liquido per rispondere alla crescente domanda di infrastrutture AI. Questa mossa strategica sottolinea l'importanza di soluzioni di raffreddamento efficienti per i deployment on-premise di Large Language Models, dove la gestione del calore e la densità di calcolo sono cruciali per performance, TCO e sovranità dei dati.

→

Jun 08 2026

Market

CXMT: la disponibilità di DDR5 ridefinisce il vantaggio competitivo nel mercato memorie

Il produttore cinese di memorie CXMT sta ridefinendo la sua posizione nel mercato delle DDR5. Contrariamente alla percezione comune di prezzi aggressivi, l'azienda si distingue ora per la capacità di garantire la fornitura di moduli, un fattore critico in un contesto globale di catene di approvvigionamento tese. Questa evoluzione ha implicazioni per i decision-maker che valutano l'approvvigionamento di componenti hardware per infrastrutture AI on-premise, dove la disponibilità è spesso prioritaria rispetto al costo unitario.

→

Jun 08 2026

Market

Volteum ottiene 2,5 milioni di euro per l'ottimizzazione delle flotte miste ed elettriche

Volteum, piattaforma di gestione per flotte elettriche e ibride, ha raccolto 2,5 milioni di euro in un round guidato da Movens Capital, portando il finanziamento totale a 3,75 milioni. L'investimento supporterà l'espansione in Regno Unito, Benelux e DACH. La soluzione affronta le nuove sfide dell'elettrificazione, consolidando i dati e riducendo i costi operativi fino al 30% senza hardware aggiuntivo.

→

Jun 08 2026

Altro

Sovranità dei Dati: Un Errore Umano e la Responsabilità nel Deployment SaaS

Un consulente ha accidentalmente cancellato dati critici da un tool di gestione test basato su SaaS. Invece di ammettere l'errore, lo ha segnalato come un bug. Il cliente, dopo aver ripristinato i dati da backup, ha attribuito la colpa a un proprio script SaaS malfunzionante. L'episodio evidenzia le sfide legate alla sovranità dei dati e alla chiarezza delle responsabilità in architetture cloud e SaaS, temi centrali per chi valuta deployment on-premise.

→

Jun 08 2026

Market

NTT e i Partner Asiatici: Oltre 70 Miliardi di Yen per l'Iniziativa IOWN

NTT ha annunciato un fondo da oltre 70 miliardi di yen, in collaborazione con partner coreani e taiwanesi, per accelerare lo sviluppo dell'iniziativa Innovative Optical and Wireless Network (IOWN). Questo investimento strategico mira a potenziare le infrastrutture di rete e di calcolo di prossima generazione, con implicazioni significative per l'evoluzione dei deployment AI, inclusi quelli on-premise, grazie a capacità di trasmissione dati e elaborazione avanzate.

→

Jun 08 2026

Altro

Huawei Cloud si lancia nell'AI Agente con Ascend 950DT e cloud ibrido sicuro

Huawei Cloud si posiziona nella competizione per l'AI Agente, presentando il chip Ascend 950DT. L'iniziativa mira a supportare carichi di lavoro computazionali per la guida intelligente, con un'enfasi sul deployment in ambienti di cloud ibrido e sulla sicurezza dei dati. Questa strategia riflette la crescente domanda di soluzioni AI flessibili e controllate, cruciali per aziende che necessitano di bilanciare performance e sovranità dei dati.

→

Jun 08 2026

Altro

Nvidia e LG Group: una partnership strategica per l'AI in Corea

Nvidia e LG Group hanno siglato una partnership estesa in Corea, focalizzata sullo sviluppo di soluzioni avanzate di intelligenza artificiale. La collaborazione abbraccia settori chiave come le "AI factory", la robotica e la guida autonoma, evidenziando un impegno congiunto verso l'innovazione tecnicica su larga scala e la costruzione di infrastrutture AI robuste, spesso con implicazioni per deployment on-premise e la sovranità dei dati.

→

Jun 08 2026

Hardware

Marvell: il "muro del rame" per l'AI è vicino, soluzioni ottiche e silicio custom per la scalabilità

Marvell, tramite il suo COO Chris Koopmans, evidenzia l'imminente "muro del rame" per l'infrastruttura AI. Le attuali interconnessioni basate sul rame stanno raggiungendo i loro limiti di scalabilità e performance, soprattutto per carichi di lavoro di Large Language Models (LLM) sempre più complessi. L'azienda propone l'adozione di silicio personalizzato e interconnessioni ottiche come soluzioni chiave per superare queste barriere, garantendo la scalabilità necessaria per il futuro dell'intelligenza artificiale, con implicazioni significative per i deployment on-premise.

→

Jun 08 2026

LLM

Personalizzazione degli LLM: il fattore umano svela i limiti dei modelli attuali

Una nuova ricerca evidenzia un divario significativo nella personalizzazione dei Large Language Models (LLM) quando si passa da dati sintetici a interazioni umane reali. Uno studio approfondito, basato su 550 conversazioni e migliaia di giudizi umani, ha rivelato che i modelli faticano a estrarre attributi pertinenti, ad allinearsi alle preferenze umane e a generare risposte che gli utenti percepiscono come realmente personalizzate. La sfida di modellare la qualità della personalizzazione allineata all'uomo rimane complessa.

→

Jun 08 2026

LLM

LLM multilingue: il Reinforcement Learning migliora la coerenza fattuale

Una nuova ricerca affronta il problema dell'incoerenza fattuale negli LLM addestrati principalmente in inglese quando operano in altre lingue. Introducendo PolyFact, un dataset multilingue con 100K fatti, lo studio dimostra che il Reinforcement Learning tramite GRPO supera il fine-tuning supervisionato, migliorando la coerenza cross-lingue e la generalizzazione. Questo approccio riorganizza le rappresentazioni interne dei modelli, promuovendo una maggiore condivisione tra le lingue, con implicazioni significative per i deployment on-premise.

→

Jun 08 2026

LLM

FAIR-Calib: Ottimizzare la Quantization per i Diffusion LLM On-Premise

I Diffusion Large Language Models (dLLM) affrontano un "ritardo di stabilità" critico durante la quantization post-training (PTQ), dove errori minimi possono alterare decisioni iniziali e amplificarle. FAIR-Calib è un nuovo framework PTQ a due stadi che mira a proteggere questi stati fragili, migliorando l'efficienza e la precisione. La soluzione è particolarmente rilevante per deployment on-premise, riducendo i requisiti di risorse grazie a tecniche come la quantization W4A4.

→

Jun 08 2026

Frameworks

Elmes*: Un Framework per la Valutazione Approfondita dei Large Language Models in Ambito Educativo

Elmes* introduce un framework end-to-end per la creazione e l'applicazione di rubriche di valutazione dettagliate per i Large Language Models (LLM) nel settore educativo. Superando i limiti dei benchmark esistenti, Elmes* valuta non solo le conoscenze, ma anche le capacità didattiche degli LLM, offrendo un'infrastruttura diagnostica scalabile per scenari pedagogici complessi e multidimensionali.

→

Jun 08 2026

Altro

DiBS: L'AI Ibrida che Ottimizza la Risoluzione di Problemi Complessi

Un nuovo approccio, DiBS (Diffusion-Informed Branch Selection), combina modelli di diffusione con risolutori simbolici per affrontare problemi di soddisfacimento dei vincoli come il Sudoku. Superando i limiti delle metodologie esistenti, DiBS riduce significativamente i costi di ricerca, offrendo garanzie di correttezza e migliorando l'efficienza su istanze complesse. Questo bilanciamento tra performance e prevedibilità è cruciale per le applicazioni AI in ambienti enterprise che richiedono controllo e sovranità dei dati.

→

Jun 08 2026

Frameworks

Rilevare e mitigare il bias nei sistemi ML: un approccio basato sulla simmetria

Un nuovo framework propone di affrontare il bias nei sistemi di machine learning, specialmente in contesti socioeconomici critici, trattando la correttezza come un'operazione di simmetria. Il metodo, che non richiede la conoscenza di grafi causali ed è computazionalmente leggero, mira a garantire che gli output di un classificatore rimangano invarianti al variare di attributi sensibili. Testato su dataset sintetici, ha dimostrato una riduzione delle violazioni del bias superiore al 90%, con un costo in accuratezza di circa il 5%.

→

Jun 08 2026

Market

Coalizione VC tedesca: 15 miliardi per l'innovazione e le future industrie AI

Un'alleanza di 24 fondi di venture capital tedeschi lancia un playbook per sbloccare 15 miliardi di euro annui in capitale privato. L'iniziativa mira a finanziare startup e aziende in crescita, cruciali per lo sviluppo di settori strategici come l'AI, la robotica e l'energia. L'obiettivo è rafforzare l'economia tedesca e la sua capacità di innovazione tecnicica, con implicazioni per future infrastrutture e soluzioni on-premise.

→

Jun 08 2026

Market

Taiwan rafforza la filiera AI: MediaTek e Nvidia intensificano la collaborazione

L'ecosistema taiwanese sta consolidando la propria posizione nella filiera globale dei chip per l'intelligenza artificiale. Questa tendenza è rafforzata dalla crescente collaborazione tra giganti del settore come MediaTek e Nvidia, che stanno approfondendo le loro partnership strategiche. Tale sviluppo è cruciale per la disponibilità e l'innovazione nell'hardware AI, con implicazioni significative per le aziende che valutano soluzioni di deployment on-premise e la sovranità dei dati.

→

Jun 08 2026

LLM

Gemma4 QAT: Ottimizzazione e Prestazioni per LLM On-Premise

L'introduzione di Gemma4 QAT segna un passo avanti nell'ottimizzazione dei Large Language Models per deployment locali. Un utente ha riscontrato miglioramenti significativi in termini di qualità e throughput, con prestazioni fino a 50 token/secondo per la sintesi di documenti e 36 token/secondo per il roleplay, superando le versioni precedenti. Questa tecnicia consente di gestire task a contesto sia breve che lungo con un unico modello, offrendo efficienza e controllo per architetture self-hosted.

→

Jun 08 2026

Altro

Gemma 4.31B FP8 e Sonnet 4.6: LLM on-premise e ottimizzazione delle risorse

Un recente test evidenzia come il modello Gemma 4.31B, ottimizzato con Quantization FP8, sia in grado di eguagliare le prestazioni di Sonnet 4.6 Medium in diverse attività complesse. Questo risultato, ottenuto in un ambiente locale, sottolinea il potenziale degli LLM efficienti per deployment on-premise, offrendo nuove opportunità per la sovranità dei dati e il controllo infrastrutturale, anche su hardware con risorse limitate.

→

Jun 08 2026

Altro

Naver e Nvidia: la Corea del Sud accelera verso l'AI sovrana con 'fabbriche' da gigawatt

Naver, in collaborazione con Nvidia, si appresta a costruire infrastrutture AI su scala gigawatt, segnando un'accelerazione significativa nella strategia della Corea del Sud per l'intelligenza artificiale sovrana. L'iniziativa sottolinea l'importanza crescente del controllo nazionale sui dati e sulle capacità di calcolo, spingendo verso deployment on-premise massivi per gestire carichi di lavoro LLM complessi e garantire la sovranità tecnicica.

→

Jun 08 2026

Hardware

Nvidia rivede il design di raffreddamento per la piattaforma Vera Rubin

Nvidia starebbe abbandonando l'architettura di raffreddamento a due pezzi per la sua prossima piattaforma Vera Rubin, secondo quanto riportato da DIGITIMES. Questa mossa potrebbe indicare un'evoluzione nel design hardware, con implicazioni significative per la densità dei server e l'efficienza termica nei data center. La gestione del calore è un fattore cruciale per le GPU ad alte prestazioni, specialmente in contesti on-premise dove l'ottimizzazione dello spazio e dei consumi energetici è prioritaria per i CTO e gli architetti di infrastruttura.

→

Jun 08 2026

Altro

Hitachi e Intel: una partnership strategica per l'AI fisica e l'industria

Hitachi e Intel hanno formalizzato una collaborazione strategica per avanzare nello sviluppo dell'AI fisica e delle infrastrutture industriali. L'iniziativa mira a integrare capacità di intelligenza artificiale direttamente negli ambienti operativi, con implicazioni significative per settori come la produzione, la logistica e la gestione degli asset. Questa partnership sottolinea l'importanza di soluzioni AI robuste e localizzate per le esigenze del mondo industriale.

→

Jun 08 2026

Altro

Nvidia e SK Telecom: un'alleanza per un'AI cloud su scala gigawatt in Corea

Nvidia e SK Telecom hanno annunciato una collaborazione strategica per la creazione di un'infrastruttura AI cloud di dimensioni considerevoli in Corea. L'iniziativa, che mira a supportare carichi di lavoro intensivi per l'intelligenza artificiale, sottolinea l'importanza di partnership tecniciche per lo sviluppo di capacità di calcolo avanzate, con implicazioni per la sovranità dei dati e l'efficienza energetica su larga scala.

→

Jun 08 2026

Altro

Nvidia e Doosan Rafforzano la Collaborazione per Robotica e Infrastrutture AI

Nvidia e Doosan ampliano la loro partnership, puntando a sviluppare soluzioni per la robotica e le infrastrutture AI in ambito industriale. Questa collaborazione evidenzia la crescente domanda di capacità di calcolo on-premise per carichi di lavoro AI complessi, come quelli richiesti dalle fabbriche intelligenti. Per le aziende, la scelta di architetture locali offre controllo sui dati e ottimizzazione del TCO, aspetti cruciali per l'adozione di sistemi robotici avanzati.

→

Jun 08 2026

Hardware

Nvidia e SK Hynix: alleanza pluriennale per la memoria in AI, PC e robotica

Nvidia e SK Hynix hanno annunciato una partnership pluriennale strategica incentrata sulla fornitura di soluzioni di memoria avanzate. L'accordo coprirà settori chiave come i server AI, i personal computer e la robotica, evidenziando l'importanza crescente della memoria ad alte prestazioni per l'evoluzione dell'intelligenza artificiale e delle infrastrutture che la supportano, con implicazioni dirette per i deployment on-premise.

→

Jun 08 2026

Hardware

Murata introduce MLCC più compatti per l'elettronica dei veicoli di nuova generazione

Murata ha annunciato il lancio di nuovi condensatori ceramici multistrato (MLCC) caratterizzati da dimensioni ridotte. Questi componenti sono specificamente progettati per l'integrazione nei sistemi elettronici avanzati dei veicoli elettrici e a guida autonoma. La miniaturizzazione è un fattore critico per ottimizzare lo spazio e migliorare le prestazioni in applicazioni automotive complesse, dove l'affidabilità e l'efficienza energetica sono essenziali anche per i carichi di lavoro di AI all'edge.

→

Jun 08 2026

Altro

Anthropic Mythos: Più Vulnerabilità Rilevate, Costi di Scansione in Aumento

Anthropic ha introdotto Mythos, un nuovo strumento che promette di identificare un numero significativamente maggiore di vulnerabilità nei sistemi. Tuttavia, questa maggiore efficacia comporta un notevole incremento dei costi associati alle operazioni di scansione, ponendo le aziende di fronte a un trade-off tra sicurezza avanzata e gestione della spesa. La notizia solleva interrogativi cruciali per i responsabili IT e i CTO.

→

Jun 08 2026

Altro

OpenAI: Codex, ChatGPT e Atlas convergono in una superapp desktop

OpenAI si prepara a lanciare una "superapp" desktop che integrerà i modelli Codex, ChatGPT e Atlas. L'iniziativa, attesa nelle prossime settimane, segna un passo verso l'unificazione delle capacità AI su piattaforme locali. Per le aziende, l'evoluzione dei modelli e delle loro modalità di deployment, inclusi scenari on-premise, rimane un fattore critico per la sovranità dei dati e il Total Cost of Ownership (TCO).

→

Jun 08 2026

Altro

Francia: oltre 110 miliardi in investimenti AI e data center, ma la realizzazione è in salita

La Francia ha attratto impegni per oltre 110 miliardi di euro in investimenti per l'intelligenza artificiale e i data center. Tuttavia, la concretizzazione di questi progetti su larga scala si scontra con ostacoli significativi, in particolare per quanto riguarda la disponibilità di energia e la complessità dei processi autorizzativi. Questo scenario evidenzia le sfide infrastrutturali che attendono i deployment AI, con implicazioni dirette per il Total Cost of Ownership e la sovranità dei dati.

→

Jun 08 2026

Altro

KT Cloud: costruzione modulare e digital twin per data center AI più rapidi

KT Cloud sta accelerando la realizzazione di data center dedicati all'intelligenza artificiale attraverso l'adozione di metodologie innovative. L'azienda sfrutta la costruzione modulare e i digital twin per ottimizzare i tempi di deployment e l'efficienza operativa. Questo approccio risponde alla crescente domanda di infrastrutture AI robuste e scalabili, offrendo vantaggi significativi per le organizzazioni che valutano strategie di deployment on-premise o ibride, con un occhio attento al TCO e alla sovranità dei dati.

→

Jun 08 2026

Market

xAI punta sulla Cina: assunzioni di 'AI tutor' per l'espansione locale

xAI, l'azienda di intelligenza artificiale fondata da Elon Musk, sta intensificando la sua presenza in Cina attraverso l'assunzione di specialisti locali, definiti 'AI tutor'. Questa mossa strategica sottolinea l'importanza del mercato cinese per lo sviluppo e il perfezionamento dei Large Language Models, evidenziando le sfide legate alla localizzazione dei dati e alla sovranità digitale in un contesto geopolitico complesso.

→

Jun 08 2026

Market

T3EX potenzia il trasporto aereo in Asia per le filiere di chip ed elettronica

T3EX ha annunciato un'espansione dei suoi servizi di trasporto aereo nel Nord-Est asiatico, con l'obiettivo di rafforzare le catene di approvvigionamento per l'elettronica e i semiconduttori. Questa mossa strategica sottolinea la crescente importanza della logistica per i componenti ad alta tecnicia, cruciali per lo sviluppo e il deployment di infrastrutture AI, inclusi i Large Language Models (LLM) on-premise.

→

Jun 08 2026

Altro

Onsemi promuove architettura di alimentazione a 800 VDC per l'infrastruttura AI

Onsemi sta promuovendo una nuova architettura di alimentazione a 800 VDC, pensata per le future infrastrutture dedicate all'intelligenza artificiale. Questa soluzione mira a migliorare l'efficienza energetica e la densità di potenza, aspetti cruciali per i deployment on-premise di Large Language Models e altri carichi di lavoro AI, dove il controllo sui costi operativi e la gestione dell'hardware sono prioritari.

→

Jun 08 2026

Market

L'India mira a diventare un hub per il packaging dei chip, attrattiva per Taiwan

L'India sta intensificando gli sforzi per affermarsi come centro strategico per il packaging dei chip, cercando attivamente investimenti dalle aziende elettroniche taiwanesi. Questa mossa riflette una tendenza globale verso la diversificazione della supply chain dei semiconduttori, con potenziali impatti sulla disponibilità e sul Total Cost of Ownership (TCO) dell'hardware per i deployment di Large Language Models (LLM) on-premise. La strategia indiana mira a rafforzare la propria sovranità tecnicica e a creare un ecosistema manifatturiero robusto.

→

Jun 08 2026

Market

LG Innotek espande le operazioni in Vietnam per il packaging AI

LG Innotek ha annunciato l'espansione delle sue operazioni in Vietnam, focalizzandosi sul packaging avanzato per componenti AI. Questa mossa risponde alla crescente domanda globale di soluzioni hardware dedicate all'intelligenza artificiale, evidenziando l'importanza della supply chain per i deployment on-premise e cloud, e l'impatto sulla disponibilità di silicio per l'Inference e il training di LLM.

→

Jun 07 2026

Altro

L'adattamento infrastrutturale: il ruolo dei cavi in fibra ottica nell'AI on-premise

In un contesto di crescente complessità per i deployment di Large Language Models (LLM), l'adattamento e la resilienza infrastrutturale diventano cruciali. Questo articolo esplora come i cavi in fibra ottica rappresentino un elemento fondamentale per garantire connettività ad alta larghezza di banda e bassa latenza, essenziali per le architetture AI on-premise, influenzando direttamente il TCO e la sovranità dei dati.

→

Jun 07 2026

Altro

Notion ripristina l'accesso ad Anthropic dopo un'interruzione del servizio

Notion ha ristabilito l'accesso ai servizi di Anthropic a seguito di un'interruzione che ha generato notevole attenzione. L'episodio evidenzia la dipendenza delle piattaforme da fornitori esterni di Large Language Models e solleva interrogativi sulla resilienza delle architetture basate su cloud per carichi di lavoro AI critici, spingendo le aziende a valutare alternative on-premise per maggiore controllo e sovranità dei dati.

→

Jun 07 2026

Hardware

Affidabilità hardware: il guasto di un sistema X99 e le implicazioni per l'AI on-premise

Un utente ha segnalato il guasto di un sistema basato su chipset X99. Questo evento, sebbene aneddotico, solleva questioni cruciali sull'affidabilità dell'hardware in contesti di deployment on-premise per carichi di lavoro AI. La gestione del ciclo di vita dei componenti e la resilienza infrastrutturale sono fattori determinanti per CTO e architetti che valutano soluzioni self-hosted, dove il TCO include anche i costi di manutenzione e i tempi di inattività.

→

Jun 07 2026

Frameworks

Controllo di Avatar 3D via Linguaggio Naturale: La Rivoluzione di `programasweights`

Un nuovo approccio permette di controllare avatar 3D con il linguaggio naturale, superando i limiti dei comandi predefiniti. Basato sul framework `programasweights`, il sistema compila descrizioni testuali in programmi di azione che vengono eseguiti localmente nel browser, anche offline. Questa tecnicia Open Source apre nuove frontiere per l'interazione utente e promette di trasformare il comportamento dei personaggi nei videogiochi, offrendo maggiore dinamicità e reattività.

→

Jun 07 2026

Hardware

GMKtec EVO-X3: OCuLink, Wi-Fi 7 e Doppio PCIe 4.0 per il Ryzen AI MAX+ 495 da 192GB

GMKtec ha annunciato il mini PC EVO-X3, che integra connettività OCuLink, Wi-Fi 7 e doppio slot PCIe 4.0. L'azienda prevede di rilasciare una versione più potente entro l'anno, equipaggiata con un processore Ryzen AI MAX+ 495 e ben 192GB di RAM. Questo hardware, il primo basato su "Strix 495" ad emergere, promette capacità I/O avanzate, posizionandosi come una soluzione interessante per carichi di lavoro AI on-premise. I dettagli sui prezzi non sono ancora stati divulgati.

→

Jun 07 2026

Altro

OpenAI e la "Super App": il futuro delle interazioni AI oltre la chat

OpenAI sta sviluppando una "super app" che potrebbe ridefinire l'interazione con l'intelligenza artificiale. La dichiarazione di un dipendente senior, "Chat is dead", suggerisce un superamento delle interfacce conversazionali attuali. Questa evoluzione pone nuove sfide e opportunità per le aziende che valutano deployment on-premise, in termini di requisiti hardware, gestione dei dati e sovranità.

→

Jun 07 2026

Hardware

Firefox integra il supporto per la decodifica video Vulkan

Mozilla Firefox ha introdotto il supporto iniziale per Vulkan Video, abilitando la decodifica video accelerata tramite GPU. Questa integrazione mira a migliorare le prestazioni e l'efficienza energetica nella riproduzione multimediale, sfruttando le capacità hardware moderne per un'esperienza utente più fluida e un minor carico sulla CPU.

→

Jun 07 2026

Altro

NXP a Computex 2026: L'AI per l'Edge e la Robotica nel Mondo Reale

NXP, tramite il suo CEO Rafael Sotomayor, ha delineato a Computex 2026 la propria visione per l'implementazione dell'intelligenza artificiale su dispositivi edge e nella robotica. L'azienda si posiziona come attore chiave per portare l'AI in applicazioni concrete, affrontando le sfide del deployment in ambienti reali, dove sovranità dei dati, controllo locale e ottimizzazione del TCO sono prioritari per le infrastrutture AI.

→

Jun 07 2026

Altro

Oltre i Large Language Models: l'AI quotidiana che sfugge ai riflettori

Mentre i Large Language Models dominano il dibattito sull'intelligenza artificiale, una discussione online ha acceso i riflettori su strumenti AI meno noti ma utilizzati quotidianamente. L'analisi esplora l'ecosistema di soluzioni AI "nascoste" che supportano operazioni critiche, spesso con implicazioni significative per le strategie di deployment on-premise e la sovranità dei dati, offrendo spunti per CTO e architetti infrastrutturali che valutano alternative al cloud.

→

Jun 07 2026

Altro

Wayland Protocols 1.49: Supporto Multi-GPU Rafforzato per Carichi AI

La versione 1.49 dei Wayland Protocols, rilasciata da Simon Ser, introduce un supporto multi-GPU migliorato. Questo aggiornamento è significativo per le architetture che gestiscono carichi di lavoro intensivi, come l'inference e il training di Large Language Models (LLM) in ambienti on-premise. La capacità di orchestrare più unità di elaborazione grafica in modo più efficiente può influenzare direttamente le performance e il TCO delle infrastrutture AI, offrendo maggiore flessibilità e controllo sui deployment locali.

→

Jun 07 2026

Market

La Cina punta a veicoli elettrici più leggeri: la sfida di peso e dimensioni

Le autorità cinesi stanno spingendo per una riduzione del peso e delle dimensioni dei veicoli elettrici. Con un peso medio di 1.704 kg nel 2024, circa un terzo in più rispetto al 2012, e larghezze che superano i 2 metri per molti SUV e MPV, i veicoli attuali faticano a inserirsi negli spazi di parcheggio esistenti, creando nuove sfide infrastrutturali.

→

Jun 07 2026

Frameworks

llama.cpp integra il supporto Multi-Tensor Parallelism per Gemma4

Il progetto `llama.cpp` ha introdotto il supporto per il Multi-Tensor Parallelism (MTP) per i modelli Gemma4. Questo sviluppo è cruciale per le organizzazioni che mirano a eseguire LLM su infrastrutture on-premise, consentendo una gestione più efficiente di modelli complessi su configurazioni multi-GPU e migliorando le performance di Inference in ambienti self-hosted e air-gapped.

→

Jun 07 2026

Market

ASML vola a 674 miliardi di dollari: è la società europea di maggior valore, spinta dall'EUV

ASML ha raggiunto una capitalizzazione di mercato di 674 miliardi di dollari, diventando la società di maggior valore in Europa. Questo traguardo è alimentato dalle aspettative degli analisti su un aumento della produzione di sistemi EUV, tecnicia cruciale per i chip avanzati. Il successo di ASML sottolinea l'importanza strategica della litografia per l'industria dei semiconduttori, fondamentale per l'innovazione in settori come l'AI e i deployment on-premise.

→

Jun 07 2026

LLM

Qwen 3.6 27B: Analisi della Quantization KV Cache per LLM On-Premise

Nuovi benchmark esplorano la quantization del KV cache per il modello Qwen 3.6 27B, testando diverse configurazioni (q8, q6, q5, q4) e tecniche avanzate come KVarN, TurboQuant e TCQ. I risultati, ottenuti tramite BeeLlama.cpp, offrono spunti cruciali per ottimizzare l'inference di Large Language Models in ambienti self-hosted, riducendo i requisiti di VRAM e migliorando il throughput per deployment on-premise efficienti e sovrani.

→

Jun 07 2026

Altro

Russia: un satellite della flotta "Rassvet" fuori orbita, 15 restano operativi

La Russia ha perso il primo satellite della sua nuova costellazione "Rassvet", definita "Starlink-Style", dopo poche settimane dal lancio. L'oggetto 4 è uscito dall'orbita, ma la maggior parte della flotta, composta da altri 15 satelliti, continua a operare. L'incidente evidenzia le sfide intrinseche nella gestione di infrastrutture spaziali complesse, cruciali per la connettività e la sovranità dei dati.

→

Jun 07 2026

Hardware

Half-Life su Nokia N95: il mobile del 2007 eguaglia le performance dei PC del 1998

Un recente esperimento ha dimostrato come un Nokia N95, smartphone del 2007, sia riuscito a far girare Half-Life a 30 FPS, eguagliando le performance dei PC del 1998. Questa impresa evidenzia la rapida evoluzione del silicio e le sue implicazioni per il deployment di Large Language Models (LLM) su dispositivi edge e infrastrutture on-premise, sottolineando l'importanza dell'efficienza hardware e della sovranità dei dati.

→

Jun 07 2026

Altro

Sistema AI di rilevamento armi sotto accusa dopo fallimento in sparatoria scolastica

Un sopravvissuto a una sparatoria in una scuola del Tennessee ha citato in giudizio Omnilert, produttore di un sistema AI per il rilevamento di armi, dopo che il dispositivo non ha identificato la pistola usata nell'attacco. La causa evidenzia presunte limitazioni operative significative del sistema, legate a fattori ambientali come posizionamento delle telecamere, angolazione e illuminazione. Il caso solleva interrogativi cruciali sull'affidabilità dei sistemi AI per la sicurezza in contesti reali.

→

Jun 07 2026

Hardware

Mesa 26.2 integra VK_GOOGLE_display_timing per un rendering più fluido

Mesa 26.2 introduce l'estensione VK_GOOGLE_display_timing, migliorando la gestione dei tempi di visualizzazione per i driver Vulkan. Questa novità, che include il supporto per la modalità di display diretto tramite KHR_display, mira a ottimizzare il frame-pacing e ridurre il micro-stuttering nei giochi. I driver Intel ANV, Radeon RADV, PowerVR, Turnip e V3DV beneficiano immediatamente di questa integrazione, offrendo un'esperienza visiva più fluida e reattiva su diverse piattaforme hardware.

→

Jun 07 2026

Hardware

Overclock estremo su Core i7-6700K: sbloccare una RTX 3080 e il nodo CPU-GPU per l'AI

Un esperimento ha spinto un Intel Core i7-6700K a 5.2 GHz con 1.7 volt per mitigare un bottleneck sulla GPU NVIDIA RTX 3080. L'overclock ha permesso di aumentare l'utilizzo della GPU dal 60% al 74%. Questo caso studio evidenzia come l'equilibrio tra CPU e GPU sia cruciale per massimizzare le performance, un aspetto fondamentale per l'efficienza dei carichi di lavoro di Large Language Models (LLM) in ambienti self-hosted.

→

Jun 07 2026

Altro

USA: Direttiva presidenziale sull'AI militare e la sovranità sui sistemi

Un memorandum presidenziale firmato dall'ex Presidente Trump impone alle agenzie militari e di intelligence statunitensi di accelerare l'adozione di AI avanzata. La direttiva NSPM-11 stabilisce un Framework per l'integrazione rapida di modelli da più vendor, ma soprattutto vieta alle aziende di disabilitare, degradare o modificare i sistemi AI una volta deployati. Questo sottolinea l'importanza del controllo operativo e della sovranità tecnicica in contesti di sicurezza nazionale.

→

Jun 07 2026

Hardware

Broadcom V3D: Fine del Supporto per le Versioni 3.3 e 4.1

Broadcom ha annunciato la deprecazione e la successiva rimozione del supporto per le IP grafiche V3D 3.3 e V3D 4.1 dal driver kernel V3D. La decisione, che segue la cessazione del supporto da parte del driver Mesa due anni fa, è motivata dalla mancanza di hardware di test per gli sviluppatori e dalla scarsa adozione di queste specifiche soluzioni grafiche in determinati SoC. Questo scenario evidenzia le sfide legate al ciclo di vita del supporto hardware per i deployment on-premise.

→

Jun 07 2026

Altro

Clustering di Jetson Nano Orin Super: L'AI Distribuita Oltre il Datacenter

Un nuovo progetto esplora la creazione di cluster di calcolo distribuiti utilizzando hardware accessibile come i Jetson Nano Orin Super. L'iniziativa mira a democratizzare l'addestramento e l'inference di modelli AI, dimostrando come sistemi distribuiti possano operare al di fuori dei grandi datacenter, offrendo controllo e sovranità sui dati per carichi di lavoro on-premise.

→

Jun 07 2026

Hardware

Intel lancia chip Core 200H senza iGPU per desktop SFF

Intel ha ampliato la sua offerta di processori Core 200H con due nuovi modelli, Core 7 230H e Core 5 205H, basati sull'architettura Raptor Lake. Questi chip si distinguono per l'assenza di una GPU integrata, una scelta mirata a sistemi desktop compatti (Small Form Factor). La decisione risponde all'esigenza di configurazioni che prevedono l'uso di schede grafiche discrete, ottimizzando costi e consumi per specifici scenari di deployment.

→

Jun 07 2026

Altro

OpenAI rafforza ChatGPT con "Lockdown Mode" contro gli attacchi di prompt injection

OpenAI ha iniziato il rilascio di "Lockdown Mode" per ChatGPT, una nuova impostazione di sicurezza progettata per contrastare il furto di dati tramite attacchi di prompt injection. Questa funzionalità disabilita diverse capacità, tra cui la navigazione web in tempo reale, la modalità agente, la ricerca approfondita, il recupero di immagini, il networking Canvas e i download di file. È disponibile per tutti gli utenti registrati, indipendentemente dal piano di abbonamento.

→

Jun 07 2026

Market

Sriram Krishnan lascia il ruolo di consigliere AI alla Casa Bianca

Sriram Krishnan, consigliere senior per l'intelligenza artificiale della Casa Bianca, si dimetterà a fine giugno. L'ex partner di Andreessen Horowitz era stato nominato dal Presidente Donald Trump per definire la strategia AI dell'amministrazione durante il suo secondo mandato. La sua partenza solleva interrogativi sulla continuità delle politiche AI a livello governativo, un ambito cruciale per le decisioni di deployment tecnicico in settori chiave.

→

Jun 07 2026

Hardware

Raffreddamento AI: Niching registra un'impennata nelle consegne di heat spreader

L'incremento della domanda di soluzioni di raffreddamento per l'intelligenza artificiale sta spingendo le consegne di heat spreader da parte di aziende come Niching. Questo fenomeno evidenzia la crescente importanza della gestione termica nell'infrastruttura AI, specialmente per i deployment on-premise di Large Language Models, dove l'efficienza e la dissipazione del calore sono cruciali per performance e TCO.

→

Jun 07 2026

Market

Taiwan: primo hub estero per la certificazione della supply chain dei droni USA

Taiwan è stata designata come il primo hub estero per la certificazione della supply chain dei droni statunitensi. Questa mossa strategica sottolinea l'importanza crescente della sicurezza e dell'integrità delle catene di fornitura per le tecnicie critiche, in un contesto geopolitico in evoluzione. La certificazione mira a garantire l'affidabilità e la resilienza dei componenti, un aspetto cruciale anche per i deployment on-premise di soluzioni AI avanzate.

→

Jun 07 2026

Market

AI agentica: Aspeed prevede un'impennata della domanda e tensioni sulla supply chain entro il 2027

Aspeed, fornitore di componenti essenziali per l'infrastruttura server, anticipa un'escalation della domanda legata all'AI agentica entro il 2027. Questa crescita è destinata a mettere sotto pressione le capacità della supply chain globale, con potenziali ripercussioni sui tempi di consegna e sui costi per le infrastrutture AI. Le aziende che valutano deployment on-premise dovranno pianificare con attenzione per mitigare i rischi.

→

Jun 07 2026

Hardware

JCET inaugura un impianto per il packaging 3D, mirando a moduli AI e CPO

JCET ha annunciato l'apertura di un nuovo stabilimento in Corea del Sud, specializzato nel packaging 3D avanzato. L'impianto è progettato per soddisfare la crescente domanda di moduli di potenza per l'intelligenza artificiale e di soluzioni Co-Packaged Optics (CPO), componenti cruciali per l'infrastruttura AI di prossima generazione. Questa mossa sottolinea l'importanza delle tecnicie di packaging per migliorare le prestazioni e l'efficienza dei sistemi AI.

→

Jun 07 2026

Market

ASRock Rack si aggiudica un ordine per server GPU in un data center AI in Thailandia

ASRock Rack, divisione di Pegatron, ha ottenuto un significativo ordine per la fornitura di 587 server GPU destinati a un nuovo data center AI in Thailandia. Questa commessa, riportata da DIGITIMES, sottolinea la crescente domanda globale di infrastrutture dedicate all'intelligenza artificiale e l'importanza strategica dei deployment on-premise per la sovranità dei dati e il controllo delle risorse computazionali.

→

Jun 07 2026

Frameworks

dvlt.cu: Un Motore di Inference CUDA/C++ Minimale per Modelli 3D NVIDIA

dvlt.cu è un motore di inference sviluppato ex novo in CUDA/C++ per i modelli transformer 3D DVLT di NVIDIA. Si distingue per la sua architettura estremamente leggera: un singolo binario da 5MB con dipendenze minime, privo di runtime complessi come Python, PyTorch o Hugging Face. Questo approccio lo rende ideale per deployment on-premise che richiedono controllo granulare, efficienza e bassa latenza, offrendo un esempio concreto di ottimizzazione hardware-software per carichi di lavoro AI specifici.

→

Jun 06 2026

Altro

Audi Nuvolari: Potenza Ibrida e le Lezioni per l'AI On-Premise

Audi presenta la Nuvolari, un'hypercar ibrida da 1.001 PS che ridefinisce i limiti prestazionali. Questo veicolo, con il suo V8 biturbo e motori elettrici, incarna una complessità ingegneristica che richiama le sfide affrontate nel deployment di Large Language Models (LLM) on-premise. L'articolo esplora come la ricerca di prestazioni estreme e l'ottimizzazione delle risorse in contesti fisici possano offrire spunti preziosi per architetti e CTO che gestiscono infrastrutture AI.

→

Jun 06 2026

Altro

Grave vulnerabilità in uno strumento AI: rischio di takeover amministrativo con un click

Una grave vulnerabilità di sicurezza è stata scoperta in uno strumento AI associato al noto creator PewDiePie. Il difetto permette un "account takeover" amministrativo con un solo click, esponendo potenzialmente i dati e il controllo del sistema. Questo episodio sottolinea l'importanza di robuste pratiche di sicurezza per qualsiasi deployment di strumenti AI, sia on-premise che in cloud, evidenziando i rischi legati alla gestione degli accessi e alla protezione dei dati sensibili.

→

Jun 06 2026

Altro

OpenAI introduce la "Lockdown Mode" per rafforzare la sicurezza dei dati in ChatGPT

OpenAI ha annunciato la "Lockdown Mode" per ChatGPT, una nuova funzionalità volta a mitigare i rischi degli attacchi di prompt injection. L'obiettivo è ridurre la probabilità che dati sensibili vengano esposti, sebbene la protezione completa da tali vulnerabilità rimanga una sfida complessa per i Large Language Models. Questa mossa evidenzia la crescente attenzione alla sicurezza dei dati nel panorama degli LLM.

→

Jun 06 2026

Altro

GLM e la ricerca di modelli efficienti: la sfida del deployment locale

La community tech esprime preoccupazione per l'evoluzione dei modelli GLM. Dopo l'assenza di aggiornamenti per la serie "Air" e le prestazioni altalenanti del 4.7 Turbo, il recente GLM 5.1, pur eccellendo nella programmazione, si rivela troppo grande per il deployment locale e lento anche via API. Si evidenzia la necessità di modelli più efficienti, capaci di competere con alternative come Qwen 3.6 35B, ottimizzati per l'esecuzione on-premise e con un minor consumo di Token.

→

Jun 06 2026

LLM

Gemma 4 12B QAT: 120 tok/s su GPU da 12GB VRAM con llama.cpp

Un recente benchmark dimostra come il modello Gemma 4 12B QAT di Google, ottimizzato con Quantization-Aware Training, possa raggiungere prestazioni notevoli su hardware consumer. Utilizzando una GPU NVIDIA RTX 4070 Super da 12GB VRAM e una versione patchata di llama.cpp, è stato possibile ottenere una velocità di circa 120 token al secondo. Questo risultato evidenzia il potenziale dei Large Language Models quantizzati per deployment on-premise, anche con risorse hardware limitate, mantenendo un'elevata efficienza nell'inference.

→

Jun 06 2026

LLM

KVarN: Nuovi benchmark per la KV Cache riducono il fabbisogno di VRAM negli LLM

Una nuova serie di benchmark sulla quantization della KV cache, condotta con la tecnica KVarN, rivela un significativo potenziale di risparmio di VRAM per i Large Language Models. I risultati indicano che KVarN a 6-bit può eguagliare la precisione di q8_0, mentre la versione a 4-bit raggiunge quella di q5_0, offrendo un vantaggio cruciale per i deployment on-premise con risorse hardware limitate, nonostante un attuale rallentamento nella fase di prompt processing.

→

Jun 06 2026

Market

Sriram Krishnan lascia la Casa Bianca per un nuovo ruolo nella politica AI

Sriram Krishnan, già consigliere AI della Casa Bianca, si appresta a lasciare il suo incarico. Secondo le prime indiscrezioni, fonderà una nuova istituzione con l'obiettivo di continuare a influenzare le future politiche sull'intelligenza artificiale dell'amministrazione Trump. Questo sviluppo sottolinea la crescente importanza delle figure chiave nella definizione delle strategie nazionali per l'AI e le loro potenziali ricadute sulle decisioni di deployment.

→

Jun 06 2026

Altro

StepFun 3.7 Flash MTP: L'accelerazione LLM on-premise su AMD Strix Halo

Un recente benchmark evidenzia come la tecnicia MTP (Multi-Token Prediction) migliori significativamente la velocità di decode e l'efficienza energetica per i Large Language Models (LLM) su hardware locale. Testato su un'APU AMD Strix Halo con 128 GB di memoria unificata, il modello StepFun 3.7 Flash, un MoE da circa 200 miliardi di parametri, ha mostrato un incremento del 27,5% nella generazione di token e una riduzione del 14% nel consumo energetico, senza penalizzare il prefill.

→

Jun 06 2026

LLM

Cohere presenta in anteprima un nuovo LLM per la programmazione, ottimizzato per deployment locali

Cohere ha offerto alla community di `localllama` un accesso anticipato al suo primo Large Language Model (LLM) dedicato alla programmazione. Il modello, da 30 miliardi di parametri con 3 miliardi attivi, è progettato per funzionare efficacemente su configurazioni locali, sottolineando l'attenzione verso l'inference on-premise. Questa iniziativa mira a raccogliere feedback diretti per affinare il modello prima del rilascio ufficiale, evidenziando l'importanza della collaborazione con gli sviluppatori per ottimizzare le performance e l'usabilità in ambienti controllati.

→

Jun 06 2026

Hardware

Schede di espansione AMD B650: più storage e connettività per PC on-premise

Le nuove schede di espansione AMD B650 arrivano sul mercato a partire da 199 dollari, offrendo quattro slot M.2 PCIe 4.0 e undici porte USB. Questa soluzione permette di potenziare i PC esistenti con capacità di storage ad alta velocità e maggiore connettività, rivelandosi strategica per chi gestisce carichi di lavoro AI/LLM on-premise e cerca flessibilità e controllo sull'infrastruttura locale.

→

Jun 06 2026

Market

L'amministrazione Trump valuta una partecipazione in OpenAI per il beneficio pubblico dell'AI

L'amministrazione Trump sta esplorando la possibilità di acquisire una partecipazione azionaria in OpenAI. Il Presidente Donald Trump ha dichiarato che l'obiettivo di questi accordi è garantire che il popolo americano possa trarre vantaggio dal successo e dallo sviluppo dell'intelligenza artificiale. Questa mossa sottolinea la crescente importanza strategica dell'AI a livello nazionale e le discussioni in corso su come i governi possano influenzare e beneficiare del suo progresso.

→

Jun 06 2026

Hardware

Upgrade PC da $300: un'analisi per le esigenze LLM on-premise

Un bundle hardware consumer offre SSD PCIe 4.0 da 2TB, alimentatore da 750W e AIO da 240mm a $300. Sebbene conveniente per l'upgrade di un PC domestico, queste specifiche sono lontane dai requisiti per carichi di lavoro LLM in ambienti on-premise. L'articolo esplora le differenze fondamentali nelle infrastrutture necessarie per l'intelligenza artificiale.

→

Jun 06 2026

LLM

Gemma 4 QAT su Strix Halo: performance on-premise per LLM quantizzati

I modelli Gemma 4 QAT (Quantization-Aware Training) di Google, eseguiti localmente su una APU AMD Strix Halo, dimostrano un notevole incremento delle performance per l'inference on-premise. I test hanno evidenziato come l'utilizzo di assistant heads specifici per QAT migliori significativamente l'efficienza e l'accuratezza, raggiungendo fino a 71 token/secondo per il modello 26B-A4B QAT Q4_0. Questi risultati sono cruciali per chi valuta deployment di Large Language Models su hardware edge.

→

Jun 06 2026

Hardware

Gigabyte R1C7-K0A-AS1: 40 Nodi e 40 iGPU in 1U per l'Edge AI

Gigabyte ha presentato al Computex 2026 il cluster R1C7-K0A-AS1, una soluzione ultra-densa che integra 40 nodi, 320 core, 40 iGPU e 80 SSD in un'unità rack da 1U. Questo design compatto è pensato per carichi di lavoro AI distribuiti e per scenari di edge computing, offrendo capacità di elaborazione locale con un ingombro minimo, ideale per deployment on-premise che richiedono efficienza spaziale e sovranità dei dati.

→

Jun 06 2026

Market

AI e limiti energetici: il Governatore della Bank of England paventa il razionamento

Andrew Bailey, Governatore della Bank of England, ha sollevato preoccupazioni significative riguardo al futuro dell'intelligenza artificiale. Ha avvertito che la rapida espansione delle capacità dell'AI potrebbe scontrarsi con i limiti della fornitura energetica globale, rendendo necessario un potenziale razionamento. Questa prospettiva impone a governi e aziende scelte sociali complesse, evidenziando come le restrizioni energetiche possano forzare compromessi tra diversi settori tecnicici e industriali.

→

Jun 06 2026

LLM

L'Evoluzione dei LLM: Perché l'Età del Modello e gli Strumenti Contano per l'Accuratezza

Un recente dibattito online evidenzia come la valutazione dei Large Language Models debba considerare l'età del modello e l'integrazione con strumenti esterni. Analizziamo le implicazioni di un LLM datato, privo di funzionalità avanzate come il Retrieval Augmented Generation (RAG), e come ciò influenzi l'accuratezza e l'affidabilità, aspetti cruciali per i deployment enterprise, specialmente in contesti on-premise.

→

Jun 06 2026

Market

GR3N raccoglie 15,5 milioni di euro per un impianto PET a microonde in Spagna

La startup svizzera cleantech GR3N ha completato un round di finanziamento Series B da 15,5 milioni di euro. I fondi saranno impiegati per costruire in Spagna il primo impianto commerciale al mondo per il riciclo del PET assistito da microonde, denominato MODUS, con una capacità di 40.000 tonnellate all'anno. L'operazione è stata guidata da 360 Capital, con la partecipazione di VP Textile.

→

Jun 06 2026

LLM

Domino: Decoupling Causal Modeling per un'inference LLM fino a 5.8x più rapida

Il progetto Domino introduce un nuovo approccio per l'inference dei Large Language Models (LLM), ottimizzando il decoding speculativo. Questa tecnica, che disaccoppia il modeling causale dal drafting autoregressivo, ha dimostrato un incremento del throughput fino a 5.8 volte sul modello Qwen3. L'innovazione è particolarmente rilevante per le aziende che cercano di massimizzare l'efficienza e ridurre il TCO nei deployment LLM on-premise, offrendo un significativo miglioramento delle performance con risorse hardware esistenti.

→

Jun 06 2026

Hardware

FormulaV Line punta al mercato USA con chassis innovativi per sistemi ad alte prestazioni

La startup taiwanese FormulaV Line si prepara a entrare nel mercato statunitense con due nuovi modelli di chassis, attesi su Newegg entro fine anno. Sebbene l'annuncio si concentri sull'espansione commerciale, l'introduzione di case "unici" suggerisce soluzioni potenzialmente adatte a ospitare configurazioni hardware avanzate, cruciali per lo sviluppo e il deployment di carichi di lavoro AI on-premise.

→

Jun 06 2026

Altro

Un agente AI scopre 21 zero-day in FFmpeg con un costo di 1.000 dollari

Una startup di sicurezza ha utilizzato un agente AI autonomo per identificare 21 vulnerabilità zero-day finora sconosciute nella libreria multimediale open source FFmpeg. L'operazione ha comportato un costo di calcolo di circa 1.000 dollari, rivelando bug presenti nel codice da oltre due decenni. Questo evento sottolinea il potenziale dell'intelligenza artificiale nel rafforzare la sicurezza dei sistemi critici e le implicazioni per le strategie di deployment on-premise.

→

Jun 06 2026

Altro

Worm Miasma colpisce 73 repository GitHub di Microsoft: allarme supply chain

Un worm auto-replicante, denominato Miasma, ha compromesso 73 repository GitHub di Microsoft, inclusi quelli di Azure. L'attacco, parte di una campagna più ampia sulla supply chain open source, ha permesso al malware di raccogliere credenziali di sviluppatori, evidenziando rischi significativi per la sicurezza dei dati e delle infrastrutture.

→

Jun 06 2026

Frameworks

OpenCV 5.0: Motore DNN Riscritto e Supporto Integrato per LLM e VLM

OpenCV 5.0 segna un aggiornamento significativo per la celebre libreria open source di computer vision. La nuova versione introduce un motore DNN completamente riscritto e, per la prima volta, un supporto nativo per i Large Language Models (LLM) e i Vision-Language Models (VLM). Queste innovazioni aprono nuove frontiere per lo sviluppo di applicazioni multimodali, ponendo al contempo nuove sfide per le architetture di deployment on-premise, in particolare per quanto riguarda le risorse hardware necessarie all'inference.

→

Jun 06 2026

Hardware

G.Skill e AMD EXPO ULL: Ottimizzare la RAM per l'AI On-Premise

G.Skill ha approfondito il funzionamento di AMD EXPO ULL, una tecnicia che permette ai produttori di memoria di integrare profili espansi con modifiche ai subtiming. Questa innovazione mira a sbloccare prestazioni aggiuntive dalla RAM, un fattore cruciale per ottimizzare l'efficienza e il TCO nei deployment di Large Language Models (LLM) e altri carichi di lavoro AI eseguiti on-premise, dove ogni guadagno prestazionale contribuisce a massimizzare l'investimento hardware.

→

Jun 06 2026

Hardware

Huawei: post-training di DeepSeek-V2 1.6T con 1.000 chip Ascend 910C

Un team guidato da Huawei ha annunciato di aver completato il post-training del modello DeepSeek-V2 da 1.6 trilioni di parametri. L'operazione, che sottolinea le capacità di calcolo dell'azienda, ha impiegato una vasta infrastruttura composta da 1.000 chip Huawei Ascend 910C. Questo traguardo evidenzia l'impegno nello sviluppo di Large Language Models su larga scala e l'importanza delle soluzioni hardware proprietarie per carichi di lavoro intensivi di AI.

→

Jun 06 2026

LLM

Qwen3.6-35B GGUF: Un LLM per deployment on-premise con ragionamento Claude Opus

Il modello Qwen3.6-35B, disponibile in formato GGUF, si propone come soluzione robusta per il deployment on-premise di Large Language Models. Basato su una fusione delta e arricchito dal ragionamento di Claude 4.6 Opus, offre stabilità per la programmazione, capacità di roleplay complesse e funzionalità di chiamata di funzioni migliorate. La sua ottimizzazione per l'inference locale, anche con quantization Q4_K_M, lo rende particolarmente interessante per aziende che privilegiano sovranità dei dati e controllo infrastrutturale.

→

Jun 06 2026

Market

Reid Hoffman lascia Microsoft per Manus, startup AI nella scoperta di farmaci

Reid Hoffman si dimette dal consiglio di amministrazione di Microsoft dopo quasi un decennio per dedicarsi a tempo pieno a Manus, la sua startup focalizzata sulla scoperta di farmaci tramite intelligenza artificiale. La mossa evidenzia il crescente interesse per l'applicazione dell'AI in settori complessi, sollevando questioni cruciali sui requisiti infrastrutturali e sulla sovranità dei dati per tali carichi di lavoro.

→

Jun 06 2026

Altro

L'AI tra Minacce Cripto-Finanziate e Collaborazioni Governative: Nuove Sfide per la Sicurezza

Recenti sviluppi evidenziano la duplice natura dell'intelligenza artificiale: da un lato, l'uso di bot AI di Meta per attacchi informatici e l'emergere di laboratori di peptidi cinesi finanziati in criptovalute; dall'altro, la collaborazione di Anthropic con la NSA. Questi scenari sottolineano l'urgenza di affrontare le implicazioni di sicurezza e sovranità dei dati per chi valuta il deployment di LLM on-premise.

→

Jun 06 2026

Market

Il Ciclone e-bike: un monito per le strategie di deployment AI

Il mercato delle e-bike ha assistito a fallimenti di alto profilo tra aziende sostenute da ingenti capitali di rischio, in netto contrasto con il successo di attori "bootstrapped". Questa dinamica offre spunti cruciali per CTO e decision-maker nel settore AI/LLM, evidenziando l'importanza di modelli di business sostenibili, un'attenta analisi del TCO e scelte strategiche di deployment, specialmente per le infrastrutture on-premise, al fine di evitare i rischi di valutazioni gonfiate e crescita insostenibile.

→

Jun 06 2026

Market

Trump e il futuro dell'AI: l'idea di una "partnership" pubblica con le aziende

L'ex Presidente Donald Trump ha annunciato l'intenzione di incontrare aziende del settore AI alla Casa Bianca per discutere una "partnership" governativa. L'obiettivo sarebbe permettere al pubblico americano di beneficiare economicamente dal successo dell'industria. La proposta solleva interrogativi sulle modalità di implementazione e sulle implicazioni per il settore, in particolare per le dinamiche tra innovazione privata e controllo pubblico.

→

Jun 06 2026

Altro

Ex dirigente IBM accusa l'azienda di aver nascosto attacchi hacker cinesi

Un ex vicepresidente della cybersecurity di IBM, William Barlow, ha mosso gravi accuse contro l'azienda. Secondo una causa per whistleblowing, IBM avrebbe deliberatamente nascosto per anni violazioni di dati attribuite ad hacker legati allo stato cinese, omettendo di informare le autorità statunitensi. L'episodio solleva interrogativi sulla trasparenza e la gestione della sicurezza dei dati in contesti aziendali complessi.

→

Jun 06 2026

LLM

Ondata di Modelli AI Open-Weight: Nuove Opzioni per Deployment On-Premise

La scorsa settimana ha visto un'intensa attività nel panorama dell'intelligenza artificiale, con il rilascio di oltre 25 modelli "open-weight" in diverse modalità. Tra questi, spiccano soluzioni ottimizzate per l'inference su hardware locale e edge, come NVIDIA Nemotron 3 Ultra e Google Gemma 4, che promettono maggiore throughput e flessibilità di deployment. Queste novità offrono opportunità significative per le aziende che cercano controllo sui dati e costi operativi ottimizzati.

→

🗄️ Archivio Notizie