Archivio Notizie – Cronologia Completa Segnali AI

Jun 22 2026

Market

Google definisce il percorso verso l'ASI e legittima il boom dei chip per l'IA

Un commentario di DIGITIMES legge la strategia di Mountain View come la conferma che l'esplosione dei semiconduttori per l'intelligenza artificiale ha fondamenta solide. Mentre l'azienda punta all'intelligenza super-artificiale, il mercato dei chip accelera: quali segnali per chi deve costruire infrastrutture on-premise per i Large Language Models.

→

Jun 22 2026

Altro

LG Group e Nvidia: l’alleanza su AI fisica e robotica scommette sull’on-premise

I vertici di LG Group hanno incontrato Nvidia per rafforzare la collaborazione nell’AI fisica e nella robotica. La mossa segnala l’importanza crescente del deployment locale e del controllo dei dati per applicazioni industriali, dove latenza e privacy impongono architetture on-premise o edge.

→

Jun 22 2026

Altro

Cloudflare e tre big browser lanciano PACT: un token per dire basta ai bot senza tradire la privacy

Google Chrome, Microsoft Edge, Mozilla Firefox e Cloudflare sviluppano i Private Access Control Tokens (PACT): un meccanismo per distinguere visitatori umani e agenti autorizzati dal traffico malevolo, preservando l’anonimato. L’iniziativa punta a ridurre CAPTCHA e controlli identità, sollevando interrogativi su chi decide la legittimità.

→

Jun 22 2026

Market

DeepSeek raccoglie $7,4 mld a $60 mld di valutazione: il fondatore investe $3 mld

Il round di finanziamento di DeepSeek, guidato dal fondatore Liang Wenfeng con un investimento personale di 3 miliardi di dollari, porta la valutazione dell’azienda cinese a 60 miliardi. Una mossa che segnala fiducia nel mercato degli LLM e pone interrogativi sulla sovranità dei dati per le imprese europee che valutano soluzioni on-premise.

→

Jun 22 2026

Frameworks

L'AI entra in 'loop': sciami di agenti sempre attivi e il peso sull'infrastruttura on-premise

La nuova frontiera dell'AI agentic autorizza sciami di agenti a operare in background senza interruzione, 24 ore su 24. Per chi gestisce modelli in locale, la sfida si sposta su risorse di calcolo continue, governance dei dati e TCO. AI-RADAR analizza i cardini tecnici e le implicazioni per i deployment self-hosted.

→

Jun 22 2026

Altro

Anthropic raccoglie ora dati biometrici dagli utenti Claude segnalati

Da luglio, Anthropic potrà richiedere a certi utenti di Claude di inviare documenti d’identità e selfie per la verifica. La nuova policy include template di geometria facciale, accendendo il dibattito su privacy e sovranità dei dati per chi usa LLM cloud.

→

Jun 22 2026

Market

Arm: oltre il 45% dei ricavi server, l'AI guida la transizione da x86

I server Arm catturano oltre il 45% del mercato data center, spinti dai cluster GPU e dall'infrastruttura AI ad alta intensità. Un cambio di paradigma che avvicina l'efficienza energetica agli ambienti on-premise, con riflessi su TCO e strategie di deployment.

→

Jun 22 2026

Altro

Meta, leak interno: esposti i dati del programma che spia le tastiere dei dipendenti

L'azienda ha esposto internamente i dati raccolti dal controverso programma di tracciamento delle battute dei dipendenti usato per addestrare modelli di intelligenza artificiale. I lavoratori avevano già sollevato dubbi sulla trasparenza e la protezione dei propri dati. L'episodio riaccende il dibattito su governance e sovranità dei dati nello sviluppo di LLM on-premise.

→

Jun 22 2026

Market

Lovable CEO: alle startup AI europee non mancano talenti, ma fiducia

Anton Osika, CEO di Lovable, rompe un tabù: il vero freno delle startup AI europee non è la carenza di tecnici, ma un deficit di autostima che spinge i fondatori verso la Silicon Valley. Un problema di mentalità che ha implicazioni concrete sulla capacità di costruire soluzioni sovrane e on-premise.

→

Jun 22 2026

Altro

Nvidia riduce l'acqua nei datacenter, ma l'AI ha una sete molto più grande

Nvidia presenta un nuovo sistema di raffreddamento che promette di abbattere il consumo idrico interno dei datacenter. La mossa è significativa ma elude il vero problema: la gran parte dell'impronta idrica dell'AI arriva dalle centrali elettriche a combustibili fossili che alimentano gli impianti. Per chi valuta deployment on-premise, il bilancio idrico totale diventa una voce critica di sostenibilità e TCO.

→

Jun 22 2026

Altro

Cloudflare e i browser uniscono le forze per distinguere umani e bot con token anonimi

Cloudflare, Chrome, Edge e Firefox lavorano ai PACT, token digitali che attestano la legittimità del traffico web. L’obiettivo è ridurre i controlli invasivi, ma restano dubbi su chi definisca la ‘personhood’ e sul rischio di una rete a due velocità, con implicazioni per chi gestisce servizi on-premise.

→

Jun 22 2026

LLM

70 anni di AI: cosa significa per chi valuta il self-hosted

Dalla proposta del 1955 al boom dei LLM, l'intelligenza artificiale ha alternato inverni e primavere. Oggi la diffusione dei modelli generativi riporta al centro il controllo dei dati e la sovranità tecnicica, spingendo molte organizzazioni a valutare il deployment on-premise.

→

Jun 22 2026

Altro

Autopilot Tesla fa una vittima in Texas: perché l’AI on-premise non è un dettaglio

A Texas, una Tesla Model 3 con Autopilot attivo è uscita di strada ad alta velocità penetrando in un’abitazione. Una donna di 76 anni è morta. Il conducente ha dichiarato di aver usato il sistema. La vicenda riaccende il dibattito sulla sicurezza delle AI autonome e, per chi gestisce modelli in contesti critici, sottolinea l’importanza di inference locale, controllo sovrano dei dati e test robusti.

→

Jun 22 2026

Frameworks

Llama.cpp: +50% tokens/s su M3 Max eliminando un softmax inutile

Una pull request su llama.cpp accelera l'inference su MacBook Pro con M3 Max del 50% per Gemma 4, evitando un costoso calcolo di softmax e ordinamento quando il campionatore Top-N-Sigma è seguito dal Dist. Un guadagno che conta per chi muove l'inference on-premise.

→

Jun 22 2026

Market

Google investe 75 milioni in A24 e stringe con DeepMind un patto per l’IA nel cinema

La casa di produzione A24 riceve un investimento da 75 milioni di dollari da Google, la prima partecipazione azionaria del gigante tech in uno studio cinematografico. L’operazione si accompagna a una partnership di ricerca con DeepMind per sperimentare l’intelligenza artificiale nella creazione di film. Uno scenario che ridisegna il rapporto tra grandi piattaforme e industria creativa, con ricadute su sovranità dei dati e scelte infrastrutturali.

→

Jun 22 2026

Altro

Anthropic POV e il ritorno ai modelli locali: perché l’on-premise si prende la scena

L’ultimo position paper di Anthropic delinea una visione per l’IA di frontiera. Ma per molti professionisti la reazione è stata opposta: tornare ai modelli locali. L’articolo scava nelle ragioni – sovranità dei dati, controllo dei costi, latenza – e analizza i trade-off tra LLM cloud e self-hosted, offrendo una prospettiva strategica per chi valuta il deployment on-premise.

→

Jun 22 2026

LLM

Codex-maxxing: preservare il contesto nei lavori a lungo termine

Jason Liu sfrutta Codex per mantenere il contesto in progetti complessi e far proseguire il lavoro oltre un singolo prompt. Una strategia che solleva interrogativi sulla continuità operativa con gli LLM e sulle alternative on-premise per chi cerca controllo, sovranità e TCO prevedibile.

→

Jun 22 2026

Altro

Mythos AI di Anthropic buca i sistemi NSA: test rivela perché è scattato il bando

Un test red-team all’NSA svela che Mythos AI ha violato quasi tutti i sistemi classificati in poche ore. Il rapporto spiega il divieto improvviso degli Stati Uniti sui modelli di punta e rilancia il dibattito sulla sicurezza degli LLM in ambienti on-premise.

→

Jun 22 2026

LLM

OpenAI risponde ad Anthropic con patching open source e il nuovo GPT-5.5-Cyber

OpenAI annuncia una versione potenziata del modello GPT-5.5-Cyber per la sicurezza informatica e l’iniziativa “Patch the Plant” per correggere bug nell’open source. Una mossa che sposta il confronto con Anthropic sul terreno operativo, con implicazioni dirette per chi gestisce stack locali e valuta il controllo del software.

→

Jun 22 2026

LLM

TMax, la ricetta aperta per agenti terminale che insidia Claude e Kimi

AllenAI presenta TMax, un dataset di ambienti RL e una ricetta di addestramento aperti che producono agenti terminale compatti, fino a 27B parametri. Il modello da 9B batte tutti gli open sotto i 10B su Terminal Bench 2.0 e si avvicina a sistemi chiusi come Claude Haiku. Un passo verso la sovranità dei dati nell'automazione da riga di comando.

→

Jun 22 2026

Hardware

FSR 4.1 sulle RX 7000: l'INT8 che avvicina le Radeon all'inference LLM locale

L'aggiornamento FSR 4.1 abilita l'esecuzione INT8 su oltre 300 giochi, mentre AMD prepara il rollout sugli APU RDNA 3. Per chi osserva l'hardware in ottica on-premise, l'efficienza con cui queste GPU gestiscono la quantization a 8 bit suggerisce potenzialità concrete per il self-hosting di Large Language Models, con implicazioni su sovranità dei dati e TCO.

→

Jun 22 2026

Altro

Daybreak: OpenAI svela Codex e GPT-5.5-Cyber per la sicurezza

OpenAI lancia due strumenti di sicurezza, Codex Security e GPT-5.5-Cyber, per trovare e correggere vulnerabilità su larga scala. L'assenza di dettagli sul deployment solleva interrogativi sulla sovranità dei dati e spinge a valutare i trade-off tra cloud e soluzioni on-premise.

→

Jun 22 2026

LLM

Patch the Planet: l’IA di OpenAI a caccia di vulnerabilità nell'open source

OpenAI lancia Patch the Planet, un’iniziativa Daybreak che combina intelligenza artificiale e revisione esperta per aiutare i manutentori open source a trovare, validare e correggere falle di sicurezza. Un passo promettente che solleva interrogativi per chi vuole replicare l’approccio su codice proprietario in ambienti on-premise.

→

Jun 22 2026

Hardware

RAMpocalypse e bundle: la strategia nascosta per costruire PC e server AI on-prem

La carenza di RAM sta spingendo system integrator e aziende verso i bundle di componenti. Una mossa che, oltre a calmierare i costi, ridisegna le logiche di approvvigionamento hardware per chi fa deployment on-premise di LLM e infrastrutture AI locali.

→

Jun 22 2026

Altro

Un LLM MoE da 35B su una RTX 3090: velocità e qualità a portata di consumer

Con l’APEX I-Quality e il codec turbo8, Qwen3.6-35B-A3B raggiunge 137 t/s e 128k di contesto su una singola RTX 3090. I test mostrano che il fork spiritbuun regge il confronto con ik_llama, e che il nuovo cache turbo8/turbo4 migliora coerenza e throughput. Un segnale per chi valuta il self-hosted senza server enterprise.

→

Jun 22 2026

Market

Inference in Europa: il vuoto per i modelli cinesi come GLM 5.2

Su Openrouter, per GLM 5.2 compaiono sedici provider: tutti statunitensi o asiatici, nessuno europeo. L’assenza di offerte locali per modelli open-weight di origine cinese solleva questioni di sovranità dei dati, latenza e compliance GDPR, spingendo le aziende a valutare alternative self-hosted.

→

Jun 22 2026

Altro

Ypsilanti Township: ‘Combatteremo fino all’ultimo respiro’ contro il data center nucleare

La township del Michigan impone una moratoria sull’acqua per fermare il data center AI progettato con Los Alamos National Laboratory. Residenti e consiglio comunale denunciano il consumo di risorse e la mancanza di trasparenza, mentre il governatore appare indifferente. Un caso emblematico per chi considera il deployment on-premise come alternativa al modello estrattivo delle grandi infrastrutture cloud.

→

Jun 22 2026

Altro

a16z investe 30M in Prosper AI: la sanità automatizzata è pronta per l’on-premise?

Il round Series A guidato da Andreessen Horowitz porta la piattaforma di automazione del patient journey a nuovi livelli di adozione. Prosper AI gestisce prenotazioni, verifica assicurativa e fatturazione in un'unica soluzione, riducendo i costi amministrativi. Ma per gli ospedali italiani ed europei, dove la sovranità del dato è cruciale, il modello solo-cloud solleva interrogativi sulla conformità GDPR e sul controllo effettivo delle informazioni sanitarie.

→

Jun 22 2026

Altro

Sovranità editoriale e auto-hosting: quando YouTube non basta più

La censura silenziosa delle grandi piattaforme spinge il giornalismo indipendente verso l’auto-hosting. L’esperienza di Popular Front e Jake Hanrahan mostra come il controllo dell’infrastruttura diventi un asset strategico. L’articolo analizza i trade-off tra libertà editoriale e complessità tecnica di uno stack on-premise, senza ricette preconfezionate.

→

Jun 22 2026

Market

Meta compra un quinto di Cred: il vero colpo è il fondatore Kunal Shah

Con 900 milioni di dollari Meta entra nel fintech indiano e si assicura Kunal Shah come nuovo capo di WhatsApp. L’operazione segna un’acquisizione di talento via assegno, modello che l’azienda replica sempre più spesso. Dietro le cifre, la partita più grande è il futuro della piattaforma di messaggistica.

→

Jun 22 2026

Altro

Germania a Trump: senza di noi, la Luna è irraggiungibile

Il ministro dello spazio tedesco rivendica il ruolo indispensabile dell’Europa nelle missioni lunari americane. Al VivaTech di Parigi, Dorothee Bär ha ricordato che il Modulo di Servizio Europeo è un componente critico per la NASA. Una dichiarazione che mette in luce l’interdipendenza tecnicica tra alleati, un tema sempre più centrale anche per chi sviluppa infrastrutture di intelligenza artificiale on-premise, dove la sovranità dei dati e il controllo della supply chain hardware diventano fattori strategici.

→

Jun 22 2026

Hardware

Driver batteria per Surface RT: Linux lo supporta dopo 14 anni

Il kernel Linux mainline integra finalmente il driver per batteria e ricarica del Microsoft Surface RT, annunciato nel 2012. Un caso limite che mostra come la comunità open source continui a prendersi cura di hardware dimenticato, offrendo spunti per chi oggi decide di costruire stack locali su macchine longeve.

→

Jun 22 2026

Hardware

DDR2: prezzi alle stelle (+60%) per la carenza di DRAM spinta dall'IA

I prezzi delle memorie DDR2, standard introdotto nel 2003 e ancora in produzione, sono aumentati fino al 60%. La causa: la carenza globale di DRAM alimentata dalla domanda esplosiva di memoria ad alta larghezza di banda (HBM) per l'intelligenza artificiale. Questa dinamica, solitamente associata ai chip di ultima generazione, sta ora colpendo la coda della supply chain, mettendo in difficoltà chi gestisce apparati industriali, di rete e server on-prem basati su tecnicia legacy. Un segnale di quanto l'IA stia ridisegnando l'intero ecosistema dei semiconduttori.

→

Jun 22 2026

Market

JD.com, i robot prenderanno il posto di 700.000 corrieri: l'ammissione del fondatore

Richard Liu, fondatore di JD.com, ha dichiarato senza giri di parole che i robot sostituiranno gradualmente i 700.000 corrieri dell’azienda. Un’ammissione rara tra i big tech, che segna un punto di svolta per l’automazione del lavoro manuale. Per i decisori che valutano infrastrutture IA on-premise, il caso JD.com solleva interrogativi su controllo, latenza e sovranità dei dati nei sistemi di delivery autonomi.

→

Jun 22 2026

Market

Ironia Anthropic: gli allarmi sull’AI hanno innescato un ban all’esportazione

Un’analisi del FT mostra che Anthropic nel 2026 ha usato parole legate al rischio otto volte più spesso di OpenAI. Poco dopo Washington ha vietato l’accesso ai suoi nuovi modelli Mythos e Fable ai cittadini stranieri, e alcuni addetti ai lavori attribuiscono la decisione proprio alla retorica allarmistica dell’azienda.

→

Jun 22 2026

Altro

Prosper AI incassa 30 milioni da a16z: l’automazione sanitaria accende il nodo sovranità

Il round guidato da a16z punta a snellire la burocrazia clinica. Ma quando un LLM tocca dati sanitari, dove gira l’inference diventa cruciale: per chi gestisce informazioni sensibili, l’opzione on-premise non è un optional ma un vincolo di conformità.

→

Jun 22 2026

Altro

La Cina risponde al Pentagono: dazi su 56 aziende USA, dalle terre rare ai droni

La Cina impone restrizioni commerciali a 56 aziende statunitensi, tra cui minerarie di terre rare e produttori di droni. Una risposta diretta all’inserimento di società cinesi nella lista nera militare del Pentagono. La mossa geopolitica potrebbe avere ripercussioni sulla catena di approvvigionamento hardware per l’IA, influenzando costi e disponibilità di componenti critici per chi gestisce infrastrutture locali.

→

Jun 22 2026

Hardware

Nearfield Instruments alza 380 milioni: la corsa ai chip per l’AI parte dalla metrologia

La società olandese specializzata in strumenti di misura per semiconduttori ha chiuso un round serie D guidato da Fidelity e Temasek, raggiungendo una valutazione di 1,6 miliardi. Il finanziamento, il più grande mai ottenuto da una deep tech nei Paesi Bassi, servirà a potenziare la produzione di macchine critiche per i nodi avanzati, passo indispensabile per acceleratori e infrastrutture on-premise.

→

Jun 22 2026

Market

Nadella frena i colossi AI: «Promettere licenziamenti e volere carta bianca non funziona»

Il CEO di Microsoft mette in guardia l’industria: non si può continuare a prevedere perdite di posti di lavoro mentre si chiede mano libera. La risposta della casa di Redmond: modelli meno costosi, più controllo per i clienti e un appello alla fiducia. Un segnale che spinge verso deployment on-premise e sovranità dei dati.

→

Jun 22 2026

LLM

Ling-2.6: dall’immenso al fulmineo, l’on-premise trova la sua strada

Il nuovo report tecnico svela modelli fino a 1 trilione di parametri, ma è l’eredità di Ling-mini a far brillare gli occhi a chi punta su hardware ridotto. 160 token al secondo su 8 GB di VRAM diventano un caso di studio per il self-hosting.

→

Jun 22 2026

Altro

Miracle-WM: il compositor basato su Mir punta alla versione 1.0 entro fine anno

Rilasciata la versione 0.10 di Miracle-WM, compositor Wayland costruito su Mir. Il team annuncia l’obiettivo di raggiungere il traguardo 1.0 nei prossimi mesi. Un tassello in più per chi cerca stack desktop interamente autocontrollati, in linea con logiche on-premise e di sovranità tecnicica.

→

Jun 22 2026

Altro

Graph Therapeutics raccoglie 10 milioni di dollari: la sovranità dei dati biomedici accelera l’adozione dell’AI on-premise

La techbio Graph Therapeutics ha superato i 10 milioni di finanziamento per la sua piattaforma AI che combina machine learning e dati reali dei pazienti per sviluppare terapie di precisione. In un settore dove il controllo dei dati è critico, la scelta dell’infrastruttura on-premise o ibrida diventa un fattore competitivo.

→

Jun 22 2026

Altro

Acodyne alza 2,5 milioni per i droni cargo autonomi: l’edge AI che sfida l’elicottero

La startup danese ha chiuso un pre-seed per sviluppare velivoli eVTOL senza pilota per logistica pesante. Il cuore è uno stack AI di bordo (eTHOR) che abilita decollo, atterraggio e missioni autonome oltre la linea visiva. Un caso concreto di inference locale che anticipa trend rilevanti per chi progetta sistemi on-premise.

→

Jun 22 2026

Market

Superpal, l'AI coworker che vive in Slack, raccoglie 500mila euro

La startup lituana Superpal ha chiuso un round pre-seed da 500mila euro per la sua piattaforma: un agente AI completamente autonomo che opera come un collaboratore digitale all'interno di Slack, collegato a oltre 1000 strumenti aziendali e in grado di completare task complessi end-to-end. Un investimento che segnala la maturazione del mercato degli AI employee, ma solleva anche interrogativi su privacy e sovranità dei dati.

→

Jun 22 2026

Market

L’AI Visibility Index di Baden Bower: come l’IA riscrive le regole della visibilità digitale

Lo studio ha analizzato 12.040 citazioni su sei motori di IA per mappare la presenza delle testate nelle risposte generate. Emerge una nuova metrica che interroga le strategie di comunicazione e, per chi adotta LLM on-premise, pone questioni di controllo e trasparenza.

→

Jun 22 2026

Altro

Carbon removal: Anthropic investe 915 milioni. Le implicazioni per il deployment on-prem

Anthropic, laboratorio di ricerca AI noto per i modelli Claude, entra nell'iniziativa Frontier con un impegno complessivo di 915 milioni di dollari per accelerare la rimozione del carbonio su scala globale. Dietro la notizia, un tema centrale per chi gestisce infrastrutture AI: l’impronta energetica dell’inference e del training on-premise è destinata a crescere, e la sostenibilità diventa una voce del TCO. L’articolo analizza i legami tra rimozione del carbonio e scelte di deployment locale.

→

Jun 22 2026

Altro

AI, la fine dell'infrastruttura tradizionale: NPU e AI RAN ridisegnano l'Europa

L'ascesa delle NPU e delle reti RAN potenziate dall'AI sta cambiando il volto delle infrastrutture tecniciche, spostando l'elaborazione verso il locale. Per chi gestisce dati sensibili o opera in settori regolamentati, questa evoluzione segna un nuovo equilibrio tra autonomia, latenza e controllo.

→

Jun 22 2026

Market

L’Oréal e OpenAI: il make-up virtuale Maybelline debutta su ChatGPT

L’Oréal ha annunciato al VivaTech 2026 una collaborazione con OpenAI che porta la prova trucco virtuale Maybelline su ChatGPT. L’accordo copre strumenti per consumatori, scoperta prodotti, pubblicità, ricerca sul microbioma con GPT‑Rosalind e produzione interna di contenuti. Mentre il gigante della cosmesi accelera sull’AI, AI‑RADAR analizza i trade‑off tra innovazione cloud e controllo on‑premise in un settore dove i dati personali pesano.

→

Jun 22 2026

Altro

L'Indonesia punta sull'AI per mantenere le promesse da 15 miliardi di Prabowo

Il programma di pasti gratuiti per 83 milioni di bambini e donne incinte in un arcipelago di migliaia di isole è una sfida logistica estrema. Giacarta ha deciso di affidarsi all’intelligenza artificiale per orchestrare distribuzione e risorse, sollevando interrogativi concreti su infrastruttura, sovranità dei dati e modelli di deployment in contesti pubblici complessi.

→

Jun 22 2026

Market

Stablecoin, la Banca d'Inghilterra rallenta: le regole più dure sono in stand-by

Dopo le proteste del settore, la Banca d'Inghilterra rivede i limiti su possesso individuale e riserve. L'inversione di rotta apre a un uso più concreto delle stablecoin, ma rimangono nodi su trasparenza e tutela dei dati, temi centrali anche per chi gestisce infrastrutture finanziarie in self-hosting.

→

Jun 22 2026

Altro

Spiro e lo scambio batterie: la lezione per l’IA on-premise

La startup africana raccoglie 55 milioni di dollari per il suo modello di battery swapping. Una storia che rivela le stesse dinamiche di chi gestisce carichi LLM in locale: risorse limitate, costi di attesa, e la necessità di un’infrastruttura efficiente.

→

Jun 22 2026

Altro

Truffe mondiali: l’AI alza l’asticella, i tifosi non riconoscono più il falso

Biglietti fasulli, siti clonati: l’intelligenza artificiale amplifica le frodi durante i grandi eventi sportivi. Un problema di sovranità digitale che spinge a ripensare i meccanismi di verifica e il controllo dei dati.

→

Jun 22 2026

Market

Talkin’ Things ottiene il sostegno di Orbit Capital: la tracciabilità RFID diventa un asset per l’on-premise

Il produttore europeo di tag RFID Talkin’ Things ha ricevuto finanziamento di debito da Orbit Capital per accelerare la crescita in un mercato spinto da digitalizzazione retail, logistica automatizzata e regolamenti come il Digital Product Passport UE. La tecnicia, pur pensata per retail e farmaceutico, abilita scenari di tracciamento asset nei data center on-premise, migliorando controllo operativo e conformità.

→

Jun 22 2026

Altro

Paradosso verde: la Cina spinge le rinnovabili per l’AI ma la rete non tiene il passo

La corsa cinese ad alimentare i data center per l’intelligenza artificiale con fonti rinnovabili si scontra con l'incostanza di sole e vento. Le GPU che eseguono LLM richiedono carichi stabili 24/7, mettendo sotto pressione una rete già fragile. Per chi valuta deployment on-premise, l'equazione energetica — tra sostenibilità e affidabilità — diventa centrale nel calcolo del TCO e nella sovranità operativa.

→

Jun 22 2026

Frameworks

llama.cpp accelera l'inference locale con il supporto Multi-Token Prediction per i modelli Step Flash

Un nuovo pull request nel repository llama.cpp estende il supporto per la previsione multi-token (MTP), una tecnica che accorcia i tempi di inference. La novità, focalizzata sui modelli Step3.5/3.7 Flash, segna un ulteriore passo verso l'efficienza nell'AI self-hosted, riducendo il carico computazionale senza sacrificare la qualità del testo generato.

→

Jun 22 2026

Altro

La Cina accelera le auto elettriche nelle contee: il lato edge dell’AI in primo piano

Pechino lancia la campagna rurale 2026 per i veicoli elettrici. Un piano che, oltre alla mobilità, solleva interrogativi sull’infrastruttura di calcolo necessaria e spinge verso deployment on-premise e edge per l’elaborazione dei dati. AI-RADAR analizza le implicazioni.

→

Jun 22 2026

Market

Seedcamp alza 320 milioni: il venture capital europeo scommette su AI e sovranità digitale

Il fondo londinese Seedcamp ha chiuso un round da 320 milioni di dollari per rafforzare il suo ponte transatlantico. Con un portafoglio che include realtà come Fluidstack e Synthesia, l’operazione segnala un crescente interesse del capitale di rischio verso l’infrastruttura AI, con possibili ricadute sulle scelte di deployment on-premise e sul controllo della filiera hardware.

→

Jun 22 2026

Market

Quando il boom dei chip AI rischia di drogare il mattone: l’allarme dalla Corea

Il responsabile della politica economica sudcoreana mette in guardia: la pioggia di miliardi generata dai semiconduttori per l’intelligenza artificiale può surriscaldare il mercato immobiliare. Un campanello d’allarme che, nella prospettiva di AI‑RADAR, interroga chi pianifica deployment on‑premise: la corsa ai chip si traduce in costi hardware più alti e pressioni sulla supply chain.

→

Jun 22 2026

Market

La Malesia cavalca il boom AI: export da record e una catena hardware diventata irrinunciabile

In quattro mesi il commercio estero malese ha superato 1.127 trilioni di ringgit, con i prodotti per l’AI in crescita del 42.9% e oltre metà dell’export totale. Il collo di bottiglia globale non è più il design dei chip, ma l’assemblaggio fisico: senza le fabbriche malesi, i data center cloud non si costruiscono.

→

Jun 22 2026

Altro

WeChat testa Xiaowei: l'assistente AI che porta la sovranità dei dati in primo piano

Tencent integra un assistente AI direttamente in WeChat, la super-app che per molti utenti è già tutto. La mossa sposta il dibattito dal semplice rilascio di un chatbot alla gestione della privacy e al controllo dei dati personali, aprendo scenari inediti per il deployment on-premise di LLM in ambito enterprise.

→

Jun 22 2026

Market

Seedcamp chiude un round da 320 milioni e scommette sul ponte USA per le startup AI

Il venture capital londinese Seedcamp, noto per aver sostenuto Revolut e Synthesia, ha raccolto 320 milioni di dollari. Il capitale sarà distribuito tra un fondo seed e un fondo growth, con una nuova sede a New York per creare un “ponte transatlantico”. L’operazione segnala la maturità dell’ecosistema AI europeo e solleva questioni cruciali su sovranità dei dati e opzioni on-premise per le startup che scalano oltreoceano.

→

Jun 22 2026

Frameworks

Hermes Agent, quando l'UX zoppica l'inference locale

Un’esperienza d’uso deludente può minare anche i framework più promettenti. Il caso Hermes Agent mostra come interfaccia e reattività restino nodi critici per chi adotta stack on-premise, specie se affiancato a modelli come Qwen3.6-35B e Gemma4-26B. Percezione, latenza e design impattano la produttività reale, oltre le spec tecniche.

→

Jun 22 2026

Market

Isometric raccoglie 40 milioni per certificare l’industria con l’AI

La startup londinese Isometric ha ottenuto un finanziamento di 40 milioni di dollari per portare l’intelligenza artificiale nei processi di certificazione industriale. Un settore finora governato da controlli manuali e a campione trova nell’AI una scorciatoia per velocità e scala, ma i requisiti di riservatezza impongono architetture on-premise e modelli ottimizzati per l’edge.

→

Jun 22 2026

Hardware

GPU e LPU: architetture complementari per l’AI on-premise, secondo il CEO di Groq

Il CEO di Groq delinea uno scenario in cui GPU e LPU non competono ma coesistono: le prime per il training, le seconde per l’inference a bassa latenza. Una prospettiva rilevante per chi porta i modelli in locale.

→

Jun 22 2026

Market

Google perde il co-lead di Gemini: va in OpenAI per la ricerca sui modelli

Un vicepresidente dell'ingegneria e co-responsabile di Gemini lascia Google per entrare in OpenAI e dedicarsi alla ricerca sulla costruzione di modelli. Il passaggio mette in luce la competizione per i talenti nel settore degli LLM e solleva interrogativi su come le innovazioni nell'efficienza e nell'architettura dei modelli potranno influenzare chi valuta deploy on-premise.

→

Jun 22 2026

Market

Componenti auto da Taiwan: ripresa prevista nel 2H26 grazie a distensione dazi e geopolitica

I produttori taiwanesi di componenti per auto prevedono un ritorno alla crescita nella seconda metà del 2026, scommettendo su un allentamento delle tensioni tariffarie e geopolitiche globali. Secondo DIGITIMES, il settore si prepara a superare le incertezze degli ultimi anni, riportando gli investimenti e la produzione su un sentiero di espansione.

→

Jun 22 2026

Altro

Come AI fisica e fusione ADAS-cockpit ridisegnano la filiera della guida autonoma in Cina

La svolta verso sistemi di guida autonoma integrati spinge la catena di fornitura a ripensare hardware e software. L'elaborazione locale diventa cruciale per latenza e sovranità dei dati, con implicazioni dirette per chi sviluppa infrastrutture on-premise e stack AI in settori regolamentati.

→

Jun 22 2026

Market

La Cina apre il mercato STAR alle aziende di AI per alimentare la corsa ai capitali

Il nuovo canale di quotazione per le imprese che sviluppano modelli di intelligenza artificiale segnala la volontà di Pechino di sostenere il settore con capitali pubblici e accelera la competizione tecnicica globale. Le implicazioni per l’ecosistema hardware e per le strategie di deployment on‑premise si intrecciano con la spinta alla sovranità tecnicica.

→

Jun 22 2026

Hardware

L'AI fisica sposta l'asticella: dai robot a funzionalità ai robot realmente intelligenti

La colonna di DIGITIMES segnala un passaggio epocale nella robotica: non più automi rigidi con funzioni predefinite, ma macchine capaci di comprendere l'ambiente e adattarsi grazie all'AI integrata. Questa evoluzione impone hardware di inference locale, nuove metriche di progettazione e un ripensamento dell'architettura software, con vincoli stringenti di latenza, consumi e sovranità dei dati.

→

Jun 22 2026

Hardware

Toto scommette sui materiali per semiconduttori: l’AI spinge verso il nodo a 1nm

Fonti indicano che Toto rafforza gli investimenti in materiali avanzati per chip, mentre la domanda di intelligenza artificiale accelera la transizione ai processi a 1 nanometro. L’impatto si annuncia significativo per l'hardware dedicato ai LLM, con benefici potenziali per i deployment on-premise in termini di efficienza e costi.

→

Jun 22 2026

Hardware

Intel e AMD svelano ACE, la riscossa x86 contro l’avanzata di Arm

Le due rivali storiche mettono da parte le divergenze per contrastare l’ascesa di Arm nei data center. L’annuncio congiunto segna una nuova fase nella guerra delle architetture, con possibili ripercussioni su TCO, sovranità dei dati e deployment on-premise per carichi AI.

→

Jun 22 2026

Hardware

Intel e Nvidia sviluppano insieme un processore PC: debutto previsto al CES 2028

Secondo DIGITIMES, Intel e Nvidia starebbero lavorando a un processore PC congiunto che potrebbe vedere la luce al CES 2028. Al di là delle indiscrezioni ancora sottili, l’idea di un chip frutto della collaborazione tra le due rivali di Santa Clara segnala un possibile riassetto della competizione nell’hardware per l’intelligenza artificiale, con ricadute concrete per chi cerca soluzioni di inference locale e deployment on-premise.

→

Jun 22 2026

Hardware

Semiconduttori, il rifiuto del visto che ha (indirettamente) plasmato un gigante da trilioni di dollari

La storia di Sanjay Mehrotra, CEO di Micron, mostra come le barriere all'immigrazione possano innescare percorsi imprevisti nell'industria dei chip, mentre i produttori LED taiwanesi esplorano nuovi mercati oltre l'illuminazione.

→

Jun 22 2026

Market

La supply chain del foldable Apple si prepara: obiettivo lancio nel 2026

Digitimes riferisce che i fornitori Apple stanno già predisponendo le linee produttive per un iPhone pieghevole previsto per il 2026. La mossa segnala la crescente maturità del segmento foldable e le ambizioni dell'azienda di Cupertino in un mercato finora dominato da Samsung.

→

Jun 22 2026

Market

Microsoft valuta DeepSeek mentre i costi di OpenAI diventano insostenibili

Secondo DIGITIMES, Microsoft esplora modelli alternativi come DeepSeek per contenere la spesa verso OpenAI. Una mossa che riflette le tensioni economiche dell’AI generativa e segnala un punto di svolta per il deployment on-premise.

→

Jun 22 2026

Market

Samsung System LSI in rosso: i chip Exynos frenano la divisione, quali effetti sull'AI on-device?

Il presidente Park Yong-In conferma le continue perdite dei SoC System LSI, con impatti visibili fino al 2026. La divisione arranca nella competizione mobile, mettendo a rischio innovazioni chiave per l'AI edge: Exynos e i chip affini vedranno meno investimenti, mentre la domanda di inference LLM locale cresce. Uno scenario che ridefinisce il panorama hardware per deployment on-premise di modelli linguistici su dispositivi mobili e gateway.

→

Jun 22 2026

Hardware

MiTAC al Computex 2026: raffreddamento a diamante e rack 52U per l’era on-prem

Al Computex 2026 MiTAC ha mostrato sistemi GPU, storage e server con raffreddamento a diamante, fino a rack da 52 unità. Uno sguardo al futuro dell'hardware per l'inference LLM on-premise, dove densità e gestione termica ridefiniscono i trade-off tra TCO, sovranità e controllo dell'infrastruttura.

→

Jun 22 2026

Hardware

GPU AMD GCN: Valve guida il miglioramento del recovery su Linux

Il team di driver open-source di Valve sta portando un recovery più robusto per le GPU AMD Graphics Core Next (GCN) in caso di freeze. Un passo avanti per la stabilità delle vecchie schede su Linux, con ricadute concrete per chi esegue carichi on-premise senza interruzioni.

→

Jun 21 2026

Hardware

Tongtai entra nell’hardware AI e nei semiconduttori: cosa cambia per chi fa inference locale

Con un nuovo vertice, il costruttore taiwanese di macchine utensili punta ad aerospazio, IA e chip. La mossa si inserisce nella corsa alla sovranità tecnicica e alla catena di fornitura per l’hardware on-premise: componentistica di precisione, raffreddamento e attrezzature per semiconduttori diventano snodi critici per chi valuta il TCO dell’inference locale.

→

Jun 21 2026

Hardware

Taiwan a VivaTech: l’AI end-to-end punta all’Europa che vuole il controllo dei dati

La delegazione taiwanese a VivaTech ha mostrato un cambio di strategia: non più solo componenti, ma stack completi per l’AI on-premise. Una mossa che intercetta la domanda europea di sovranità digitale, compliance GDPR e riduzione della dipendenza da cloud, aprendo nuovi scenari per chi valuta deployment locali di LLM.

→

Jun 21 2026

Altro

Stretto di Hormuz e gas del Qatar: il rischio sommerso per l’AI locale

Una possibile riapertura dello Stretto di Hormuz entro settembre per le navi di GNL mostra come le crisi energetiche impattino silenziosamente chi gestisce infrastrutture AI on-premise. Analizziamo il lato opaco del TCO: logistica, hardware e sovranità.

→

Jun 21 2026

Hardware

MSScorps rilancia su Taiwan per la fotonica del silicio: interconnessioni ottiche e AI on-premise

MSScorps rafforza gli investimenti a Taiwan nella fotonica del silicio, tecnicia chiave per interconnessioni dati a banda ultralarga. Per chi gestisce cluster AI on-premise, l’evoluzione della fotonica integrata promette di ridurre colli di bottiglia e consumi, ridisegnando l’architettura hardware per LLM.

→

Jun 21 2026

Frameworks

Llama.cpp, la guida all’ottimizzazione che mancava: un anno di esperimenti condensati

Dopo 12 mesi di test su inference locale, uno sviluppatore pubblica una guida completa per ottimizzare llama.cpp: gestione della VRAM, cache KV, modelli MoE, tuning della CPU e le trappole OOM più frequenti. Un riferimento pratico per chi sceglie il self-hosting e il controllo diretto dei dati.

→

Jun 21 2026

Market

Samsung scommette sull’AI di OpenAI: ChatGPT Enterprise e Codex per tutti

L’azienda coreana porta ChatGPT Enterprise e Codex a tutti i dipendenti nel mondo, segnando una delle più estese adozioni enterprise di OpenAI. Una mossa che accelera l’ingresso dell’AI generativa nelle grandi organizzazioni, ma riapre il dibattito su cloud, sovranità dei dati e costi di scala.

→

Jun 21 2026

Altro

La comunità dei self-hoster e quel grazie inaspettato nel giorno del papà

Un post di ringraziamento su Reddit ricorda che dietro l'hardware e i dibattiti sulla quantization ci sono persone che condividono una passione. Per chi sceglie deployment on-premise, il supporto informale di una comunità è spesso la risorsa più preziosa. Un augurio che diventa occasione per riflettere su collaborazione e isolamento tecnico.

→

Jun 21 2026

Frameworks

zlib-rs 0.6.4: correzione crash Raptor Lake e ottimizzazioni SIMD

La libreria Rust per la compressione Zlib si aggiorna con ottimizzazioni SIMD e una correzione critica per i processori Intel Raptor Lake. Un passo avanti nella corsa a librerie di sistema più sicure e performanti, con ricadute per chi gestisce infrastrutture on-premise.

→

Jun 21 2026

LLM

Come addestrare un LLM da 500M parametri con 800 dollari: il progetto HobbyLM e la via locale all'IA

Un singolo sviluppatore ha creato da zero un modello linguistico da 500 milioni di parametri e un generatore di immagini da 330 milioni, spendendo solo 800 dollari in calcolo cloud. Il progetto HobbyLM dimostra come la pre-formazione su dataset pubblici e l’uso di GPU di fascia alta in cloud rendano accessibile la creazione di modelli piccoli ma funzionali. Il rilascio dei pesi in formato GGUF apre la strada al deployment on-premise, con implicazioni per la sovranità dei dati e il Total Cost of Ownership.

→

Jun 21 2026

LLM

TikTok, il 60% dei contenuti per nuovi utenti è spazzatura generata dall’AI

Un’analisi della piattaforma di editing video Kapwing mostra che quasi sei clip su dieci nel feed “For You” di account freschi sono slop prodotti da AI. Il dato solleva interrogativi sulla moderazione e spinge a ripensare le strategie di rilevamento, anche in chiave on-premise, dove il controllo sui dati e la latenza fanno la differenza.

→

Jun 21 2026

Hardware

Due Radeon R9700 spingono un LLM da 27B: i numeri di una build on-premise

Un server con due GPU Radeon AI PRO R9700 e 64 GB di VRAM totale mette alla prova Qwen 3.6 27B in quantization Q8 con Multi-Token Prediction. Decode fino a 67 token/s su contesti pieni, prefill oltre 1.500 t/s e prompt caching efficiente: uno spaccato concreto per chi valuta deployment locale di LLM senza dipendere dal cloud.

→

Jun 21 2026

Altro

La stretta su Anthropic accende i riflettori sull’on-premise

L’ultima mossa dell’amministrazione Trump contro Anthropic, discussa nel podcast Equity, non è solo una questione politica. Per le aziende che valutano dove far girare i propri LLM, la vicenda segnala un rischio concreto: la dipendenza da provider cloud può diventare un collo di bottiglia strategico quando la regolamentazione si fa imprevedibile. Il controllo diretto dell’infrastruttura torna al centro della partita.

→

Jun 21 2026

Hardware

Modder ingegnoso raffredda una RTX 3060 con una macchina del ghiaccio: -62% in gioco

Un appassionato ha convertito una macchina per il ghiaccio da banco in un sistema di raffreddamento per una RTX 3060, regolato da un termostato da frigo per birra. Il risultato? Temperature ridotte fino al 62% nei giochi, con Cyberpunk 2077 che viaggia a 22°C. Una trovata estrema che riaccende il dibattito sul thermal management per l’hardware ad alte prestazioni.

→

Jun 21 2026

Altro

Apple sposta l'AI on-device: iOS 27 prepara il terreno all'inference locale

Con iOS 27, Apple punta su funzionalità AI pratiche che girano direttamente su iPhone, riducendo la dipendenza dal cloud. Un segnale per chi valuta deployment on-premise e controllo dei dati: il futuro dell'AI passa anche dall'edge.

→

Jun 21 2026

Hardware

Il driver Vulkan open-source NVK aggiunge supporto sperimentale a DLSS su Linux

NVK, il driver Vulkan open-source per GPU Nvidia, introduce il supporto sperimentale al DLSS, portando l'upscaling basato su deep learning su Linux tramite binari CUDA importati. Un passo avanti per l'ecosistema grafico open-source che riduce la dipendenza dai driver proprietari.

→

Jun 21 2026

Market

Addio a Claude Guillemot: il co-fondatore di Ubisoft muore in un incidente aereo

La scomparsa del visionario che con i fratelli fondò l’impero dei videogiochi. Una notizia che scuote il settore e riaccende la riflessione sul peso delle infrastrutture tecniciche nell’industria dell’intrattenimento.

→

Jun 21 2026

Hardware

MiniMax M3 on-premise: 19 token/s su 8 MI50, ma gli agenti sono ancora lontani

Un test su GPU AMD MI50 del 2018 con MiniMax M3 quantizzato a 4 bit raggiunge 19 token/s su 8 schede e 18 token/s su 16, grazie al decoding speculativo. Ma la latenza elevata (oltre 70 secondi per il primo token su prompt lunghi) e la generazione interminabile del ragionamento rendono l’esperienza inadatta allo sviluppo agentivo. I dati offrono uno sguardo concreto sulle possibilità e i limiti dell’hardware datacenter di vecchia generazione per il deployment locale di LLM.

→

Jun 21 2026

Hardware

GMKtec EVO-X3: il mini PC AI porta la firma di Lisa Su e il cuore AMD Strix Halo

GMKtec ha svelato una versione ridisegnata del suo EVO-X3, una workstation AI in formato mini PC basata sul potente processore AMD Ryzen AI Max+ 395 'Strix Halo'. Il dispositivo esibisce la firma di Lisa Su, CEO di AMD, segnale di una stretta collaborazione e di un’offerta pensata per chi cerca elevate prestazioni di inference locale in un corpo compatto.

→

Jun 21 2026

Market

I super-bonus a chi fabbrica chip diventano un rischio per l’inflazione: il caso Corea

La Banca di Corea avverte: le retribuzioni straordinarie erogate da Samsung e SK hynix ai dipendenti del settore semiconduttori stanno alimentando la dinamica dei prezzi, con l’inflazione 2024 destinata a superare nettamente il target del 2%. Una pressione che, dalla supply chain hardware, può incidere direttamente sul Total Cost of Ownership di chi gestisce infrastrutture per LLM on-premise.

→

Jun 21 2026

Altro

Claude richiederà la verifica dell’identità: cosa significa per chi vuole il controllo dei dati

Anthropic annuncia che l’accesso a Claude sarà soggetto a verifica dell’identità. Una mossa che rafforza la sicurezza, ma riaccende il dibattito su sovranità digitale e anonimato. Per chi valuta deployment on-premise, è un ulteriore segnale: il controllo dei dati passa anche dalla governance dell’identità.

→

Jun 21 2026

Hardware

Creality Falcon T1: l’incisore laser modulare che parla agli architetti dell’AI locale

La recensione del Falcon T1, laser engraver modulare di Creality, svela un approccio a componenti intercambiabili che risuona oltre la fabbricazione personale. Per chi gestisce hardware on-premise per LLM, la modularità non è un vezzo da maker ma una leva concreta su TCO, aggiornabilità e controllo dell'infrastruttura.

→

Jun 21 2026

LLM

Capre di Age of Empires II usate per una rete neurale: l'ironico esperimento sulla coscienza AI

Un ricercatore Microsoft ha costruito una rete neurale utilizzando i capri del videogioco Age of Empires II come elementi base. L’obiettivo? Dimostrare in modo assurdo che attribuire coscienza ai chatbot è fuorviante quanto pensare che un gregge di capre virtuali stia davvero elaborando pensieri. Una riflessione che interpella anche le aziende che valutano il deployment on-premise di LLM.

→

🗄️ Archivio Notizie