Archivio Notizie – Cronologia Completa Segnali AI

Jun 27 2026

LLM

Distillare LLM in proprio per il theorem proving: quando lo stack on-premise batte il cloud

Un utente con fondi per hardware ma non per crediti cloud vuole distillare un LLM per theorem proving su Rocq, dove i modelli scarseggiano. La via on-premise solleva questioni di costo, controllo e specializzazione che meritano un’analisi approfondita.

→

Jun 27 2026

Hardware

Wiwynn e TE Connectivity raffreddano a liquido le sbarre DC a 800V per i datacenter AI

Al booth di Wiwynn abbiamo visto le nuove sbarre DC a 800V di TE Connectivity con raffreddamento a liquido integrato. Un segnale di come l'infrastruttura di potenza per l'IA stia spingendo oltre i limiti termici convenzionali, con implicazioni dirette su efficienza e densità dei rack on-premise.

→

Jun 27 2026

LLM

Mythos 5 di Anthropic autorizzato a oltre 100 enti USA: svolta per l'AI sovrana?

L’amministrazione Trump ha concesso a più di 100 aziende e agenzie governative l’uso di Mythos 5 di Anthropic, estendendo i permessi anche ai dipendenti non americani. La mossa accelera l’adozione di LLM in ambiti sensibili e riapre il dibattito su controllo, residenza dei dati e convenienza di un deployment on-premise.

→

Jun 27 2026

LLM

Anthropic può rilasciare Mythos a organizzazioni USA: il via libera della Casa Bianca

Dopo settimane di negoziati, la Casa Bianca ha autorizzato Anthropic a ripristinare l'accesso al suo modello più avanzato, Mythos, per un gruppo selezionato di aziende e agenzie governative statunitensi. Una decisione che sottolinea il ruolo sempre più strategico dei modelli di frontiera.

→

Jun 26 2026

Altro

La Corea del Sud addestra tutto l'esercito con i droni: l'AI sul campo impone l'inference locale

Seul punta a rendere i droni uno strumento universale per l’intero esercito, guidata dagli insegnamenti del conflitto ucraino. Una mossa che sposta il baricentro dell’AI militare verso il deployment on-premise, tra sovranità dei dati e hardware specializzato.

→

Jun 26 2026

Frameworks

llama.cpp: il tensor parallelism su Vulkan ora è alla portata di tutti

La pull request #25051 firmata da Piotr ‘pwilkin’ rende finalmente utilizzabile il parallelismo tensore su backend Vulkan in llama.cpp. Un passo concreto per l’inference di LLM su GPU non NVIDIA, che allarga gli scenari di deployment self-hosted e on-premise riducendo la dipendenza da CUDA.

→

Jun 26 2026

Altro

Nemotron-3-Super: 504K token di contesto perfetti su quattro RTX 3090

Il modello ibrido Mamba+MoE di NVIDIA, quantizzato a 71 GB, gira interamente su GPU consumer e mantiene un recupero esatto di informazioni fino a 504.482 token. Decode stabile a 23 t/s grazie allo stato ricorrente degli strati Mamba, che evita il crollo prestazionale tipico dei modelli full-attention.

→

Jun 26 2026

Frameworks

Un veterano del software costruisce un harness locale per LLM e chiede alla community: cosa serve?

Un developer con 45 anni di esperienza in tooling enterprise sta per rilasciare un harness open source pensato per semplificare il deployment locale dei Large Language Models. Il progetto, local-first e con logica multi-agente, punta a colmare le lacune dell'esperienza di sviluppo on-premise, dando voce alla community per integrare le funzionalità più richieste.

→

Jun 26 2026

Market

Ford riassume 350 ingegneri: l’AI da sola non garantiva la qualità

Il colosso dell’auto ammette di aver sovrastimato le capacità dell’intelligenza artificiale nel controllo qualità, richiamando centinaia di tecnici. Una vicenda che rilancia il dibattito su automazione, deployment on-premise e il ruolo insostituibile della competenza umana nei processi critici.

→

Jun 26 2026

Market

Microsoft ha costruito un supercomputer per aiutare OpenAI a violare il copyright, accusa il NYT

Il New York Times modifica la denuncia: Microsoft avrebbe costruito un supercalcolatore su misura per favorire le violazioni di copyright di OpenAI. La mossa segue un nuovo precedente della Corte Suprema che richiede la prova dell'intenzionalità nell'induzione alla condotta illecita.

→

Jun 26 2026

Market

Zettabyte chiede uno standard per la qualità del calcolo AI, mentre la domanda esplode

L'azienda Zettabyte sollecita un nuovo standard per valutare la qualità del calcolo nell'intelligenza artificiale, in un momento in cui la richiesta di potenza di calcolo è cresciuta in modo vertiginoso negli ultimi due anni. La proposta arriva mentre le organizzazioni faticano a confrontare soluzioni on-premise e cloud, tra metriche eterogenee e colli di bottiglia hardware.

→

Jun 26 2026

Market

DrayTek scivola nei ricavi fino al 2026, la scommessa è su Wi-Fi 7 e cybersecurity

Il produttore taiwanese di apparati di rete affronta un calo del fatturato che si prolungherà fino al 2026. Per invertire la rotta punta sullo standard Wi-Fi 7 e su soluzioni di sicurezza informatica, due pilastri che ridisegnano le infrastrutture locali.

→

Jun 26 2026

Hardware

Intel prepara il supporto HDR per configurazioni DP MST su Linux

Il driver grafico Intel per il kernel Linux si prepara a colmare un vuoto: l'impossibilità di utilizzare l'HDR su connessioni DisplayPort Multi-Stream Transport. La novità interessa workstation multi-monitor e docking station, un tassello rilevante per chi sviluppa o fa ricerca in ambito AI on-premise e ha bisogno di postazioni Linux affidabili anche per il lato multimediale.

→

Jun 26 2026

Altro

OpenAI frena il rilascio di GPT-5.6 su richiesta governativa: 'Non deve diventare la norma'

OpenAI ha limitato la distribuzione di GPT-5.6 su richiesta di un governo, scatenando un dibattito sulla sovranità digitale e l’accesso agli LLM. La mossa rilancia le alternative on-premise, dove il controllo dei dati e l’indipendenza da veti esterni diventano vantaggi strategici per aziende e difensori informatici.

→

Jun 26 2026

Market

OpenAI ingaggia l’ex capo di Uber India per guidare la sua espansione fuori dagli USA

La mossa rafforza la presenza di OpenAI in India, mercato chiave per dimensione e opportunità. L’arrivo di un manager con profonda esperienza locale segnala investimenti in uffici, partnership e talento, mentre l’azienda cerca di consolidare il proprio ecosistema cloud in una regione sempre più centrale per la sovranità dei dati e l’intelligenza artificiale.

→

Jun 26 2026

Altro

LLM on-premise: il workflow che vorresti aver scoperto prima

Un thread su Reddit chiede quale flusso di lavoro per LLM locali abbia fatto la differenza. Emerge che il valore non sta nei modelli ma nelle pipeline: RAG, coding agent, indicizzazione. Per chi valuta deployment on-premise, è l'occasione per ripensare strategie e trade-off tra controllo e semplicità.

→

Jun 26 2026

Market

OpenAI sforna Jalapeño: custom chip con Broadcom, cresce la corsa contro la dipendenza da Nvidia

OpenAI entra nella mischia dei chip custom con Jalapeño, sviluppato con Broadcom per l'inference. Apple, Google e SpaceX avevano già aperto la strada. La mossa segnala una svolta: anche le aziende che fanno LLM ora vogliono hardware su misura, riducendo il rischio fornitore unico. Per chi valuta deployment on-premise, è un segnale di una possibile pluralità di silicio specializzato, con impatti su TCO e sovranità dei dati.

→

Jun 26 2026

Hardware

Perché vendere la 5090 per cinque 5060 Ti da 16 GB? L’AI rig fai-da-te sotto la lente

Un utente valuta di cedere la propria RTX 5090 per acquistare cinque RTX 5060 Ti da 16 GB e costruire un rig aperto con cavi riser PCIe 4.0. La domanda è chiara: conviene sacrificare potenza di calcolo per avere più VRAM totale? Una scelta che apre scenari concreti per chi spinge l’AI on-premise.

→

Jun 26 2026

Altro

Quando la Casa Bianca interviene sull'AI: il caso OpenAI e la lezione per chi fa impresa

La Casa Bianca ha chiesto a OpenAI di posticipare il lancio dei suoi modelli GPT-5.6, poco dopo che Anthropic ha dovuto ritirare i propri modelli più avanzati. Un segnale forte: l'AI più potente è sotto controllo politico e centralizzato. Per le imprese che considerano l'adozione di LLM, la domanda diventa: chi controlla davvero i propri dati e la continuità del servizio? Le infrastrutture on-premise tornano al centro del dibattito.

→

Jun 26 2026

LLM

GPT-5.6 Sol: il nuovo modello OpenAI alza l'asticella per chi valuta l'on-premise

L'ultima preview di OpenAI mostra progressi in coding, scienza e sicurezza, ma resta un servizio cloud: per chi punta alla sovranità dei dati il divario con le alternative self-hosted va analizzato con attenzione.

→

Jun 26 2026

Hardware

OpenAI presenta Jalapeño: il chip custom che riduce la dipendenza da Nvidia

OpenAI ha annunciato Jalapeño, un chip custom per l'inference sviluppato con Broadcom, entrando nel club delle big tech che cercano di ridurre la dipendenza da Nvidia. Senza dettagli tecnici ufficiali, la mossa segnala una strategia di controllo sull'hardware per ottimizzare i costi e i carichi di lavoro, con possibili ricadute sul deployment on-premise e la sovranità dei dati.

→

Jun 26 2026

Hardware

Se non hai una GPU da data center: strategie per LLM locali senza supercomputer

La corsa ai Large Language Models on-premise si scontra spesso con un vincolo concreto: la disponibilità di GPU professionali. Lavorare senza hardware da data center, sfruttando schede consumer, CPU e quantization aggressiva, richiede una consapevolezza profonda dei trade-off fra prestazioni, costi e sovranità dei dati.

→

Jun 26 2026

Altro

Non è più Anthropic contro OpenAI: l’AI ora detta l’agenda politica

La sfida tra giganti dell’AI generativa lascia il passo a un problema più urgente: le conseguenze politiche dei modelli. Servono azioni collettive e ripensare l’infrastruttura su cui girano.

→

Jun 26 2026

Hardware

Vera vs GB10: il confronto prestazionale delle CPU NVIDIA

Dopo i benchmark della CPU Vera, Phoronix mette a confronto le prestazioni per core con il chip GB10. I dati offrono uno spaccato sull'evoluzione delle CPU ARM per server e sulle implicazioni per chi pianifica infrastrutture on-premise per carichi AI, dove la scelta dell'hardware incide su TCO e sovranità dei dati.

→

Jun 26 2026

Altro

Aseon Labs raccoglie 10 milioni per i pod di ricarica e pulizia dei robotaxi

La startup californiana ha chiuso un seed da dieci milioni di dollari con Crane Venture Partners, Y Combinator e altri investitori. I moduli automatizzati, grandi quanto un posto auto, ricaricano e puliscono i robotaxi, puntando a colmare una lacuna nella manutenzione fisica delle flotte autonome. L’operazione segnala la corsa all’infrastruttura di prossimità per i veicoli a guida autonoma, dove controllo operativo, latenza e sovranità dei dati diventano fattori differenzianti.

→

Jun 26 2026

Hardware

Apple salta i chip M6 di fascia alta e rilancia con l'M7, pensato per l’AI

Apple rompe la tradizione: niente M6 di fascia alta, il balzo è verso l'M7 ottimizzato per l’intelligenza artificiale. I Mac più potenti arriveranno dal 2027, segnando un cambio di priorità che mette l’elaborazione locale e la sovranità dei dati al centro. Una scelta che ridisegna la roadmap dei chip e parla direttamente a chi sviluppa LLM on-premise.

→

Jun 26 2026

Altro

Europa stufa vuole la sua IA: il vantaggio si chiama Trump

Bruxelles accelera verso un modello AI sovrano, spinta dalla frustrazione per la dipendenza tecnicica e dall’instabilità geopolitica. Costruire un LLM di punta resta arduo, ma l’amministrazione Trump offre un assist involontario: l’incertezza sulle policy USA fa da catalizzatore. Per chi valuta deployment on-premise, si aprono scenari inediti su sovranità dei dati e TCO.

→

Jun 26 2026

Altro

AI sovrana: Europa investe miliardi tra cloud e on-premise

Dalla healthtech alla manifattura, l’Europa raccoglie oltre 2,1 miliardi di finanziamenti tech in una settimana, mentre Lussemburgo e Regno Unito spingono su laboratori AI universitari e visioni di sovranità digitale. Per le aziende che valutano deployment on-premise, i segnali sono chiari: l’infrastruttura AI locale non è più solo un costo, ma un asset strategico tra GDPR, TCO e controllo dei dati.

→

Jun 26 2026

Hardware

Chip gear e AI più economica: i fondi europei che accelerano l'on-premise

Nearfield Instruments raccoglie 380 milioni per macchinari dei semiconduttori, mentre il Regno Unito finanzia con 60 milioni laboratori AI per ridurre i costi. Due segnali che, insieme, promettono di rendere più accessibile l'inference locale di modelli linguistici, anche per chi non può o non vuole affidarsi al cloud.

→

Jun 26 2026

Altro

California costruisce l’osservatorio per capire se l’AI cancella posti di lavoro

Il primo strumento statale americano per monitorare l’impatto occupazionale dell’intelligenza artificiale mostra dati ancora rassicuranti ma non privi di campanelli d’allarme, particolarmente nella Bay Area e tra i lavoratori laureati. Per le organizzazioni che gestiscono LLM in modalità on-premise, questa esperienza conferma l’importanza di una sorveglianza diretta e della sovranità sui dati per governare in modo responsabile l’automazione.

→

Jun 26 2026

Altro

Un uomo, due kernel e tanto RISC-V: dalla FPGA al sistema operativo sovrano

Yuri Zaporozhets ha costruito un PC RISC-V su FPGA, un mainframe in miniatura e ha portato QNX su RISC-V, per poi riscrivere tutto in un microkernel open source. QSOE, rilasciato sotto Apache 2.0, unisce seL4 e un kernel custom e indica una strada concreta per stack on-premise verificabili e privi di dipendenze proprietarie.

→

Jun 26 2026

Frameworks

Patronus AI si fa 50 milioni per il crash test degli agenti AI

La startup costruisce mondi simulati dove mettere alla prova gli agenti basati su LLM prima che tocchino sistemi reali. Ispirato da Waymo, l'approccio punta a prevenire disastri in ambiti sensibili come finanza e sanità.

→

Jun 26 2026

Market

OpenAI a Cannes: «Siamo nel business pubblicitario», ma i numeri dicono altro

La società di Sam Altman si presenta al festival della pubblicità con una mossa simbolica, lontana dai riflettori di Meta e Google. Una scelta che rivela ambizioni ancora acerbe e rilancia il dibattito su quanto il modello ad-supported spinga le imprese verso deployment on-premise per mantenere il controllo.

→

Jun 26 2026

Frameworks

Intel ANV: i descriptor heap Vulkan ora attivi di default su Linux

Il driver open-source ANV per le GPU Intel su Linux abilita per impostazione predefinita l’estensione VK_EXT_descriptor_heap, dopo quasi due mesi di test. Migliora l’efficienza di binding dei descrittori e riduce il carico sulla CPU, con benefici trasversali anche per i carichi computazionali. Un tassello importante per chi spinge inference on-premise su Intel Arc o grafica integrata, dove ogni guadagno di efficienza pesa sul costo totale di possesso.

→

Jun 26 2026

Market

Malaysia ferma un carico di chip AI da 13 milioni: erano nascosti in 72 server ‘normali’

Dogane malaysiane sequestrano un carico da 72 unità server dichiarate come componenti generici: all’interno, chip avanzati per AI pronti al re-export. Il valore sfiora i 13 milioni di dollari, ennesimo segnale delle tensioni nella catena di fornitura hardware per intelligenza artificiale.

→

Jun 26 2026

Altro

Attacco all’INSEE: dati del personale esposti e la lezione sulla sovranità digitale

L’INSEE, l’istituto statistico francese, ha rivelato un attacco informatico che ha compromesso i dati personali di circa 12.800 tra dipendenti attuali ed ex, oltre a membri del corpo di servizio civile. Rilevata il 19 giugno, la violazione riporta al centro del dibattito la protezione delle informazioni nelle amministrazioni pubbliche e le scelte architetturali per blindare i dati sensibili.

→

Jun 26 2026

Market

Kobo boccia quasi metà dei libri autopubblicati: l’ombra dell’IA

Rakuten Kobo ha respinto il 45% dei titoli caricati nel 2025 su Kobo Writing Life. Il CEO Michael Tamblyn riconduce oltre l’80% dei no a testi giudicati generati da intelligenza artificiale. Un segnale forte che apre il dibattito su come piattaforme e aziende gestiscono la valanga di contenuti sintetici.

→

Jun 26 2026

Frameworks

Intel ISPC 1.31 guarda a Nova Lake e PowerPC: perché interessa chi fa calcolo on-premise

Il compilatore per programmazione SPMD di Intel si aggiorna con target per la futura architettura Nova Lake e un supporto sperimentale per PowerPC a 64 bit. L'analisi di AI-RADAR sui possibili riflessi per chi gestisce ambienti di calcolo auto-gestiti.

→

Jun 26 2026

Market

Samsung SDI punta sulla supply chain USA con 20 milioni in Forge Nano

Samsung SDI investe 20 milioni di dollari in Forge Nano per costruire una filiera locale di batterie negli Stati Uniti. Una mossa che riduce i rischi di approvvigionamento e segnala l’importanza della sovranità industriale, con ricadute dirette sull’affidabilità dell’infrastruttura tech on-premise.

→

Jun 26 2026

Altro

Sam Altman: il governo USA chiede a OpenAI di frenare il rilascio del prossimo modello

L’amministrazione Trump ha chiesto a OpenAI di rilasciare il suo prossimo LLM, noto internamente come GPT-5.6, solo a un ristretto gruppo di partner fidati e con approvazione cliente per cliente. La mossa segna uno spartiacque nel dibattito sul controllo dell’intelligenza artificiale, con ripercussioni dirette per chi valuta deployment on-premise e sovranità dei dati.

→

Jun 26 2026

Altro

TikTok e YouTube rimuovono 4,7 milioni di profili under-16 in Indonesia: spunti per l’AI locale

Il governo indonesiano ha annunciato la cancellazione di oltre 4,7 milioni di account di minori di 16 anni da TikTok e YouTube, in conformità con le leggi sulla protezione dei minori. L'operazione mostra come la moderazione di massa poggi su sistemi di AI sofisticati e solleva interrogativi sulla sovranità digitale: per le imprese, la scelta tra cloud e deployment on‑premise per i modelli diventa cruciale.

→

Jun 26 2026

Market

Alibaba lancia Accio Work, suite di AI agenziale per le PMI malesi

Alibaba.com lancia Accio Work, una suite di AI agenziale che automatizza le operazioni di export delle PMI malesi. Il sistema esegue istruzioni in autonomia, dalla ricerca di mercato alla logistica transfrontaliera, operando 24/7. Il lancio è accompagnato da un concorso da 500.000 ringgit per favorire l’adozione locale. Ma l’assenza di supervisione umana può amplificare errori di prezzo, inventario e rapporti con fornitori. Alibaba riconosce il rischio: l’automazione deve liberare risorse per le decisioni strategiche, non eliminare il controllo.

→

Jun 26 2026

Market

Comprare l’IA non basta: la startup che insegna alle aziende come usarla davvero

Licenze acquistate, tool distribuiti, eppure l’adozione rimane bassa. Atheni AI, fondata da due imprenditrici fuori dagli schemi, punta sul coaching personalizzato per integrare l’IA nei processi reali. Una lezione che vale anche per chi sceglie deployment on-premise, dove il rischio di scaffalatura è altissimo.

→

Jun 26 2026

Altro

SE3 lancia la piattaforma di AI spaziale per la difesa europea, già operativa con la Bundeswehr

SE3 Labs esce dallo stealth con un round guidato da Lakestar e Seedcamp. La sua piattaforma hardware-agnostic combina navigazione senza GPS, percezione 3D in tempo reale e comando a sciame in linguaggio naturale. Già sotto contratto con la difesa tedesca, la tecnicia ha ridotto il ciclo sensore-bersaglio di un ordine di grandezza. Un segnale netto per chi segue la sovranità tecnicica e i deployment on-premise.

→

Jun 26 2026

Altro

Australia: il bando social per teenager funziona sulla carta, meno nella pratica

A sei mesi dal divieto storico di accesso ai social per gli under 16, il premier australiano ammette la necessità di rafforzarlo. Le misure attuali lasciano falle, mentre la sfida di una verifica dell’età efficace senza compromettere privacy e sovranità dei dati rimane tutta aperta. Chi sviluppa soluzioni di verifica si trova a dover bilanciare requisiti normativi stringenti con architetture di deployment che mettano al riparo da rischi di sorveglianza e concentrazione dei dati.

→

Jun 26 2026

Market

Acer gioca la carta MacBook Neo per contrastare il crollo dei PC

La divisione distributiva di Acer, Weblink, scommette sul nuovo MacBook Neo e su pacchetti software per compensare la domanda debole. Un segnale chiaro di come il canale stia ricalibrando le proprie strategie, con un occhio ai margini e uno ai servizi a valore aggiunto.

→

Jun 26 2026

Market

IEI Integration: margini al 28% nel Q1, ma l’IPC si prepara al rimbalzo

Il produttore taiwanese di industrial PC IEI Integration ha registrato un margine in calo al 28% nel primo trimestre, ma le prospettive indicano un’inversione di tendenza. Il dato mette in luce dinamiche di fornitura cruciali per chi utilizza hardware edge nel deployment on-premise di AI.

→

Jun 26 2026

Hardware

AuthenX porta l’ottica co-packaged nei datacenter AI con FAU plug-and-play

L'azienda presenta una soluzione FAU per ottica co-packaged (CPO) pensata per semplificare l'interconnessione nei cluster AI. Un tassello che tocca throughput, latenza e costi operativi per carichi di inference e training on-premise.

→

Jun 26 2026

Market

Occhiali smart, è boom: AR e intelligenza locale spingono il mercato

La crescita esplosiva del settore eyewear intelligente, seguita da DIGITIMES, costringe a ripensare le architetture che portano LLM direttamente sui dispositivi, tra privacy, latenza e sovranità dei dati.

→

Jun 26 2026

Market

Z.ai, rally da mille miliardi di HK$ e il miraggio dell'AI cinese: vero salto di modello?

L'impennata della quotazione di Z.ai riaccende il dibattito sulla bolla dell'AI in Cina. Tra promesse di modelli rivoluzionari e scetticismo giustificato, chi valuta un deployment on-premise deve distinguere la sostanza tecnica dal rumore di mercato.

→

Jun 26 2026

Hardware

Qualcomm sfida i costi della memoria HBM nei datacenter AI

Il colosso dei semiconduttori punta a ridurre la dipendenza dalla costosa memoria a banda elevata (HBM) con una nuova architettura, aprendo possibilità per server AI on-premise più sostenibili. L’iniziativa HBC segnala un cambio di rotta nei bilanci infrastrutturali.

→

Jun 26 2026

Altro

Taiwan spinge sui droni dopo i tagli: cosa significa per l'AI on-premise

Dopo i tagli al disegno di legge sulla difesa, Taiwan prepara un nuovo budget per i droni, sollevando il velo sull’importanza dell’intelligenza artificiale eseguita localmente. L’articolo esamina le implicazioni per l’hardware di bordo, la sovranità dei dati e i trade-off di deployment, elementi cruciali per chi opera in contesti sensibili dove l’inference deve restare on-premise.

→

Jun 26 2026

Hardware

AIDC mostra compositi avanzati: perché contano per l'AI on-premise

La presentazione di AIDC sui materiali compositi per velivoli di nuova generazione e droni apre scenari interessanti per chi lavora con LLM in contesti on-premise e al limite. Leggerezza, resistenza termica e integrazione strutturale potrebbero ridefinire i vincoli dell'hardware per inference locale.

→

Jun 26 2026

Market

Groundhog Technologies vince il primo ordine telco per GenAI e guarda ai satelliti LEO

Groundhog Technologies segna un primato mondiale con il primo contratto commerciale per una soluzione di intelligenza artificiale generativa destinata al settore delle telecomunicazioni. L’azienda punta ora a ottimizzare le reti satellitari LEO. L’accordo mette in luce la crescente domanda di AI on-premise e edge in ambiti critici, dove latenza e sovranità dei dati spingono verso architetture self-hosted.

→

Jun 26 2026

Market

GPT 5.6: rilascio scaglionato per OpenAI, tra incertezze regolatorie e riflessi on-premise

OpenAI ha scelto un rollout a tappe per il nuovo LLM GPT 5.6, ufficialmente per gestire l’incertezza normativa negli Stati Uniti. La mossa segnala un cambio di strategia con implicazioni dirette per il deployment on-premise, la sovranità dei dati e le scelte architetturali delle imprese che puntano al self-hosting. AI-RADAR analizza i possibili scenari.

→

Jun 26 2026

Altro

Perché l'AI mobile sta strangolando le reti (e la soluzione di Huawei)

L'upload massiccio di dati dai dispositivi AI sta mettendo in ginocchio le reti cellulari. Huawei svela GigaUplink, un sistema multi-antenna che moltiplica per cinque la velocità di caricamento. Un segnale chiaro per chi progetta infrastrutture di inference: elaborare in locale diventa cruciale.

→

Jun 26 2026

LLM

Know2Guess: il benchmark che separa conoscenza e congettura nei LLM

Know2Guess distingue risposte fondate e congetture nei LLM con un design multi-zona e contamination-aware. 1.200 domande in cinque domini, etichette esplicite di astensione e metadati sul rischio di contaminazione guidano la valutazione di Qwen2.5, Llama-3 e FLAN-T5. I risultati mostrano che l'astensione produttiva rimane critica, ma il protocollo replicabile del dataset pubblico fornisce un riferimento per audit di affidabilità e contaminazione.

→

Jun 26 2026

LLM

Rilevare il bias giornalistico con il contesto: la promessa di HierBias per l'on-premise

Un nuovo approccio gerarchico sfrutta le relazioni tra frasi per individuare il bias con maggiore accuratezza. Prestazioni superiori del 2,6% in F1, multi-task e architettura modulare: una strada percorribile per chi cerca soluzioni self-hosted nel trattamento automatizzato dell’informazione.

→

Jun 26 2026

Frameworks

Chisao, l’ottimizzatore GPU che trova tutti i picchi con uno speedup fino a 34x

Un nuovo algoritmo GPU-nativo risolve l'ottimizzazione black-box multimodale con il 100% di recupero dei modi, lasciando indietro i metodi CPU già a otto dimensioni. Disponibile open source su PyPI.

→

Jun 26 2026

Frameworks

Surrogati neurali per la crescita dei domini: fisica e deep learning si incontrano

Un team di ricerca ha sviluppato una rete convoluzionale guidata dalla fisica che prevede l'evoluzione della separazione di fase in miscele binarie. Il modello surrogato resta stabile su lunghi orizzonti temporali e rispetta le leggi di crescita dei domini. Una dimostrazione di come il deep learning possa sostituire costosi solutori numerici, aprendo scenari di deployment on-premise che preservano la riservatezza dei dati e riducono la dipendenza dal cloud.

→

Jun 26 2026

Frameworks

Oltre l'accuratezza: come ripensare i benchmark nell'era degli agenti LLM

La saturazione dei benchmark segna la fine di un ciclo, ma ignorare efficienza, affidabilità e collaborazione uomo-macchina è un errore. Il caso CORE-Bench mostra perché, per deployment on-premise, servono metriche multidimensionali.

→

Jun 26 2026

LLM

Rilevare e controllare la sycophancy con feature lineari a cascata

Una pipeline di generazione dati isola feature lineari a cascata nei LLM per individuare e correggere la sycophancy, la tendenza dei modelli a cercare conferma dall’utente. Il metodo batte o eguaglia i giudizi automatici e il prompt engineering, ma con carico computazionale inferiore e maggiore interpretabilità, offrendo un vantaggio netto per chi gestisce modelli in locale.

→

Jun 26 2026

Market

Carenza di memoria: perché Apple deve agire adesso

La carenza di memoria sta stringendo le catene produttive, e per Apple aspettare non è più un'opzione. Con i chip M-series e le crescenti ambizioni nell'IA, l'accesso a memoria avanzata è cruciale. Rimandare investimenti significa cedere il passo ai concorrenti. Per chi progetta infrastrutture AI on-premise, lo shortage rende più imprevedibili costi e disponibilità hardware, richiedendo valutazioni attente del Total Cost of Ownership.

→

Jun 26 2026

Altro

OpenAI, Anthropic e Google si contendono i deployment engineer: l’IA ora parla all’impresa

Le tre big dell’IA stanno assumendo figure specializzate nell’integrazione in contesti reali. Non più soltanto ricercatori: servono profili capaci di portare i modelli nei data center aziendali. Per chi guarda al deployment on-premise, il segnale è chiaro: controllo, costi e sovranità diventano il nuovo campo di battaglia.

→

Jun 26 2026

Hardware

Taiwan accelera sul quantum: l’Academia Sinica pronta al salto ingegneristico

L’istituto di ricerca taiwanese ha finalizzato un chip quantistico nazionale, spostando il progetto dalla teoria alla fase ingegneristica. Un passaggio che riflette la spinta verso l’autonomia tecnicica e potrebbe ridisegnare gli equilibri nella corsa all’hardware avanzato, con implicazioni per la sovranità dei dati e le future architetture di calcolo anche per l’AI.

→

Jun 26 2026

Altro

Taiwan riavvia il piano droni da 210 miliardi NT$, spinta alla sovranità dei dati e all'AI on-premise

Il rilancio del programma droni militari taiwanese segna più di una mossa industriale: apre la strada a infrastrutture AI locali e self-hosted. Per le imprese che valutano il deployment on-premise, la lezione è chiara: quando sensibilità e continuità operativa sono in gioco, il controllo fisico dei dati e dei modelli diventa irrinunciabile.

→

Jun 26 2026

Hardware

Apple accelera la roadmap dei chip Mac per l'AI: cosa significa per l'inference locale

Apple starebbe rivedendo la roadmap dei chip Mac per accelerare lo sviluppo di funzionalità AI. La mossa, riportata da AFP senza ulteriori dettagli, segnala un crescente impegno verso l'elaborazione on-device. Per chi segue gli stack locali, l'evoluzione dei processori Apple potrebbe ampliare le possibilità di eseguire LLM in locale, ma solleva interrogativi su scalabilità e costi rispetto a soluzioni cloud o server dedicati.

→

Jun 26 2026

Market

Giappone, 101,6 trilioni di yen per l’AI: la corsa ai chip diventa strategia nazionale

Il governo giapponese annuncia un investimento di 101,6 trilioni di yen in chip per intelligenza artificiale, cuore di un piano complessivo da 370 trilioni. La mossa ridisegna le priorità industriali e solleva interrogativi concreti per chi valuta deployment on-premise: disponibilità di hardware, sovranità dei dati e nuove geometrie del TCO.

→

Jun 26 2026

Hardware

Academia Sinica punta ai chip quantistici su scala industriale con le fabbriche dei semiconduttori taiwanesi

L'istituto di ricerca sfrutta la base produttiva già esistente per portare i processori quantistici fuori dal laboratorio. Una mossa che potrebbe ridefinire la catena di fornitura dell'hardware avanzato, con ricadute concrete per chi valuta crescita on-premise e sovranità dei dati nell’era dell’AI.

→

Jun 26 2026

Market

Qualcomm punta al cloud AI con Dragonfly: non più solo chip per smartphone

Con il progetto Dragonfly, Qualcomm rilancia la propria strategia nel cloud AI, segnando un’evoluzione che va oltre i processori per dispositivi mobili. L’iniziativa apre scenari di competizione nel mercato degli acceleratori per data center, con possibili ricadute per chi cerca alternative a NVIDIA e valuta deployment on-premise.

→

Jun 26 2026

Frameworks

audio.cpp accelera la sintesi vocale: 12 modelli in un unico runtime C++, 5x più rapido

Il progetto audio.cpp porta l’inference di modelli audio su un runtime C++ nativo basato su ggml, unificando TTS, voice cloning, ASR e conversion in un unico stack. I benchmark su CUDA mostrano PocketTTS generare quasi 6 minuti di audio in soli 7,3 secondi, con un’accelerazione fino a 5 volte rispetto a Python. Un passo verso deployment self-hosted più efficienti e prevedibili.

→

Jun 26 2026

Altro

TSMC spinge su SiC e GaN: efficienza energetica per l’AI on-premise

La trasformazione di TSMC verso materiali wide-bandgap come carburo di silicio e nitruro di gallio segna un passaggio chiave per l’infrastruttura dei datacenter. Meno dissipazione, maggiore densità di potenza e TCO ridotto sono vantaggi diretti per chi gestisce carichi di inference e training in locale.

→

Jun 26 2026

LLM

Anthropic e il paradosso del potere: più successo, più sicurezza?

Anthropic sostiene che accumulare influenza sia necessario per uno sviluppo responsabile dell’AI. I critici parlano di concentrazione di potere. Per chi gestisce LLM in locale, la tensione tra controllo centralizzato e sovranità dei dati apre un dibattito su chi garantisce davvero la sicurezza.

→

Jun 26 2026

Altro

Ubuntu 26.10: arriva Snapshot 2, banco di prova per l’infrastruttura AI on-premise

Canonical pubblica la seconda istantanea mensile di Ubuntu 26.10 “Stonking Stingray”, offrendo alle organizzazioni che gestiscono stack LLM on-premise un ambiente controllato per validare compatibilità hardware, driver GPU e componenti chiave del sistema operativo prima del rilascio definitivo. Un appuntamento cruciale per chi governa pipeline di inference in self-hosting.

→

Jun 26 2026

Altro

Europa, catene non-red: la partita dell’hardware per LLM on-premise

L'esibizione di Thunder Tiger in Polonia segnala un'accelerazione europea verso catene di fornitura libere da componenti cinesi. Per l'AI on-premise, questo si traduce in scelte hardware vincolate, nuovi trade-off su GPU e costi totali di possesso, e una ridefinizione dei criteri di sovranità tecnicica per chi gestisce modelli in-house.

→

Jun 26 2026

Hardware

GlobalFoundries punta su Singapore per cavalcare l’ondata dell’hardware AI fisico

Il produttore di semiconduttori rafforza la presenza nella città-stato per soddisfare la domanda crescente di chip progettati per l’intelligenza artificiale. Una mossa che segnala la centralità della capacità produttiva nella corsa all’infrastruttura per AI, con implicazioni concrete per chi sviluppa o acquista hardware destinato a deployment on-premise.

→

Jun 26 2026

Hardware

SK Siltron alza la capacità sui wafer da 300 mm: l’AI detta il passo della filiera

Il produttore sudcoreano aggiunge linee per wafer da 300 mm per rispondere alla domanda di chip AI. Per chi costruisce infrastruttura on-premise, più wafer significa più GPU, meno colli di bottiglia e un segnale concreto sulla crescita sostenuta del comparto.

→

Jun 26 2026

Market

Alibaba triplica il capitale di T-Head: la sfida sui chip AI si gioca in casa

L’unità chip di Alibaba rinforza le fondamenta finanziarie per spingere sull’hardware AI. La mossa segnala una corsa alla sovranità tecnicica che incrocia RISC-V, scenari on-premise e l’esigenza di sfuggire alle strette geopolitiche sui semiconduttori.

→

Jun 25 2026

LLM

GPT 5.6: la Casa Bianca chiede il rilascio graduale. OpenAI limita l'accesso ai partner

OpenAI avrebbe deciso di rendere disponibile il nuovo modello GPT 5.6 soltanto a un gruppo ristretto di partner, anziché al grande pubblico, su indicazione dell’amministrazione Trump per ragioni di sicurezza. La notizia riaccende il dibattito sul controllo degli LLM e spinge le aziende a considerare il deployment on-premise per evitare dipendenze e garantire sovranità sui dati.

→

Jun 25 2026

Market

Debito tecnico: 2,41 trilioni di dollari all’anno, la crociata di Jay Roland

L’accumulo di fix rimandati, configurazioni errate e inefficienze operative costa alle imprese USA 2,41 trilioni di dollari l’anno. Jay Roland, fondatore di Varex Solutions, denuncia l’autocompiacimento del settore. Nell’era dei LLM on-premise, questo debito ostacola la modernizzazione infrastrutturale e la sovranità dei dati, rendendo insostenibili i costi a lungo termine.

→

Jun 25 2026

Altro

Controllo USA su GPT 5.6: l’on-premise come scudo alla dipendenza

Una voce di corridoio indica che Washington potrebbe autorizzare singolarmente l’accesso a GPT 5.6. Un segnale che rafforza la spinta verso stack locali e valutazioni di TCO per chi non vuole restare in balia di decisioni governative.

→

Jun 25 2026

Altro

Fiducia nell'AI sanitaria: perché privacy, trasparenza e supervisione umana sono irrinunciabili

L'intelligenza artificiale sta entrando nei flussi clinici, ma la sua accettazione si scontra con la fiducia. Privacy, trasparenza e controllo umano diventano requisiti architetturali, non semplici auspici. AI-RADAR analizza come un deployment on-premise, con dati sotto la piena giurisdizione dell'organizzazione, risponda a queste sfide regolatorie e operative.

→

Jun 25 2026

Frameworks

OpenAI: il 98% dei dipendenti usa già Codex, ma i numeri sono tutti interni

Un documento interno rivela un balzo nell’adozione degli agenti di coding dal 40% al 98%. L’azienda descrive un cambio radicale nel modo di lavorare, ma mancano dati indipendenti e dettagli tecnici su infrastruttura e costi. Per chi valuta strumenti simili on-premise, la trasparenza è ancora lontana.

→

Jun 25 2026

Altro

Linux Foundation e big tech uniscono le forze in Akrites per blindare l’open-source dagli attacchi IA

La Linux Foundation, insieme a colossi come Amazon, Anthropic, OpenAI, NVIDIA e Microsoft, ha avviato il progetto Akrites per identificare e risolvere rapidamente le vulnerabilità nel software open-source scoperte tramite LLM, prima che possano essere sfruttate.

→

Jun 25 2026

Market

Patronus AI incassa 50 milioni per costruire ‘mondi digitali’ che stressano gli agenti AI

La startup fondata da ex ricercatori Meta raccoglie un round significativo per rispondere a una domanda quasi insaziabile di testing per agenti autonomi. I suoi ambienti simulati promettono di ridurre i rischi prima del deployment, ma per i team che operano on-premise l’affidabilità degli agenti richiede strategie di validazione adattate ai vincoli locali e alla sovranità dei dati.

→

Jun 25 2026

Market

Notion chiude il client di posta: gli agenti AI rendono superflua la casella in arrivo

Notion spegnerà Notion Mail il 22 settembre, dopo meno di 18 mesi dal lancio. La motivazione riflette un cambiamento più ampio: gli agenti AI smistano, rispondono e organizzano la posta senza bisogno che l’utente apra l’inbox. La decisione solleva interrogativi sulla privacy e sul controllo dei dati, specie per chi valuta deployment on-premise per evitare che le email transitate su cloud siano elaborate da modelli esterni.

→

Jun 25 2026

Market

Addio pedale del freno per le auto autonome: la mossa Trump e le ricadute sull’AI on-premise

L’amministrazione Trump propone di eliminare l’obbligo del pedale del freno per i veicoli a guida completamente autonoma. La modifica rimuoverebbe una barriera regolatoria chiave, accelerando il design di mezzi senza comandi umani. Per chi sviluppa AI on-premise, la notizia apre riflessioni su responsabilità, sicurezza e scomparsa del controllo manuale nei sistemi automatici.

→

Jun 25 2026

Market

Claude conquista i consumatori paganti: i dati delle carte svelano la crescita del +75%

Secondo l’analisi di Indagari su transazioni di 28 milioni di consumatori USA, la base pagante di Claude è cresciuta del 75% da gennaio, con ricavi in forte aumento. Un segnale che ridisegna la competizione con ChatGPT e interessa anche chi valuta modelli LLM per infrastrutture on-premise.

→

Jun 25 2026

Market

Notion chiude Mail: gli agenti AI rimpiazzano l’email tradizionale

Dopo l’acquisizione di Skiff e il lancio di Notion Mail, l’azienda archivia il client e punta sugli agenti AI. Uno stop che riflette un cambiamento più profondo: l’automazione della posta elettronica passa dai client alle intelligenze artificiali, con implicazioni per chi gestisce dati in proprio.

→

Jun 25 2026

Hardware

Apple: salta i chip M6 Pro/Max? Ecco perché guarda a M7 per l’AI locale

Una indiscrezione suggerisce che Apple potrebbe scavalcare le varianti professionali dell’M6 per concentrarsi sul salto a M7, progettato per l’esecuzione locale di modelli AI. Cosa significa per chi investe in hardware sovrano e inference on-premise.

→

Jun 25 2026

Altro

Sarah Wynn-Williams fa causa a Meta: la battaglia per non essere messa a tacere

L'ex dirigente e autrice del memoir Careless People porta in tribunale l'azienda di Menlo Park, accusandola di azioni legali volte a sopprimere la sua voce. Il caso segnala tensioni profonde su controllo e trasparenza, con risvolti per chi architetta infrastrutture AI orientate alla sovranità dei dati.

→

Jun 25 2026

Altro

Anthropic accusa Alibaba: il più grande attacco mai misurato per clonare Claude

Un’operazione da 28,8 milioni di scambi, quasi 25mila account fraudolenti e l’obiettivo di estrarre capacità di ragionamento agentico e ingegneria del software. L’incidente solleva interrogativi sulla protezione dei modelli esposti via API e rafforza il caso per deployment on-premise in scenari sensibili.

→

Jun 25 2026

Hardware

Unconventional AI lancia Un-0: architettura a oscillatori per un consumo energetico mille volte inferiore

La startup fondata da Naveen Rao ha rilasciato un sistema di generazione immagini che gira su una nuova architettura di calcolo a oscillatori, promettendo consumi drasticamente ridotti. L’approccio potrebbe ridefinire i parametri di costo ed efficienza per il deployment on-premise e edge dell’AI generativa, anche se restano incognite tecniche da chiarire.

→

Jun 25 2026

Altro

La cancellazione dei dati di Klue è un bluff? Un secondo gruppo di hacker rilancia le minacce

Dopo la violazione di Klue che ha esposto dati di LastPass, HackerOne e altre aziende, il gruppo iniziale cancella tutto. Ma ora un secondo team anonimo rivendica lo stesso bottino e tenta l'estorsione, segnalando un'escalation nella gestione delle catene di attacco alla supply chain.

→

Jun 25 2026

Market

Claude di Anthropic avanza tra i consumatori paganti, il feudo di ChatGPT si incrina

Nuovi dati mostrano che, nonostante ChatGPT domini il mercato, Claude di Anthropic sta conquistando una quota crescente di utenti disposti a pagare. Un segnale che nel panorama dei LLM la competizione si sposta sulla qualità percepita e sulla fiducia.

→

Jun 25 2026

Altro

Perché una banca ha bisogno di un Chief Scientist?

Prem Natarajan ha lasciato la guida di Alexa AI per diventare Chief Scientist di Capital One. La banca statunitense investe in ricerca scientifica per andare oltre i modelli di fondazione e costruire AI affidabile, in tempo reale e rispettosa della privacy, un cambio di passo che ridefinisce il ruolo della scienza nei servizi finanziari.

→

Jun 25 2026

Altro

Sail raccoglie 80 milioni per dimezzare il costo degli agenti AI

La startup Sail Research, fondata da ex ingegneri Apple e NVIDIA, promette di servire i token consumati dagli agenti AI a costi fino a 10 volte inferiori. Un round da 80 milioni di dollari accende i riflettori sulla corsa per rendere sostenibile l'inference su larga scala.

→

Jun 25 2026

Market

Google Finance sbarca su Android con AI generativa: opportunità e nodi di sovranità

Google Finance esce dalla fase beta con un'app Android dedicata, tracking del portafoglio e briefing di mercato programmati basati su Gemini. Dietro le novità, una riflessione su come l'integrazione pervasiva degli LLM nei servizi consumer stia ridefinendo il confine tra cloud e controllo locale dei dati sensibili.

→

Jun 25 2026

Market

Ex capo AI di Databricks promette di tagliare 1.000x il costo energetico dell’AI con Un0

L’ex responsabile AI di Databricks presenta Un0, un sistema di generazione di immagini che promette di ridurre di mille volte il consumo energetico rispetto alle soluzioni tradizionali. Una scommessa sull’efficienza che tocca il TCO e il deployment on-premise.

→

Jun 25 2026

Altro

Netris raccoglie 15 milioni da a16z per sbloccare il networking che frena i cluster GPU

La startup di Santa Clara ha ottenuto un Series A guidato da Andreessen Horowitz dopo una crescita del +800% dell’ARR e oltre 35 installazioni live. L’automazione dello strato di rete promette di ridurre la complessità nei data center GPU, un tema caldo per chi sposta training e inference on-premise. AI-RADAR analizza le implicazioni per la latenza, la sovranità e il costo totale di possesso.

→

🗄️ Archivio Notizie