Archivio Notizie – Cronologia Completa Segnali AI

Jul 03 2026

Altro

Le email che hanno rotto il patto tra Anthropic e il Pentagono

Documenti giudiziari svelano che lo scontro legale non riguarda solo l’accesso a Claude. È in gioco il controllo sull’uso militare dell’AI di frontiera: una partita che ridefinisce i confini della sovranità tecnicica e del deployment on-premise.

→

Jul 03 2026

Altro

Erebor, la banca di Luckey che punta a 8 miliardi: cosa significa per l’AI finanziaria

Fondata dal creatore di Anduril e sostenuta da Peter Thiel, Erebor ha quadruplicato i depositi in tre mesi e cerca una valutazione da 8 miliardi di dollari. Dietro la crescita ci sono scelte infrastrutturali che toccano privacy, sovranità del dato e costo reale del deployment AI.

→

Jul 03 2026

Market

Zoom vuole l'intero ciclo di vendita: con Common Room l'AI legge i segnali d'acquisto

Con l'acquisizione di Common Room, Zoom integra l'AI nel processo di vendita prima della videochiamata. La startup analizza i segnali d'acquisto, portando Zoom nel software enterprise. L'operazione, senza dettagli finanziari, segna un passo verso un ecosistema in cui la piattaforma controlla dati e conversazioni, sollevando interrogativi sulla sovranità dei dati per chi valuta on-premise.

→

Jul 03 2026

Altro

Spagna, blocco LALIGA abbatte 500mila siti innocenti

Ordini del tribunale per fermare lo streaming pirata delle partite hanno portato all’oscuramento di centinaia di migliaia di pagine web legittime, dalle organizzazioni umanitarie ai tool aziendali. Un rapporto quantifica per la prima volta il danno collaterale di un sistema di blocco automatico che solleva domande sulla sovranità digitale e sui limiti dell’automazione.

→

Jul 03 2026

Altro

Palantir su HuggingFace è vuota, ma i clienti governativi abbracciano l’open source

L’organizzazione gratuita di Palantir su Hugging Face esiste ma non contiene modelli né dataset pubblici. Il CEO Alex Karp ha dichiarato che alcuni clienti del governo USA sono passati a soluzioni AI open source. Un segnale del peso crescente della sovranità dei dati e del controllo diretto sui modelli, specie per chi opera in ambienti on-premise.

→

Jul 03 2026

Altro

L’Argentina propone società gestite da AI, ma il fattore umano resta indispensabile

Il governo argentino ha inviato al Congresso un disegno di legge per creare società non-umane, entità gestite da agenti AI o robot capaci di firmare contratti e detenere beni in autonomia. La proposta, però, ammette implicitamente che la supervisione umana rimane irrinunciabile, sollevando questioni su controllo, responsabilità e l’infrastruttura tecnicica che rende possibili simili forme giuridiche.

→

Jul 03 2026

Hardware

Intel accelera il supporto a Nova Lake con Xe3P per Linux 7.3

Le prime patch per il kernel Linux 7.3 concentrano gli sforzi sulla grafica integrata della futura architettura Nova Lake e sul motore Xe3P. L’abilitazione open source del driver diventa un tassello cruciale per chi valuta l’inference LLM on-premise su piattaforme Intel, dove il controllo dei dati e l’efficienza hardware contano più della potenza bruta.

→

Jul 03 2026

Market

Starling Bank taglia 130 posti e spinge sull’AI: cosa significa per il banking e il controllo dei dati

Starling Bank elimina 130 ruoli tra banking e tecnicia per semplificare le operazioni e accelerare il lancio di prodotti. Profitti e ricavi in calo nell’ultimo esercizio. La challenger bank investe nell’AI, lanciando il primo assistente finanziario agentico del Regno Unito. L’automazione solleva interrogativi su sovranità dei dati e scelte architetturali: cloud o on-premise? Una ristrutturazione che segnala come l’adozione dell’AI stia ridisegnando il lavoro nel settore finanziario.

→

Jul 03 2026

Hardware

NVIDIA abbraccia l'open source per la gestione dei server AI: ecco cosa cambia

Il colosso avvia l'upstreaming del Device Tree per il BMC della piattaforma Vera Rubin VR-NVL, segnando un passo importante verso il supporto a OpenBMC. Un'apertura che promette maggiore controllo infrastrutturale per chi fa deployment on-premise di LLM.

→

Jul 03 2026

Altro

Spotify rimuove 500mila stream sospetti: perché anche l’AI on-premise guarda a Kalshi

Spotify cancella mezzo milione di ascolti di “Earrings” di Malcolm Todd dopo che la sua ascesa in classifica coincideva con una scommessa sul mercato predittivo Kalshi. L’azienda ha chiesto a Kalshi e Polymarket di rimuovere il proprio logo. Un campanello d’allarme sull’integrità dei dati, tema centrale per chi addestra LLM in ambienti on-premise.

→

Jul 03 2026

Altro

Linux 7.2-rc2 alza le difese contro il JIT spraying su BPF

Il kernel Linux in arrivo integra modifiche per mitigare gli attacchi di tipo JIT spraying nel codice BPF. Una mossa che rafforza la sicurezza dei sistemi on-premise, dove la fiducia nello stack software parte dalle fondamenta del kernel.

→

Jul 03 2026

LLM

DeepSeek annuncia DSpark: un salto di velocità per l’inference degli LLM

Il team cinese svela DSpark, un nuovo metodo che supera in velocità la predizione multi-token (MTP). Se i numeri saranno confermati, potrebbe accelerare l’inference nei deployment on-premise, riducendo la latenza senza hardware aggiuntivo. Un’analisi delle implicazioni.

→

Jul 03 2026

Hardware

Intel 18A: risolti i problemi di resa, produzione a 15.000 wafer al mese

Secondo un report, Intel avrebbe superato i colli di bottiglia nella resa wafer-to-wafer del nodo 18A, portando la produzione a 15.000 wafer mensili in due stabilimenti. Un passo decisivo per la catena di fornitura di chip per server e acceleratori IA.

→

Jul 03 2026

Market

Crusoe in trattativa per 3 miliardi di dollari: l’AI incontra l’energia di scarto

La società, specializzata in data center modulari alimentati a gas di scarto, potrebbe triplicare la valutazione a 30 miliardi. Il round finanziario segnala la crescente fame di potenza di calcolo per l’AI e spinge verso infrastrutture distribuite, con possibili riflessi sul deployment on-premise e la sovranità del dato.

→

Jul 03 2026

Altro

GitHub stampa CD-ROM dei repo pubblici: frecciata a Sony e simbolo di sovranità digitale

Un’edizione limitata di 1.000 dischi ottici con il codice sorgente di progetti open source. Un gesto ironico che riaccende la discussione su conservazione fisica e controllo dei dati, temi sempre più centrali per chi sceglie stack on-premise e self-hosted.

→

Jul 03 2026

Market

Climentum raccoglie 60 milioni per l’hardware climatico: un segnale per chi fa AI on-premise

Il fondo danese Climentum Capital ha chiuso una prima tranche da 60 milioni di euro per il suo secondo veicolo, con EIF, EIFO e IDA. Si punta su hardware per energia, industria e sovranità delle filiere. Per chi gestisce inference di LLM in locale, queste tecnicie toccano il costo e la disponibilità dell’energia, nodo cruciale del TCO.

→

Jul 03 2026

Altro

L’India allarga la stretta sugli username a Telegram e Signal

Il ministero della Tecnologia indiano ha inviato avvisi a Telegram e Signal dopo aver intimato a WhatsApp di sospendere il lancio degli username. Un’escalation regolatoria che riaccende il dibattito su sovranità dei dati e controllo delle comunicazioni.

→

Jul 03 2026

Altro

Privacy e AI: la sentenza della Corte Suprema che cambia le regole sui dati di localizzazione

La Corte Suprema USA ha stabilito che i dati di localizzazione, anche se raccolti per brevi periodi, sono protetti dal Quarto Emendamento. Un precedente che incrocia il futuro dell'AI, spingendo le aziende a riconsiderare dove e come addestrano i modelli.

→

Jul 03 2026

Hardware

La giacca di Jensen Huang all'asta per 60.000 dollari: il simbolo del boom dell'hardware AI

Sotheby’s mette all’asta la giacca di pelle firmata indossata dal CEO NVIDIA al Foxconn Tech Day 2023. Un cimelio che riflette l’ascesa della domanda di infrastrutture per LLM on-premise e la centralità della catena produttiva taiwanese.

→

Jul 03 2026

Hardware

Infineon Cina contesta la rimozione dei GaN alla fiera di Shanghai

La filiale cinese di Infineon reagisce dopo che i suoi prodotti al nitruro di gallio sono stati tolti da un evento a Shanghai. La vicenda getta luce sul ruolo cruciale del GaN nell’efficienza energetica dei data center e sulle tensioni crescenti nelle filiere dei semiconduttori per l’AI.

→

Jul 03 2026

Altro

DeepSeek V4 Flash su RTX PRO 6000: coding 3x più veloce di Sonnet, qualità simile

Un benchmark indipendente mostra che DeepSeek V4 Flash eseguito in locale su due GPU RTX PRO 6000 con vLLM completa task di coding in circa 2 minuti, contro i 6 minuti di Sonnet 5 via API, con qualità paragonabile. Opus e Fable restano superiori per precisione, ma i risultati segnano un punto di svolta per l'inference on-premise.

→

Jul 03 2026

Altro

Anthropic e la Casa Bianca negano colloqui su una quota pubblica nell’azienda

Fonti vicine ai colloqui smentiscono che l'amministrazione Trump e Anthropic abbiano discusso la cessione di una partecipazione statale. La precisazione arriva dopo indiscrezioni su una proposta simile di OpenAI. AI-RADAR analizza cosa significa per la sovranità dei dati e le scelte di deployment on-premise in un contesto di crescente intreccio tra AI e potere pubblico.

→

Jul 03 2026

Altro

Una cellula costruita da zero: si nutre, cresce e compete senza essere viva

Un team dell'Università del Minnesota ha realizzato SpudCell, una cellula sintetica che si nutre, si divide e compete. La biologia di sintesi sfuma il confine tra chimica e vita, aprendo interrogativi su cosa definisca un organismo vivente.

→

Jul 03 2026

Hardware

Turvo punta sulla robotica: l’edge computing incontra l’inference locale

La taiwanese Turvo conferma il pieno controllo manageriale e rilancia i piani di espansione nella robotica. Un segnale che rafforza la convergenza tra automazione e AI on-premise, spingendo verso hardware specializzato per l’inference locale.

→

Jul 03 2026

Market

Giantec alza i prezzi delle NOR Flash del 25%: rischio costi per l'hardware AI on-premise

Il produttore cinese Giantec ha annunciato un rincaro del 25% sulle memorie NOR Flash, segnalando tensioni persistenti nel mercato delle memorie. L'aumento potrebbe pesare sui costi dell'hardware per inference LLM self-hosted, specialmente in contesti edge e embedded, dove la componente NOR è diffusa.

→

Jul 03 2026

Altro

Rack AI da megawatt: l’ascesa dei semiconduttori wide-bandgap nell’infrastruttura on-premise

L’evoluzione dei cluster per l’addestramento di LLM spinge la densità di potenza dei rack verso il megawatt. I semiconduttori a banda larga come SiC e GaN promettono efficienza superiore e minor calore, riducendo il TCO per le infrastrutture on-premise. Un’analisi che trasforma la scelta dei componenti elettrici in una leva strategica per la sovranità dei dati.

→

Jul 03 2026

Altro

I robot U1 di Ubtech aprono il dibattito: l’AI intima deve restare locale

Ubtech lancia i robot compagni U1 per testare il confine dell’intimità artificiale in Cina. L’elaborazione di dati personali sensibili spinge verso architetture edge e on-device, dove privacy e sovranità prevalgono sul cloud. AI-RADAR analizza i trade-off tecnici di un deployment che deve bilanciare reattività, TCO e vincoli normativi.

→

Jul 03 2026

Altro

Alibaba vieta Claude Code ai dipendenti: rischio backdoor dietro la scelta

Dal 10 luglio Alibaba proibirà l’uso di Claude Code in azienda, citando un presunto rischio backdoor. La decisione arriva dopo che Anthropic ha accusato operatori legati a Qwen di condurre la più vasta campagna di distilazione contro Claude. Una mossa che rilancia il confronto su sicurezza degli strumenti AI esterni e controllo dei dati.

→

Jul 03 2026

Market

Quantum Systems incassa 1,2 miliardi: i droni autonomi tedeschi volano a 8 miliardi di valutazione

La startup bavarese Quantum Systems ha chiuso un round Serie D da 1,2 miliardi di dollari, portando la sua valutazione a circa 8 miliardi. Guidato da Blackstone, Noteus, Airbus e Advent, è uno dei più grandi finanziamenti mai ottenuti da una startup europea della difesa. Il mercato dei velivoli autonomi a uso militare accelera, trainato dalla domanda crescente di capacità di sorveglianza e combattimento senza pilota.

→

Jul 03 2026

LLM

Zuckerberg: gli agenti AI di Meta procedono più lentamente del previsto

Mark Zuckerberg ha comunicato ai dipendenti che lo sviluppo degli agenti AI di Meta sta procedendo più lentamente del previsto, nonostante la riorganizzazione di quattro mesi fa. La notizia solleva interrogativi sulle sfide tecniche dell'AI agentica e sulle implicazioni per chi gestisce carichi di lavoro LLM on-premise.

→

Jul 03 2026

Altro

Claude Code e la lista nascosta: cosa scatta quando imposti ANTHROPIC_BASE_URL

Un ricercatore ha scoperto un meccanismo cifrato in Claude Code: una blacklist di domini legati a Cina e laboratori IA, attivata quando si reindirizza l’API. L’analisi solleva interrogativi sulla trasparenza per chi usa endpoint personalizzati.

→

Jul 03 2026

Market

ALP Bio raccoglie 161mila euro per rendere più sicuri i farmaci biologici con l’IA

La startup svizzera ALP Bio ha ottenuto 161.000 euro dal fondo Venture Kick per validare la sua piattaforma che unisce modelli immunitari umani e intelligenza artificiale. L’obiettivo è identificare precocemente i rischi immunogenici dei farmaci biologici, riducendo fallimenti clinici e migliorando la sicurezza. I primi progetti pilota con partner farmaceutici serviranno a testare la tecnicia in contesti reali e a consolidare la posizione commerciale dell’azienda.

→

Jul 03 2026

Hardware

Sonix si rilancia tra sanità e droni: l’edge AI detta il passo dell’hardware locale

Il progettista taiwanese di SoC Sonix Technology segna una ripresa delle consegne spinta dalla domanda di dispositivi medicali e multimediali, mentre la strategia sui droni guadagna trazione. Un segnale chiaro: l’inference AI si sposta sempre più all’edge, dove contano latenza, privacy e costo energetico.

→

Jul 03 2026

Hardware

Corea del Sud: gigafabbrica di chip nel sud-ovest, ma le sfide restano

Il governo sudcoreano spinge per un mega-polo di semiconduttori nella regione sud-occidentale, ma tra carenza di talenti, costi infrastrutturali e tensioni geopolitiche il progetto deve ancora superare scogli decisivi. Per chi distribuisce LLM on-premise, la posta in gioco è la futura disponibilità di hardware accelerato.

→

Jul 03 2026

LLM

La cinese Z.ai lancia GLM-5.2 e sfida OpenAI e Anthropic

Con GLM-5.2, Z.ai intensifica la competizione globale nell'AI generativa, puntando ai big occidentali. L'annuncio accende i riflettori sulle capacità cinesi di sviluppare LLM competitivi e sul ruolo della sovranità dei dati nelle scelte di deployment on-premise.

→

Jul 03 2026

Altro

Turn Cloud si trasforma in infrastruttura AI: i riflessi per chi investe in locale

La piattaforma cloud punta sull’infrastruttura per intelligenza artificiale. Un segnale di mercato che riaccende il dibattito su TCO, sovranità dei dati e convenienza dell’on-premise. AI-RADAR analizza le implicazioni.

→

Jul 03 2026

Hardware

Intel sfida TSMC con EMIB-T: la guerra dei package avanzati entra nel vivo

La nuova tecnicia di interconnessione di Intel punta a scalfire il dominio di CoWoS nel packaging per chip ad alte prestazioni, con possibili ripercussioni sugli acceleratori per LLM on-premise.

→

Jul 03 2026

Market

Fame di server fino al 2027: la supply chain si restringe, cosa cambia per l'LLM on-premise

Secondo DIGITIMES, la domanda di server resterà forte fino al 2027, mentre la supply chain è sotto pressione crescente. Per i team che pianificano deployment on-premise di Large Language Models, questo scenario impone una pianificazione anticipata: lead time dilatati, revisione dei budget e maggiore attenzione all'ottimizzazione dell'inference. L'analisi del TCO diventa essenziale per evitare ritardi e per mantenere il controllo su dati e conformità.

→

Jul 03 2026

Market

Microsoft investe 2,5 miliardi: ingegneri embedded per guidare l'AI in azienda

Una nuova unità da 2,5 miliardi di dollari con ingegneri immersi nei clienti per accelerare l'adozione dell'intelligenza artificiale. Un segnale di quanto sia complesso portare l'AI fuori dai laboratori e nei processi reali.

→

Jul 03 2026

Market

Come TSMC ha trasformato la supply chain in una 'seconda flotta'

DIGITIMES rivela la strategia con cui TSMC rafforza la resilienza della supply chain di semiconduttori, creando una 'seconda flotta' di fornitori e capacità alternative. Per chi gestisce inference LLM on-premise, la disponibilità di GPU è un fattore di costo e rischio: una filiera più stabile potrebbe ridurre il TCO e facilitare la pianificazione delle infrastrutture AI.

→

Jul 03 2026

Hardware

BOE punta sul packaging AI con Micro LED e substrati in vetro

BOE, gigante cinese dei display, esplora il packaging per chip AI con interconnessioni ottiche Micro LED e co-packaged optics su vetro. L’obiettivo: densità, efficienza e scalabilità per data center, con possibili ricadute sul deployment on-premise.

→

Jul 03 2026

Frameworks

L’audio locale si fa serio: audio.cpp sforna generazione musicale e separazione stem

Il framework C++/ggml si arricchisce di modelli come ACE-Step, HeartMuLa e Stable Audio 3. Generazione a 10 minuti, inference quasi 10× real-time contro Python, e attenzione al risparmio VRAM. Un passo avanti per chi vuole audio AI on-premise senza cloud.

→

Jul 03 2026

Frameworks

ProvenanceGuard: tracciare la provenienza per mettere in sicurezza gli agenti LLM

Un nuovo studio propone un framework basato sull’analisi della provenienza per rilevare il misalignment negli agenti LLM, riducendo drasticamente i falsi negativi e gli interventi superflui. I test su Agent-SafetyBench e WorkBench mostrano un calo del tasso di errore dal 42,9% all’1,8% e una riduzione degli interventi su azioni corrette dal 30,5% al 12,8%, senza bloccare più del necessario le chiamate strumentali legittime. Un passo avanti per chi gestisce deployment self-hosted e cerca auditability.

→

Jul 03 2026

LLM

TokenScope illumina i meccanismi decisionali dei LLM nella generazione di codice

Uno strumento interattivo espone metriche a livello di token, meccanismi di attenzione e percorsi alternativi per capire come i modelli linguistici producono codice. Per chi sviluppa in ambienti on-premise, questa trasparenza potrebbe diventare un tassello critico per audit e controllo qualità.

→

Jul 03 2026

Altro

Stress da EEG, il metodo I²RiMA pesa 1,6M parametri e gira in locale

I²RiMA è un nuovo approccio per riconoscere lo stress mentale da segnali EEG. Sfrutta la geometria Riemanniana e un’attenzione temporale a doppio livello, toccando un’accuratezza dell’82,78% con appena 1,6 milioni di parametri e 31,95 milioni di FLOPs. Leggero ed efficiente, il modello è candidato naturale per l’inference on-device, dove i dati biometrici non lasciano il dispositivo.

→

Jul 03 2026

Altro

Diagnostica cognitiva IA: M-QCDNet unisce psicometria e reti neurali con un occhio alla privacy

Un nuovo modello di deep learning integra matrici Q per diagnosi cognitive interpretabili, con potenziali applicazioni scolastiche che richiedono deployment on-premise per la tutela dei dati degli studenti.

→

Jul 03 2026

Altro

Agenti programmatori alla conquista del federated learning: cosa funziona e cosa no

Un team di ricerca ha affidato a LLM agent la ricerca di ricette algoritmiche per il federated learning in sanità. I risultati, tra progressi reali e fallimenti legati al seme, offrono una lezione su come separare l’innovazione dal rumore.

→

Jul 03 2026

Frameworks

PACE: un framework neuro-simbolico per spiegazioni controfattuali realistiche e vincolate

Il framework PACE separa la previsione neurale dal ragionamento simbolico per produrre spiegazioni controfattuali che rispettano i vincoli di dominio. Un caso di studio sul dataset Adult Income mostra il compromesso tra validità e plausibilità, evidenziando come i vincoli simbolici migliorino la fattibilità delle raccomandazioni. Per chi sviluppa AI in contesti regolamentati on-premise, l’approccio neuro-simbolico offre un equilibrio tra accuratezza e aderenza alle regole di business.

→

Jul 03 2026

Market

Cina contro le batterie EV sovradimensionate: mossa fiscale e sulla catena di fornitura

Pechino interviene contro le batterie per auto elettriche eccessivamente grandi, secondo un'analisi AFP. L'obiettivo è contenere la spesa pubblica e gestire le pressioni sulla catena di approvvigionamento delle materie prime.

→

Jul 03 2026

Market

Meta spinge sul cloud e riaccende la corsa ai chip AI

La presunta accelerazione di Meta verso infrastrutture cloud alimenta il dibattito sull'effettiva domanda di chip AI. Mentre NVIDIA consolida il primato, gli osservatori si interrogano sulle ripercussioni per gli approvvigionamenti e sulle scelte di deployment on-premise. AI-RADAR esplora i trade-off.

→

Jul 03 2026

Market

Nvidia, finanziamenti e revenue-sharing per espandere il cloud AI

Secondo indiscrezioni, Nvidia starebbe ampliando i finanziamenti ai provider cloud AI con una formula basata sulla condivisione dei ricavi. La mossa potrebbe accelerare la diffusione di GPU di fascia alta, ma solleva interrogativi su dipendenza tecnicica e impatto sulle strategie on-premise.

→

Jul 03 2026

Hardware

AI server, la domanda di PMIC alimenta ordini extra per i chip designer di Taiwan

L'impennata della domanda di server AI sta generando effetti a catena sulla catena di fornitura: gli ordini per i circuiti integrati di gestione dell'alimentazione (PMIC) si allargano a nuovi fornitori, segnalando colli di bottiglia. Un campanello d'allarme per chi pianifica deployment on-premise.

→

Jul 03 2026

Hardware

Dalla Tsinghua una startup da 1,8 miliardi per chip AI 3D e il gap GPU cinese

Shanghai Orient Computing Core Technology, fondata da un veterano dell’industria dei chip formatosi alla Tsinghua, sviluppa processori AI tridimensionali con l’obiettivo di ridurre la dipendenza cinese dalle GPU estere. La mossa si inserisce nel framework delle restrizioni all’export statunitense e della corsa alla sovranità tecnicica.

→

Jul 03 2026

Market

GaN: la guerra dei chip passa dai tribunali cinesi

La battaglia legale Innoscience-Infineon mostra quanto la giustizia cinese stia diventando un'arma strategica nella corsa al nitruro di gallio, semiconduttore chiave per alimentare data center e carichi AI on-premise.

→

Jul 03 2026

Hardware

Anthropic guarda oltre Nvidia: Samsung potrebbe produrre i suoi chip AI

La startup Anthropic sta esplorando processori personalizzati con Samsung come partner produttivo. La mossa, ancora informale, riflette la ricerca di alternative all’hardware Nvidia e ha implicazioni per chi valuta deployment on-premise di LLM, tra TCO e sovranità dei dati.

→

Jul 03 2026

Frameworks

Fable 5 alza la guardia: un framework contro i jailbreak per LLM che girano on-premise

Sono emersi nuovi dettagliati sugli strumenti di sicurezza informatica di Fable 5 e sul suo framework anti-jailbreak, pensati per blindare i large language model in contesti self-hosted dove la sovranità dei dati è prioritaria.

→

Jul 03 2026

Market

Trend Micro e Check Point accelerano sull’AI nella sicurezza enterprise

Le due società di cybersicurezza espandono le integrazioni AI per le aziende. Una mossa che riapre il dibattito su dove far girare i modelli: cloud o on-premise, tra sovranità dei dati e latenza.

→

Jul 03 2026

Market

BYD-Valzer Volkswagen: il crack dell’auto europea tocca anche l’hardware AI

Le voci di acquisizione di Volkswagen da parte di BYD mettono a nudo la tensione industriale europea. Una ristrutturazione del settore auto potrebbe ridisegnare la domanda di semiconduttori avanzati, con effetti diretti sulla disponibilità e sui costi dell’infrastruttura per LLM on-premise.

→

Jul 03 2026

Market

CSCC espande l’impianto di Pingnan: più materiali carboniosi per la filiera tech

L’investimento della controllata di China Steel Chemical Corporation punta ad aumentare la capacità produttiva di nerofumo e derivati. La mossa riflette una domanda industriale in crescita e potrebbe ridurre le tensioni sulla catena di fornitura per componenti hardware, con effetti indiretti sul TCO delle infrastrutture di calcolo.

→

Jul 03 2026

Hardware

DeepSeek V4 Flash con 1M token in locale: la patch open-source per RTX 5090

Uno sviluppatore ha creato una patch CUDA per llama.cpp che permette a DeepSeek V4 Flash di operare con un contesto di un milione di token su una singola RTX 5090, riducendo la VRAM necessaria da circa 256 GB a soli 31 GB e raggiungendo velocità di prefill fino a 263 token al secondo. Validato con test di needle-in-haystack, il risultato segna un punto di svolta per il deployment on-premise di modelli a lunghissimo contesto.

→

Jul 03 2026

Market

Huawei punta sulla Corea del Sud con i chip Ascend per l’AI, nuova sfida a Nvidia

L’azienda cinese porta i suoi acceleratori per LLM e training nel mercato sudcoreano, storicamente legato all’ecosistema GPU. La mossa allarga le opzioni hardware per chi cerca stack per inference e fine-tuning on-premise fuori dal dominio CUDA.

→

Jul 03 2026

Hardware

HBM4E, la resa di Samsung supera il 70%: sì accende la sfida per le memorie AI

Samsung ha raggiunto una resa produttiva superiore al 70% per le memorie HBM4E di nuova generazione, alzando la posta contro SK Hynix e Micron. Il risultato segnala una maturità manifatturiera che può ampliare la disponibilità di banda passante per gli acceleratori AI, risorsa critica per l'inference e l'addestramento di Large Language Model. Per chi valuta infrastrutture on-premise, una supply più solida incide su costi e vincoli di deployment.

→

Jul 03 2026

Market

Taiwan e Giappone consolidano il riciclo dei veicoli a fine vita: lezioni per l’hardware on-premise

La collaborazione tra i due Paesi asiatici per recuperare materiali dai veicoli fuori uso segnala un cambio di passo nell'economia circolare. L’iniziativa offre spunti per chi gestisce infrastrutture IA: dalle terre rare per le GPU alla sostenibilità del TCO, il riciclo diventa variabile strategica.

→

Jul 03 2026

Hardware

Renesas sfoltisce il portafoglio chip per concentrarsi su server AI e veicoli elettrici

La società nipponica riorienta gli investimenti in semiconduttori verso due mercati chiave: l'elaborazione per l'intelligenza artificiale nei data center e la mobilità elettrica. Una mossa che segnala la crescente convergenza tra calcolo ad alte prestazioni ed elettrificazione.

→

Jul 02 2026

LLM

Mark Zuckerberg ammette: gli agenti IA arrancano. Implicazioni per i deployment on‑premise

In un incontro interno, Zuckerberg ha riferito che lo sviluppo degli agenti IA procede più lentamente del previsto. Una frenata che costringe a ricalibrare le scelte di hardware e modelli in contesti on‑premise, dove maturità applicativa, controllo del dato e TCO restano nodi centrali.

→

Jul 02 2026

Frameworks

Edge AI: dall’hackathon ExecuTorch tre progetti che spiegano perché il locale batte il cloud

Un weekend di sviluppo su Galaxy S25 Ultra con Snapdragon ha mostrato applicazioni che sfruttano ExecuTorch per girare in locale. SafeScreen AI, SixthSense e Toddle AI dimostrano che latenza, privacy e autonomia sono il vero vantaggio competitivo dell’inference on-device.

→

Jul 02 2026

LLM

Nvidia: l'AGI non arriverà, il futuro sono modelli open source personalizzati per ogni azienda

Un pioniere dell'AI in Nvidia boccia l'AGI e paragona i modelli chiusi di OpenAI e Anthropic ai walled garden di AOL e Prodigy. La scommessa è su LLM aperti e customizzati, con implicazioni profonde per chi gestisce dati sensibili in-house.

→

Jul 02 2026

Market

L’IPO di Jersey Mike’s e l’assurda ubriacatura da AI

La catena di paninoteche Jersey Mike’s ha citato l’intelligenza artificiale nei documenti per la sua IPO. Un sintomo di un’euforia che spinge aziende senza alcuna attinenza a usare la parola magica, distorcendo le valutazioni. Per chi pianifica deployment on-premise, questa ondata di hype rende ancora più cruciale un’analisi fredda di TCO, sovranità dei dati e reale fabbisogno hardware.

→

Jul 02 2026

Hardware

Anthropic tratta con Samsung per un chip AI su misura

Anthropic ha avviato trattative con Samsung Electronics per la produzione di un chip AI personalizzato. Il progetto è alle fasi iniziali e non sono ancora stati definiti utilizzo, potenza o architettura server. La mossa si inserisce in una tendenza di integrazione verticale tra i principali attori dell’AI, con implicazioni potenziali per il deployment on-premise di LLM: efficienza migliorata, ma interrogativi sull’accessibilità di tale hardware per i clienti enterprise.

→

Jul 02 2026

LLM

Gemma 4 31B addestrata per il copywriting: +290 Elo e niente più frasi fatte

Un fine-tuning mirato trasforma Gemma 4 31B in una macchina per testi pubblicitari. Il modello ottiene 1657 punti Elo, vince l'80% dei confronti e abbandona i fraseggi generici. Pesa 31 miliardi di parametri e si integra con vLLM.

→

Jul 02 2026

Altro

Wisk Aero (Boeing) denunciata: test software frettolosi per i taxi volanti autonomi

Un ex manager di Wisk Aero accusa la controllata Boeing di averla licenziata dopo aver sollevato dubbi sulla sicurezza dei test software. La vicenda riporta al centro del dibattito l’equilibrio tra velocità di sviluppo e rigore nella validazione dell’IA nei sistemi safety-critical, con implicazioni dirette per chi opera deployment edge e on-premise.

→

Jul 02 2026

Hardware

Anthropic in trattative con Samsung per un chip custom

Anthropic avrebbe avviato colloqui con Samsung per un chip custom destinato ai propri LLM. La mossa segue di pochi giorni l’annuncio di OpenAI con Broadcom e segnala un’accelerazione verso il silicio proprietario nel settore AI. Per i deployment on-premise, l’arrivo di acceleratori su misura può ridefinire i calcoli di TCO e sovranità, ma introduce nuove complessità di integrazione e compatibilità.

→

Jul 02 2026

Altro

Cursor dentro SpaceX: riuscirà a restare una piattaforma aperta per i modelli AI?

L’acquisizione di Cursor da parte di SpaceX solleva un interrogativo: l’editor AI potrà continuare a integrare modelli di terze parti come GPT-4 e Claude? Una partita che mette alla prova gli equilibri tra laboratori di frontiera e aziende con politiche stringenti sulla sovranità dei dati.

→

Jul 02 2026

Altro

Linux 7.3 cancella il file system EFS: addio a un driver senza manutenzione da oltre 20 anni

La prossima versione del kernel Linux eliminerà il supporto read-only per EFS, il file system usato da SGI IRIX prima del passaggio a XFS. Una rimozione attesa da due decenni che chiude un capitolo di legacy, ma apre riflessioni sulla gestione del codice obsoleto nelle infrastrutture moderne.

→

Jul 02 2026

Market

Lucid Motors cambia CFO e rinnova la leadership sotto il nuovo CEO: segnali per la strategia AI

Lucid Motors annuncia l’uscita del CFO Taoufiq Boussaid, sostituito da Alexander De Bock, mentre il CEO Silvio Napoli ridisegna l’intera squadra dirigenziale. Un avvicendamento che, nel settore automotive sempre più guidato da software e intelligenza artificiale, potrebbe preludere a un riposizionamento tecnicico.

→

Jul 02 2026

Frameworks

vLLM, un fix silenzioso raddoppia la finestra di contesto su una GPU consumer

Un post di gratitudine su Reddit svela un progresso tecnico: le ultime release di vLLM eliminano i bug di allocazione memoria, permettendo a Qwen2.5 7B di operare con 240.000 token su una RTX 5090, contro i 120.000 precedenti. Un esempio di come l’open source ben mantenuto abbatta le barriere per l’inference on-premise.

→

Jul 02 2026

Altro

Passare a Linux per l’AI locale: Ubuntu è la piattaforma più compatibile?

Un utente in migrazione verso Linux chiede se Ubuntu garantisca la massima compatibilità con stack di AI locale come vLLM, llama.cpp e ComfyUI. AI-RADAR esplora i fattori che contano davvero: driver GPU, supporto CUDA/ROCm, gestione dei pacchetti e assistenza per ambienti containerizzati.

→

Jul 02 2026

Hardware

SK hynix investe 712,5 miliardi in nuovi impianti: NAND a Cheongju, DRAM a Yongin

Un investimento da record ridefinisce la supply chain della memoria: il colosso sudcoreano punta su NAND e DRAM per sostenere la domanda di infrastrutture AI. Le implicazioni per chi gestisce cluster on-premise, tra HBM, TCO e colli di bottiglia.

→

Jul 02 2026

LLM

Kimi K2.7 Code sbarca su GitHub Copilot, tra coding assistito e nodi di privacy

Moonshot AI porta il suo LLM nella piattaforma Microsoft, ampliando il parco modelli per sviluppatori. L'integrazione accende il dibattito su dove risiedano davvero i dati e se abbia senso restare in locale per chi non vuole condividere codice sorgente con servizi cloud.

→

Jul 02 2026

Market

AI e processi aziendali: perché l’on-premise premia solo le organizzazioni disciplinate

Integrare l’AI nei processi non basta: serve disciplina operativa. Il mercato dell’ottimizzazione basata su AI potrebbe superare 113 miliardi di dollari, e l’88% dei manager vuole aumentare gli investimenti. Senza fondamenta solide, i progetti di AI falliscono. Le aziende con processi maturi, abituate a decisioni data‑driven, ottengono più valore, specie in contesti on‑premise dove controllo e sovranità dei dati sono cruciali.

→

Jul 02 2026

Altro

OpenAI e il fondo sovrano: cosa cambia se il 5% dell’azienda diventa pubblico

Sam Altman propone di cedere il 5% delle quote di OpenAI a un fondo sovrano americano. Un’operazione che mescola finanza, controllo pubblico dell’AI e sovranità tecnicica, riaprendo il dibattito su chi dovrebbe possedere l’infrastruttura dell’intelligenza artificiale.

→

Jul 02 2026

Altro

La comunità del kernel Linux discute se eliminare l'attribuzione per i contributi IA

Gli sviluppatori del kernel Linux riconsiderano il tag "Assisted-by" per le patch generate con agenti LLM. La discussione riapre interrogativi su trasparenza, provenienza del codice e controllo nelle pipeline di sviluppo open source e aziendali.

→

Jul 02 2026

Market

OpenAI propone una quota del 5% agli Stati Uniti per condividere i benefici dell’AI

Il CEO Sam Altman sta discutendo con l'amministrazione Trump la cessione di una partecipazione del 5% in OpenAI. L'idea, affrontata con Google e Meta, punta a coinvolgere il pubblico nella ricchezza generata dall'intelligenza artificiale, ma solleva questioni di governance e sovranità digitale.

→

Jul 02 2026

Altro

Musk's X sotto accusa: "Grave rischio privacy", gli attivisti avvertono la FTC

Con l'avvicinarsi della scadenza del 2 luglio per i commenti pubblici, organizzazioni per i diritti digitali chiedono alla FTC di respingere il tentativo di X di chiudere le verifiche indipendenti sulla gestione dei dati. La piattaforma di Elon Musk era finita sotto audit dopo un errore di codice che aveva condiviso i numeri di telefono forniti per l'autenticazione a due fattori a fini pubblicitari.

→

Jul 02 2026

Frameworks

Claude Science porta l'accelerazione GPU NVIDIA nei laboratori di calcolo delle scienze della vita

La beta pubblica di Claude Science integra il toolkit NVIDIA BioNeMo per tradurre il linguaggio naturale in flussi di lavoro computazionali accelerati, con impatto diretto su genomica, proteomica e chimica farmaceutica. La piattaforma permette di orchestrare pipeline complesse attingendo a microservizi NIM e librerie ottimizzate, riducendo drasticamente i tempi di calcolo e mantenendo il controllo sui dati.

→

Jul 02 2026

Market

CEE, fondo venture debt da 107 milioni: una spinta all'hardware per l'AI on-premise

Orbit Capital chiude il secondo closing del Growth Debt Fund II a 107 milioni di euro, superando l’obiettivo iniziale. L’ingresso di fondi pensione e il sostegno del FEI segnalano un cambio di passo. Il capitale non diluitivo può finanziare spese in conto capitale, aprendo scenari concreti per l’acquisto di infrastrutture server destinate all’inference e al training di LLM self-hosted in Europa centro-orientale.

→

Jul 02 2026

Market

Perché la vera sfida per l'AI video è insegnare agli avatar a vedere e ascoltare

Dopo anni di corsa alla fedeltà visiva, la ricerca sull'AI generativa per video e avatar si sposta sulla percezione e l'interazione in tempo reale. Una svolta che ridefinisce i requisiti di calcolo e riaccende il dibattito su dove eseguire questi modelli.

→

Jul 02 2026

Altro

Cloudflare mette un ultimatum ai crawler AI: entro settembre pagate gli editori o sarete bloccati

Da settembre Cloudflare bloccherà i crawler che estraggono contenuti per addestrare modelli AI, a meno che i siti non diano il consenso. Le pagine con pubblicità diventano off-limits. Una mossa che riscrive le regole dell'accesso al web dei dati, con riflessi immediati per chi gestisce modelli on-premise e deve fare i conti con la provenienza dei dati di training.

→

Jul 02 2026

Market

Microsoft lancia la sua società di deployment AI con 2,5 miliardi

Microsoft crea una nuova entità dedicata al deployment di intelligenza artificiale, con un impegno finanziario di 2,5 miliardi di dollari. La mossa segue quelle di Amazon, OpenAI e Anthropic, e segnala una corsa alla costruzione di infrastrutture AI dedicate. Per chi valuta soluzioni on-premise, il framework competitivo si complica, ma emergono anche nuove possibilità di controllo e personalizzazione.

→

Jul 02 2026

Altro

StirlingX incassa 20 milioni per l’intelligence sovrana: un campanello per chi gestisce dati sensibili

L’azienda britannica, guidata dall’ex direttore del GCHQ, costruisce una piattaforma che fonde dati da ambienti complessi. Il round segnala quanto sia strategico, per difesa e infrastrutture critiche, tenere l’analisi sotto il proprio controllo. Un tema che si intreccia con le scelte di deployment on-premise per i carichi di lavoro AI più delicati.

→

Jul 02 2026

Hardware

Montech NX600: il dual tower economico con ventole da jet

Un dissipatore ad aria per CPU dal prezzo aggressivo ma dalla rumorosità elevata. Per chi assembla macchine per l'inference locale o workstation on-premise, il compromesso tra costo e silenziosità diventa un fattore cruciale.

→

Jul 02 2026

Hardware

Intel avvia il supporto GCC per ACE, le estensioni AI condivise con AMD su x86

Intel ha inviato le prime patch per il compilatore GCC relative alle AI Compute Extensions (ACE), il set di istruzioni per l’AI sviluppato con AMD. Successore cross-vendor delle Advanced Matrix Extensions, ACE punta a velocizzare i carichi di machine learning sulle CPU. L’iniziativa avvicina un’accelerazione nativa dell’inference on-premise senza dipendere da GPU dedicate.

→

Jul 02 2026

Hardware

Intel ritocca al rialzo le CPU desktop top: fino a 349$ per la Core Ultra 270K Plus

Le pagine ufficiali delle Core Ultra 270K Plus e 250K Plus mostrano prezzi raccomandati più alti di 50 dollari. Una mossa che segnala pressioni sui costi e impatta chi assembla workstation per inference locale di LLM.

→

Jul 02 2026

Hardware

Alva Industries chiude un round da €16M per scalare i motori elettrici ultra-compatti

La deep-tech norvegese ha ottenuto il finanziamento guidato da Nysnø Climate Investments, Sandwater e Emerald per portare sul mercato motori sempre più piccoli e performanti. Un segnale per la robotica e l’AI on-device.

→

Jul 02 2026

LLM

GLM-5.2: il modello cinese che sfida i big a un costo irrisorio

Z.ai ha rilasciato GLM-5.2, quarto nella classifica dei modelli più performanti, con capacità in coding e agentica vicine ai leader di mercato. Il costo è una frazione di quello di Anthropic o OpenAI, sollevando interrogativi su come questo cambierà le scelte di deployment, soprattutto per chi punta a soluzioni on-premise e alla sovranità dei dati.

→

Jul 02 2026

Frameworks

Un pipeline vocale open source rimpiazza l’API realtime di OpenAI con Gemma 4

Hugging Face mostra una demo completamente open source che integra riconoscimento vocale, LLM Gemma 4 e sintesi, funzionando anche in locale su un MacBook Pro M3 con 36 GB. Un'alternativa concreta all'API realtime di OpenAI che ripensa il deployment su device e la sovranità dei dati.

→

Jul 02 2026

Frameworks

Il dating automatizzato con LLM: la storia di Ben Guez e i dilemmi dell’AI fai-da-te

Un esperimento personale accende i riflettori sui limiti della governance AI: OpenClaw, Claude Code e Instagram usati per corteggiare ‘aspiranti mogli internazionali’. Una follia estiva o un segnale per chi amministra infrastrutture on-premise?

→

Jul 02 2026

Altro

AI, l'UNICEF lancia l'allarme: 20 milioni di bambini già utenti, governance al palo

Un'analisi UNICEF su dieci paesi rivela che 20 milioni di minori usano già strumenti di AI, con un ritmo di adozione oltre tre volte più rapido di quello degli adulti. L'organizzazione parla di "esperimento globale" mentre la governance fatica a stare al passo. Per le aziende che sviluppano AI per l'infanzia, la protezione dei dati e la sovranità digitale diventano priorità che spingono verso deployment on-premise.

→

Jul 02 2026

Frameworks

YSERVER 1.3, il server X11 scritto in Rust con l'aiuto di Claude Code

Il progetto YSERVER, un moderno server X11 sviluppato in Rust con l'assistenza di Claude Code, arriva alla versione 1.3 con supporto a Xinerama e FreeBSD. Un esempio emblematico di vibe coding applicato a infrastrutture di sistema.

→

Jul 02 2026

Altro

India impone a WhatsApp di fermare la funzione username: incognita sovranità

Il ministero indiano MeitY ha ordinato a Meta di sospendere il lancio degli username su WhatsApp in India, concedendo tre giorni per una giustificazione. La mossa riaccende il dibattito su controllo dei dati, crittografia e conformità locale, mentre le aziende guardano con crescente interesse a strumenti self-hosted per garantire la sovranità delle comunicazioni.

→

🗄️ Archivio Notizie