🗄️ Archivio Notizie

Cronologia completa dei segnali AI, ordinati per data.
Total Articles: 14213

Questo archivio e la memoria storica di AI-Radar: lanci di modelli, novita sui framework, cambiamenti infrastrutturali e segnali di mercato raccolti in una timeline ricercabile. Serve per confrontare come sono evolute le narrative, capire quali tecnologie hanno mantenuto trazione e prendere decisioni con contesto storico invece che seguire solo l'hype del momento. Per orientarti piu velocemente puoi passare alle sezioni dedicate LLM, Frameworks, Hardware e alla pillar Trends.

💡 Cerchi qualcosa di specifico? Usa la Barra di Ricerca in alto per una ricerca dettagliata.

Jul 03 2026
Market

Climentum raccoglie 60 milioni per l’hardware climatico: un segnale per chi fa AI on-premise

Il fondo danese Climentum Capital ha chiuso una prima tranche da 60 milioni di euro per il suo secondo veicolo, con EIF, EIFO e IDA. Si punta su hardware per energia, industria e sovranità delle filiere. Per chi gestisce inference di LLM in locale, queste tecnicie toccano il costo e la disponibilità dell’energia, nodo cruciale del TCO.

Jul 03 2026
Altro

L’India allarga la stretta sugli username a Telegram e Signal

Il ministero della Tecnologia indiano ha inviato avvisi a Telegram e Signal dopo aver intimato a WhatsApp di sospendere il lancio degli username. Un’escalation regolatoria che riaccende il dibattito su sovranità dei dati e controllo delle comunicazioni.

Jul 03 2026
Altro

Privacy e AI: la sentenza della Corte Suprema che cambia le regole sui dati di localizzazione

La Corte Suprema USA ha stabilito che i dati di localizzazione, anche se raccolti per brevi periodi, sono protetti dal Quarto Emendamento. Un precedente che incrocia il futuro dell'AI, spingendo le aziende a riconsiderare dove e come addestrano i modelli.

Jul 03 2026
Hardware

La giacca di Jensen Huang all'asta per 60.000 dollari: il simbolo del boom dell'hardware AI

Sotheby’s mette all’asta la giacca di pelle firmata indossata dal CEO NVIDIA al Foxconn Tech Day 2023. Un cimelio che riflette l’ascesa della domanda di infrastrutture per LLM on-premise e la centralità della catena produttiva taiwanese.

Jul 03 2026
Hardware

Infineon Cina contesta la rimozione dei GaN alla fiera di Shanghai

La filiale cinese di Infineon reagisce dopo che i suoi prodotti al nitruro di gallio sono stati tolti da un evento a Shanghai. La vicenda getta luce sul ruolo cruciale del GaN nell’efficienza energetica dei data center e sulle tensioni crescenti nelle filiere dei semiconduttori per l’AI.

Jul 03 2026
Altro

DeepSeek V4 Flash su RTX PRO 6000: coding 3x più veloce di Sonnet, qualità simile

Un benchmark indipendente mostra che DeepSeek V4 Flash eseguito in locale su due GPU RTX PRO 6000 con vLLM completa task di coding in circa 2 minuti, contro i 6 minuti di Sonnet 5 via API, con qualità paragonabile. Opus e Fable restano superiori per precisione, ma i risultati segnano un punto di svolta per l'inference on-premise.

Jul 03 2026
Altro

Anthropic e la Casa Bianca negano colloqui su una quota pubblica nell’azienda

Fonti vicine ai colloqui smentiscono che l'amministrazione Trump e Anthropic abbiano discusso la cessione di una partecipazione statale. La precisazione arriva dopo indiscrezioni su una proposta simile di OpenAI. AI-RADAR analizza cosa significa per la sovranità dei dati e le scelte di deployment on-premise in un contesto di crescente intreccio tra AI e potere pubblico.

Jul 03 2026
Altro

Una cellula costruita da zero: si nutre, cresce e compete senza essere viva

Un team dell'Università del Minnesota ha realizzato SpudCell, una cellula sintetica che si nutre, si divide e compete. La biologia di sintesi sfuma il confine tra chimica e vita, aprendo interrogativi su cosa definisca un organismo vivente.

Jul 03 2026
Hardware

Turvo punta sulla robotica: l’edge computing incontra l’inference locale

La taiwanese Turvo conferma il pieno controllo manageriale e rilancia i piani di espansione nella robotica. Un segnale che rafforza la convergenza tra automazione e AI on-premise, spingendo verso hardware specializzato per l’inference locale.

Jul 03 2026
Market

Giantec alza i prezzi delle NOR Flash del 25%: rischio costi per l'hardware AI on-premise

Il produttore cinese Giantec ha annunciato un rincaro del 25% sulle memorie NOR Flash, segnalando tensioni persistenti nel mercato delle memorie. L'aumento potrebbe pesare sui costi dell'hardware per inference LLM self-hosted, specialmente in contesti edge e embedded, dove la componente NOR è diffusa.

Jul 03 2026
Altro

Rack AI da megawatt: l’ascesa dei semiconduttori wide-bandgap nell’infrastruttura on-premise

L’evoluzione dei cluster per l’addestramento di LLM spinge la densità di potenza dei rack verso il megawatt. I semiconduttori a banda larga come SiC e GaN promettono efficienza superiore e minor calore, riducendo il TCO per le infrastrutture on-premise. Un’analisi che trasforma la scelta dei componenti elettrici in una leva strategica per la sovranità dei dati.

Jul 03 2026
Altro

I robot U1 di Ubtech aprono il dibattito: l’AI intima deve restare locale

Ubtech lancia i robot compagni U1 per testare il confine dell’intimità artificiale in Cina. L’elaborazione di dati personali sensibili spinge verso architetture edge e on-device, dove privacy e sovranità prevalgono sul cloud. AI-RADAR analizza i trade-off tecnici di un deployment che deve bilanciare reattività, TCO e vincoli normativi.

Jul 03 2026
Altro

Alibaba vieta Claude Code ai dipendenti: rischio backdoor dietro la scelta

Dal 10 luglio Alibaba proibirà l’uso di Claude Code in azienda, citando un presunto rischio backdoor. La decisione arriva dopo che Anthropic ha accusato operatori legati a Qwen di condurre la più vasta campagna di distilazione contro Claude. Una mossa che rilancia il confronto su sicurezza degli strumenti AI esterni e controllo dei dati.

Jul 03 2026
Market

Quantum Systems incassa 1,2 miliardi: i droni autonomi tedeschi volano a 8 miliardi di valutazione

La startup bavarese Quantum Systems ha chiuso un round Serie D da 1,2 miliardi di dollari, portando la sua valutazione a circa 8 miliardi. Guidato da Blackstone, Noteus, Airbus e Advent, è uno dei più grandi finanziamenti mai ottenuti da una startup europea della difesa. Il mercato dei velivoli autonomi a uso militare accelera, trainato dalla domanda crescente di capacità di sorveglianza e combattimento senza pilota.

Jul 03 2026
LLM

Zuckerberg: gli agenti AI di Meta procedono più lentamente del previsto

Mark Zuckerberg ha comunicato ai dipendenti che lo sviluppo degli agenti AI di Meta sta procedendo più lentamente del previsto, nonostante la riorganizzazione di quattro mesi fa. La notizia solleva interrogativi sulle sfide tecniche dell'AI agentica e sulle implicazioni per chi gestisce carichi di lavoro LLM on-premise.

Jul 03 2026
Altro

Claude Code e la lista nascosta: cosa scatta quando imposti ANTHROPIC_BASE_URL

Un ricercatore ha scoperto un meccanismo cifrato in Claude Code: una blacklist di domini legati a Cina e laboratori IA, attivata quando si reindirizza l’API. L’analisi solleva interrogativi sulla trasparenza per chi usa endpoint personalizzati.

Jul 03 2026
Market

ALP Bio raccoglie 161mila euro per rendere più sicuri i farmaci biologici con l’IA

La startup svizzera ALP Bio ha ottenuto 161.000 euro dal fondo Venture Kick per validare la sua piattaforma che unisce modelli immunitari umani e intelligenza artificiale. L’obiettivo è identificare precocemente i rischi immunogenici dei farmaci biologici, riducendo fallimenti clinici e migliorando la sicurezza. I primi progetti pilota con partner farmaceutici serviranno a testare la tecnicia in contesti reali e a consolidare la posizione commerciale dell’azienda.

Jul 03 2026
Hardware

Sonix si rilancia tra sanità e droni: l’edge AI detta il passo dell’hardware locale

Il progettista taiwanese di SoC Sonix Technology segna una ripresa delle consegne spinta dalla domanda di dispositivi medicali e multimediali, mentre la strategia sui droni guadagna trazione. Un segnale chiaro: l’inference AI si sposta sempre più all’edge, dove contano latenza, privacy e costo energetico.

Jul 03 2026
Hardware

Corea del Sud: gigafabbrica di chip nel sud-ovest, ma le sfide restano

Il governo sudcoreano spinge per un mega-polo di semiconduttori nella regione sud-occidentale, ma tra carenza di talenti, costi infrastrutturali e tensioni geopolitiche il progetto deve ancora superare scogli decisivi. Per chi distribuisce LLM on-premise, la posta in gioco è la futura disponibilità di hardware accelerato.

Jul 03 2026
LLM

La cinese Z.ai lancia GLM-5.2 e sfida OpenAI e Anthropic

Con GLM-5.2, Z.ai intensifica la competizione globale nell'AI generativa, puntando ai big occidentali. L'annuncio accende i riflettori sulle capacità cinesi di sviluppare LLM competitivi e sul ruolo della sovranità dei dati nelle scelte di deployment on-premise.

Jul 03 2026
Altro

Turn Cloud si trasforma in infrastruttura AI: i riflessi per chi investe in locale

La piattaforma cloud punta sull’infrastruttura per intelligenza artificiale. Un segnale di mercato che riaccende il dibattito su TCO, sovranità dei dati e convenienza dell’on-premise. AI-RADAR analizza le implicazioni.

Jul 03 2026
Hardware

Intel sfida TSMC con EMIB-T: la guerra dei package avanzati entra nel vivo

La nuova tecnicia di interconnessione di Intel punta a scalfire il dominio di CoWoS nel packaging per chip ad alte prestazioni, con possibili ripercussioni sugli acceleratori per LLM on-premise.

Jul 03 2026
Market

Fame di server fino al 2027: la supply chain si restringe, cosa cambia per l'LLM on-premise

Secondo DIGITIMES, la domanda di server resterà forte fino al 2027, mentre la supply chain è sotto pressione crescente. Per i team che pianificano deployment on-premise di Large Language Models, questo scenario impone una pianificazione anticipata: lead time dilatati, revisione dei budget e maggiore attenzione all'ottimizzazione dell'inference. L'analisi del TCO diventa essenziale per evitare ritardi e per mantenere il controllo su dati e conformità.

Jul 03 2026
Market

Microsoft investe 2,5 miliardi: ingegneri embedded per guidare l'AI in azienda

Una nuova unità da 2,5 miliardi di dollari con ingegneri immersi nei clienti per accelerare l'adozione dell'intelligenza artificiale. Un segnale di quanto sia complesso portare l'AI fuori dai laboratori e nei processi reali.

Jul 03 2026
Market

Come TSMC ha trasformato la supply chain in una 'seconda flotta'

DIGITIMES rivela la strategia con cui TSMC rafforza la resilienza della supply chain di semiconduttori, creando una 'seconda flotta' di fornitori e capacità alternative. Per chi gestisce inference LLM on-premise, la disponibilità di GPU è un fattore di costo e rischio: una filiera più stabile potrebbe ridurre il TCO e facilitare la pianificazione delle infrastrutture AI.

Jul 03 2026
Hardware

BOE punta sul packaging AI con Micro LED e substrati in vetro

BOE, gigante cinese dei display, esplora il packaging per chip AI con interconnessioni ottiche Micro LED e co-packaged optics su vetro. L’obiettivo: densità, efficienza e scalabilità per data center, con possibili ricadute sul deployment on-premise.

Jul 03 2026
Frameworks

L’audio locale si fa serio: audio.cpp sforna generazione musicale e separazione stem

Il framework C++/ggml si arricchisce di modelli come ACE-Step, HeartMuLa e Stable Audio 3. Generazione a 10 minuti, inference quasi 10× real-time contro Python, e attenzione al risparmio VRAM. Un passo avanti per chi vuole audio AI on-premise senza cloud.

Jul 03 2026
Frameworks

ProvenanceGuard: tracciare la provenienza per mettere in sicurezza gli agenti LLM

Un nuovo studio propone un framework basato sull’analisi della provenienza per rilevare il misalignment negli agenti LLM, riducendo drasticamente i falsi negativi e gli interventi superflui. I test su Agent-SafetyBench e WorkBench mostrano un calo del tasso di errore dal 42,9% all’1,8% e una riduzione degli interventi su azioni corrette dal 30,5% al 12,8%, senza bloccare più del necessario le chiamate strumentali legittime. Un passo avanti per chi gestisce deployment self-hosted e cerca auditability.

Jul 03 2026
LLM

TokenScope illumina i meccanismi decisionali dei LLM nella generazione di codice

Uno strumento interattivo espone metriche a livello di token, meccanismi di attenzione e percorsi alternativi per capire come i modelli linguistici producono codice. Per chi sviluppa in ambienti on-premise, questa trasparenza potrebbe diventare un tassello critico per audit e controllo qualità.

Jul 03 2026
Altro

Stress da EEG, il metodo I²RiMA pesa 1,6M parametri e gira in locale

I²RiMA è un nuovo approccio per riconoscere lo stress mentale da segnali EEG. Sfrutta la geometria Riemanniana e un’attenzione temporale a doppio livello, toccando un’accuratezza dell’82,78% con appena 1,6 milioni di parametri e 31,95 milioni di FLOPs. Leggero ed efficiente, il modello è candidato naturale per l’inference on-device, dove i dati biometrici non lasciano il dispositivo.

Jul 03 2026
Altro

Diagnostica cognitiva IA: M-QCDNet unisce psicometria e reti neurali con un occhio alla privacy

Un nuovo modello di deep learning integra matrici Q per diagnosi cognitive interpretabili, con potenziali applicazioni scolastiche che richiedono deployment on-premise per la tutela dei dati degli studenti.

Jul 03 2026
Altro

Agenti programmatori alla conquista del federated learning: cosa funziona e cosa no

Un team di ricerca ha affidato a LLM agent la ricerca di ricette algoritmiche per il federated learning in sanità. I risultati, tra progressi reali e fallimenti legati al seme, offrono una lezione su come separare l’innovazione dal rumore.

Jul 03 2026
Frameworks

PACE: un framework neuro-simbolico per spiegazioni controfattuali realistiche e vincolate

Il framework PACE separa la previsione neurale dal ragionamento simbolico per produrre spiegazioni controfattuali che rispettano i vincoli di dominio. Un caso di studio sul dataset Adult Income mostra il compromesso tra validità e plausibilità, evidenziando come i vincoli simbolici migliorino la fattibilità delle raccomandazioni. Per chi sviluppa AI in contesti regolamentati on-premise, l’approccio neuro-simbolico offre un equilibrio tra accuratezza e aderenza alle regole di business.

Jul 03 2026
Market

Cina contro le batterie EV sovradimensionate: mossa fiscale e sulla catena di fornitura

Pechino interviene contro le batterie per auto elettriche eccessivamente grandi, secondo un'analisi AFP. L'obiettivo è contenere la spesa pubblica e gestire le pressioni sulla catena di approvvigionamento delle materie prime.

Jul 03 2026
Market

Meta spinge sul cloud e riaccende la corsa ai chip AI

La presunta accelerazione di Meta verso infrastrutture cloud alimenta il dibattito sull'effettiva domanda di chip AI. Mentre NVIDIA consolida il primato, gli osservatori si interrogano sulle ripercussioni per gli approvvigionamenti e sulle scelte di deployment on-premise. AI-RADAR esplora i trade-off.

Jul 03 2026
Market

Nvidia, finanziamenti e revenue-sharing per espandere il cloud AI

Secondo indiscrezioni, Nvidia starebbe ampliando i finanziamenti ai provider cloud AI con una formula basata sulla condivisione dei ricavi. La mossa potrebbe accelerare la diffusione di GPU di fascia alta, ma solleva interrogativi su dipendenza tecnicica e impatto sulle strategie on-premise.

Jul 03 2026
Hardware

AI server, la domanda di PMIC alimenta ordini extra per i chip designer di Taiwan

L'impennata della domanda di server AI sta generando effetti a catena sulla catena di fornitura: gli ordini per i circuiti integrati di gestione dell'alimentazione (PMIC) si allargano a nuovi fornitori, segnalando colli di bottiglia. Un campanello d'allarme per chi pianifica deployment on-premise.

Jul 03 2026
Hardware

Dalla Tsinghua una startup da 1,8 miliardi per chip AI 3D e il gap GPU cinese

Shanghai Orient Computing Core Technology, fondata da un veterano dell’industria dei chip formatosi alla Tsinghua, sviluppa processori AI tridimensionali con l’obiettivo di ridurre la dipendenza cinese dalle GPU estere. La mossa si inserisce nel framework delle restrizioni all’export statunitense e della corsa alla sovranità tecnicica.

Jul 03 2026
Market

GaN: la guerra dei chip passa dai tribunali cinesi

La battaglia legale Innoscience-Infineon mostra quanto la giustizia cinese stia diventando un'arma strategica nella corsa al nitruro di gallio, semiconduttore chiave per alimentare data center e carichi AI on-premise.

Jul 03 2026
Hardware

Anthropic guarda oltre Nvidia: Samsung potrebbe produrre i suoi chip AI

La startup Anthropic sta esplorando processori personalizzati con Samsung come partner produttivo. La mossa, ancora informale, riflette la ricerca di alternative all’hardware Nvidia e ha implicazioni per chi valuta deployment on-premise di LLM, tra TCO e sovranità dei dati.

Jul 03 2026
Frameworks

Fable 5 alza la guardia: un framework contro i jailbreak per LLM che girano on-premise

Sono emersi nuovi dettagliati sugli strumenti di sicurezza informatica di Fable 5 e sul suo framework anti-jailbreak, pensati per blindare i large language model in contesti self-hosted dove la sovranità dei dati è prioritaria.

Jul 03 2026
Market

Trend Micro e Check Point accelerano sull’AI nella sicurezza enterprise

Le due società di cybersicurezza espandono le integrazioni AI per le aziende. Una mossa che riapre il dibattito su dove far girare i modelli: cloud o on-premise, tra sovranità dei dati e latenza.

Jul 03 2026
Market

BYD-Valzer Volkswagen: il crack dell’auto europea tocca anche l’hardware AI

Le voci di acquisizione di Volkswagen da parte di BYD mettono a nudo la tensione industriale europea. Una ristrutturazione del settore auto potrebbe ridisegnare la domanda di semiconduttori avanzati, con effetti diretti sulla disponibilità e sui costi dell’infrastruttura per LLM on-premise.

Jul 03 2026
Market

CSCC espande l’impianto di Pingnan: più materiali carboniosi per la filiera tech

L’investimento della controllata di China Steel Chemical Corporation punta ad aumentare la capacità produttiva di nerofumo e derivati. La mossa riflette una domanda industriale in crescita e potrebbe ridurre le tensioni sulla catena di fornitura per componenti hardware, con effetti indiretti sul TCO delle infrastrutture di calcolo.

Jul 03 2026
Hardware

DeepSeek V4 Flash con 1M token in locale: la patch open-source per RTX 5090

Uno sviluppatore ha creato una patch CUDA per llama.cpp che permette a DeepSeek V4 Flash di operare con un contesto di un milione di token su una singola RTX 5090, riducendo la VRAM necessaria da circa 256 GB a soli 31 GB e raggiungendo velocità di prefill fino a 263 token al secondo. Validato con test di needle-in-haystack, il risultato segna un punto di svolta per il deployment on-premise di modelli a lunghissimo contesto.

Jul 03 2026
Market

Huawei punta sulla Corea del Sud con i chip Ascend per l’AI, nuova sfida a Nvidia

L’azienda cinese porta i suoi acceleratori per LLM e training nel mercato sudcoreano, storicamente legato all’ecosistema GPU. La mossa allarga le opzioni hardware per chi cerca stack per inference e fine-tuning on-premise fuori dal dominio CUDA.

Jul 03 2026
Hardware

HBM4E, la resa di Samsung supera il 70%: sì accende la sfida per le memorie AI

Samsung ha raggiunto una resa produttiva superiore al 70% per le memorie HBM4E di nuova generazione, alzando la posta contro SK Hynix e Micron. Il risultato segnala una maturità manifatturiera che può ampliare la disponibilità di banda passante per gli acceleratori AI, risorsa critica per l'inference e l'addestramento di Large Language Model. Per chi valuta infrastrutture on-premise, una supply più solida incide su costi e vincoli di deployment.

Jul 03 2026
Market

Taiwan e Giappone consolidano il riciclo dei veicoli a fine vita: lezioni per l’hardware on-premise

La collaborazione tra i due Paesi asiatici per recuperare materiali dai veicoli fuori uso segnala un cambio di passo nell'economia circolare. L’iniziativa offre spunti per chi gestisce infrastrutture IA: dalle terre rare per le GPU alla sostenibilità del TCO, il riciclo diventa variabile strategica.

Jul 03 2026
Hardware

Renesas sfoltisce il portafoglio chip per concentrarsi su server AI e veicoli elettrici

La società nipponica riorienta gli investimenti in semiconduttori verso due mercati chiave: l'elaborazione per l'intelligenza artificiale nei data center e la mobilità elettrica. Una mossa che segnala la crescente convergenza tra calcolo ad alte prestazioni ed elettrificazione.

Jul 02 2026
LLM

Mark Zuckerberg ammette: gli agenti IA arrancano. Implicazioni per i deployment on‑premise

In un incontro interno, Zuckerberg ha riferito che lo sviluppo degli agenti IA procede più lentamente del previsto. Una frenata che costringe a ricalibrare le scelte di hardware e modelli in contesti on‑premise, dove maturità applicativa, controllo del dato e TCO restano nodi centrali.

Jul 02 2026
Frameworks

Edge AI: dall’hackathon ExecuTorch tre progetti che spiegano perché il locale batte il cloud

Un weekend di sviluppo su Galaxy S25 Ultra con Snapdragon ha mostrato applicazioni che sfruttano ExecuTorch per girare in locale. SafeScreen AI, SixthSense e Toddle AI dimostrano che latenza, privacy e autonomia sono il vero vantaggio competitivo dell’inference on-device.

Jul 02 2026
LLM

Nvidia: l'AGI non arriverà, il futuro sono modelli open source personalizzati per ogni azienda

Un pioniere dell'AI in Nvidia boccia l'AGI e paragona i modelli chiusi di OpenAI e Anthropic ai walled garden di AOL e Prodigy. La scommessa è su LLM aperti e customizzati, con implicazioni profonde per chi gestisce dati sensibili in-house.

Jul 02 2026
Market

L’IPO di Jersey Mike’s e l’assurda ubriacatura da AI

La catena di paninoteche Jersey Mike’s ha citato l’intelligenza artificiale nei documenti per la sua IPO. Un sintomo di un’euforia che spinge aziende senza alcuna attinenza a usare la parola magica, distorcendo le valutazioni. Per chi pianifica deployment on-premise, questa ondata di hype rende ancora più cruciale un’analisi fredda di TCO, sovranità dei dati e reale fabbisogno hardware.

Jul 02 2026
Hardware

Anthropic tratta con Samsung per un chip AI su misura

Anthropic ha avviato trattative con Samsung Electronics per la produzione di un chip AI personalizzato. Il progetto è alle fasi iniziali e non sono ancora stati definiti utilizzo, potenza o architettura server. La mossa si inserisce in una tendenza di integrazione verticale tra i principali attori dell’AI, con implicazioni potenziali per il deployment on-premise di LLM: efficienza migliorata, ma interrogativi sull’accessibilità di tale hardware per i clienti enterprise.

Jul 02 2026
LLM

Gemma 4 31B addestrata per il copywriting: +290 Elo e niente più frasi fatte

Un fine-tuning mirato trasforma Gemma 4 31B in una macchina per testi pubblicitari. Il modello ottiene 1657 punti Elo, vince l'80% dei confronti e abbandona i fraseggi generici. Pesa 31 miliardi di parametri e si integra con vLLM.

Jul 02 2026
Altro

Wisk Aero (Boeing) denunciata: test software frettolosi per i taxi volanti autonomi

Un ex manager di Wisk Aero accusa la controllata Boeing di averla licenziata dopo aver sollevato dubbi sulla sicurezza dei test software. La vicenda riporta al centro del dibattito l’equilibrio tra velocità di sviluppo e rigore nella validazione dell’IA nei sistemi safety-critical, con implicazioni dirette per chi opera deployment edge e on-premise.

Jul 02 2026
Hardware

Anthropic in trattative con Samsung per un chip custom

Anthropic avrebbe avviato colloqui con Samsung per un chip custom destinato ai propri LLM. La mossa segue di pochi giorni l’annuncio di OpenAI con Broadcom e segnala un’accelerazione verso il silicio proprietario nel settore AI. Per i deployment on-premise, l’arrivo di acceleratori su misura può ridefinire i calcoli di TCO e sovranità, ma introduce nuove complessità di integrazione e compatibilità.

Jul 02 2026
Altro

Cursor dentro SpaceX: riuscirà a restare una piattaforma aperta per i modelli AI?

L’acquisizione di Cursor da parte di SpaceX solleva un interrogativo: l’editor AI potrà continuare a integrare modelli di terze parti come GPT-4 e Claude? Una partita che mette alla prova gli equilibri tra laboratori di frontiera e aziende con politiche stringenti sulla sovranità dei dati.

Jul 02 2026
Altro

Linux 7.3 cancella il file system EFS: addio a un driver senza manutenzione da oltre 20 anni

La prossima versione del kernel Linux eliminerà il supporto read-only per EFS, il file system usato da SGI IRIX prima del passaggio a XFS. Una rimozione attesa da due decenni che chiude un capitolo di legacy, ma apre riflessioni sulla gestione del codice obsoleto nelle infrastrutture moderne.

Jul 02 2026
Market

Lucid Motors cambia CFO e rinnova la leadership sotto il nuovo CEO: segnali per la strategia AI

Lucid Motors annuncia l’uscita del CFO Taoufiq Boussaid, sostituito da Alexander De Bock, mentre il CEO Silvio Napoli ridisegna l’intera squadra dirigenziale. Un avvicendamento che, nel settore automotive sempre più guidato da software e intelligenza artificiale, potrebbe preludere a un riposizionamento tecnicico.

Jul 02 2026
Frameworks

vLLM, un fix silenzioso raddoppia la finestra di contesto su una GPU consumer

Un post di gratitudine su Reddit svela un progresso tecnico: le ultime release di vLLM eliminano i bug di allocazione memoria, permettendo a Qwen2.5 7B di operare con 240.000 token su una RTX 5090, contro i 120.000 precedenti. Un esempio di come l’open source ben mantenuto abbatta le barriere per l’inference on-premise.

Jul 02 2026
Altro

Passare a Linux per l’AI locale: Ubuntu è la piattaforma più compatibile?

Un utente in migrazione verso Linux chiede se Ubuntu garantisca la massima compatibilità con stack di AI locale come vLLM, llama.cpp e ComfyUI. AI-RADAR esplora i fattori che contano davvero: driver GPU, supporto CUDA/ROCm, gestione dei pacchetti e assistenza per ambienti containerizzati.

Jul 02 2026
Hardware

SK hynix investe 712,5 miliardi in nuovi impianti: NAND a Cheongju, DRAM a Yongin

Un investimento da record ridefinisce la supply chain della memoria: il colosso sudcoreano punta su NAND e DRAM per sostenere la domanda di infrastrutture AI. Le implicazioni per chi gestisce cluster on-premise, tra HBM, TCO e colli di bottiglia.

Jul 02 2026
LLM

Kimi K2.7 Code sbarca su GitHub Copilot, tra coding assistito e nodi di privacy

Moonshot AI porta il suo LLM nella piattaforma Microsoft, ampliando il parco modelli per sviluppatori. L'integrazione accende il dibattito su dove risiedano davvero i dati e se abbia senso restare in locale per chi non vuole condividere codice sorgente con servizi cloud.

Jul 02 2026
Market

AI e processi aziendali: perché l’on-premise premia solo le organizzazioni disciplinate

Integrare l’AI nei processi non basta: serve disciplina operativa. Il mercato dell’ottimizzazione basata su AI potrebbe superare 113 miliardi di dollari, e l’88% dei manager vuole aumentare gli investimenti. Senza fondamenta solide, i progetti di AI falliscono. Le aziende con processi maturi, abituate a decisioni data‑driven, ottengono più valore, specie in contesti on‑premise dove controllo e sovranità dei dati sono cruciali.

Jul 02 2026
Altro

OpenAI e il fondo sovrano: cosa cambia se il 5% dell’azienda diventa pubblico

Sam Altman propone di cedere il 5% delle quote di OpenAI a un fondo sovrano americano. Un’operazione che mescola finanza, controllo pubblico dell’AI e sovranità tecnicica, riaprendo il dibattito su chi dovrebbe possedere l’infrastruttura dell’intelligenza artificiale.

Jul 02 2026
Altro

La comunità del kernel Linux discute se eliminare l'attribuzione per i contributi IA

Gli sviluppatori del kernel Linux riconsiderano il tag "Assisted-by" per le patch generate con agenti LLM. La discussione riapre interrogativi su trasparenza, provenienza del codice e controllo nelle pipeline di sviluppo open source e aziendali.

Jul 02 2026
Market

OpenAI propone una quota del 5% agli Stati Uniti per condividere i benefici dell’AI

Il CEO Sam Altman sta discutendo con l'amministrazione Trump la cessione di una partecipazione del 5% in OpenAI. L'idea, affrontata con Google e Meta, punta a coinvolgere il pubblico nella ricchezza generata dall'intelligenza artificiale, ma solleva questioni di governance e sovranità digitale.

Jul 02 2026
Altro

Musk's X sotto accusa: "Grave rischio privacy", gli attivisti avvertono la FTC

Con l'avvicinarsi della scadenza del 2 luglio per i commenti pubblici, organizzazioni per i diritti digitali chiedono alla FTC di respingere il tentativo di X di chiudere le verifiche indipendenti sulla gestione dei dati. La piattaforma di Elon Musk era finita sotto audit dopo un errore di codice che aveva condiviso i numeri di telefono forniti per l'autenticazione a due fattori a fini pubblicitari.

Jul 02 2026
Frameworks

Claude Science porta l'accelerazione GPU NVIDIA nei laboratori di calcolo delle scienze della vita

La beta pubblica di Claude Science integra il toolkit NVIDIA BioNeMo per tradurre il linguaggio naturale in flussi di lavoro computazionali accelerati, con impatto diretto su genomica, proteomica e chimica farmaceutica. La piattaforma permette di orchestrare pipeline complesse attingendo a microservizi NIM e librerie ottimizzate, riducendo drasticamente i tempi di calcolo e mantenendo il controllo sui dati.

Jul 02 2026
Market

CEE, fondo venture debt da 107 milioni: una spinta all'hardware per l'AI on-premise

Orbit Capital chiude il secondo closing del Growth Debt Fund II a 107 milioni di euro, superando l’obiettivo iniziale. L’ingresso di fondi pensione e il sostegno del FEI segnalano un cambio di passo. Il capitale non diluitivo può finanziare spese in conto capitale, aprendo scenari concreti per l’acquisto di infrastrutture server destinate all’inference e al training di LLM self-hosted in Europa centro-orientale.

Jul 02 2026
Market

Perché la vera sfida per l'AI video è insegnare agli avatar a vedere e ascoltare

Dopo anni di corsa alla fedeltà visiva, la ricerca sull'AI generativa per video e avatar si sposta sulla percezione e l'interazione in tempo reale. Una svolta che ridefinisce i requisiti di calcolo e riaccende il dibattito su dove eseguire questi modelli.

Jul 02 2026
Altro

Cloudflare mette un ultimatum ai crawler AI: entro settembre pagate gli editori o sarete bloccati

Da settembre Cloudflare bloccherà i crawler che estraggono contenuti per addestrare modelli AI, a meno che i siti non diano il consenso. Le pagine con pubblicità diventano off-limits. Una mossa che riscrive le regole dell'accesso al web dei dati, con riflessi immediati per chi gestisce modelli on-premise e deve fare i conti con la provenienza dei dati di training.

Jul 02 2026
Market

Microsoft lancia la sua società di deployment AI con 2,5 miliardi

Microsoft crea una nuova entità dedicata al deployment di intelligenza artificiale, con un impegno finanziario di 2,5 miliardi di dollari. La mossa segue quelle di Amazon, OpenAI e Anthropic, e segnala una corsa alla costruzione di infrastrutture AI dedicate. Per chi valuta soluzioni on-premise, il framework competitivo si complica, ma emergono anche nuove possibilità di controllo e personalizzazione.

Jul 02 2026
Altro

StirlingX incassa 20 milioni per l’intelligence sovrana: un campanello per chi gestisce dati sensibili

L’azienda britannica, guidata dall’ex direttore del GCHQ, costruisce una piattaforma che fonde dati da ambienti complessi. Il round segnala quanto sia strategico, per difesa e infrastrutture critiche, tenere l’analisi sotto il proprio controllo. Un tema che si intreccia con le scelte di deployment on-premise per i carichi di lavoro AI più delicati.

Jul 02 2026
Hardware

Montech NX600: il dual tower economico con ventole da jet

Un dissipatore ad aria per CPU dal prezzo aggressivo ma dalla rumorosità elevata. Per chi assembla macchine per l'inference locale o workstation on-premise, il compromesso tra costo e silenziosità diventa un fattore cruciale.

Jul 02 2026
Hardware

Intel avvia il supporto GCC per ACE, le estensioni AI condivise con AMD su x86

Intel ha inviato le prime patch per il compilatore GCC relative alle AI Compute Extensions (ACE), il set di istruzioni per l’AI sviluppato con AMD. Successore cross-vendor delle Advanced Matrix Extensions, ACE punta a velocizzare i carichi di machine learning sulle CPU. L’iniziativa avvicina un’accelerazione nativa dell’inference on-premise senza dipendere da GPU dedicate.

Jul 02 2026
Hardware

Intel ritocca al rialzo le CPU desktop top: fino a 349$ per la Core Ultra 270K Plus

Le pagine ufficiali delle Core Ultra 270K Plus e 250K Plus mostrano prezzi raccomandati più alti di 50 dollari. Una mossa che segnala pressioni sui costi e impatta chi assembla workstation per inference locale di LLM.

Jul 02 2026
Hardware

Alva Industries chiude un round da €16M per scalare i motori elettrici ultra-compatti

La deep-tech norvegese ha ottenuto il finanziamento guidato da Nysnø Climate Investments, Sandwater e Emerald per portare sul mercato motori sempre più piccoli e performanti. Un segnale per la robotica e l’AI on-device.

Jul 02 2026
LLM

GLM-5.2: il modello cinese che sfida i big a un costo irrisorio

Z.ai ha rilasciato GLM-5.2, quarto nella classifica dei modelli più performanti, con capacità in coding e agentica vicine ai leader di mercato. Il costo è una frazione di quello di Anthropic o OpenAI, sollevando interrogativi su come questo cambierà le scelte di deployment, soprattutto per chi punta a soluzioni on-premise e alla sovranità dei dati.

Jul 02 2026
Frameworks

Un pipeline vocale open source rimpiazza l’API realtime di OpenAI con Gemma 4

Hugging Face mostra una demo completamente open source che integra riconoscimento vocale, LLM Gemma 4 e sintesi, funzionando anche in locale su un MacBook Pro M3 con 36 GB. Un'alternativa concreta all'API realtime di OpenAI che ripensa il deployment su device e la sovranità dei dati.

Jul 02 2026
Frameworks

Il dating automatizzato con LLM: la storia di Ben Guez e i dilemmi dell’AI fai-da-te

Un esperimento personale accende i riflettori sui limiti della governance AI: OpenClaw, Claude Code e Instagram usati per corteggiare ‘aspiranti mogli internazionali’. Una follia estiva o un segnale per chi amministra infrastrutture on-premise?

Jul 02 2026
Altro

AI, l'UNICEF lancia l'allarme: 20 milioni di bambini già utenti, governance al palo

Un'analisi UNICEF su dieci paesi rivela che 20 milioni di minori usano già strumenti di AI, con un ritmo di adozione oltre tre volte più rapido di quello degli adulti. L'organizzazione parla di "esperimento globale" mentre la governance fatica a stare al passo. Per le aziende che sviluppano AI per l'infanzia, la protezione dei dati e la sovranità digitale diventano priorità che spingono verso deployment on-premise.

Jul 02 2026
Frameworks

YSERVER 1.3, il server X11 scritto in Rust con l'aiuto di Claude Code

Il progetto YSERVER, un moderno server X11 sviluppato in Rust con l'assistenza di Claude Code, arriva alla versione 1.3 con supporto a Xinerama e FreeBSD. Un esempio emblematico di vibe coding applicato a infrastrutture di sistema.

Jul 02 2026
Altro

India impone a WhatsApp di fermare la funzione username: incognita sovranità

Il ministero indiano MeitY ha ordinato a Meta di sospendere il lancio degli username su WhatsApp in India, concedendo tre giorni per una giustificazione. La mossa riaccende il dibattito su controllo dei dati, crittografia e conformità locale, mentre le aziende guardano con crescente interesse a strumenti self-hosted per garantire la sovranità delle comunicazioni.

Jul 02 2026
Market

Novo Holdings scommette sulle startup farmaceutiche italiane: un modello che va oltre la Danimarca

La controllante di Novo Nordisk entra in un fondo dedicato alle giovani imprese italiane del farmaco. Una mossa che estende la strategia di investimento in poli di scienze della vita lontano da Copenhagen. Per le applicazioni di intelligenza artificiale nella scoperta di farmaci, la sovranità dei dati e l'infrastruttura on-premise diventano un nodo critico.

Jul 02 2026
Market

Nvidia finanzia le startup AI: potenza di calcolo oggi, pagamento dopo

Nvidia ha svelato un modello di credito e revenue sharing per i cloud provider di AI, così le startup possono usare volumi elevati di GPU senza doverle comprare subito. Una sterzata strategica che allarga l'accesso all'infrastruttura di calcolo e riscrive le regole del mercato dei chip per l'intelligenza artificiale.

Jul 02 2026
Frameworks

Z.ai lancia ZCode: un nuovo sfidante nell'arena affollata del coding assistito dall'AI

La startup Z.ai entra nella mischia degli strumenti di coding AI con ZCode, puntando a insidiare Cursor, Claude Code e GitHub Copilot. Mentre la corsa alle funzionalità si intensifica, chi sviluppa codice sensibile deve interrogarsi su dove risiedono i dati e sull’autonomia del proprio stack.

Jul 02 2026
Altro

USA al tavolo con le AI company: standard volontari per il rilascio dei nuovi modelli

Il governo americano negozia linee guida volontarie con le aziende di AI per disciplinare tempi e benchmark dei modelli avanzati, oltre all'accesso dentro e fuori i confini. Una mossa che, seppur non vincolante, può ridefinire i margini di chi punta su deployment on-premise e sovranità dei dati.

Jul 02 2026
Hardware

Oxmiq raccoglie 35 milioni per concedere in licenza design di GPU AI: la scommessa di Raja Koduri

La startup di Raja Koduri, Oxmiq Labs, ha chiuso un round Series A da 35 milioni di dollari per scalare OxCore, un'architettura GPU licenziabile che permette ai chipmaker di creare silicio AI custom senza un intero ciclo di progettazione pluriennale. Il capitale totale raccolto sale a 60 milioni.

Jul 02 2026
Altro

Microsoft entra nel consorzio Lightstorm per un nuovo cavo sottomarino India-Sud-est asiatico

Il sistema I-2SEA collegherà India, Singapore e Malaysia su 3.600 km per sostenere i carichi di lavoro AI, cloud e hyperscale, in un mercato dati tra i più contesi al mondo.

Jul 02 2026
Altro

L'espansione AI di Google spinge il consumo elettrico a +37% nel 2025

Nel 2025 il consumo di elettricità di Google è cresciuto del 37%, il balzo più grande della sua storia. Lo rivela l’ultimo rapporto di sostenibilità, che attribuisce l’aumento ai data center per l’IA, Google Cloud e YouTube. Una tendenza che solleva interrogativi su come conciliare la corsa all’AI con gli impegni climatici, e influenzerà le scelte di chi valida deployment alternativi.

Jul 02 2026
Market

IAGi: dieci anni di acceleratore e il segreto per scalare startup nell’aviazione

Dall’acceleratore aziendale ai fondi venture, IAGi ha costruito un modello che trasforma i pilot in collaborazioni commerciali. Le compagnie decidono, l’innovazione abilita. Tassi di conversione del 30-40% e ossessione per i problemi operativi reali: cosa insegna a chi sviluppa AI per l’enterprise.

Jul 02 2026
Altro

Super Micro nel mirino: due manager detenuti a Taiwan per server AI destinati alla Cina

Due dipendenti di Super Micro sono stati posti in detenzione da un tribunale di Taiwan nell'ambito di un'inchiesta sull'instradamento illecito di server AI con chip Nvidia verso la Cina. L'indagine si allarga e solleva interrogativi sulla compliance dei fornitori hardware in un mercato segnato da restrizioni all'esportazione.

Jul 02 2026
Altro

Linux archivia le vecchie piattaforme ARM: più sicurezza per i carichi on-premise

La comunità del kernel Linux ha proposto di deprecare e rimuovere diverse piattaforme ARM obsolete entro l'inizio del 2027. L'iniziativa segue l'analoga pulizia per le CPU i486. Per chi gestisce infrastrutture on-premise, questa sfoltitura promette kernel più snelli, minore superficie d'attacco e un focus di manutenzione concentrato sulle architetture moderne, cruciali per i carichi di inference LLM.

Jul 02 2026
Frameworks

JPEG-XL: libjxl 0.12 porta ottimizzazioni di performance per codifica e decodifica

Un aggiornamento della libreria di riferimento libjxl introduce ottimizzazioni per la codifica e decodifica di immagini nel formato JPEG-XL. Il rilascio interessa chi gestisce pipeline di dati visivi on-premise, dove efficienza di storage e controllo dei dati sono prioritari, riducendo i costi operativi e migliorando la velocità di elaborazione.

Jul 02 2026
Market

SpaceX? Nessun dispositivo AI. Elon Musk stronca le voci: «Totalmente false»

L’imprenditore definisce «completamente false» le indiscrezioni su un dispositivo portatile più sottile di un iPhone. La smentita riaccende il dibattito su hardware AI on-device e sovranità dei dati.

Jul 02 2026
Hardware

SK Hynix mette 51 miliardi sul tavolo per la memoria NAND: la nuova fab M17 è targata AI

L’azienda coreana costruirà un impianto per memorie NAND a Cheongju, con produzione attesa nel 2029. L’investimento segnala come l’AI non spinga solo la domanda di bandwidth (HBM), ma anche quella di storage veloce e capiente per dataset e workload on-premise.

Jul 02 2026
Market

Europa dei chip schiacciata tra controlli cinesi e dipendenza USA: il rapporto che gela il settore

Un nuovo studio EUISS-Institut Montaigne dipinge un futuro cupo per i semiconduttori europei, stretti nella morsa delle restrizioni di Pechino e del legame sempre più profondo con la tecnicia americana. Il progetto Chips Diplomacy getta ombre lunghe sulla sovranità hardware del continente.

Jul 02 2026
Market

Quantum Systems raccoglie 1,2 miliardi di dollari per droni autonomi: la difesa europea accelera

Il produttore tedesco di droni Quantum Systems ha chiuso un round Serie D da 1,2 miliardi di dollari, raddoppiando la valutazione a 8 miliardi. Guidato da Blackstone, Noteus e Airbus, il finanziamento servirà a espandere la produzione internazionale. I velivoli senza pilota sono già operativi in Ucraina e presso forze NATO. Il CEO Florian Seibel ipotizza un futuro merger con Stark, azienda di droni armati.

← Precedente Page 1 / 143 Successiva →