🗄️ Archivio Notizie

Cronologia completa dei segnali AI, ordinati per data.
Total Articles: 14228

Questo archivio e la memoria storica di AI-Radar: lanci di modelli, novita sui framework, cambiamenti infrastrutturali e segnali di mercato raccolti in una timeline ricercabile. Serve per confrontare come sono evolute le narrative, capire quali tecnologie hanno mantenuto trazione e prendere decisioni con contesto storico invece che seguire solo l'hype del momento. Per orientarti piu velocemente puoi passare alle sezioni dedicate LLM, Frameworks, Hardware e alla pillar Trends.

💡 Cerchi qualcosa di specifico? Usa la Barra di Ricerca in alto per una ricerca dettagliata.

Jul 01 2026
Altro

BioShocking: i browser AI cadono nel gioco e svelano le password

Un team di ricercatori ha ingannato diversi agenti AI integrati nei browser, convincendoli a rivelare credenziali di accesso con una tecnica chiamata BioShocking. L’attacco ha funzionato su ogni agente testato, sollevando interrogativi sulla sicurezza dei browser AI e sulle implicazioni per chi gestisce dati sensibili in ambienti aziendali.

Jul 01 2026
Market

Higgsfield AI punta ai 5 miliardi: il video generativo accelera la corsa all'oro delle GPU

La startup Higgsfield, nata a marzo 2025, cerca fino a 500 milioni di dollari con una valutazione di 5 miliardi, quadruplicata in pochi mesi. Dietro il numero c'è la fame di calcolo per il video AI e riapre la riflessione su cloud, on-premise e sovranità dei dati.

Jul 01 2026
Hardware

Ascend GX10 o DGX Spark: la scommessa dell'inference locale

Un utente valuta l'acquisto di quattro GPU Ascend GX10 per eseguire modelli open-source con finestre di contesto a 128k token. I test con GLM5.2 mostrano circa 15 tok/s in output, sufficienti con quantization, e consumo di 1000W. Una scelta che riaccende il dibattito su hardware on-premise per LLM: quanto conta la velocità rispetto al controllo dei dati?

Jul 01 2026
Market

Qonto e Pennylane: la partita a due del fintech europeo per le PMI

Le due società francesi guidano la trasformazione digitale di banking e contabilità per piccole imprese. Si integrano, ma la fatturazione elettronica obbligatoria le trasforma in concorrenti diretti, in un mercato dove il controllo dei dati finanziari diventa sempre più strategico.

Jul 01 2026
Altro

Data center orbitali, l’hype è già in orbita: la verità dei numeri

Elon Musk promette data center nello spazio più economici entro tre anni, ma fisica, costi di raffreddamento e colli di bottiglia produttivi raccontano un’altra storia. Cosa significa per chi valuta infrastrutture di calcolo locali.

Jul 01 2026
Altro

L’IA sanitaria ha smarrito la persona: il nodo umano dietro la corsa all’automazione

L’intelligenza artificiale sta invadendo la sanità con assistenti e chatbot sempre più pervasivi, ma il paziente rischia di diventare un’astrazione. Mentre i sistemi sanitari abbracciano l’efficienza, la sovranità dei dati e il controllo locale emergono come baluardi per riportare l’essere umano al centro, aprendo scenari complessi per chi valuta deployment on-premise.

Jul 01 2026
Altro

GCC 16.2 ad agosto: impatto per chi gestisce stack LLM on-premise

La versione 16.2 del compilatore GNU è attesa per inizio agosto come release di correzione bug. Per chi mantiene infrastrutture software self-hosted, specialmente nel mondo LLM, l'uscita di una point release è il segnale per pianificare l'aggiornamento con minori rischi. Analizziamo perché questa cadenza di rilascio conta nella pratica per team che compilano tool da sorgente e puntano alla stabilità dell'ambiente di produzione.

Jul 01 2026
Altro

L’ONU lancia l’allarme: la finestra per governare l’IA si sta chiudendo

La prima commissione scientifica globale delle Nazioni Unite sull’intelligenza artificiale avverte che i governi rischiano di essere superati dalla velocità della tecnicia. Il rapporto preliminare, diffuso prima del summit internazionale, segnala l’urgenza di intervenire. Per chi adotta LLM on-premise, la spinta regolatoria inciderà sempre più sulle scelte di deployment, bilanciando controllo, sovranità dei dati e costi operativi.

Jul 01 2026
Market

Acer a 50 anni: il modello 'Business Family' come bussola per la sostenibilità

Nel quarantesimo anno dalla fondazione, il fondatore Stan Shih indica nella struttura a 'family business' la via per un futuro più resiliente. L’approccio, basato su aziende indipendenti unite dal marchio, può offrire lezioni anche per la filiera hardware che supporta le infrastrutture AI on-premise.

Jul 01 2026
Altro

L’ecosistema GPU-rete di Nvidia domina gli switch Ethernet per data center

L’integrazione tra GPU e networking di Nvidia sta ribaltando il mercato degli switch Ethernet per data center. Le infrastrutture AI, dalla inference al training di LLM, spingono la domanda di connettività ad alta velocità, e le soluzioni come Spectrum e InfiniBand stanno prendendo il sopravvento. Un segnale per chi valuta architetture on-premise.

Jul 01 2026
Altro

Apple ‘Hide My Email’ perdeva gli indirizzi reali: oltre un anno per la patch

Una falla in Hide My Email di Apple ha permesso di risalire all’indirizzo reale degli utenti per più di un anno, nonostante le segnalazioni del ricercatore Tyler Murphy. L’azienda non ha ancora risolto il problema, sollevando dubbi sulla protezione della privacy per chi si affida a iCloud+ per mascherare la propria identità digitale.

Jul 01 2026
Altro

LLM come grimaldello: Claude Opus buca il ticketing dei festival USA

Un ricercatore ha sfruttato Claude Opus 4.7 di Anthropic per violare la piattaforma Front Gate, usata dai principali festival musicali americani, riuscendo a emettere biglietti a piacimento. L'episodio riaccende il dibattito sui rischi dei LLM cloud e sull'importanza del controllo on-premise per attività sensibili come il red teaming.

Jul 01 2026
Hardware

NVIDIA spinge sull'open source: nuovo formato TLV per il driver Nova

NVIDIA sta sviluppando un formato binario TLV per i firmware GPU, pensato per semplificare il parsing nel driver open source Nova basato su Rust. Un segnale concreto per chi valuta trasparenza e controllo nelle infrastrutture AI on-premise.

Jul 01 2026
Altro

Cook e l’UE, confronto "costruttivo" mentre Siri AI resta fuori dall’Europa

Tim Cook e la commissaria europea Henna Virkkunen si sono parlati in videochiamata il 30 giugno. Il confronto, definito costruttivo da entrambi, non ha ancora rimosso il blocco di Apple Intelligence nell’Unione. Il dialogo evidenzia lo stallo regolatorio che frena i servizi AI delle big tech in Europa.

Jul 01 2026
Market

TikTok valuta altri 300 tagli nella sede di Dublino

La società prevede di licenziare circa un decimo del personale della sede europea, dopo un precedente round di dimensioni simili. L’annuncio accende i riflettori sul ruolo strategico dell'hub di Dublino e sulle scelte di localizzazione dei dati nell’attuale scenario di pressione sui costi.

Jul 01 2026
Market

OCBC porta la spesa tech oltre 771 milioni: la nuova rotta AI pesca nel locale

La banca di Singapore alza l’investimento tecnicico annuale sopra i 771 milioni di dollari. Il nuovo CEO Tan Teck Long raddoppia su AI e digital banking, segnalando una virata che potrebbe avere impatti concreti sugli stack infrastrutturali on-premise nel settore finanziario.

Jul 01 2026
Market

Yageo alza i prezzi dei condensatori: l'AI aumenta la pressione sui costi hardware

Il produttore taiwanese di componenti passivi Yageo comunica ai clienti EMS e OEM un aumento dei prezzi dei condensatori. Il rialzo si inserisce in una catena di rincari innescata dalla domanda di infrastrutture per l'intelligenza artificiale, con impatti diretti sui costi di server e sistemi destinati a deployment on-premise.

Jul 01 2026
Hardware

Yageo prende il controllo di Anpec: scossa nella filiera dell’hardware per AI

L’acquisizione del controllo del board di Anpec Electronics da parte del chairman di Yageo segna un consolidamento nella componentistica per alimentazione. Per i carichi di lavoro basati su LLM, dove stabilità e power management sono critici, la mossa potrebbe influenzare la disponibilità di semiconduttori per data center e deployment self-hosted.

Jul 01 2026
Hardware

Vertiv accende a Johor la fabbrica del raffreddamento AI: rack fino a 100kW e 800V DC

Vertiv ha aperto il primo stabilimento produttivo nel Sud-est asiatico a Johor per sistemi di raffreddamento a liquido e alimentazione per rack AI ad alta densità. La produzione locale risponde a densità di potenza verso i 100 kW, riducendo tempi di consegna e rischi. Mentre Johor diventa più selettiva nei nuovi data center, la domanda per infrastrutture AI resta robusta.

Jul 01 2026
Altro

USA ritirano le restrizioni all’export su Fable 5 di Anthropic: il modello torna disponibile

Il Dipartimento del Commercio USA ha revocato i controlli all’export su Fable 5 di Anthropic, ponendo fine a tre settimane di blocco. La mossa riaccende i riflettori sulla fragilità delle dipendenze cloud per i modelli di frontiera e sulle implicazioni per chi cerca sovranità tecnicica nel deployment di LLM.

Jul 01 2026
Market

Domanda AI alimenta fabbriche asiatiche mentre la guerra in Iran pesa sui costi

L’industria hardware dell’intelligenza artificiale spinge la crescita manifatturiera asiatica, ma l’escalation in Iran fa salire bolletta energetica e tempi di consegna. Un campanello d’allarme per chi deve pianificare deployment on-premise.

Jul 01 2026
Market

La Corea del Sud accusa Google di abusare del dominio su Android con 'Project Hug'

L'antitrust sudcoreana contesta a Google condotte che hanno influenzato ricavi per 14,16 trilioni di won. Il caso riapre il dibattito sul controllo dei marketplace digitali, con ricadute dirette su chi sviluppa applicazioni AI e valuta deployment in-house per sfuggire a vincoli proprietari.

Jul 01 2026
Market

Jim Keller: Tenstorrent supererà Cerebras nella competizione per i chip AI

Il celebre progettista di chip Jim Keller ha dichiarato che la startup Tenstorrent supererà Cerebras Systems, intensificando la sfida tra i produttori di processori specializzati per AI. Una competizione tecnicica con implicazioni dirette per i deployment on-premise e la sovranità dei dati.

Jul 01 2026
Market

TMY Technology supera la revisione per la quotazione a Taiwan: satellite e difesa trainano la svolta

La società tech ottiene il via libera dalle autorità di borsa taiwanesi, puntando su segmenti a elevata specializzazione. L'operazione riflette il rinnovato interesse per settori che richiedono infrastrutture sovrane e ambienti on-premise, uno scenario che interseca direttamente le strategie di deployment per l'intelligenza artificiale.

Jul 01 2026
LLM

OpenAI: scoperto un metodo per dimezzare i costi di inference

La notizia, rilanciata da AFP, suggerisce una svolta potenzialmente epocale per l'adozione aziendale dei LLM, in particolare per chi vuole gestirli in proprio, riducendo il Total Cost of Ownership.

Jul 01 2026
Altro

Processo a Meta: l'algoritmo che aggancia i bimbi e il nodo della sovranità dati

Un giudice federale ha dato il via libera alla causa di 29 Stati USA che accusano Meta di aver progettato Facebook e Instagram per creare dipendenza nei minori. Il caso apre un fronte cruciale sulla progettazione algoritmica e sulla gestione dei dati sensibili, sollevando interrogativi concreti per chi fa deployment on-premise di modelli AI.

Jul 01 2026
Market

Gus Technology si affida a Hota Group: presidenza affidata al presidente del conglomerato

La mossa rafforza i legami strategici nel settore dei materiali per batterie e veicoli elettrici. Il presidente di Hota Group assume la guida del consiglio di amministrazione di Gus Technology, segnando un passo deciso verso un maggiore presidio della supply chain.

Jul 01 2026
Hardware

Manager Albatron arrestato per contrabbando GPU Nvidia: l’inchiesta che tocca l’AI on-premise

Il general manager di Albatron detenuto, l’azienda nomina un CEO ad interim. L’indagine su un presunto traffico illecito di componenti legati a Supermicro e Nvidia accende un riflettore sulla filiera hardware per l’intelligenza artificiale e sui rischi per chi punta su deployment on-premise.

Jul 01 2026
Market

Supercore sotto inchiesta per contrabbando: Nvidia stringe le maglie sui server AI

Le indagini sul presunto contrabbando di Supermicro spingono Nvidia a rafforzare la verifica delle spedizioni di server AI. Un campanello d'allarme per chi adotta architetture on-premise: la catena di fornitura diventa un anello critico per la conformità e la sovranità dei dati.

Jul 01 2026
Hardware

Rebellions compra SqueezeBits: la strategia AI ora va oltre l’hardware

L’acquisizione segnala un cambio di passo per le startup di chip AI: non più solo silicio, ma integrazione verticale con software e framework. Per chi valuta deployment on-premise, l’offerta di soluzioni complete può ridurre complessità e TCO, ma impone attenzione alla maturità dell’ecosistema.

Jul 01 2026
Market

Amazon scommette 1 miliardo di dollari sugli ingegneri AI embedded nei clienti

Con una nuova divisione da un miliardo di dollari, Amazon punta a inserire i propri ingegneri AI direttamente all’interno dei team aziendali. Una strategia che ridefinisce la consulenza tecnicica e accende i riflettori su controllo dei dati, competenze e modelli di deployment. Per chi guarda all’on-premise, emergono domande più che risposte.

Jul 01 2026
Hardware

Cina: materiali per chip in ascesa grazie all’AI, il Giappone nel mirino

La domanda esplosiva di AI sta spingendo le aziende cinesi di materiali per semiconduttori a competere testa a testa con i giganti giapponesi. Dalle fette di silicio ai compound avanzati, la partita si gioca sulla fornitura di componenti cruciali per GPU e acceleratori, con ripercussioni dirette su costo e disponibilità dell’hardware per chi adotta infrastrutture AI on-premise.

Jul 01 2026
Market

Carbon tax a Taiwan, le fonderie di chip sono le più colpite. Quale impatto per l'AI on-premise?

La nuova tassa ambientale colpisce la manifattura dei semiconduttori, facendo salire i costi di produzione. Chi valuta deployment self-hosted di LLM deve prepararsi a un TCO più alto e a possibili ritardi nella fornitura di GPU e acceleratori.

Jul 01 2026
Market

Schneider Electric mette 3,1 miliardi sull'IA industriale: acquisita Cognite

La mossa da 3,1 miliardi di dollari segna un salto nell’AI per il colosso francese. La piattaforma di Cognite, specializzata in gemelli digitali e dati industriali, apre scenari di deployment on-premise e controllo della sovranità dei dati per l’automazione. Il mercato delle infrastrutture AI locali accelera.

Jul 01 2026
Market

Taiwan svetta nell’adozione AI, ma le aziende restano senza bussola strategica

Microsoft ha rilevato che Taiwan è il paese con il più alto tasso di adozione dell’intelligenza artificiale al mondo. Tuttavia, la maggior parte delle imprese locali non ha una strategia definita, un cortocircuito che rischia di vanificare i benefici economici e operativi. Un monito che suona familiare anche per chi in Europa e nel resto del mondo valuta il deployment on-premise di LLM.

Jul 01 2026
LLM

Quando il mix di lingue spegne i LLM: cosa dice il benchmark Indi-RomCoM

L'uso quotidiano di lingue mescolate alla scrittura latina è un banco di prova severo per i Large Language Models. Il nuovo benchmark Indi-RomCoM mostra che persino i modelli più potenti perdono colpi quando le istruzioni intrecciano inglese e lingue indiane, con un crollo delle performance all'aumentare della densità del code-mixing. Un campanello d'allarme per chi immagina assistenti AI davvero multilingue.

Jul 01 2026
Frameworks

Agenti AI: una sola riscrittura basta a evitare le collisioni tra skill

Un team ha automatizzato l'ottimizzazione delle descrizioni testuali delle skill in un agente aziendale. Con un solo rewrite guidato da casi di errore, la pipeline raggiunge l'accuratezza del tuning manuale (F1 79,2% contro 79,4%) e riduce il lavoro per skill da 120 a 3,8 minuti. Lo studio mostra che iterazioni e feedback aggiuntivi migliorano meno dello 0,5%. Resta il problema delle sovrapposizioni reali, che richiedono interventi architetturali.

Jul 01 2026
LLM

Quando l’accelerometro prevede il rischio cardiaco: il benchmark che mancava

Un nuovo dataset tabulare basato su dati NHANES e accelerometria sfida i modelli di apprendimento automatico a prevedere biomarcatori come HbA1c e PCR. TabPFN v2 emerge come la soluzione più efficace, ma con limiti sui trigliceridi. Per chi adotta AI in ambito medico, la trasparenza e la privacy dei dati restano centrali.

Jul 01 2026
Altro

Poche osservazioni, leggi universali: il competitive optimization unisce dataset senza muovere i dati

Il metodo MCO-PDE riesce a ricostruire equazioni differenziali governanti partendo da dataset eterogenei distribuiti. Addestra surrogate neurali per ogni fonte e fonde le conoscenze con un meccanismo di weighting competitivo. Con appena 50 osservazioni per sorgente, il framework recupera leggi canoniche anche su domini irregolari. Per l’ecosistema AI on-premise, la prospettiva è chiara: si possono combinare dati di impianti diversi senza centralizzare le informazioni, preservando la sovranità e riducendo i costi di trasferimento.

Jul 01 2026
Frameworks

Prompt debugging diventa scienza: arriva Contrastive Reflection

Un nuovo framework iterativo per ottimizzare i prompt degli agenti LLM nell’information retrieval. Invece della ricerca cieca, usa esempi contrastivi per identificare e riparare errori, convalidando ogni modifica. Su HotpotQA, la precisione sale dal 51,4% al 60,4%, avvicinandosi agli ottimizzatori moderni ma offrendo maggiore ispezionabilità. Una svolta per chi cerca controllo e trasparenza nei deployment on-premise.

Jul 01 2026
LLM

Quando il feedback automatico non basta: cosa serve davvero per migliorare gli agenti LLM

Un nuovo studio smonta l'idea che gli agenti linguistici migliorino grazie ai commenti auto-generati. Solo docenti esterni di qualità offrono guadagni reali, e il collo di bottiglia non è il feedback in sé ma la capacità dello studente di usarlo. Per il deployment on-premise, questo significa scegliere con cura le strategie di validazione e non dare per scontato che basti aggiungere cicli di auto-correzione.

Jul 01 2026
Altro

U Mobile completa migrazione a ULTRA5G: la rete ora è tutta sua

U Mobile ha completato la migrazione dei propri clienti sulla rete ULTRA5G, chiudendo l’accordo wholesale con DNB. Copertura oltre l’85% delle aree popolate, 190+ siti indoor e tecnicia 5G-Advanced-ready. L’operazione, finanziata con 4,3 miliardi di ringgit, segna il passaggio della Malaysia al modello dual-network e offre lezioni di controllo infrastrutturale per chi guarda al deployment on-premise.

Jul 01 2026
Altro

Giappone, iniziativa IA da 6,2 miliardi $: SoftBank punta alla leadership nell’IA fisica

Tokyo stanzia 6,2 miliardi di dollari per un progetto d’intelligenza artificiale fisica, affidato a un consorzio guidato da SoftBank. L’obiettivo è dominare robotica, manifattura autonoma e sistemi edge, scenari dove il deployment on-premise diventa un fattore competitivo per latenza, privacy e controllo dei dati.

Jul 01 2026
Market

Dietro la svolta cinese sulle auto, la tenuta dei chip taiwanesi che serve agli LLM

Mentre Pechino allenta i vincoli per il mercato post-vendita auto, le aziende taiwanesi serrano i ranghi negli Stati Uniti. Una dinamica che investe la catena di fornitura dei semiconduttori e, di riflesso, la disponibilità di hardware per inference on-premise di grandi modelli linguistici, in un intreccio geopolitico che nessun data center può più ignorare.

Jul 01 2026
Altro

Via libera di Trump ai modelli Anthropic: Mythos e Fable tornano accessibili

L’amministrazione Trump ha rimosso le restrizioni sui modelli Mythos e Fable di Anthropic. L’accesso a Fable verrà ripristinato dal 1° luglio, aprendo nuovi scenari per il deployment on-premise e la sovranità dei dati per le aziende che gestiscono infrastrutture locali.

Jul 01 2026
LLM

Anthropic lancia Sonnet 5: quasi Opus a -60% di costi, revocato il divieto export

Anthropic ha rilasciato Sonnet 5, un LLM che raggiunge performance vicine a Opus ma con un taglio dei costi operativi del 60%. La novità coincide con la rimozione di un divieto all’esportazione, allargandone la platea. Per chi guarda al deployment on-premise, il binomio efficienza economica e prestazioni riaccende la discussione su costi, hardware e sovranità dei dati, anche se mancano ancora dettagli tecnici ufficiali.

Jul 01 2026
Frameworks

audio.cpp sdogana VibeVoice: podcast di 90 minuti in 23 minuti su RTX 5090, senza Python

Il runtime C++/ggml audio.cpp accelera la sintesi vocale di VibeVoice 1.5B di 2,86x rispetto a Python, generando 93 minuti di audio multivoce in 23 minuti su una RTX 5090. Un passo verso stack locali autosufficienti anche per modelli audio long-form.

Jul 01 2026
Market

Chip AI, la strozzatura del packaging dà potere contrattuale agli OSAT fino al 2027

La domanda di acceleratori per l’intelligenza artificiale sta saturando la capacità di assemblaggio e collaudo, dando agli OSAT un potere di prezzo inedito. Secondo DIGITIMES, le commesse coprono già il triennio fino al 2027. Chi valuta infrastrutture on-premise deve mettere in conto la rigidità della supply chain, con effetti concreti su costi, tempi di consegna e calcolo del Total Cost of Ownership.

Jul 01 2026
Market

Wayve lancia una tender offer da $85M a valutazione di $8.5 miliardi

Wayve consente ai dipendenti di vendere azioni per 85 milioni di dollari, confermando una valutazione di 8,5 miliardi. La mossa rientra in una strategia sempre più diffusa tra le startup AI per attrarre e trattenere talenti in un mercato iper-competitivo. AI-RADAR esamina le implicazioni di questa corsa al capitale umano per l’ecosistema dell’inference on-premise e la sovranità dei dati.

Jul 01 2026
Market

H2U e l’IA nella sanità: quotazione a luglio e il nodo della sovranità dei dati

H2U si prepara alla quotazione all'Innovation Board per valorizzare le opportunità dell'intelligenza artificiale applicata ai dati sanitari. Un segnale che riaccende il dibattito su controllo dei dati, conformità e modelli di deployment on-premise.

Jul 01 2026
Market

Mercato auto Taiwan si stabilizza: il segnale distensivo sui dazi rassicura anche l’hardware AI

Secondo DIGITIMES, l’incertezza sui dazi USA si allenta e spinge l’export di componenti auto taiwanesi. Il dato è più ampio di quanto sembri: per chi valuta deployment on-premise di LLM, la stabilizzazione delle tensioni commerciali riduce i rischi di costo sull’hardware specializzato. GPU, server e memoria beneficiano di una supply chain meno turbolenta, con implicazioni dirette sulla pianificazione del TCO.

Jul 01 2026
Hardware

La corsa AI traina i connettori taiwanesi, ma costi e forniture offuscano il 2026

I produttori taiwanesi di connettori guardano al secondo semestre 2026 con fiducia per la domanda legata all’AI, ma l’aumento dei costi e le strozzature logistiche minacciano i piani di crescita. Un campanello d’allarme per chi realizza infrastrutture on-premise per Large Language Models: la componentistica di interconnessione può diventare il prossimo collo di bottiglia, influenzando Total Cost of Ownership e tempi di deploy.

Jul 01 2026
Market

La guerra dei profitti nell’auto spinge l’IA on-premise

La prevista stretta sui margini nel terzo trimestre 2026 costringe i fornitori auto a ricercare nuove efficienze. L’intelligenza artificiale, soprattutto con deployment on-premise, diventa un pilastro per proteggere dati industriali e contenere i costi a lungo termine.

Jul 01 2026
Hardware

NVIDIA Vera, Arc Pro B70 e le ottimizzazioni Linux che hanno infiammato il Q2

Il Q2 ha visto lettori Linux entusiasti per la futura CPU Vera di NVIDIA, la scheda Intel Arc Pro B70 e una serie di miglioramenti delle performance. Per il deployment on-premise di modelli AI, queste novità aprono scenari di maggiore controllo dei costi e sovranità dei dati, tra architetture integrate e alternative al cloud.

Jul 01 2026
Altro

Claude Code e la steganografia nascosta nelle richieste: tracciamento invisibile per i prompt

Un recente report porta alla luce una pratica controversa: Claude Code, l’assistente di Anthropic per la programmazione, inserirebbe marcatori steganografici nelle richieste. Una scelta tecnica che apre interrogativi profondi su tracciabilità, privacy e sovranità del codice generato, con implicazioni dirette per chi valuta deployment on-premise e controllo delle informazioni.

Jun 30 2026
LLM

64 GB di VRAM e LLM per coding: l’esperimento on-premise con Qwen 3.5 122b

Un utente Reddit con 64 GB di VRAM condivide la sua esperienza di inference locale con una versione Unsloth di Qwen 3.5 122b-a10b, quantizzato UD-IQ4_NL, finestra di contesto 100.000 token e velocità di circa 30 tok/sec. L’architettura MoE consente di attivare solo 10 miliardi di parametri, mantenendo la qualità del coding pur con layer parzialmente su CPU. La discussione riaccende il dibattito sulla fattibilità dei grandi modelli assistenti alla programmazione in ambienti on-premise vincolati dalla memoria video.

Jun 30 2026
Altro

Trump allenta i controlli sull’export per i modelli AI Mythos e Fable di Anthropic

Dopo settimane di blocco per i cittadini stranieri, l’amministrazione americana rimuove le restrizioni sui modelli più avanzati di Anthropic. La mossa segnala l’imprevedibilità delle politiche di export tech e può ridefinire le strategie di deployment on-premise, toccando sovranità dei dati e compliance internazionale.

Jun 30 2026
Altro

COSMIC Epoch 1.2 risolve i flickering su GPU Intel: System76 lima il desktop Rust

A una settimana dalla 1.1, System76 rilascia COSMIC Epoch 1.2 con una correzione mirata per i disturbi grafici su hardware Intel. Il continuo affinamento del desktop scritto in Rust segnala un’attenzione crescente all’affidabilità delle workstation Linux, terreno fertile per chi sviluppa o esegue LLM in locale.

Jun 30 2026
LLM

Claude Science è la nuova scommessa scientifica di Anthropic

Anthropic ha annunciato Claude Science, un prodotto standalone per la ricerca in biologia computazionale e sviluppo farmaci. Simile a Claude Code, opera in autonomia su istruzioni ad alto livello. L'azienda lo userà anche per studiare farmaci per malattie rare, mentre prepara l'IPO e cerca nuovi contratti farmaceutici.

Jun 30 2026
Altro

OpenClaw sbarca su Android e iOS: l’agente AI open source arriva in tasca

Il programma agentico open source OpenClaw è finalmente disponibile su smartphone. Una mossa che porta capacità autonome direttamente sui dispositivi mobili, con ricadute su latenza, privacy e sovranità dei dati. Per chi valuta deployment on-premise, il passaggio segna un’evoluzione importante nell’edge computing per l’intelligenza artificiale.

Jun 30 2026
Market

Google sforna Nano Banana 2 Lite: immagini in 4 secondi a meno di 4 centesimi per mille

Google ha rilasciato Nano Banana 2 Lite, il modello più veloce ed economico della sua famiglia di generatori di immagini. In 4 secondi produce un’immagine a un costo inferiore a 4 centesimi di dollaro ogni mille richieste, un segnale per chi sviluppa su larga scala. AI-RADAR analizza cosa significa per chi valuta deployment on-premise e in cloud, tra vantaggi, rischi e alternative self-hosted.

Jun 30 2026
Market

Da DeepMind ai quant: il trio del poker AI vale 500 milioni

EquiLibre Technologies, laboratorio AI con base a Praga fondato da tre ex ricercatori di DeepMind, ha raggiunto una valutazione superiore a 500 milioni di dollari. I fondatori, noti per aver sviluppato un’IA di successo nel poker, portano ora modelli predittivi negli hedge fund quantitativi. La notizia riaccende il dibattito sul deployment on-premise per carichi finanziari: latenza, controllo dei dati e conformità spingono verso stack locali, un tema caro ad AI-RADAR.

Jun 30 2026
Altro

Virginia: 37 data center e le scuole devono risparmiare elettricità

La contea di Henrico, in Virginia, ha inviato una richiesta di risparmio energetico ai dipendenti pubblici: le tariffe elettriche aumenteranno del 25%, con un costo aggiuntivo di 5 milioni di dollari. Il paradosso: la contea ospita 37 data center, e altri 17 sono in progetto. Un caso che illumina i costi nascosti dell’infrastruttura digitale e pone interrogativi su chi sostiene veramente la fame di energia dei servizi AI e cloud.

Jun 30 2026
Frameworks

GraalVM 25.1.3: un Hello World da 6,5 MB con Native Image

GraalVM Community Edition 25.1.3 riduce l'impronta di un programma minimo a soli 6,5 MB, segnando un passo avanti nell'ottimizzazione delle applicazioni Java e poliglotte. La compilazione ahead-of-time (AOT) si conferma alleata per ambienti containerizzati e deployment on-premise che richiedono startup rapida e consumo ridotto di risorse.

Jun 30 2026
Altro

L'illusione dei guardrail: i browser AI possono essere raggirati con un sito web

Nuova ricerca mostra come un sito malevolo possa spingere i browser basati su LLM in uno stato onirico dove le restrizioni di sicurezza vengono disattivate. L'attaccante ottiene così accesso a repository privati e gestori di credenziali. Un campanello d'allarme per chiunque integri agenti IA con dati sensibili.

Jun 30 2026
Hardware

xTool 01 Omni Printer: la stampa UV arriva su tutte le superfici fino a 5 mm

xTool debutta nella stampa UV con la Omni 01, una macchina che promette di imprimere su qualsiasi materiale, fino a 5 mm di spessore. Una mossa che rafforza la tendenza a portare in sede processi produttivi completi, con ricadute sul controllo e sulla protezione della proprietà intellettuale.

Jun 30 2026
LLM

Google accelera e ottimizza i costi per la generazione di immagini AI con Nano Banana 2 Lite

Google ha annunciato un aggiornamento significativo per il suo generatore di immagini AI, Nano Banana 2 Lite, promettendo maggiore velocità e costi operativi ridotti. Questa evoluzione mira a rendere lo strumento più accessibile ed efficiente per i creatori di contenuti, con implicazioni rilevanti per le strategie di deployment AI e la valutazione del Total Cost of Ownership.

Jun 30 2026
LLM

Anthropic lancia Claude Sonnet 5: agentività avanzata a costi ridotti

Anthropic ha rilasciato Claude Sonnet 5, un LLM mid-tier progettato per l'agentività, capace di operare in modo simile al modello flagship Opus 4.8 ma con costi inferiori della metà. Questa offerta mira a ridefinire il rapporto tra performance e TCO per le aziende che valutano soluzioni AI, influenzando le strategie di deployment on-premise e cloud.

Jun 30 2026
LLM

Google DeepMind lancia Nano Banana 2 Lite: velocità e costi ridotti per la generazione di immagini

Google DeepMind ha presentato Nano Banana 2 Lite, un nuovo modello di generazione di immagini della famiglia Gemini 3.1. Progettato per bilanciare qualità e velocità, si distingue per essere più rapido ed economico rispetto ai modelli precedenti di Google. Sebbene sia ottimizzato per il prototyping rapido, dove la qualità può essere meno critica, l'azienda ne evidenzia le capacità, pur riconoscendo limiti nella gestione di testo piccolo e coerenza dei personaggi. Il modello è disponibile nell'ecosistema Google.

Jun 30 2026
Altro

La governance dei contenuti: la base mancante per l'AI aziendale

Le iniziative di AI in azienda faticano a decollare perché le organizzazioni trascurano la governance dei contenuti, trattando il linguaggio come dati strutturati. Rob Hanna di Precision Content sottolinea come i team di comunicazione tecnica possiedano già le competenze per creare una base solida. Per il successo dell'AI aziendale, la gestione affidabile della conoscenza è più critica di nuove scoperte tecniciche, con implicazioni dirette per chi valuta deployment on-premise e la sovranità dei dati.

Jun 30 2026
Frameworks

Anthropic presenta Claude Science: l'ambiente AI per la ricerca scientifica

Anthropic ha introdotto Claude Science, una piattaforma progettata per consolidare gli strumenti di ricerca e automatizzare processi complessi tramite agenti AI. Disponibile in beta dal 30 giugno 2026, questa soluzione rappresenta un'espansione strategica di Anthropic nel settore della ricerca scientifica, mirando a ottimizzare l'efficienza nei laboratori.

Jun 30 2026
LLM

Anthropic lancia Claude Sonnet 5: nuove sfide per i deployment on-premise

Anthropic ha annunciato Claude Sonnet 5, l'ultima iterazione della sua famiglia di Large Language Models. Questo rilascio solleva interrogativi cruciali per le aziende che valutano strategie di deployment self-hosted, ponendo l'accento su requisiti hardware, TCO e sovranità dei dati in un panorama AI in continua evoluzione.

Jun 30 2026
Market

Etched sfida Nvidia con chip AI custom: valutazione da 5 miliardi e 1 miliardo di ordini

La startup Etched ha chiuso un round da 500 milioni a una valutazione di 5 miliardi, portando il totale raccolto a 800 milioni, e ha già contratti per un miliardo di dollari per sistemi completi di inference. Il chip, prodotto da TSMC, promette di accelerare l’inference degli LLM in modo più economico ed efficiente, puntando a un mercato dove il costo dell’inference è il collo di bottiglia principale per le aziende AI.

Jun 30 2026
LLM

Anthropic lancia Claude Sonnet 5: capacità agentive avanzate e costi ottimizzati

Anthropic ha presentato Claude Sonnet 5, un Large Language Model che promette capacità agentive più robuste, maggiore sicurezza e un costo inferiore. Posizionandosi come alternativa economica a modelli come Claude Opus, GPT-5.5 e Gemini Pro, Sonnet 5 mira a rendere più accessibile lo sviluppo e l'esecuzione di agenti AI, con implicazioni significative per le strategie di deployment e l'analisi del Total Cost of Ownership (TCO).

Jun 30 2026
General

La Guerra di Sovranità dei Modelli di Frontiera: È la "Costellazione ChatGPT 6.6" la Risposta Adeguata al Battaglione AI di Anthropic?

The frontier artificial intelligence landscape of mid-2026 has officially graduated from a polite, academic pursuit of benchmark superiority into a highly militarized, vertically integrated struggle for global infrastructure and operational sovereignity.

Jun 30 2026
Market

L'AI parla "da cavernicolo": la strategia delle aziende per abbattere i costi degli LLM

Per contenere la spesa crescente legata all'uso dei Large Language Models, diverse aziende, inclusi sviluppatori di OpenAI, Nvidia e GitHub, stanno adottando un approccio che rende le risposte degli LLM più concise. Questa "dieta" di token mira a ridurre i costi operativi imprevedibili, evidenziando come l'efficienza stia diventando una priorità strategica nel deployment dell'AI.

Jun 30 2026
Market

Il progetto Cannes di Meta: account falsi di minorenni per mettere alla prova ChatGPT e Gemini

WIRED svela che Meta ha fatto creare centinaia di profili fake di adolescenti. Per mesi hanno inviato decine di migliaia di prompt estremi – suicidio, autolesionismo, richieste di farmaci – a ChatGPT, Gemini e Character.AI. Un test che i rivali non hanno mai autorizzato e che accende un faro sulla zona grigia tra sicurezza e spionaggio competitivo, mentre le autorità USA e UE indagano.

Jun 30 2026
Altro

New Glenn: l’esplosione inspiegata e le fragilità dell’infrastruttura on-premise

Blue Origin non sa ancora perché il New Glenn sia esploso a maggio. Danni gravi alla rampa, ma si punta a volare entro il 2026. La vicenda mostra criticità comuni ai sistemi self-hosted, dalla supply chain all'analisi delle cause.

Jun 30 2026
Frameworks

Anthropic lancia Claude Science: un ambiente AI per la ricerca scientifica

Anthropic ha reso disponibile Claude Science, una piattaforma di lavoro basata sull'intelligenza artificiale pensata specificamente per gli scienziati. Questo strumento mira a supportare la ricerca, sollevando questioni cruciali su gestione dei dati, requisiti infrastrutturali e le implicazioni per i deployment on-premise in contesti scientifici sensibili.

Jun 30 2026
LLM

PageStorm: Un LLM per la Scrittura Creativa di Libri, Ora in Anteprima

Pageshift Entertainment ha presentato PageStorm Research Preview, il suo primo Large Language Model progettato per la scrittura creativa di libri completi in un'unica iterazione. Il progetto, avviato oltre un anno fa, si basa sul LongPage Dataset. L'annuncio evidenzia la crescente specializzazione degli LLM e le opportunità per le aziende di esplorare soluzioni on-premise per la gestione di contenuti sensibili e la personalizzazione.

Jun 30 2026
Frameworks

Claude Science di Anthropic: un ambiente unificato per ottimizzare la ricerca computazionale

Anthropic ha introdotto Claude Science, una piattaforma che funge da ambiente di lavoro integrato per i ricercatori. L'obiettivo è semplificare la ricerca computazionale, eliminando la necessità di passare continuamente tra database, pipeline e strumenti diversi. Questa iniziativa si concentra sull'ottimizzazione del workflow piuttosto che sull'introduzione di un nuovo Large Language Model, offrendo un approccio olistico alla gestione dei progetti scientifici basati su AI.

Jun 30 2026
Altro

Il piano di Trump per i siti .gov: l'AI e la sfida della riprogettazione su larga scala

L'iniziativa 'America by Design' dell'ex presidente Donald Trump mirava a riprogettare 27.000 siti web governativi statunitensi in tre anni, affidandosi all'AI e a un nuovo ente, il National Design Studio. Tuttavia, il progetto ha incontrato significative difficoltà, evidenziando le complessità dei deployment su vasta scala e la gestione delle risorse tecniciche, un tema cruciale per chi valuta soluzioni on-premise e la sovranità dei dati.

Jun 30 2026
Altro

GeneBench-Pro: Un Nuovo Benchmark per l'AI nella Ricerca Scientifica

È stato presentato GeneBench-Pro, un nuovo benchmark progettato per valutare le performance dell'intelligenza artificiale in ambiti critici come la genomica, la biologia e la ricerca scientifica. Utilizzando dataset complessi e realistici, mira a fornire metriche affidabili per le decisioni infrastrutturali, specialmente per chi considera deployment on-premise dove sovranità dei dati e controllo sono prioritari.

Jun 30 2026
LLM

SkillOpt: Ottimizzare le 'skill' degli agenti LLM senza toccare i pesi del modello

SkillOpt introduce un approccio innovativo per migliorare l'affidabilità degli agenti basati su Large Language Models (LLM), trattando le loro 'skill' come parametri addestrabili. Questo processo di ottimizzazione avviene esternamente ai pesi del modello, garantendo guadagni di performance significativi e 'skill' compatte e verificabili. La metodologia promette di rendere i deployment di agenti AI più robusti e gestibili, riducendo la necessità di 'fine-tuning' intensivo e migliorando l'efficienza anche per modelli più piccoli.

Jun 30 2026
Market

8090 di Chamath Palihapitiya: 135 milioni per la gestione del codice AI in azienda

La startup 8090, guidata da Chamath Palihapitiya, ha chiuso un round di finanziamento Series A da 135 milioni di dollari, con Salesforce come investitore principale. L'azienda mira a risolvere la complessità della gestione del codice software enterprise, dove l'introduzione di agenti AI e l'intervento di numerosi ingegneri possono compromettere la stabilità. Il focus è sulla coesione e l'integrità del software in ambienti di sviluppo dinamici, una sfida cruciale per le infrastrutture IT moderne.

Jun 30 2026
Altro

Linux 7.2: Aggiornamenti Chiave per Scheduling e Supporto Hardware AMD

La prossima versione del kernel Linux, la 7.2, in arrivo ad agosto, introduce significative novità. Tra queste, miglioramenti allo scheduling, al supporto USB4STREAM e driver aggiornati per le GPU AMD, inclusi HDMI 2.1 FRL e ISP4. Questi aggiornamenti sono cruciali per ottimizzare le performance dei sistemi, con implicazioni dirette per chi gestisce carichi di lavoro AI su infrastrutture on-premise, dove il controllo e l'efficienza hardware sono prioritari.

Jun 30 2026
Hardware

Etched: 800 milioni per chip AI focalizzati sull'inference, con il supporto di TSMC

La startup Etched ha raccolto 800 milioni di dollari, con il supporto di Jane Street e VentureTech Alliance, legata a TSMC. L'azienda si concentra sulla progettazione di chip specifici per l'esecuzione (inference) di modelli AI, distinguendosi dai competitor che mirano al training. Ha già siglato contratti di vendita per un miliardo di dollari, segnalando un forte interesse del mercato per soluzioni hardware ottimizzate per il deployment on-premise.

Jun 30 2026
LLM

Bartowski Rilascia DeepSeek-V4-Flash in Formato GGUF per Deployment Locali

Bartowski ha reso disponibile su Hugging Face una versione del Large Language Model DeepSeek-V4-Flash nel formato GGUF. Questa release è significativa per chi cerca soluzioni di Inference on-premise, abilitando l'esecuzione efficiente del modello su hardware locale e aprendo la strada a confronti diretti con altre quantization ottimizzate, come la versione "imamtrix" di Antirez.

Jun 30 2026
Altro

OpenAI: un'analisi approfondita dei core dump svela un difetto hardware e un bug software diciottenne

Gli ingegneri di OpenAI hanno impiegato un'analisi su larga scala dei core dump per diagnosticare rari crash infrastrutturali. Questo approccio ha permesso di identificare non solo un guasto hardware, ma anche un bug software persistente da ben diciotto anni. La vicenda sottolinea l'importanza di strumenti diagnostici avanzati per la stabilità di sistemi complessi, un aspetto cruciale anche per i deployment on-premise.

Jun 30 2026
LLM

L'espansione di ChatGPT: implicazioni per l'infrastruttura AI aziendale

I dati di OpenAI Signals rivelano una crescita globale nell'adozione di ChatGPT, con un aumento dell'utilizzo e dell'esplorazione delle sue capacità. Questa tendenza solleva questioni cruciali per le aziende riguardo le strategie di deployment degli LLM, bilanciando agilità cloud e controllo on-premise per sovranità dei dati e TCO.

Jun 30 2026
Frameworks

X semplifica l'integrazione AI con un server Model Context Protocol ospitato

X ha introdotto un server Model Context Protocol (MCP) ospitato, permettendo a strumenti AI come Claude, Cursor e Grok Build di connettersi direttamente alla sua API. Questa soluzione elimina la necessità per gli sviluppatori di creare infrastrutture di integrazione personalizzate e gestire l'autenticazione, snellendo il processo di collegamento e sfruttando le autorizzazioni esistenti degli utenti. La mossa mira a ridurre il carico di lavoro per chi sviluppa applicazioni AI, pur sollevando considerazioni per i deployment on-premise.

Jun 30 2026
Market

AI e mercati: la Bank of England avverte sui rischi degli agenti autonomi

Sarah Breeden, Vice Governatrice della Bank of England, ha lanciato un allarme sui potenziali pericoli degli agenti di trading autonomi basati su intelligenza artificiale. Secondo Breeden, questi sistemi potrebbero amplificare la volatilità dei mercati finanziari, innescando cicli di feedback destabilizzanti se reagiscono in modo uniforme e simultaneo. La situazione potrebbe rendere necessarie nuove regolamentazioni per mitigare i rischi.

Jun 30 2026
Market

L'UE apre un'indagine antitrust su Align per il 'tying' di scanner e allineatori

La Commissione europea ha avviato un'indagine formale su Align Technology, sospettata di legare illegalmente gli scanner iTero agli allineatori Invisalign. La pratica, nota come tying, potrebbe aver distorto la concorrenza nel mercato degli apparecchi ortodontici trasparenti. Partita da un reclamo di un concorrente, l'istruttoria si inserisce nella strategia Ue di contrasto agli abusi di posizione dominante, con possibili conseguenze su multe e cambiamenti commerciali.

Jun 30 2026
Altro

X lancia un server MCP ospitato per semplificare l'integrazione AI

X ha introdotto un server MCP in modalità hosted, pensato per facilitare l'integrazione delle applicazioni AI con le sue API. Questa mossa mira a ridurre la complessità per gli sviluppatori, consentendo una connessione più rapida e diretta tra gli strumenti di intelligenza artificiale e la piattaforma dell'azienda, con implicazioni sulle strategie di deployment cloud e on-premise.

Jun 30 2026
Altro

Marc Andreessen nel board del Pentagono: il confine tra tech e difesa si assottiglia

L'ingresso di Marc Andreessen, co-fondatore di Andreessen Horowitz, nel Defense Policy Board del Pentagono solleva interrogativi sui potenziali conflitti di interesse. La sua nomina, seppur legale, evidenzia la crescente interconnessione tra il settore tecnicico privato e le decisioni strategiche della difesa, in particolare in ambiti come la modernizzazione e la struttura delle forze armate, con implicazioni per le future strategie di deployment tecnicico.

Jun 30 2026
Market

Un investimento da 55 milioni di dollari per l'AI nella diagnosi precoce del cancro

Un nuovo istituto al Basser Center di Penn, finanziato con 55 milioni di dollari, impiegherà l'intelligenza artificiale e i biomarcatori per intercettare i tumori ereditari nelle fasi iniziali. L'iniziativa mira a prevenire la malattia prima che si manifesti, un approccio innovativo rispetto ai tradizionali finanziamenti per la cura.

Jun 30 2026
Hardware

AMD accelera sull’AI locale: GAIA, Lemonade e il futuro delle LLM on-prem

Nel secondo trimestre 2026 AMD ha concentrato gli sforzi sul fronte locale: dai nuovi progressi di GAIA, capace di interagire con Gmail tramite pipeline LLM self-hosted, a Lemonade SDK ridotto del 90%, fino all’arrivo di ROCm nei repository Ubuntu. Intanto un LLM rodato su hardware Ryzen AI Max scova bug del kernel Linux. Una spinta che interroga chi valuta deployment on-premise: controllo, TCO e sovranità dei dati diventano più accessibili su hardware consumer e professionale.

Jun 30 2026
Altro

Lumo 2.0 di Proton: un chatbot AI con focus sulla privacy si aggiorna

Proton, noto per i suoi servizi attenti alla privacy, ha annunciato Lumo 2.0, la nuova versione del suo chatbot basato su intelligenza artificiale. L'aggiornamento introduce una gamma più ampia di funzionalità, rafforzando l'impegno dell'azienda verso soluzioni AI che tutelano la sovranità dei dati e la riservatezza degli utenti, un aspetto cruciale per le aziende che valutano deployment on-premise.

Jun 30 2026
Market

SAP riorganizza la leadership: l'AI al centro della strategia

SAP, il colosso europeo del software, ha riorganizzato per la seconda volta quest'anno le sue responsabilità di prodotto e ingegneria, ponendo l'intelligenza artificiale al centro. La supervisione dei prodotti AI è ora affidata direttamente al CEO e al COO, segnalando un'accelerazione strategica. Questa mossa evidenzia l'importanza critica dell'AI per le grandi aziende e le decisioni infrastrutturali che ne derivano.

Jun 30 2026
Market

Omnea e Firedrop investono nei talenti AI: nasce il Future Founders Fund

Omnea, azienda londinese specializzata in piattaforme di orchestrazione AI-native per il procurement, ha lanciato il Future Founders Fund in partnership con Firedrop. L'iniziativa offre 250.000 dollari in seed funding e supporto operativo ai dipendenti con almeno cinque anni di esperienza che desiderano avviare la propria attività, sottolineando l'importanza della coltivazione interna di competenze nel settore AI e le implicazioni per le future scelte infrastrutturali.

← Precedente Page 3 / 143 Successiva →