🗄️ Archivio Notizie

Cronologia completa dei segnali AI, ordinati per data.
Total Articles: 14274

Questo archivio e la memoria storica di AI-Radar: lanci di modelli, novita sui framework, cambiamenti infrastrutturali e segnali di mercato raccolti in una timeline ricercabile. Serve per confrontare come sono evolute le narrative, capire quali tecnologie hanno mantenuto trazione e prendere decisioni con contesto storico invece che seguire solo l'hype del momento. Per orientarti piu velocemente puoi passare alle sezioni dedicate LLM, Frameworks, Hardware e alla pillar Trends.

💡 Cerchi qualcosa di specifico? Usa la Barra di Ricerca in alto per una ricerca dettagliata.

Jun 04 2026
LLM

Come le Etichette di Contesto Modificano il Comportamento degli LLM

Una nuova ricerca evidenzia come le etichette di ruolo discorsivo (es. "Instruction:", "Example:") che incapsulano il contesto fornito ai Large Language Models possano alterarne significativamente il comportamento. Lo studio, condotto su modelli come Llama-3 e Qwen2.5, rivela che l'adozione di informazioni fuorvianti può variare drasticamente, fino a 84 punti percentuali, a seconda dell'etichetta utilizzata. Questo suggerisce la necessità di controllare attentamente la presentazione del contesto nei benchmark RAG e di utilizzo degli LLM.

Jun 04 2026
LLM

POLARIS: Piccoli LLM scrivono storie lunghe con 4 A100

Una nuova metodologia di training, POLARIS, permette a modelli LLM open-weight di dimensioni ridotte come Qwen3.5-9B di generare storie creative di lungo formato con qualità elevata e maggiore aderenza alla lunghezza richiesta. Sviluppata con 4 GPU A100, la tecnica si dimostra competitiva con modelli molto più grandi, mantenendo la coerenza anche per testi tre volte superiori alla lunghezza di training.

Jun 04 2026
Hardware

IEEE P3109: Nuovi Formati Aritmetici per l'Efficienza del Machine Learning

Il draft standard IEEE P3109 introduce una famiglia parametrizzata di formati floating-point binari e operazioni associate, ottimizzati per il machine learning. L'obiettivo è una rappresentazione efficiente e consistente dei valori con un numero ridotto di bit, migliorando il throughput e la gestione delle eccezioni. Questi formati sono cruciali per l'ottimizzazione dell'hardware e la riduzione del TCO nei deployment on-premise di carichi di lavoro AI, offrendo maggiore controllo e sovranità dei dati.

Jun 04 2026
Altro

Diagnosi Precoce dell'Alzheimer: Il Ruolo del Machine Learning Spiegabile

Un nuovo studio ha sviluppato un modello di Machine Learning basato su XGBoost per la diagnosi precoce della malattia di Alzheimer, distinguendo tra cognizione normale, lieve deterioramento cognitivo e Alzheimer con elevata accuratezza. Il modello, addestrato su dati clinici di routine, integra la spiegabilità tramite i valori SHAP, un aspetto cruciale per l'adozione in contesti medici e per la gestione della sovranità dei dati in deployment on-premise.

Jun 04 2026
LLM

PEEL: Garantire l'Affidabilità Epistemica degli LLM nella Ricerca

I Large Language Models stanno ridefinendo le pratiche di ricerca, ma sollevano interrogativi sulla responsabilità epistemica. Il framework PEEL (Protocols for Epistemically Engaged Literacy in AI) propone una metodologia che combina strumenti deterministici (Voyant Tools) con l'interpretazione di LLM (Claude) per identificare distorsioni sistematiche nei contenuti generati dall'AI. I risultati sottolineano la necessità di affiancare l'AI con verifiche non-AI, riconoscendo che la fluidità linguistica non equivale a fedeltà e che l'autorità epistemica va integrata nel design.

Jun 04 2026
Altro

Agenti AI Enterprise: Nuovi Standard di Verifica Pre-Deployment con Ontologie

Un nuovo framework basato su ontologie mira a colmare il divario critico nella verifica pre-deployment degli agenti AI enterprise. La soluzione propone un "Agent Operational Envelope", una pipeline di generazione scenari automatizzata e un "Trust Certificate" per attestare la conformità. Uno studio pilota in settori regolamentati ha dimostrato una maggiore copertura normativa rispetto ai metodi tradizionali, offrendo un complemento credibile per chi cerca controllo e sovranità sui propri carichi di lavoro AI.

Jun 04 2026
Hardware

Nvidia e Unitree: un'alleanza per standardizzare lo sviluppo di robot umanoidi AI

Nvidia e Unitree hanno stretto una partnership strategica con l'obiettivo di definire uno standard per lo sviluppo di robot umanoidi basati sull'intelligenza artificiale. L'iniziativa mira a replicare un modello di piattaforma dominante, simile a "Wintel", per accelerare l'innovazione e semplificare il deployment di soluzioni robotiche avanzate, affrontando le complesse sfide legate all'integrazione hardware e software nel settore dell'AI e della robotica.

Jun 04 2026
Hardware

Qualcomm e Snapdragon C: un nuovo attore nel segmento AI PC entry-level

Qualcomm ha annunciato il posizionamento della sua piattaforma Snapdragon C, progettata per colmare il vuoto nel mercato dei PC con capacità AI di fascia entry-level. L'azienda sottolinea che questa offerta non è legata all'ecosistema Apple, mirando a un'ampia adozione in altri segmenti di mercato. Questo posizionamento strategico evidenzia l'espansione dell'hardware dedicato all'intelligenza artificiale direttamente sui dispositivi.

Jun 04 2026
Hardware

La 'Tau Law' di Huawei e il futuro dei chip AI: substrati in vetro e packaging avanzato

Huawei introduce la sua 'Tau Law', un'iniziativa che mira a ridefinire la progettazione dei chip AI attraverso l'adozione di substrati in vetro e tecniche di packaging avanzato. Questa evoluzione tecnicica promette di migliorare significativamente le prestazioni e l'efficienza dei processori dedicati all'intelligenza artificiale, con implicazioni dirette per i deployment on-premise e la sovranità dei dati, offrendo nuove opportunità per architetture più dense e performanti.

Jun 04 2026
Altro

L'UE lancia il pacchetto per la sovranità tecnicica: focus su chip, AI e cloud

L'Unione Europea ha presentato un nuovo pacchetto per la sovranità tecnicica, mirato a rafforzare l'autonomia del continente in settori strategici. L'iniziativa si concentra sullo sviluppo e la protezione delle infrastrutture critiche, inclusi i semiconduttori, l'intelligenza artificiale e le soluzioni cloud. Questo approccio riflette la crescente necessità di controllo sui dati e sulle tecnicie fondamentali, specialmente per le aziende che valutano deployment on-premise e la compliance normativa.

Jun 04 2026
Altro

Data center modulari per l'AI: Kentec ridefinisce l'infrastruttura on-premise

Kentec sta emergendo come attore chiave nel settore dei data center modulari dedicati all'intelligenza artificiale, proponendo un'alternativa alle infrastrutture tradizionali. Questa tendenza risponde alla crescente domanda di soluzioni ottimizzate per i carichi di lavoro AI, con implicazioni significative per il deployment on-premise, la sovranità dei dati e il Total Cost of Ownership.

Jun 04 2026
Altro

Ordine Esecutivo USA sull'AI: Nuovi Vincoli per i LLM 'Potenti'

Un recente ordine esecutivo negli Stati Uniti, firmato dall'amministrazione Trump e rivisto dopo obiezioni del settore, introduce potenziali nuovi requisiti per il rilascio di Large Language Models (LLM) 'potenti' sviluppati negli USA. Si prevede che questi modelli, in particolare quelli open-weight, dovranno superare un processo di revisione di 30 giorni prima di poter essere distribuiti, sollevando preoccupazioni per l'ecosistema AI statunitense.

Jun 04 2026
Altro

Delta Electronics e i sistemi HVDC da 800V: la sfida energetica dell'AI on-premise

Delta Electronics sta promuovendo sistemi di alimentazione HVDC da 800V per i rack AI. Questa soluzione risponde alla crescente domanda energetica dei carichi di lavoro di intelligenza artificiale, che si avvicinano a livelli di megawatt. L'adozione di tali tecnicie è cruciale per le infrastrutture on-premise, dove efficienza e gestione termica sono fattori determinanti per il TCO e la sostenibilità operativa.

Jun 04 2026
Market

Meta rafforza la strategia AI con il Business Agent: cresce la competizione enterprise

Meta ha annunciato l'espansione delle sue iniziative AI con il rilascio di un "Business Agent", un'offerta che intensifica la competizione nel settore enterprise. L'introduzione di questa soluzione solleva interrogativi sulle strategie di pricing e sulle implicazioni per le aziende che valutano deployment di Large Language Models (LLM), spingendo la discussione su controllo, sovranità dei dati e Total Cost of Ownership (TCO) delle infrastrutture AI.

Jun 04 2026
Hardware

Broadcom accelera sui chip AI personalizzati per OpenAI e Anthropic

Broadcom sta intensificando il suo impegno nello sviluppo di chip personalizzati per OpenAI e nell'espansione delle iniziative di calcolo AI per Anthropic. Questa mossa sottolinea la crescente tendenza dei grandi attori dell'intelligenza artificiale a investire in silicio specifico per ottimizzare le prestazioni, l'efficienza energetica e il TCO delle proprie infrastrutture, con implicazioni rilevanti per le strategie di deployment on-premise.

Jun 04 2026
Market

Broadcom punta a 100 miliardi di dollari dai chip AI entro il 2027, escludendo il business dei rack

Broadcom prevede ricavi superiori a 100 miliardi di dollari dal settore dei chip AI entro il 2027, ma si disimpegna dal business dei rack. Questa mossa strategica evidenzia la crescente domanda di silicio specializzato per l'intelligenza artificiale e le diverse strategie dei vendor nell'ecosistema hardware, con implicazioni per le architetture di deployment on-premise.

Jun 04 2026
Market

Pegatron: forte crescita attesa per i server AI, riorganizzazione in fase finale

Pegatron, gigante della produzione elettronica, prevede un'accelerazione significativa nell'espansione del mercato dei server AI, parallelamente al completamento di una riorganizzazione interna. Questa prospettiva evidenzia la crescente domanda di infrastrutture dedicate all'intelligenza artificiale, con implicazioni dirette per le aziende che valutano deployment on-premise per carichi di lavoro LLM, ponendo l'accento su sovranità dei dati e TCO.

Jun 04 2026
Market

MiTAC Computing: fiducia nella crescita dei server AI entro il 2026

MiTAC Computing, attraverso il suo presidente Rick Hwang, esprime ottimismo riguardo all'espansione del mercato dei server AI, prevedendo una crescita robusta entro il 2026. Questa prospettiva sottolinea la crescente domanda di infrastrutture hardware dedicate all'intelligenza artificiale, un fattore chiave per le organizzazioni che mirano a implementare soluzioni di Large Language Models (LLM) on-premise, garantendo controllo e sovranità sui dati.

Jun 04 2026
Market

Broadcom e il mercato AI: prospettive finanziarie e impatto sull'infrastruttura locale

Broadcom ha annunciato previsioni di crescita solide per il terzo trimestre, ma le aspettative sui ricavi generati dall'intelligenza artificiale non hanno raggiunto le stime più ottimistiche del mercato. Questo scenario evidenzia la volatilità delle proiezioni nel settore AI e le sue implicazioni per le strategie di investimento in infrastrutture, specialmente per le aziende che valutano deployment on-premise di Large Language Models.

Jun 04 2026
Altro

OpenAI e Anthropic: l'appello per prevenire armi biologiche basate sull'AI

Le principali aziende e figure di spicco nel campo dell'intelligenza artificiale, tra cui OpenAI e Anthropic, hanno sottoscritto una lettera indirizzata ai legislatori. L'iniziativa mira a sollecitare un miglioramento nei sistemi di tracciamento delle sequenze di DNA sintetico, al fine di mitigare il rischio che l'AI possa essere impiegata nello sviluppo di armi biologiche.

Jun 03 2026
Hardware

Qualcomm lancia Dragonfly: il nuovo brand per i prodotti data center

Qualcomm ha svelato "Dragonfly", il suo nuovo brand dedicato ai prodotti per il data center. L'iniziativa segna un'espansione strategica nel settore, con ulteriori dettagli attesi per il 24 giugno, in occasione dell'Investor's Day 2026 dell'azienda. Questa mossa suggerisce un impegno crescente di Qualcomm nel fornire soluzioni hardware per carichi di lavoro AI e LLM, potenzialmente rilevanti per deployment on-premise e per chi cerca alternative nel mercato.

Jun 03 2026
Altro

Innodisk, Qualcomm e Formosa Plastics: visione industriale con GenAI per la sicurezza

Innodisk, Qualcomm e Formosa Plastics hanno annunciato una collaborazione per introdurre una soluzione di visione industriale basata su intelligenza artificiale generativa. L'iniziativa mira a rafforzare la sicurezza negli ambienti produttivi attraverso l'analisi in tempo reale. Questo approccio evidenzia la crescente adozione di deployment edge e on-premise per applicazioni critiche che richiedono bassa latenza e una rigorosa sovranità dei dati.

Jun 03 2026
Market

Taiwan e la strategia AI: attrarre startup per blindare il futuro dei chip

Taiwan sta intensificando gli sforzi per attrarre startup nel settore dell'intelligenza artificiale. L'obiettivo è consolidare la propria posizione di leadership nella produzione di semiconduttori, un elemento cruciale per l'evoluzione dell'AI. Questa strategia mira a rafforzare l'ecosistema locale e a garantire un ruolo centrale nell'innovazione tecnicica globale, specialmente in un'era dominata dai Large Language Models e dal computing on-premise.

Jun 03 2026
Market

Kioxia valuta un nuovo stabilimento NAND: l'AI spinge l'espansione a lungo termine

Kioxia, uno dei principali produttori di memorie flash NAND, sta considerando la costruzione di un nuovo stabilimento produttivo. Questa mossa strategica è una risposta diretta alla crescente domanda generata dalle applicazioni di intelligenza artificiale, che richiedono capacità di storage sempre maggiori. La decisione si inserisce nei piani di espansione a lungo termine dell'azienda, evidenziando come l'AI stia ridefinendo le priorità di investimento nel settore dei semiconduttori e dello storage.

Jun 03 2026
Market

Strategie di Resilienza per l'Framework AI: Oltre la Corsa alla Produzione

Il settore dell'intelligenza artificiale sta evolvendo, passando da una mera corsa alla potenza di calcolo a una strategia incentrata sulla resilienza infrastrutturale. Questo approccio è cruciale per le aziende che cercano sovranità sui dati, stabilità della supply chain e controllo sui costi operativi a lungo termine, privilegiando spesso il deployment on-premise per i carichi di lavoro LLM.

Jun 03 2026
Altro

800VDC: Una Svolta per i Data Center, tra Sfide Normative e di Filiera

L'adozione di sistemi di alimentazione a corrente continua (DC) a 800 Volt (800VDC) promette di rivoluzionare i data center, migliorando efficienza e densità di potenza, cruciali per i carichi di lavoro AI e LLM. Tuttavia, la sua diffusione è rallentata da normative ancora assenti e da catene di approvvigionamento immature, creando incertezza per gli operatori e i fornitori. La tecnicia offre vantaggi significativi per le infrastrutture on-premise, ma richiede un'attenta valutazione dei trade-off.

Jun 03 2026
Altro

Wasmer e l'AI generativa: sviluppo rapido di runtime Node.js per l'edge

Wasmer ha sfruttato Codex e GPT-5.5 per accelerare lo sviluppo di un runtime Node.js ottimizzato per l'edge. L'adozione di questi strumenti di intelligenza artificiale ha permesso all'azienda di ridurre drasticamente i tempi di realizzazione, passando da mesi a poche settimane e ottenendo un'accelerazione dello sviluppo tra 10x e 20x. Questo approccio evidenzia il potenziale dell'AI nel migliorare l'efficienza dei team di sviluppo che operano su infrastrutture distribuite.

Jun 03 2026
Market

Aziende manipolano i chatbot AI sfruttando Reddit e l'AEO

Un'indagine rivela come alcune aziende stiano sistematicamente manipolando i chatbot AI, inclusi ChatGPT e Google AI Search, inondando Reddit con contenuti promozionali. La tattica, definita "AI Engine Optimization" (AEO), mira a influenzare le risposte dei Large Language Models (LLM) agendo direttamente sulle fonti di dati che essi acquisiscono. Il caso del subreddit r/biohackers evidenzia i rischi per l'integrità delle informazioni e la qualità dei contenuti online.

Jun 03 2026
Altro

Allarme sicurezza: un pacchetto npm per OpenAI Codex rubava token agli sviluppatori

Un pacchetto npm ampiamente utilizzato, `codexui-android`, che offriva un'interfaccia web remota per OpenAI Codex, ha rubato silenziosamente i token degli sviluppatori per circa un mese. Nonostante apparisse legittimo con 29.000 download settimanali e un repository GitHub attivo, l'incidente evidenzia i rischi della supply chain del software e le implicazioni per la sovranità dei dati nei deployment di Large Language Models.

Jun 03 2026
Altro

Chatbot AI di Meta: un errore di verifica espone account Instagram

Un recente incidente ha mostrato come gli hacker abbiano compromesso account Instagram di alto profilo, non tramite tecniche tradizionali, ma semplicemente ingannando un chatbot di supporto AI di Meta. Il bot ha modificato l'indirizzo email di un utente senza adeguata verifica dell'identità, evidenziando le sfide di sicurezza nell'integrazione degli LLM in sistemi critici.

Jun 03 2026
Market

Uber riorganizza la divisione HR: tagli al 23% dei ruoli

Uber ha annunciato una significativa riorganizzazione interna, eliminando il 23% delle posizioni nella sua divisione "People and Places", responsabile di risorse umane e cultura aziendale. I tagli, che colpiscono anche ruoli senior, arrivano a poche settimane dall'ampliamento delle responsabilità della presidente Jill Hazelbaker, segnalando una fase di ridefinizione strategica per l'azienda.

Jun 03 2026
LLM

Qwen3.5-9B supera Gemma-4-12B-it nei benchmark: efficienza e performance a confronto

Un'analisi comparativa sui benchmark ufficiali di Hugging Face rivela che Qwen3.5-9B supera Gemma-4-12B-it in 5 degli 8 test, nonostante un footprint e un KV cache più leggeri. Questo suggerisce una maggiore efficienza per Qwen, un fattore cruciale per i deployment LLM on-premise, dove l'ottimizzazione delle risorse hardware e il TCO sono prioritari.

Jun 03 2026
Altro

Google sotto la lente del Regno Unito: più controllo editoriale sull'AI nella ricerca

L'autorità britannica per la concorrenza (CMA) ha imposto a Google nuove regole per le funzionalità di ricerca basate sull'intelligenza artificiale. Google dovrà garantire attribuzioni più chiare ai contenuti degli editori e offrire loro la possibilità di escludere i propri materiali dalle risposte generate dall'AI, senza subire penalizzazioni. Questa decisione, definita una "prima mondiale", mira a rafforzare la posizione negoziale degli editori e la fiducia dei consumatori.

Jun 03 2026
LLM

GPT-Rosalind si evolve: nuove capacità per la ricerca nelle scienze della vita

GPT-Rosalind, un Large Language Model specializzato, introduce nuove funzionalità che potenziano la ricerca nelle scienze della vita. Le innovazioni includono un ragionamento biologico avanzato, competenze in chimica medicinale, analisi genomica e gestione dei workflow sperimentali, promettendo di accelerare scoperte e processi in un settore ad alta intensità di dati.

Jun 03 2026
Altro

GitHub.dev: un click di troppo e l'accesso ai repository privati è garantito

L'editor browser-based GitHub.dev, attivabile con un semplice tasto, rilascia silenziosamente un token OAuth. Questo token concede accesso in lettura e scrittura a tutti i repository privati dell'utente, spesso senza che il developer ne sia consapevole. Una comodità che solleva interrogativi sulla sicurezza e sul controllo dei dati, specialmente in contesti dove la sovranità delle informazioni è cruciale per le strategie di deployment on-premise.

Jun 03 2026
Altro

L'impatto dell'AI sulla rete elettrica europea: l'UE chiede di ridurre i consumi

La Commissione Europea ha invitato i cittadini a ridurre il consumo di elettricità nelle ore di punta. La causa principale è la rapida crescita dei data center AI, che, insieme all'elettrificazione e alla domanda di infrastrutture digitali, sta mettendo sotto pressione le reti energetiche europee. L'iniziativa coincide con un pacchetto sull'efficienza energetica dei data center, pubblicato il 3 giugno, che mira a mitigare tali impatti.

Jun 03 2026
Altro

Google Dreambeans: l'AI che trasforma i dati personali in storie illustrate

Google ha presentato Dreambeans, un nuovo strumento basato su intelligenza artificiale che genera "storie" illustrate a partire dai dati personali degli utenti Google. Questa iniziativa solleva questioni rilevanti sulla gestione della privacy e sull'architettura di deployment per carichi di lavoro AI che elaborano informazioni sensibili, un tema centrale per le aziende che valutano soluzioni on-premise per la sovranità dei dati.

Jun 03 2026
Altro

La sicurezza nell'era dell'AI: nuove sfide per i deployment aziendali

L'adozione rapida dell'intelligenza artificiale nelle applicazioni aziendali sta creando pressioni inedite sui team di sicurezza. Le applicazioni basate su AI introducono superfici di attacco sconosciute, comportamenti imprevedibili e nuove vie per gli aggressori per manipolare gli input, accedere ai dati o concatenare vulnerabilità. È cruciale ripensare le strategie di protezione per garantire la resilienza dei sistemi.

Jun 03 2026
Altro

xAI chiede la revoca dell'anonimato per le presunte vittime di deepfake Grok

xAI, l'azienda di intelligenza artificiale di Elon Musk, ha chiesto a un tribunale di obbligare quattro querelanti, che sostengono di essere vittime di deepfake a sfondo intimo generati da Grok, a rivelare le proprie identità. Le persone coinvolte avevano agito in giudizio sotto pseudonimo, citando i rischi legati alla loro identificazione pubblica, ponendole di fronte a una difficile scelta tra privacy e prosecuzione della causa.

Jun 03 2026
Altro

Ordine Esecutivo USA su AI: Test Volontari e Critiche alla Regolamentazione

L'amministrazione Trump ha firmato un ordine esecutivo per promuovere test di sicurezza volontari sui Large Language Models (LLM) “frontier”. Nonostante l'intento dichiarato di garantire un deployment sicuro, i critici lo considerano un provvedimento “annacquato” che offre rassicurazioni superficiali senza imporre requisiti vincolanti alle aziende. L'iniziativa segue tensioni interne tra esperti di cybersecurity e sostenitori della deregolamentazione, sollevando interrogativi sull'efficacia della supervisione governativa.

Jun 03 2026
LLM

Gemma 4 12B: un modello multimodale unificato per l'AI on-premise

È stato presentato Gemma 4 12B, un nuovo modello multimodale unificato e 'encoder-free'. Questa architettura innovativa promette di semplificare i carichi di lavoro AI che combinano testo e altri media, offrendo nuove opportunità per deployment on-premise dove il controllo dei dati e l'ottimizzazione delle risorse hardware sono prioritari per le aziende.

Jun 03 2026
Hardware

MSI Claw 8 EX AI+ e Intel Arc G3 Extreme: l'AI on-device nei palmari

MSI ha presentato il Claw 8 EX AI+, un palmare gaming che integra la GPU Intel Arc G3 Extreme, un display da 8 pollici a 120 Hz e nuove impugnature ergonomiche. Questo dispositivo evidenzia la crescente tendenza all'integrazione di capacità AI direttamente nell'hardware consumer, spingendo verso l'elaborazione on-device e l'inference locale, un tema rilevante anche per le strategie di deployment AI aziendali all'edge.

Jun 03 2026
Altro

OpenAI definisce l'agenda di policy per un'IA responsabile

OpenAI ha delineato la sua agenda di policy pubblica per l'intelligenza artificiale, focalizzandosi su sicurezza, protezione dei giovani, transizione della forza lavoro e standard globali. L'obiettivo è garantire che l'IA apporti benefici concreti alla società, indirizzando le sfide etiche e pratiche legate al suo sviluppo e deployment.

Jun 03 2026
Altro

OpenAI propone un framework federale per la governance dell'AI di frontiera negli USA

OpenAI ha presentato una proposta per la governance dell'intelligenza artificiale di frontiera negli Stati Uniti. Il piano suggerisce un framework federale incentrato su sicurezza, resilienza e protezione nazionale, delineando un potenziale percorso per la regolamentazione di queste tecnicie emergenti.

Jun 03 2026
LLM

Gemma 4: La community chiede una variante da 124 miliardi di parametri

La community di sviluppatori e professionisti AI sta esprimendo un forte interesse per una versione più grande del modello Gemma 4 di Google, in particolare una variante da 124 miliardi di parametri. Attualmente, il modello Gemma 4 da 12B è apprezzato per le sue capacità, ma la richiesta di una versione più potente evidenzia la necessità di LLM con maggiore complessità per carichi di lavoro enterprise. Questa spinta riflette le crescenti esigenze di performance e controllo nei deployment on-premise, dove la dimensione del modello incide direttamente sui requisiti hardware e sul TCO.

Jun 03 2026
LLM

Meta AI e la manipolazione: implicazioni per la sicurezza dei Large Language Models

Un recente episodio ha messo in luce le vulnerabilità dei Large Language Models (LLM): hacker sono riusciti a manipolare l'AI di Meta per ottenere accesso a un account Instagram, semplicemente chiedendole di modificare un indirizzo email. Questo incidente, insieme a un caso simile di frode interna su un sistema di tracciamento AI di Amazon, solleva interrogativi cruciali sulla sicurezza, il controllo e la sovranità dei dati in contesti di deployment AI, sia cloud che on-premise, evidenziando la necessità di robuste strategie di mitigazione.

Jun 03 2026
LLM

Google DeepMind lancia Gemma 4: LLM aperti e multimodali per ogni scala

Google DeepMind ha rilasciato Gemma 4, una famiglia di Large Language Models aperti e multimodali. Disponibili in diverse dimensioni, da E2B a 31B, supportano architetture Dense e Mixture-of-Experts (MoE). Con una finestra di contesto fino a 256K token e ottimizzati per deployment su dispositivi locali, laptop e server, i modelli Gemma 4 offrono flessibilità per carichi di lavoro AI on-premise, garantendo controllo e sovranità dei dati.

Jun 03 2026
LLM

Qwen 3.6 27B e il limite di contesto: le sfide hardware per gli LLM

L'introduzione di modelli come Qwen 3.6 27B, seppur in un contesto ipotetico, evidenzia l'importanza critica dell'hardware per le capacità dei Large Language Models. In particolare, il limite della finestra di contesto, come un ipotetico 4K token, pone vincoli significativi sulle applicazioni. Questo articolo esplora come le specifiche delle GPU e l'architettura di sistema influenzino direttamente le performance e le possibilità di deployment on-premise, delineando i trade-off per CTO e architetti infrastrutturali.

Jun 03 2026
LLM

Gemma 4-12B in GGUF: Nuove opportunità per l'Inference On-Premise

La recente disponibilità del modello Gemma 4-12B in formato GGUF su Hugging Face, gestito da ggml-org, segna un passo significativo per l'esecuzione di Large Language Models in ambienti self-hosted. Questa versione ottimizzata apre scenari interessanti per le aziende che cercano maggiore controllo, sovranità dei dati e costi operativi ridotti per i loro carichi di lavoro AI.

Jun 03 2026
LLM

Gemma 4 Unified: L'integrazione anticipata in llama.cpp svela un'architettura inedita

Una recente pull request nel repository `llama.cpp` ha rivelato l'implementazione del nuovo modello "Gemma 4 Unified" di Google. L'integrazione anticipata suggerisce un lancio con supporto immediato per l'inference locale. Dettagli nel codice accennano a una "vision tower" priva di architettura transformer, indicando una potenziale innovazione significativa nel design dei modelli multimodali e sollevando interrogativi sulla sua architettura finale.

Jun 03 2026
Altro

AI: Trump firma l'ordine esecutivo, tra attese e implicazioni future

Donald Trump ha siglato un ordine esecutivo sull'intelligenza artificiale, un passo che arriva dopo un rinvio del mese precedente. La mossa sottolinea la crescente attenzione globale verso la regolamentazione dell'AI, con potenziali impatti significativi sulle strategie di deployment e sulla sovranità dei dati per le aziende che gestiscono Large Language Models on-premise.

Jun 03 2026
Frameworks

llama.cpp integra i diagrammi Mermaid: visualizzazione avanzata per LLM on-premise

Il progetto Open Source llama.cpp, punto di riferimento per l'inference di Large Language Models su hardware locale, introduce una nuova funzionalità UI: la generazione e l'anteprima interattiva dei diagrammi Mermaid direttamente nelle chat. Questa integrazione migliora la capacità degli sviluppatori di visualizzare flussi di lavoro complessi e documentare architetture, rafforzando l'utilità delle soluzioni LLM self-hosted e il controllo sui dati.

Jun 03 2026
Hardware

AMD presenta il Ryzen AI Halo: un PC per sviluppatori AI a Computex 2026

AMD ha mostrato il suo nuovo PC per sviluppatori AI, il Ryzen AI Halo, durante una demo dal vivo a Computex 2026. Questa macchina è progettata per supportare lo sviluppo di applicazioni e modelli di intelligenza artificiale in locale, sottolineando l'impegno dell'azienda nel fornire hardware dedicato per l'ecosistema AI on-premise. L'iniziativa evidenzia la crescente domanda di soluzioni che garantiscano controllo e sovranità dei dati per i carichi di lavoro AI.

Jun 03 2026
Hardware

AMD alza il tono sulla competizione AI mobile: "Sbagliato non scegliere Strix Halo"

I dirigenti di AMD hanno lanciato una sfida diretta nel mercato dell'AI su dispositivi mobili, dichiarando che i notebook basati su architettura Strix Halo rappresentano la scelta obbligata. Questa affermazione, che si confronta con l'iniziativa RTX Spark di Nvidia, sottolinea l'intensificarsi della competizione per portare le capacità di Large Language Models e altre applicazioni AI direttamente sui dispositivi client, enfatizzando l'importanza dell'elaborazione locale.

Jun 03 2026
Altro

Regno Unito: i publisher potranno escludere i contenuti dalla ricerca AI di Google

I regolatori del Regno Unito hanno imposto a Google di introdurre uno strumento che permetta ai publisher di escludere i propri siti dalle funzionalità di ricerca basate su intelligenza artificiale generativa. Questa opzione sarà inizialmente testata nel Regno Unito per poi essere estesa a livello globale. La mossa risponde alle crescenti preoccupazioni riguardo l'uso dei contenuti online da parte degli LLM e segna un passo significativo verso una maggiore sovranità dei dati per i creatori di contenuti.

Jun 03 2026
Altro

Dall'alta finanza all'AI vocale: la startup che punta su stack proprietari per l'Africa e il Medio Oriente

Due ex-dirigenti di Goldman Sachs e Meta hanno fondato una startup focalizzata sull'AI vocale, mirando a mercati spesso trascurati come l'Africa e il Medio Oriente. La loro strategia si basa su uno stack tecnicico proprietario e self-hosted, che attualmente gestisce oltre 17.000 chiamate al giorno, evidenziando l'efficacia di un approccio on-premise per esigenze specifiche di localizzazione e sovranità dei dati.

Jun 03 2026
Altro

L'Unione Europea punta alla sovranità tecnicica per proteggere i cittadini

L'Unione Europea ha presentato il suo "Pacchetto per la Sovranità Tecnologica", un'iniziativa strategica per ridurre la dipendenza da fornitori tech esterni e rafforzare le capacità interne in AI, semiconduttori, cloud computing e Open Source. L'obiettivo è garantire autonomia decisionale e protezione dei cittadini, con proposte che includono il triplicare la capacità dei data center e promuovere l'uso di chip e soluzioni Open Source europee, pur tra le preoccupazioni per le relazioni internazionali.

Jun 03 2026
Market

Anthropic Rafforza l'Ecosistema Claude con un Nuovo Partner Network

Anthropic ha annunciato l'introduzione del Services Track e del Partner Hub all'interno del suo Claude Partner Network. Questa iniziativa mira a espandere il supporto e le capacità di integrazione per gli LLM di Claude, offrendo nuove opportunità per le aziende che cercano soluzioni AI robuste e personalizzate, con un occhio di riguardo alle complessità dei deployment enterprise e alla sovranità dei dati.

Jun 03 2026
Market

Apoha svela la 'Liquid State Intelligence' con 36 milioni di dollari

Apoha, una deeptech, ha raccolto 36 milioni di dollari per sviluppare la 'Liquid State Intelligence', un nuovo paradigma per comprendere il comportamento molecolare in condizioni reali. La piattaforma VIBE® genera dati empirici cruciali per l'AI nel mondo fisico, permettendo previsioni accurate in settori come farmaceutica, alimentare e materiali, riducendo incertezze e costi. Il finanziamento supporterà l'espansione di questa classe di dati fondamentale.

Jun 03 2026
Market

L'AI fa risparmiare ore, ma le aziende le disperdono: il paradosso dell'efficienza

Un nuovo studio Workday rivela che l'85% dei dipendenti risparmia fino a sette ore settimanali grazie all'AI. Tuttavia, gran parte di questo tempo guadagnato viene disperso, evidenziando una sfida critica per le aziende: trasformare il potenziale dell'AI in valore concreto. La corretta integrazione e gestione delle soluzioni AI, sia on-premise che in cloud, è fondamentale per capitalizzare questi benefici.

Jun 03 2026
Altro

Sovranità Digitale UE: Nuove Norme su Chip e Dati Sensibili

La Commissione Europea ha presentato un pacchetto di quattro misure legislative per rafforzare la sovranità tecnicica del blocco. Le proposte includono poteri di emergenza per la gestione della catena di fornitura dei chip e restrizioni per i fornitori cloud statunitensi nell'accesso a dati governativi sensibili. L'iniziativa, attesa da tempo, mira a ridurre la dipendenza dell'UE da tecnicie extra-europee, in particolare nel settore dei semiconduttori.

Jun 03 2026
LLM

Qwen 3.7 Plus: l'apparizione lampo su OpenRouter

Un nuovo modello, Qwen 3.7 Plus, è apparso e poi rapidamente scomparso dalla piattaforma OpenRouter, generando interrogativi nella comunità tech. L'episodio evidenzia le sfide legate alla disponibilità dei Large Language Models e le complessità che le aziende affrontano nel pianificare deployment robusti, sia tramite API esterne che con soluzioni self-hosted.

Jun 03 2026
Market

Meta e la sfida AI: Muse Spark e la scommessa su una nuova leadership

Un anno dopo l'incarico ad Alexandr Wang, Meta presenta Muse Spark, il suo modello AI più promettente. La decisione di Zuckerberg di affidare la guida a un fondatore di startup esterno, anziché a un ricercatore interno, mirava a infondere urgenza e ambizione. Nonostante le sfide iniziali e le critiche, Wang sta ora ottenendo i primi risultati, segnando un'evoluzione nella strategia AI del colosso tecnicico.

Jun 03 2026
Market

Meta lancia l'agente AI per WhatsApp Business: disponibilità globale e tariffazione a token

Meta ha esteso la disponibilità globale del suo agente AI per WhatsApp Business, introducendo un modello di tariffazione basato sull'utilizzo dei token. Questa mossa integra l'intelligenza artificiale generativa nelle comunicazioni aziendali, offrendo strumenti avanzati per l'automazione. Per le imprese, il nuovo approccio alla fatturazione solleva importanti considerazioni sul Total Cost of Ownership (TCO) e sulla gestione dei dati, spingendo a valutare attentamente le implicazioni economiche e strategiche rispetto a soluzioni self-hosted.

Jun 03 2026
Altro

L'AI nei servizi consumer: dalla ricerca all'ottimizzazione dei deployment enterprise

L'integrazione di strumenti AI in piattaforme consumer come Google Search e Shopping evidenzia la crescente pervasività dell'intelligenza artificiale. Per le aziende che valutano l'adozione di capacità AI simili, emergono considerazioni critiche relative al deployment on-premise, alla sovranità dei dati e al Total Cost of Ownership. L'analisi di queste architetture è fondamentale per ottimizzare le strategie infrastrutturali.

Jun 03 2026
LLM

Abliteration di LLM: confronto tra Apostate, Heretic e Huihui su Qwen 2.5 7B

Un'analisi comparativa approfondisce le capacità di tre strumenti di 'abliteration' – Apostate, Heretic e Huihui – nel rimuovere il 'safety training' dal Large Language Model Qwen 2.5 7B. I benchmark, eseguiti su una GPU RTX 5090 32GB, rivelano differenze significative nell'efficacia della rimozione del rifiuto, nell'impatto sulle performance del modello e nell'entità delle modifiche ai parametri, offrendo spunti cruciali per i deployment on-premise e la sovranità dei dati.

Jun 03 2026
Market

Coralogix raccoglie 200 milioni di dollari per la supervisione degli agenti AI

Coralogix ha annunciato un round di finanziamento Series F da 200 milioni di dollari, portando la sua valutazione a 1,6 miliardi di dollari. L'investimento, avvenuto a meno di un anno dal precedente, sottolinea la crescente domanda di soluzioni per la supervisione e l'osservabilità degli agenti AI. Questo posizionamento strategico mira a rispondere alla necessità di monitorare l'operato dei sistemi di intelligenza artificiale, un aspetto cruciale per le aziende che adottano LLM e altre tecnicie AI.

Jun 03 2026
Hardware

Microsoft Solara AI: la piattaforma 'chip-to-cloud' per dispositivi enterprise con agenti AI

Microsoft ha presentato Project Solara AI, una piattaforma 'chip-to-cloud' progettata per alimentare una nuova generazione di dispositivi enterprise 'agent-first'. Questi hardware sono concepiti per eseguire agenti AI, superando le applicazioni tradizionali. Tra i primi concept di riferimento figurano un compagno desktop e un badge indossabile, evidenziando un cambio di paradigma verso l'integrazione profonda dell'intelligenza artificiale direttamente nell'hardware aziendale.

Jun 03 2026
Altro

E.ON: l'AI e SAP S/4HANA per modernizzare la rete e garantire la sovranità dei dati

E.ON sta trasformando la sua infrastruttura energetica attraverso la standardizzazione dei dati con SAP S/4HANA e l'integrazione dell'AI. L'azienda ha internalizzato competenze chiave in dati e cybersecurity, riducendo i tempi di inattività IT del 77%. Adottando un approccio pragmatico all'AI, E.ON si concentra su casi d'uso specifici come la manutenzione predittiva e l'automazione del servizio clienti, bilanciando innovazione e controllo per una maggiore resilienza operativa e sovranità dei dati.

Jun 03 2026
Hardware

Qwen 3.6 27B e contesto da 262K: quanta VRAM serve per il deployment on-premise?

L'implementazione di Large Language Models come Qwen 3.6 27B con finestre di contesto estese (262K token) e requisiti di quantization specifici (Q8 con KV cache non compressa) pone sfide significative in termini di VRAM. Un utente valuta l'acquisto di una GPU e si interroga sull'adeguatezza di 48GB di VRAM per un deployment on-premise, evidenziando le complessità nella pianificazione dell'infrastruttura AI.

Jun 03 2026
Altro

Ubuntu 26.04 LTS: Canonical accelera gli aggiornamenti ROCm per le GPU AMD

Canonical ha annunciato un cambio di strategia per Ubuntu 26.04 LTS, introducendo aggiornamenti più rapidi per lo stack di calcolo GPU open source ROCm di AMD tramite Stable Release Updates (SRUs). Questa mossa risponde alla necessità di mantenere la piattaforma aggiornata, dato che la versione iniziale di ROCm inclusa nella distribuzione era già obsoleta. La decisione facilita l'accesso a versioni più recenti di ROCm per gli sviluppatori e gli architetti che utilizzano GPU AMD in ambienti Linux.

Jun 03 2026
Altro

USA: Ordine Esecutivo AI Richiede Accesso Preventivo ai Modelli Frontier

L'amministrazione statunitense ha firmato un ordine esecutivo sull'intelligenza artificiale che mira a garantire al governo un accesso di 30 giorni ai "modelli frontier" prima del loro rilascio pubblico. Il framework, di natura volontaria, includerà un benchmark classificato per determinare quali modelli rientrano in questa categoria, evidenziando la crescente attenzione alla sicurezza e alla governance degli LLM avanzati.

Jun 03 2026
Altro

Boom nel settore dei semiconduttori coreano: implicazioni per l'infrastruttura AI on-premise

La provincia di Gyeonggi, cuore dell'industria coreana dei semiconduttori, registra una significativa crescita economica, evidenziata da un aumento del 150% nelle vendite di beni di lusso. Questo boom sottolinea l'importanza strategica del settore per l'avanzamento dell'AI. Per le aziende che valutano deployment on-premise di Large Language Models, la prosperità di queste "cinture del silicio" è cruciale, influenzando la disponibilità di hardware, la sovranità dei dati e il TCO delle infrastrutture AI locali.

Jun 03 2026
Market

CoreWeave accelera l'infrastruttura AI nel Regno Unito: la velocità è la chiave

CoreWeave, neocloud supportata da Nvidia, sta espandendo rapidamente la sua capacità di calcolo AI nel Regno Unito. L'azienda ha scelto di affittare spazi in data center esistenti piuttosto che costruirne di nuovi, una strategia dettata dalla necessità di soddisfare l'enorme domanda di compute con la massima velocità. Questa mossa, parte di un investimento multimiliardario, mira a ridurre i tempi di deployment da anni a mesi, posizionando CoreWeave come attore centrale nei piani AI del governo britannico.

Jun 03 2026
Market

Suno: la valutazione sale a 5,4 miliardi di dollari tra partnership e sfide AI

Suno, l'azienda di intelligenza artificiale per la musica, ha raggiunto una valutazione di 5,4 miliardi di dollari, raddoppiando il suo valore in sei mesi. Questo traguardo arriva dopo un periodo di contenziosi legali con le major discografiche, ora trasformatesi in partner. La vicenda evidenzia la rapida evoluzione del mercato AI e le complesse dinamiche tra innovazione tecnicica e proprietà intellettuale.

Jun 03 2026
Altro

Il Ruolo Indispensabile del Calcolo Classico nell'Era dei Computer Quantistici

I computer quantistici, pur promettendo capacità di calcolo rivoluzionarie, dipendono in modo critico da un'infrastruttura classica robusta per la calibrazione e la correzione degli errori. L'aumento del numero di qubit impone nuove sfide di scalabilità, spingendo aziende come Nvidia, Q-CTRL, IBM e Google a sviluppare soluzioni innovative, inclusi approcci basati sull'AI, per gestire la complessità operativa di questi sistemi ibridi.

Jun 03 2026
Hardware

Nvidia RTX Spark: i chip che ridefiniscono il futuro dell'AI su PC

Nvidia sta puntando a trasformare il concetto di "AI PC" in realtà grazie ai suoi nuovi chip RTX Spark per laptop. Questa mossa potrebbe segnare un punto di svolta per l'elaborazione dell'intelligenza artificiale direttamente sui dispositivi client, riducendo la dipendenza dal cloud e aprendo nuove opportunità per applicazioni locali e per la sovranità dei dati, aspetti cruciali per molte organizzazioni e utenti finali.

Jun 03 2026
Hardware

Noctua entra nel mercato AIO: raffreddamento silenzioso per sistemi ad alte prestazioni

Noctua, noto produttore di soluzioni di raffreddamento, ha presentato il suo primo sistema All-in-One (AIO) per CPU. Caratterizzato da una pompa Asetek Emma V2 silenziosa e ventole NF-A12/14, il modello NL-LC1 sarà disponibile in varianti da 240mm e 420mm, con prezzi a partire da circa 250 dollari. Sebbene si tratti di un prodotto consumer, il suo debutto evidenzia l'importanza crescente di soluzioni di raffreddamento efficienti e silenziose per qualsiasi carico di lavoro ad alte prestazioni, inclusi i server on-premise per LLM.

Jun 03 2026
Market

L'AI spinge i costi della DDR5: 32GB a 375 dollari, impatto sui deployment on-premise

Il costo della memoria DDR5 da 32GB ha raggiunto un minimo di 375 dollari, un aumento significativo attribuito alla crescente domanda nel settore dell'intelligenza artificiale. Questa tendenza mette sotto pressione il mercato dell'assemblaggio PC e solleva interrogativi sui costi per le infrastrutture AI self-hosted, influenzando il TCO per le aziende che valutano soluzioni on-premise.

Jun 03 2026
Market

Vivilo raccoglie 628mila euro per l'AI negli eventi: focus su computer vision

La startup italiana Vivilo ha chiuso un round pre-seed da 628.000 euro per potenziare la sua piattaforma di intelligenza artificiale. La tecnicia proprietaria automatizza la creazione di contenuti personalizzati da filmati di eventi, riconoscendo volti e oggetti. I fondi supporteranno la crescita commerciale, lo sviluppo della piattaforma e l'espansione nel settore motorsport, puntando a rafforzare la presenza europea e l'espansione internazionale.

Jun 03 2026
Market

Lovable e Google Cloud: una partnership strategica per l'AI aziendale

Lovable, sviluppatore svedese di app che gestisce milioni di progetti settimanali, ha stretto una partnership strategica con Google Cloud. L'obiettivo è attrarre clienti aziendali, sfruttando i modelli Gemini e un robusto strato di sicurezza. La proposta di Lovable permette a chiunque di creare software conversando con un'intelligenza artificiale, mirando ora a scalare questa offerta nel mercato corporate con il supporto dell'infrastruttura cloud di Google.

Jun 03 2026
LLM

Ricerca LLM: il divario tra pubblicazione su Arxiv e implementazione pratica

La comunità tech si interroga sul "timeshift" tra la pubblicazione di ricerche innovative su Arxiv da parte di laboratori come Google DeepMind e la loro effettiva integrazione in Large Language Models commerciali. Comprendere se le scoperte vengono divulgate prima o dopo i test su larga scala è cruciale per chi valuta strategie di deployment e l'adozione di nuove tecnicie.

Jun 03 2026
Hardware

NVIDIA: Il driver open-source Nova si avvicina al supporto per Hopper e Blackwell

Lo sviluppo del driver open-source Nova per le GPU NVIDIA Hopper e Blackwell prosegue, con il rilascio della dodicesima iterazione. Questo driver, scritto in Rust, mira a offrire un'alternativa al Nouveau, già compatibile tramite GSP. La sua evoluzione è cruciale per gli ambienti Linux e per chi cerca maggiore controllo sull'hardware NVIDIA, specialmente in contesti on-premise dove la flessibilità e la sovranità dei dati sono prioritarie.

Jun 03 2026
Market

GoPro e la Crisi della Memoria AI: Un Campanello d'Allarme per il Mercato

GoPro ha sollevato dubbi significativi sulla propria continuità operativa, citando una carenza di memoria AI come fattore critico. Questo evento evidenzia le crescenti sfide nella catena di approvvigionamento di componenti essenziali per l'intelligenza artificiale, con ripercussioni che vanno oltre i settori tradizionali e influenzano le strategie di deployment on-premise e cloud.

Jun 03 2026
Altro

Mappare le minacce cyber abilitate dall'AI: un anno di sfide per l'on-premise

L'analisi di un anno di minacce cyber potenziate dall'intelligenza artificiale rivela sfide crescenti per la sicurezza delle infrastrutture. Per le aziende che valutano deployment on-premise di LLM, comprendere queste dinamiche è cruciale per proteggere la sovranità dei dati e garantire la compliance, bilanciando controllo e TCO in un panorama di attacchi sempre più sofisticati.

Jun 03 2026
Hardware

Il CEO di MIPS promuove RISC-V per l'AI su hardware fisico al Computex

Al Computex, il CEO di MIPS ha evidenziato il potenziale di RISC-V per l'intelligenza artificiale su hardware fisico. Questa architettura aperta offre flessibilità e controllo, elementi cruciali per le aziende che cercano soluzioni AI on-premise o edge, con un'attenzione particolare alla sovranità dei dati e all'ottimizzazione del TCO. La discussione sottolinea l'evoluzione del panorama dei processori per carichi di lavoro AI.

Jun 03 2026
Altro

Molfar raccoglie 1,5 milioni di euro per radar anti-drone tattici on-premise

Molfar Defence Technologies, azienda polacco-ucraina, ha chiuso la prima tranche di un round di finanziamento da 1,5 milioni di euro. L'investimento di Front Ventures supporterà lo sviluppo e il deployment di sistemi radar tattici per la rilevazione di piccoli UAV. Questi sistemi, progettati per operare in ambienti complessi e vicini alle unità operative, enfatizzano la sovranità dei dati e il controllo sul campo, aspetti cruciali per le infrastrutture di difesa.

Jun 03 2026
Market

Immobiliare a San Francisco: le azioni Anthropic superano il contante

Nel dinamico mercato immobiliare della Bay Area, alcune proprietà vengono offerte in cambio di quote azionarie di Anthropic, la startup di intelligenza artificiale. Questo fenomeno sottolinea la percezione di un valore eccezionale per le aziende leader nel settore AI, riflettendo l'intensa corsa agli investimenti e l'importanza strategica dell'intelligenza artificiale generativa.

Jun 03 2026
Hardware

KRAID: Nuovo Compilatore per GPU Arm Mali Integrato in Mesa 26.2

Il nuovo compilatore KRAID, progettato per le moderne GPU Arm Mali, è stato integrato in Mesa 26.2. Questa mossa strategica mira a migliorare le prestazioni e l'efficienza dei driver open-source Panfrost e PanVK, con implicazioni significative per i deployment AI su hardware Arm, in particolare in contesti edge e on-premise dove il controllo e il TCO sono prioritari.

Jun 03 2026
Altro

Microsoft Porta Coreutils su Windows, Basato su Rust

Durante la conferenza Build 2026, Microsoft ha svelato Coreutils per Windows, un set di utility di sistema derivato da Rust Coreutils. L'iniziativa mira a standardizzare e semplificare l'esperienza degli sviluppatori su piattaforme eterogenee come Windows, WSL, macOS e Linux, offrendo strumenti familiari e coerenti per la gestione dell'infrastruttura.

Jun 03 2026
Market

Walmart e l'AI: la realtà dei costi di inference per le grandi imprese

Walmart ha iniziato a limitare l'uso di un assistente AI interno a causa di costi di inference superiori alle attese, passando da un accesso illimitato a un sistema basato su token. Questa mossa riflette una tendenza più ampia nel settore, dove i Large Language Models (LLM) adottano modelli di pricing pay-per-use. La gestione dei costi e l'ottimizzazione dell'utilizzo dei modelli diventano cruciali per le grandi imprese che cercano di bilanciare produttività e spese operative dell'AI.

Jun 03 2026
Altro

Apoha: 36 milioni di dollari per insegnare alle macchine il comportamento della materia

Apoha ha annunciato un finanziamento da 36 milioni di dollari per sviluppare soluzioni che permettano alle macchine di simulare il comportamento della materia in condizioni reali. L'azienda mira a colmare una lacuna scientifica critica, offrendo un approccio scalabile ed economicamente vantaggioso per prevedere come le molecole interagiscono nell'ambiente, un fattore chiave per il successo nello sviluppo di farmaci e prodotti alimentari.

Jun 03 2026
Market

Qisda: il 2026 sarà l'anno della svolta per l'intelligenza artificiale

Il presidente di Qisda prevede un'accelerazione significativa nell'adozione dell'IA entro il 2026. Questa prospettiva sottolinea l'urgenza per le aziende di definire strategie infrastrutturali robuste, valutando attentamente i trade-off tra soluzioni cloud e deployment on-premise, con particolare attenzione a TCO, sovranità dei dati e requisiti hardware per i Large Language Models.

Jun 03 2026
Altro

INXM Raccoglie 5,7 Milioni di Euro per l'Automazione AI On-Premise nelle Imprese Europee

La startup berlinese INXM ha ottenuto un finanziamento pre-seed di 5,7 milioni di euro per la sua tecnicia di automazione dei processi basata su AI. La piattaforma, che emerge dalla modalità stealth, mira a risolvere le sfide di deployment dell'AI in ambienti enterprise e industriali, garantendo consistenza, auditabilità e conformità. Il suo approccio "Compiled AI" trasforma gli insight dei Large Language Models in processi deterministici, ideali per la sovranità dei dati e l'integrazione con infrastrutture esistenti, specialmente in Europa.

Jun 03 2026
Altro

Sovranità tecnicica: il Parlamento UK chiede lo stop a Palantir nel NHS

Il comitato per la scienza e la tecnicia del Parlamento britannico ha esortato il governo a rescindere il contratto con Palantir per la Federated Data Platform del NHS. La richiesta nasce dalla preoccupazione per il "vendor lock-in" e la dipendenza da fornitori esterni in settori critici. Il comitato suggerisce di sviluppare soluzioni interne o affidarsi a imprese britanniche per garantire la sovranità tecnicica e la sicurezza dei dati, sottolineando l'importanza di un'infrastruttura digitale robusta per i futuri progetti nazionali.

Jun 03 2026
LLM

I fan del Mondiale usano l'AI per aggirare il caro-biglietti e i bagarini

I tifosi di calcio si stanno organizzando su Reddit, sfruttando Large Language Models come Claude per sviluppare software di ticketing fai-da-te. L'obiettivo è contrastare i prezzi esorbitanti dei biglietti per la Coppa del Mondo e l'attività dei bagarini, dimostrando come l'AI possa essere impiegata per soluzioni creative e decentralizzate, con implicazioni interessanti per il controllo dei dati e il deployment di applicazioni personalizzate.

Jun 03 2026
Market

Oxford Quantum Circuits raccoglie 260 milioni di sterline: una svolta per il quantum computing britannico

Oxford Quantum Circuits (OQC), spin-off dell'Università di Oxford, ha chiuso un round di finanziamento Series C da 260 milioni di sterline, il più grande mai registrato in Europa per il quantum computing privato. L'investimento segna un "momento di maturità" per il settore britannico, evidenziando il passaggio dalla promessa a consegne concrete. OQC sviluppa hardware e software per computer quantistici superconduttori, offrendo la propria tecnicia come servizio cloud a settori critici come finanza e difesa.

Jun 03 2026
Altro

SolarDew raccoglie 800.000 euro per la purificazione dell'acqua a energia solare

La startup olandese SolarDew ha ottenuto 800.000 euro per espandere la sua tecnicia di purificazione dell'acqua a energia solare. La soluzione, che sfrutta evaporazione e condensazione, opera autonomamente grazie all'energia termica solare e alla gravità, senza necessità di elettricità o prodotti chimici. Mira a fornire acqua potabile a un milione di persone entro il 2035, specialmente in aree remote e con scarsità idrica, offrendo un'alternativa sostenibile ai sistemi centralizzati e complessi.

Jun 03 2026
Hardware

Quobly raccoglie 115 milioni per i computer quantistici su silicio

La startup francese Quobly, con sede a Grenoble, ha recentemente raccolto 115 milioni di euro per sviluppare computer quantistici basati su chip di silicio. L'azienda si distingue per un approccio che mira a sfruttare l'infrastruttura produttiva esistente nel settore dei semiconduttori, a differenza di altre realtà che richiedono materiali e processi di fabbricazione completamente nuovi. Questa strategia potrebbe accelerare l'adozione della tecnicia quantistica, rendendola potenzialmente più accessibile e scalabile.

Jun 03 2026
Market

MiniMax e Z.ai: la corsa a Shanghai riflette la crescita del compute AI

MiniMax e Z.ai, due attori emergenti nel panorama dell'intelligenza artificiale, stanno esplorando la quotazione a Shanghai. Questa mossa evidenzia una tendenza più ampia: l'incremento significativo degli investimenti nel compute dedicato all'AI. La crescente domanda di risorse computazionali, sia per il training che per l'Inference di Large Language Models, spinge le aziende a cercare capitali per sostenere l'espansione infrastrutturale, un fattore chiave per chi valuta strategie di Deployment on-premise o ibride.

← Precedente Page 26 / 143 Successiva →