AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

L'ascesa degli LLM: un cambiamento strutturale nel panorama digitale
📁 Market AI generated ℹ️ The Next Web

L'ascesa degli LLM: un cambiamento strutturale nel panorama digitale

Gli LLM stanno ridefinendo il comportamento utente e le strategie aziendali, segnando un'evoluzione profonda che va oltre i precedenti cambiamenti tecnicici. Questa trasformazione impone alle aziende di riconsiderare le proprie infrastrutture e le decisioni di deployment, con un'attenzione crescente alla sovranità dei dati e al controllo dei costi.

2026-05-22 📰 Fonte
Ordine esecutivo sull'AI di Trump annullato: i CEO tech si defilano
📁 Altro AI generated ✅ Ars Technica AI

Ordine esecutivo sull'AI di Trump annullato: i CEO tech si defilano

Il Presidente Trump ha annullato un evento per la firma di un ordine esecutivo che avrebbe concesso al governo il potere di testare modelli AI avanzati prima del rilascio pubblico. La decisione è arrivata dopo che diversi CEO di importanti aziende AI hanno rifiutato di partecipare con breve preavviso. Elon Musk e Mark Zuckerberg avrebbero contribuito a far deragliare l'iniziativa, mentre OpenAI la sosteneva, evidenziando le tensioni sulla governance dell'AI.

2026-05-22 📰 Fonte
Qwen-27B ottimizzato per GPU NVIDIA da 16GB: nuove quantizzazioni per LLM on-premise
📁 LLM AI generated ℹ️ LocalLLaMA

Qwen-27B ottimizzato per GPU NVIDIA da 16GB: nuove quantizzazioni per LLM on-premise

Una nuova quantization del modello Qwen-27B, denominata IQ4_KS, è stata rilasciata per ottimizzare l'esecuzione su GPU NVIDIA con 16GB di VRAM. Sviluppata con le quantizzazioni KS e KSS di ikawrakow, questa versione da 14.1GB offre prestazioni superiori e una finestra di contesto di 105k token, rendendola ideale per deployment on-premise che richiedono efficienza e controllo sui dati. La soluzione è attualmente compatibile solo con architetture NVIDIA CUDA e CPU.

2026-05-22 📰 Fonte
OpenCL 3.1.1: Un Aggiornamento Cruciale per Performance AI e HPC
📁 Frameworks AI generated ✅ Phoronix

OpenCL 3.1.1: Un Aggiornamento Cruciale per Performance AI e HPC

Khronos Group ha rilasciato OpenCL 3.1.1, un aggiornamento mirato a risolvere una potenziale regressione di performance identificata nella precedente versione 3.1. Questa specifica, fondamentale per i carichi di lavoro di intelligenza artificiale e High-Performance Computing, sottolinea l'importanza della stabilità e dell'ottimizzazione per i deployment on-premise, dove la prevedibilità delle performance è cruciale per il TCO e la sovranità dei dati.

2026-05-22 📰 Fonte
Google Search: un aggiornamento AI blocca la ricerca per 'disregard'
📁 LLM AI generated ✅ TechCrunch AI

Google Search: un aggiornamento AI blocca la ricerca per 'disregard'

Un recente aggiornamento basato sull'intelligenza artificiale per Google Search ha causato un'anomalia: la ricerca della parola "disregard" rende inutilizzabile l'interfaccia. L'incidente solleva interrogativi sulla complessità dei Large Language Models (LLM) e sulle sfide legate al loro deployment e alla loro integrazione in prodotti su larga scala, evidenziando l'importanza di test rigorosi e del controllo sui sistemi AI.

2026-05-22 📰 Fonte
Wingtech cita in giudizio Nexperia in Cina dopo il sequestro olandese di semiconduttori
📁 Market AI generated ℹ️ The Next Web

Wingtech cita in giudizio Nexperia in Cina dopo il sequestro olandese di semiconduttori

Wingtech Technology ha avviato una causa legale contro la sua sussidiaria Nexperia presso un tribunale cinese, chiedendo un risarcimento di almeno 8 miliardi di yuan (circa 1,1 miliardi di dollari). La disputa nasce dal sequestro forzato di un produttore di chip di proprietà cinese da parte del governo olandese, segnando la prima sfida legale significativa contro tale azione in Europa. Questo evento sottolinea le crescenti tensioni geopolitiche nel settore dei semiconduttori.

2026-05-22 📰 Fonte
Meta introduce Forum: una nuova app per i Gruppi Facebook con funzionalità AI
📁 LLM AI generated ℹ️ The Next Web

Meta introduce Forum: una nuova app per i Gruppi Facebook con funzionalità AI

Meta ha rilasciato Forum, una nuova applicazione standalone che si basa sui Gruppi Facebook. L'app integra una sezione "Ask" basata su intelligenza artificiale e un assistente per gli amministratori. Il lancio, avvenuto senza un evento dedicato, si inserisce nel contesto delle discussioni interne a Meta sull'espansione del proprio portfolio di applicazioni, con l'obiettivo di svilupparne fino a cinquanta.

2026-05-22 📰 Fonte
Salesforce e la promessa dell'AI: tra marketing ambizioso e realtà di deployment
📁 Market AI generated ℹ️ The Next Web

Salesforce e la promessa dell'AI: tra marketing ambizioso e realtà di deployment

Salesforce ha costruito la sua strategia sull'AI con Agentforce, una piattaforma di agenti intelligenti che vanta 29.000 accordi e 800 milioni di dollari di ricavi annuali. Tuttavia, il mercato e gli analisti osservano una potenziale discrepanza tra le ambiziose promesse di sostituire intere categorie di lavoro umano e la concreta capacità di delivery, sollevando interrogativi sulla maturità delle soluzioni AI nel contesto enterprise.

2026-05-22 📰 Fonte
Le Guerre dell'Attenzione nell'AI: Gestire le Risorse On-Premise
📁 Altro AI generated ✅ 404 Media

Le Guerre dell'Attenzione nell'AI: Gestire le Risorse On-Premise

L'articolo esplora come il concetto di 'guerre dell'attenzione', pur derivando da un contesto non tecnicico, si traduca nella gestione critica delle risorse hardware e software per i deployment di Large Language Models (LLM) on-premise. Vengono analizzati i trade-off tra performance, TCO e sovranità dei dati, evidenziando l'importanza di strategie di ottimizzazione per infrastrutture AI locali.

2026-05-22 📰 Fonte
CXMT e Corsair: la DRAM cinese si affaccia al mercato consumer, un'alternativa per la supply chain
📁 Market AI generated ℹ️ Tom's Hardware

CXMT e Corsair: la DRAM cinese si affaccia al mercato consumer, un'alternativa per la supply chain

Il produttore cinese di memorie CXMT ha fatto il suo ingresso nel segmento mainstream della memoria consumer, collaborando con Corsair per un kit DDR5 Vengeance. Questa mossa segna l'emergere della DRAM di produzione cinese come potenziale soluzione alle carenze di fornitura, introducendo un nuovo attore in un mercato cruciale per l'infrastruttura tecnicica globale, inclusi i deployment AI on-premise.

2026-05-22 📰 Fonte
Google presenta occhiali XR prototipali con integrazione Gemini
📁 Hardware AI generated ✅ TechCrunch AI

Google presenta occhiali XR prototipali con integrazione Gemini

Google ha mostrato un prototipo di occhiali Android XR capaci di sovrapporre informazioni in tempo reale nel campo visivo dell'utente. Alimentati da Gemini, questi dispositivi offrono funzionalità come traduzione e navigazione, esplorando nuove interfacce per l'interazione con l'intelligenza artificiale.

2026-05-22 📰 Fonte
OpenAI leader nel Magic Quadrant Gartner 2026 per agenti di coding AI enterprise
📁 Market AI generated 🏆 OpenAI Blog

OpenAI leader nel Magic Quadrant Gartner 2026 per agenti di coding AI enterprise

OpenAI è stata riconosciuta come leader nel Magic Quadrant 2026 di Gartner per gli agenti di coding AI enterprise. Il report evidenzia in particolare Codex, elogiato per la sua innovazione e la capacità di deployment su scala aziendale. Questo posizionamento sottolinea l'importanza crescente degli strumenti AI per lo sviluppo software in contesti professionali.

2026-05-22 📰 Fonte
Starbucks ritira lo strumento AI per l'inventario: i problemi con i latticini
📁 Altro AI generated ℹ️ The Next Web

Starbucks ritira lo strumento AI per l'inventario: i problemi con i latticini

Starbucks ha ritirato il suo strumento di inventario basato sull'intelligenza artificiale dopo soli nove mesi di utilizzo in Nord America. Il sistema, che rientrava tra le iniziative tecniciche di rilievo del CEO Brian Niccol, ha mostrato difficoltà nel distinguere correttamente i diversi tipi di latte, portando l'azienda a tornare ai conteggi manuali. Questo episodio evidenzia le sfide che i progetti di AI aziendale possono incontrare nell'applicazione pratica in ambienti reali.

2026-05-22 📰 Fonte
Il fondo sovrano norvegese contesta la rielezione di Elkann nel board di Meta
📁 Market AI generated ℹ️ The Next Web

Il fondo sovrano norvegese contesta la rielezione di Elkann nel board di Meta

Il Government Pension Fund Global norvegese, il più grande fondo sovrano al mondo con 2.3 trilioni di dollari, ha espresso dissenso sulla rielezione di John Elkann nel consiglio di amministrazione di Meta. La decisione è motivata dalla convinzione che il presidente di Stellantis e CEO di Exor non disponga di tempo sufficiente per dedicarsi adeguatamente all'incarico, sollevando questioni sulla governance e l'impegno dei consiglieri in aziende tecniciche di primo piano.

2026-05-22 📰 Fonte
La ricerca AI di Google: convenienza immediata, costi a lungo termine per il web
📁 Market AI generated ✅ Wired AI

La ricerca AI di Google: convenienza immediata, costi a lungo termine per il web

Google sta integrando risposte generate dall'intelligenza artificiale nella sua ricerca, offrendo una convenienza senza precedenti. Questa evoluzione, sebbene attrattiva per gli utenti, solleva interrogativi significativi sul futuro del web, sulla sostenibilità dei creatori di contenuti e sulla provenienza delle informazioni, spingendo le aziende a considerare alternative self-hosted per la gestione dei propri dati e la sovranità delle informazioni.

2026-05-22 📰 Fonte
OpenBMB e BitCPM-CANN 1.58 bit: l'efficienza LLM su Huawei Ascend
📁 LLM AI generated ℹ️ LocalLLaMA

OpenBMB e BitCPM-CANN 1.58 bit: l'efficienza LLM su Huawei Ascend

OpenBMB ha presentato BitCPM-CANN, un LLM caratterizzato da una quantization a 1.58 bit. Questo approccio mira a ottimizzare l'efficienza dell'inference, riducendo l'impronta di memoria e i requisiti computazionali. Il modello è attualmente in fase di test sul processore Huawei Ascend 910B, evidenziando l'interesse per soluzioni hardware alternative e deployment on-premise che privilegiano il controllo e l'ottimizzazione delle risorse.

2026-05-22 📰 Fonte
systemd 261-rc1: Un Installer OS, IMDS e storagectl per il Gestore di Servizi Linux
📁 Altro AI generated ✅ Phoronix

systemd 261-rc1: Un Installer OS, IMDS e storagectl per il Gestore di Servizi Linux

È disponibile la prima release candidate di systemd 261, che introduce significative novità per il gestore di sistema e servizi Linux. Tra le aggiunte spiccano un installer per il sistema operativo, un nuovo sottosistema IMDS e l'utility storagectl. Questi aggiornamenti consolidano il ruolo di systemd come componente infrastrutturale chiave, offrendo strumenti avanzati per la gestione e il deployment di ambienti server, con implicazioni dirette per le architetture on-premise e la sovranità dei dati.

2026-05-22 📰 Fonte
Nvidia punta a due terzi del mercato CPU x86: 20 miliardi e 4 milioni di Vera entro il 2027
📁 Market AI generated ℹ️ Tom's Hardware

Nvidia punta a due terzi del mercato CPU x86: 20 miliardi e 4 milioni di Vera entro il 2027

Nvidia si prepara a conquistare una quota significativa del mercato delle CPU server x86, tradizionalmente dominato da Intel e AMD. Le previsioni indicano che l'azienda potrebbe raggiungere i due terzi di questo segmento, generando ricavi per 20 miliardi di dollari. Entro l'anno fiscale 2027, Nvidia prevede di consegnare 4 milioni di processori Vera, segnando un'espansione strategica nel settore dei processori centrali per data center.

2026-05-22 📰 Fonte
Mistral AI acquisisce Emmi AI, Bliq.ai ottiene via libera per guida autonoma in Estonia: il panorama tech europeo si evolve
📁 Market AI generated ℹ️ Tech.eu

Mistral AI acquisisce Emmi AI, Bliq.ai ottiene via libera per guida autonoma in Estonia: il panorama tech europeo si evolve

La settimana nel panorama tecnicico europeo è stata ricca di movimenti strategici. Tra le notizie di spicco, Mistral AI ha acquisito Emmi AI, consolidando la sua posizione nel settore degli LLM. In Estonia, Bliq.ai ha ottenuto l'approvazione per operazioni stradali completamente autonome, segnando un passo avanti per l'AI su strada. Dunia Innovations ha inoltre presentato un GigaLab da 280 milioni di euro per la scoperta di materiali basata sull'AI, evidenziando investimenti significativi in infrastrutture e ricerca.

2026-05-22 📰 Fonte
Casi di 'citazioni sintetiche' in un libro sollevano interrogativi sull'affidabilità dell'AI
📁 LLM AI generated ✅ Ars Technica AI

Casi di 'citazioni sintetiche' in un libro sollevano interrogativi sull'affidabilità dell'AI

Il giornalista Steven Rosenbaum ha utilizzato strumenti di intelligenza artificiale per la ricerca del suo libro "The Future of Truth". Un'indagine del New York Times ha rivelato la presenza di "citazioni sintetiche" o attribuite erroneamente. Nonostante l'autore stia lavorando a una revisione, intende continuare a impiegare l'AI, sollevando questioni cruciali sull'affidabilità e la verifica dei contenuti generati da Large Language Models in contesti professionali.

2026-05-22 📰 Fonte
LLM e progettazione di chip: l'AI affianca l'ingegnere, la guida umana è chiave
📁 LLM AI generated ℹ️ Tom's Hardware

LLM e progettazione di chip: l'AI affianca l'ingegnere, la guida umana è chiave

Gli LLM stanno iniziando a superare gli ingegneri nella progettazione di chip in ambiti specifici, accelerando lo sviluppo di strumenti software. Nonostante i progressi, un ricercatore di Berkeley sottolinea l'importanza della guida umana nel processo. Questo scenario evidenzia l'evoluzione degli strumenti di design e le implicazioni per l'infrastruttura on-premise necessaria a supportare tali carichi di lavoro complessi.

2026-05-22 📰 Fonte
SupraLabs presenta Supra-50M: un LLM compatto con performance sorprendenti
📁 LLM AI generated ℹ️ LocalLLaMA

SupraLabs presenta Supra-50M: un LLM compatto con performance sorprendenti

SupraLabs ha rilasciato Supra-50M, un LLM causale da 50 milioni di parametri con architettura Llama-style. Addestrato su 20 miliardi di token, il modello dimostra risultati competitivi su diversi benchmark, superando in alcuni casi modelli di dimensioni maggiori. Questa release segna il primo passo del piano di scaling di SupraLabs, suggerendo un approccio all'efficienza e alla performance per deployment con risorse limitate.

2026-05-22 📰 Fonte
Password rubate: il rischio persistente per la sovranità dei dati nei deployment AI
📁 Altro AI generated ℹ️ The Next Web

Password rubate: il rischio persistente per la sovranità dei dati nei deployment AI

Le password rubate rappresentano la causa principale di molte violazioni di dati, un rischio amplificato nei contesti di deployment AI on-premise. Pratiche come il riutilizzo di credenziali, la loro condivisione informale o la memorizzazione non sicura nei browser minacciano direttamente la sovranità dei dati e la compliance. Proteggere l'accesso è fondamentale per salvaguardare gli asset critici e l'integrità dei carichi di lavoro LLM.

2026-05-22 📰 Fonte
Lucis ottiene 20 milioni di dollari per potenziare la prevenzione sanitaria basata su AI
📁 Market AI generated ℹ️ Tech.eu

Lucis ottiene 20 milioni di dollari per potenziare la prevenzione sanitaria basata su AI

Lucis, la piattaforma di salute preventiva basata su AI, ha annunciato un finanziamento di Serie A da 20 milioni di dollari, portando il capitale totale raccolto a 28 milioni. Il round, guidato da Singular, mira a espandere la sua offerta che analizza oltre 110 biomarcatori ematici per fornire indicazioni personalizzate e monitorate da medici, con l'obiettivo di rendere la prevenzione una pratica standard in Europa.

2026-05-22 📰 Fonte
DeepSeek avanza con un round da 10,29 miliardi, puntando sull'Open Source
📁 LLM AI generated ℹ️ LocalLLaMA

DeepSeek avanza con un round da 10,29 miliardi, puntando sull'Open Source

DeepSeek sta finalizzando un round di finanziamento da 10,29 miliardi di dollari. Il fondatore Liang Wenfeng ha ribadito l'impegno a sviluppare modelli AI Open Source, privilegiando la visione a lungo termine rispetto a obiettivi di commercializzazione immediata. Questa strategia si allinea con le esigenze di controllo, sovranità dei dati e ottimizzazione del TCO per le aziende che valutano deployment on-premise di Large Language Models.

2026-05-22 📰 Fonte
I marchi EV cinesi superano il 15% del mercato europeo: un segnale di cambiamento strategico
📁 Market AI generated ℹ️ The Next Web

I marchi EV cinesi superano il 15% del mercato europeo: un segnale di cambiamento strategico

I marchi cinesi di veicoli elettrici, guidati da BYD e Chery, hanno raggiunto una quota di mercato superiore al 15% in Europa ad aprile, segnando un raddoppio delle consegne e superando una soglia importante per la prima volta. Questo scenario si sviluppa mentre Bruxelles mantiene le barriere tariffarie e i produttori europei come Stellantis riorganizzano le proprie capacità produttive, evidenziando dinamiche competitive intense nel settore.

2026-05-22 📰 Fonte
REPS raccoglie 23,6 milioni di dollari per generare elettricità dal traffico stradale
📁 Altro AI generated ℹ️ The Next Web

REPS raccoglie 23,6 milioni di dollari per generare elettricità dal traffico stradale

La startup austriaca REPS ha ottenuto un finanziamento di 23,6 milioni di dollari per sviluppare la sua tecnicia innovativa. L'azienda mira a convertire l'energia cinetica generata dal traffico stradale, in particolare dai mezzi pesanti, in elettricità. Il primo "impianto stradale" è stato installato nel Porto di Amburgo, con l'obiettivo di testare la sostenibilità economica della soluzione su larga scala.

2026-05-22 📰 Fonte
La Guardia di Finanza smantella una vasta rete di pirateria audiovisiva in Europa
📁 Market AI generated ℹ️ The Next Web

La Guardia di Finanza smantella una vasta rete di pirateria audiovisiva in Europa

Un'operazione congiunta, denominata "Tutto Chiaro", ha portato allo smantellamento di una complessa rete di pirateria audiovisiva che trasmetteva illegalmente contenuti a pagamento da piattaforme come Sky, DAZN, Netflix, Disney+ e Spotify. L'indagine, condotta dalla Guardia di Finanza italiana, ha colpito oltre cento siti in Italia, Francia e Germania, interrompendo un sistema che riutilizzava codici di abbonamento legittimi per migliaia di utenti.

2026-05-22 📰 Fonte
Critterz: il film AI bloccato a Cannes per l'indisponibilità del modello generativo
📁 Market AI generated ℹ️ The Next Web

Critterz: il film AI bloccato a Cannes per l'indisponibilità del modello generativo

Il progetto di animazione "Critterz", sostenuto da OpenAI e presentato come il primo film commerciale realizzato con una pipeline di IA generativa, ha mancato la sua finestra al festival di Cannes. Il motivo principale è l'indisponibilità del modello video su cui era basato, evidenziando le sfide e i rischi legati alla dipendenza da infrastrutture e modelli di IA esterni per produzioni complesse e mission-critical.

2026-05-22 📰 Fonte
La Cina mappa la sua rete energetica rinnovabile con l'AI: un modello per il mondo?
📁 Altro AI generated ℹ️ AI News

La Cina mappa la sua rete energetica rinnovabile con l'AI: un modello per il mondo?

La Cina ha realizzato un inventario nazionale ad alta risoluzione della sua infrastruttura eolica e solare, utilizzando un modello di deep learning su immagini satellitari. Questo permette una coordinazione energetica su scala nazionale, affrontando le inefficienze attuali e la crescente domanda di elettricità dovuta all'AI, offrendo un potenziale modello per altre economie.

2026-05-22 📰 Fonte
OpenAI inaugura un laboratorio a Singapore e l'IMDA aggiorna il framework per l'AI agentica
📁 Altro AI generated ℹ️ AI News

OpenAI inaugura un laboratorio a Singapore e l'IMDA aggiorna il framework per l'AI agentica

OpenAI ha aperto il suo primo laboratorio di AI applicata fuori dagli Stati Uniti a Singapore, con un investimento di oltre 300 milioni di dollari di Singapore. L'iniziativa mira a creare ruoli tecnici e a supportare l'ecosistema locale. Contemporaneamente, l'IMDA di Singapore ha aggiornato il suo framework di governance per l'AI agentica, fornendo nuove linee guida e casi di studio per il deployment responsabile di questi sistemi, con un focus sulla mitigazione dei rischi e la responsabilità umana.

2026-05-22 📰 Fonte
AMD potenzia il recupero dei carichi di lavoro GPU: driver aggiornati per maggiore stabilità
📁 Hardware AI generated ✅ Phoronix

AMD potenzia il recupero dei carichi di lavoro GPU: driver aggiornati per maggiore stabilità

AMD ha rilasciato una serie di 42 patch per i driver kernel AMDGPU e AMDKFD, mirando a migliorare la capacità di recupero delle GPU da blocchi nei carichi di lavoro di calcolo. Questo aggiornamento introduce funzionalità di reset della pipeline, cruciali per garantire maggiore stabilità e continuità operativa, un aspetto fondamentale per i deployment on-premise di LLM e altre applicazioni AI.

2026-05-22 📰 Fonte
LLM e AI: l'onda di innovazione che ridefinisce i sottosistemi Linux
📁 Altro AI generated ✅ Phoronix

LLM e AI: l'onda di innovazione che ridefinisce i sottosistemi Linux

L'influenza degli LLM e dell'intelligenza artificiale si estende sempre più in profondità nei sistemi operativi. Dopo aver stimolato numerosi aggiornamenti nel sottosistema di rete di Linux, inclusi importanti patch di sicurezza per vulnerabilità di escalation dei privilegi, ora l'AI sta guidando un'intensa attività anche nel sottosistema audio. Molte delle recenti modifiche e patch sono state sviluppate o assistite da strumenti di intelligenza artificiale, evidenziando un nuovo paradigma nello sviluppo del kernel.

2026-05-22 📰 Fonte
L'espansione dell'AI nel Golfo: la sfida dei cavi sottomarini
📁 Altro AI generated ✅ Wired AI

L'espansione dell'AI nel Golfo: la sfida dei cavi sottomarini

Il rapido sviluppo dell'intelligenza artificiale nella regione del Golfo sta mettendo sotto pressione le infrastrutture internet esistenti. Con l'aumento della posta in gioco per i carichi di lavoro AI, gli hyperscaler spingono per una revisione delle reti sottomarine, evidenziando la crescente dipendenza da una connettività robusta e resiliente per sostenere l'innovazione e il deployment di Large Language Models.

2026-05-22 📰 Fonte
CPE broadband a Taiwan: l'onda del 10G tra volumi in crescita e pressioni sui prezzi
📁 Market AI generated ✅ DigiTimes

CPE broadband a Taiwan: l'onda del 10G tra volumi in crescita e pressioni sui prezzi

Il mercato taiwanese dei Customer Premises Equipment (CPE) si prepara a un'espansione significativa nel primo trimestre del 2026, trainato dagli aggiornamenti alla tecnicia 10 Gigabit (10G). Nonostante l'aumento dei volumi, il settore dovrà affrontare continue pressioni sui prezzi. Questa dinamica evidenzia la crescente domanda di infrastrutture di rete ad alta velocità, cruciali per i carichi di lavoro AI, ma anche la sfida di bilanciare innovazione e sostenibilità economica per i decision-maker tecnici.

2026-05-22 📰 Fonte
NVentures di NVIDIA investe in Alice & Bob, rafforzando il legame con CUDA-Q
📁 Hardware AI generated ℹ️ The Next Web

NVentures di NVIDIA investe in Alice & Bob, rafforzando il legame con CUDA-Q

NVentures, il braccio di venture capital di NVIDIA, ha investito in Alice & Bob, un'azienda di hardware quantistico con sede a Parigi e Boston. L'investimento rafforza la collaborazione esistente, in particolare il legame con il Framework CUDA-Q di NVIDIA. Alice & Bob è nota per la sua architettura proprietaria "cat-qubit", progettata per costruire macchine quantistiche tolleranti agli errori, un passo cruciale per la scalabilità e l'affidabilità del quantum computing.

2026-05-22 📰 Fonte
lemon-mlx-engine: ROCm 7.13 per LLM on-premise e correzioni per Qwen
📁 Frameworks AI generated ℹ️ LocalLLaMA

lemon-mlx-engine: ROCm 7.13 per LLM on-premise e correzioni per Qwen

Il progetto lemon-mlx-engine ha rilasciato un aggiornamento significativo, integrando la versione 7.13 di ROCm, la piattaforma open source di AMD per il calcolo su GPU. Questa novità permette agli utenti di sfruttare la potenza di ROCm su hardware locale con il motore MLX per i Large Language Models. La release include anche importanti correzioni di bug e kernel, specificamente mirate ai modelli Qwen3, 3.5 e 3.6, sia in configurazione MoE che dense, migliorando stabilità e performance nei deployment self-hosted.

2026-05-22 📰 Fonte
DeepSeek punta all'AGI con un round di finanziamento da 10 miliardi di dollari
📁 LLM AI generated ℹ️ The Next Web

DeepSeek punta all'AGI con un round di finanziamento da 10 miliardi di dollari

DeepSeek, guidata dal fondatore Liang Wenfeng, ha annunciato l'obiettivo di perseguire l'Intelligenza Artificiale Generale (AGI) come priorità principale. L'azienda, con sede a Hangzhou, sta conducendo il suo primo round di finanziamento esterno, puntando a raccogliere 10 miliardi di dollari. La strategia prevede di privilegiare la ricerca di frontiera rispetto ai ricavi immediati e di continuare a rilasciare modelli open source.

2026-05-22 📰 Fonte
Lenovo: ricavi record nel Q4, spinta dall'AI e vendite PC oltre le attese
📁 Market AI generated ℹ️ The Next Web

Lenovo: ricavi record nel Q4, spinta dall'AI e vendite PC oltre le attese

Lenovo ha registrato un quarto trimestre eccezionale, con ricavi che hanno raggiunto i 21,6 miliardi di dollari, superando le stime del mercato del 27% anno su anno. L'utile netto è balzato del 479% a 521 milioni di dollari, quasi il doppio delle previsioni. Un fattore chiave è stato il raddoppio dei ricavi legati all'AI, contribuendo a un anno fiscale record per l'azienda. Questo risultato sottolinea la crescente domanda di soluzioni tecniciche, inclusi i sistemi per l'intelligenza artificiale.

2026-05-22 📰 Fonte
AMD: la memoria si afferma come fattore critico per i chip AI, secondo Lisa Su
📁 Hardware AI generated ✅ DigiTimes

AMD: la memoria si afferma come fattore critico per i chip AI, secondo Lisa Su

Lisa Su, CEO di AMD, ha evidenziato come la memoria stia diventando un vincolo sempre più pressante per lo sviluppo e il deployment dei chip dedicati all'intelligenza artificiale. Questa osservazione sottolinea l'importanza della VRAM e della sua larghezza di banda per le performance degli LLM, specialmente in contesti on-premise dove l'ottimizzazione hardware è cruciale per il TCO e la sovranità dei dati. La gestione efficiente della memoria è fondamentale per carichi di lavoro AI complessi.

2026-05-22 📰 Fonte
Bliq.ai: Via libera in Estonia per i veicoli autonomi senza conducente
📁 Altro AI generated ℹ️ Tech.eu

Bliq.ai: Via libera in Estonia per i veicoli autonomi senza conducente

Bliq.ai ha ottenuto l'approvazione per operare veicoli completamente senza conducente sulle strade pubbliche in Estonia, segnando la prima autorizzazione di questo tipo in un paese dell'UE. L'azienda, che aggiorna veicoli esistenti con uno stack di sensori e computazione basato su AI, mira a estendere la mobilità autonoma a consumatori e aziende, enfatizzando un modello di retrofit e la supervisione remota. Questo sviluppo evidenzia l'importanza dell'AI all'edge e delle soluzioni di deployment locali nel settore della mobilità.

2026-05-22 📰 Fonte
Meta chiude il primo caso pilota sulla salute mentale giovanile
📁 Market AI generated ℹ️ The Next Web

Meta chiude il primo caso pilota sulla salute mentale giovanile

Meta ha raggiunto un accordo extragiudiziale nel primo processo intentato da un distretto scolastico statunitense, quello della Contea di Breathitt in Kentucky. La causa mirava a rendere le aziende di social media responsabili dei costi legati alla crisi della salute mentale giovanile. Questo accordo chiude un caso pilota che precede circa 1.200 azioni legali simili, sollevando interrogativi sulle future strategie legali del settore.

2026-05-22 📰 Fonte
AMD: la domanda di AI è concreta e i processori tornano protagonisti
📁 Market AI generated ✅ DigiTimes

AMD: la domanda di AI è concreta e i processori tornano protagonisti

Lisa Su, CEO di AMD, ha confermato la solidità della domanda nel settore dell'intelligenza artificiale, evidenziando un rinnovato interesse per il ruolo delle CPU. Questo spostamento strategico suggerisce un'evoluzione nell'architettura dei carichi di lavoro AI, con implicazioni significative per le decisioni di deployment on-premise e l'ottimizzazione del TCO per le aziende che gestiscono LLM e altre applicazioni AI.

2026-05-22 📰 Fonte
NVIDIA investe in Alice & Bob per l'accelerazione del quantum computing ibrido
📁 Altro AI generated ℹ️ Tech.eu

NVIDIA investe in Alice & Bob per l'accelerazione del quantum computing ibrido

NVentures, il braccio di venture capital di NVIDIA, ha ampliato il round di Serie B da 100 milioni di euro di Alice & Bob, azienda francese specializzata in quantum computing fault-tolerant. L'investimento rafforza la collaborazione tecnica tra le due aziende, focalizzata sullo sviluppo di architetture ibride che combinano elaborazione quantistica e classica. L'obiettivo è portare i computer quantistici nei centri di calcolo ad alte prestazioni, integrando i "cat-qubit" di Alice & Bob con l'ecosistema di computing accelerato di NVIDIA.

2026-05-22 📰 Fonte
Anthropic valuta i chip Maia di Microsoft per ridurre la dipendenza da Nvidia
📁 Hardware AI generated ✅ DigiTimes

Anthropic valuta i chip Maia di Microsoft per ridurre la dipendenza da Nvidia

Anthropic, uno dei principali sviluppatori di Large Language Models (LLM), starebbe considerando l'adozione dei chip Maia di Microsoft. Questa mossa strategica mira a diversificare i fornitori di hardware e a ridurre la dipendenza da Nvidia, il fornitore dominante di GPU. La decisione riflette una tendenza crescente nel settore AI verso l'ottimizzazione dei costi e un maggiore controllo sull'infrastruttura, con implicazioni significative per i deployment on-premise e la supply chain.

2026-05-22 📰 Fonte
La dipendenza tecnicica globale: implicazioni per l'AI on-premise
📁 Altro AI generated ✅ DigiTimes

La dipendenza tecnicica globale: implicazioni per l'AI on-premise

La crescente interdipendenza nelle catene di fornitura tecniciche, come evidenziato nel settore delle energie rinnovabili, solleva questioni cruciali per l'adozione dell'AI. Per le organizzazioni che implementano Large Language Models (LLM) on-premise, comprendere i rischi legati alla sovranità dei dati, alla disponibilità dell'hardware e al controllo infrastrutturale è fondamentale. Questo articolo esplora come una strategia di deployment locale possa mitigare tali vulnerabilità, garantendo autonomia operativa e resilienza strategica nel panorama AI.

2026-05-22 📰 Fonte
Il paradosso di Apple Pay: la funzione già operativa richiesta dal marketing
📁 Altro AI generated ✅ The Register AI

Il paradosso di Apple Pay: la funzione già operativa richiesta dal marketing

Un professionista IT ha raccontato un episodio in cui il team marketing di un rivenditore britannico ha richiesto l'implementazione di Apple Pay sul sito aziendale, ignorando che la funzionalità fosse già attiva e pienamente operativa. L'equivoco è emerso a causa di test condotti esclusivamente su dispositivi non-Apple, evidenziando una comune disconnessione tra le aspettative aziendali e la comprensione tecnica delle funzionalità web dinamiche.

2026-05-22 📰 Fonte
EverDisplay rinnova la leadership: un segnale per il futuro dell'AI on-premise?
📁 Market AI generated ✅ DigiTimes

EverDisplay rinnova la leadership: un segnale per il futuro dell'AI on-premise?

EverDisplay ha annunciato un significativo riassetto del proprio consiglio di amministrazione, nominando un ex dirigente di Hua Hong come nuovo presidente. Questa mossa strategica solleva interrogativi sulle direzioni future del settore tecnicico, in particolare per quanto riguarda la catena di fornitura e lo sviluppo di componenti critici per l'infrastruttura AI on-premise. Le decisioni ai vertici aziendali possono influenzare profondamente l'innovazione e le strategie di deployment per i Large Language Models.

2026-05-22 📰 Fonte
REPS raccoglie 23,6 milioni di dollari per trasformare le strade in centrali elettriche
📁 Market AI generated ℹ️ Tech.eu

REPS raccoglie 23,6 milioni di dollari per trasformare le strade in centrali elettriche

La startup tirolese REPS ha chiuso un round di finanziamento da 23,6 milioni di dollari per espandere il suo sistema brevettato di produzione energetica stradale. Questa tecnicia innovativa converte il traffico veicolare in elettricità pulita, installandosi direttamente nell'infrastruttura esistente senza interruzioni. Con un'efficienza dichiarata 254 volte superiore alle alternative e un rapido ammortamento, REPS mira a recuperare l'energia meccanica sprecata, offrendo una soluzione sostenibile per porti, hub logistici e città.

2026-05-22 📰 Fonte
AIC espande i circuiti integrati analogici nelle fibre ottiche, ordini fino al 2027
📁 Altro AI generated ✅ DigiTimes

AIC espande i circuiti integrati analogici nelle fibre ottiche, ordini fino al 2027

AIC, azienda specializzata in circuiti integrati analogici, sta ampliando la sua offerta nel settore delle fibre ottiche. L'espansione è significativa, con ordini che si estendono fino al primo trimestre del 2027, evidenziando una crescente domanda per componenti essenziali nelle infrastrutture di rete ad alta velocità. Questi elementi sono cruciali per i deployment di Large Language Models e altri carichi di lavoro AI, specialmente in contesti on-premise dove la sovranità dei dati è prioritaria.

2026-05-22 📰 Fonte
Taiwan: nuove direttive per la governance dell'AI tra rischio e competenze
📁 Altro AI generated ✅ DigiTimes

Taiwan: nuove direttive per la governance dell'AI tra rischio e competenze

Taiwan si muove per stabilire un framework normativo per l'intelligenza artificiale, concentrandosi su gestione del rischio, sviluppo del talento e formazione. Questa iniziativa riflette una tendenza globale verso una maggiore regolamentazione dell'AI, con implicazioni significative per le strategie di deployment aziendali, la sovranità dei dati e la conformità.

2026-05-22 📰 Fonte
Taiwan e il Ruolo Strategico dei Chip nell'Era dell'AI On-Premise
📁 Market AI generated ✅ DigiTimes

Taiwan e il Ruolo Strategico dei Chip nell'Era dell'AI On-Premise

Taiwan sta capitalizzando un'espansione delle esportazioni guidata dal settore dei semiconduttori per finanziare una profonda riconversione industriale. Questo scenario evidenzia la centralità del silicio avanzato per l'infrastruttura AI globale, influenzando direttamente le strategie di deployment on-premise e la sovranità dei dati per le aziende che sviluppano Large Language Models.

2026-05-22 📰 Fonte
Sicurezza AI e Sovranità Digitale: Priorità nei Vertici Geopolitici
📁 Altro AI generated ✅ DigiTimes

Sicurezza AI e Sovranità Digitale: Priorità nei Vertici Geopolitici

I recenti colloqui tra Giappone e Corea del Sud hanno evidenziato la sicurezza dell'AI come punto chiave nell'agenda strategica. Questa enfasi riflette una crescente preoccupazione globale per la sovranità dei dati e il controllo delle infrastrutture AI, spingendo le nazioni a valutare deployment on-premise e soluzioni self-hosted per carichi di lavoro critici.

2026-05-22 📰 Fonte
Wuhan e Huagong Tech: un modulo ottico da 12.8 Tbps per l'AI cinese
📁 Hardware AI generated ✅ DigiTimes

Wuhan e Huagong Tech: un modulo ottico da 12.8 Tbps per l'AI cinese

Il polo ottico di Wuhan, in Cina, sta rafforzando il suo impegno nell'intelligenza artificiale con il debutto di un modulo ottico da 12.8 Tbps, sviluppato da Huagong Tech. Questo componente è cruciale per le infrastrutture AI, facilitando interconnessioni ad alta velocità necessarie per i carichi di lavoro intensivi di Large Language Models (LLM) e per la costruzione di data center all'avanguardia.

2026-05-22 📰 Fonte
AP Memory IPD entra nella catena di fornitura EMIB di Intel, consegne dal 2026
📁 Hardware AI generated ✅ DigiTimes

AP Memory IPD entra nella catena di fornitura EMIB di Intel, consegne dal 2026

AP Memory IPD si unisce alla catena di fornitura di Intel per la tecnicia EMIB (Embedded Multi-die Interconnect Bridge), con consegne previste a partire dal secondo trimestre del 2026. Questa integrazione evidenzia l'importanza crescente delle soluzioni di packaging avanzato per i chip ad alte prestazioni, fondamentali per l'evoluzione dell'hardware destinato ai carichi di lavoro AI e Large Language Models (LLM), specialmente in contesti on-premise dove efficienza, densità e controllo sono fattori chiave per le decisioni di deployment.

2026-05-22 📰 Fonte
AI Generativa e Dati Pubblici: Un Framework per l'Accesso Sicuro ai Dati sulla Sicurezza Stradale
📁 Frameworks AI generated 🏆 ArXiv cs.CL

AI Generativa e Dati Pubblici: Un Framework per l'Accesso Sicuro ai Dati sulla Sicurezza Stradale

Un nuovo framework basato su LLM promette di democratizzare l'accesso ai dati sulla sicurezza dei trasporti, superando le barriere tecniche per enti locali e cittadini. La soluzione, che separa l'interpretazione del linguaggio naturale dall'esecuzione deterministica su un database PostGIS, garantisce affidabilità e riproducibilità. Valutato con successo su un database del Massachusetts, il sistema offre un modello per l'AI affidabile nel settore pubblico, affrontando le sfide di governance e accuratezza.

2026-05-22 📰 Fonte
CR4T: Un Nuovo Approccio alla Sicurezza degli LLM per gli Utenti Adolescenti
📁 LLM AI generated 🏆 ArXiv cs.CL

CR4T: Un Nuovo Approccio alla Sicurezza degli LLM per gli Utenti Adolescenti

I Large Language Models (LLM) sono sempre più presenti nelle interazioni digitali degli adolescenti, ma i meccanismi di sicurezza attuali sono spesso inadeguati e orientati al rifiuto. Il framework CR4T (Critique-and-Revise-for-Teenagers) propone un approccio innovativo, trasformando le risposte potenzialmente insicure o evasive in contenuti appropriati e orientati alla guida, preservando l'intento originale. Questo metodo, basato sulla riscrittura selettiva, offre una soluzione più umana e costruttiva.

2026-05-22 📰 Fonte
LLM compatti: prevedere il successo della ricerca scientifica prima degli esperimenti
📁 LLM AI generated 🏆 ArXiv cs.LG

LLM compatti: prevedere il successo della ricerca scientifica prima degli esperimenti

Un nuovo studio esplora la capacità dei Large Language Models (LLM) di prevedere il successo empirico di idee di ricerca prima di qualsiasi sperimentazione. Utilizzando un dataset di 11.488 coppie di idee, i ricercatori hanno dimostrato che modelli da 8 miliardi di parametri, sottoposti a Fine-tuning, raggiungono un'accuratezza del 77,1%, superando GPT-5 (61,1%). Questi LLM compatti e computazionalmente efficienti offrono una via scalabile per l'accelerazione della scoperta scientifica autonoma.

2026-05-22 📰 Fonte
Temporal Contrastive Transformer: Nuove Frontiere per il Rilevamento di Frodi Finanziarie
📁 LLM AI generated 🏆 ArXiv cs.LG

Temporal Contrastive Transformer: Nuove Frontiere per il Rilevamento di Frodi Finanziarie

Un nuovo framework, il Temporal Contrastive Transformer (TCT), promette di rivoluzionare il rilevamento di frodi finanziarie. Utilizzando un approccio self-supervised, TCT genera embeddings che catturano le dinamiche temporali delle transazioni, offrendo prestazioni predittive significative. Sebbene le sue rappresentazioni si sovrappongano a quelle delle feature ingegnerizzate manualmente, il modello raggiunge risultati comparabili senza tale sforzo, indicando un potenziale per ridurre la dipendenza dall'ingegneria delle feature nel settore.

2026-05-22 📰 Fonte
COSMO-Agent: LLM e Reinforcement Learning per l'ottimizzazione del design industriale
📁 Frameworks AI generated 🏆 ArXiv cs.AI

COSMO-Agent: LLM e Reinforcement Learning per l'ottimizzazione del design industriale

COSMO-Agent è un framework di reinforcement learning che integra LLM con strumenti esterni per colmare il divario semantico tra CAD e CAE nel design industriale. Insegnando agli LLM a orchestrare la generazione, la simulazione e la revisione geometrica, il sistema migliora l'efficienza e la stabilità dei processi. I test dimostrano che piccoli LLM open source, addestrati con COSMO-Agent, superano modelli più grandi e proprietari in termini di fattibilità e prestazioni, offrendo nuove prospettive per l'ottimizzazione on-premise.

2026-05-22 📰 Fonte
← Precedente Page 11 / 119 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge