AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

Siri e la privacy: Apple punta sull'eliminazione automatica delle chat
📁 Altro AI generated ✅ TechCrunch AI

Siri e la privacy: Apple punta sull'eliminazione automatica delle chat

Apple si prepara a presentare una nuova versione di Siri, con la privacy al centro della strategia. Tra le novità attese, spicca la potenziale introduzione di funzionalità per l'eliminazione automatica delle chat, un passo significativo per rafforzare il controllo degli utenti sui propri dati. Questa mossa riflette una crescente attenzione del settore alla sovranità dei dati e alle configurazioni self-hosted, dove la gestione locale delle informazioni diventa cruciale.

2026-05-17 📰 Fonte
Processo Musk-OpenAI: la fiducia al centro del dibattito
📁 Market AI generated ✅ TechCrunch AI

Processo Musk-OpenAI: la fiducia al centro del dibattito

Nelle fasi conclusive del processo tra Elon Musk e OpenAI, la questione della fiducia nel CEO Sam Altman è emersa come un tema centrale. Questo dibattito evidenzia l'importanza della trasparenza e della governance nel settore AI, influenzando le decisioni strategiche delle aziende riguardo l'adozione e il deployment di Large Language Models, specialmente per chi valuta soluzioni on-premise.

2026-05-17 📰 Fonte
Tata Electronics e ASML: un polo per i chip in India da 11 miliardi di dollari
📁 Hardware AI generated ℹ️ Tech in Asia

Tata Electronics e ASML: un polo per i chip in India da 11 miliardi di dollari

Tata Electronics ha annunciato un investimento di 11 miliardi di dollari per la costruzione di un impianto di produzione di semiconduttori a Dholera, in India, con la collaborazione di ASML. Questo progetto mira a rafforzare l'autonomia indiana nel settore dei chip, cruciale per l'ecosistema tecnicico globale e per la disponibilità di hardware per i deployment on-premise di carichi di lavoro AI e LLM.

2026-05-17 📰 Fonte
OpenAI unifica ChatGPT e Codex: Brockman alla guida della strategia di prodotto
📁 LLM AI generated ℹ️ Tech in Asia

OpenAI unifica ChatGPT e Codex: Brockman alla guida della strategia di prodotto

OpenAI, sotto la guida di Greg Brockman per la strategia di prodotto, intende integrare le capacità di ChatGPT e Codex in un'unica esperienza utente. Questa mossa strategica mira a semplificare l'interazione con i Large Language Models, offrendo un accesso più coeso a funzionalità che spaziano dalla conversazione alla generazione di codice. L'iniziativa potrebbe influenzare le future architetture di deployment per le aziende che valutano soluzioni LLM self-hosted.

2026-05-17 📰 Fonte
Aumenti di prezzo per Tesla Model Y: un riflesso sulle dinamiche di mercato
📁 Market AI generated ℹ️ Tech in Asia

Aumenti di prezzo per Tesla Model Y: un riflesso sulle dinamiche di mercato

Tesla ha nuovamente ritoccato al rialzo i prezzi della Model Y negli Stati Uniti, con incrementi fino a 1.000 dollari per alcune versioni. Questo movimento, sebbene specifico per il settore automobilistico, evidenzia dinamiche di mercato più ampie che possono influenzare anche le decisioni strategiche e i costi di deployment per l'infrastruttura AI, in particolare per le soluzioni on-premise.

2026-05-17 📰 Fonte
Le aziende tech filippine più finanziate: un decennio di innovazione
📁 Market AI generated ℹ️ Tech in Asia

Le aziende tech filippine più finanziate: un decennio di innovazione

Un'analisi delle principali aziende tecniciche delle Filippine che hanno attratto i maggiori investimenti nell'ultimo decennio. Queste realtà emergenti sono posizionate per influenzare significativamente l'evoluzione del panorama tecnicico nazionale, delineando le future direzioni dell'innovazione e del mercato locale.

2026-05-17 📰 Fonte
Riunione privata all'HQ di Uber: il futuro dell'Iran e il ruolo della tecnicia
📁 Market AI generated ✅ 404 Media

Riunione privata all'HQ di Uber: il futuro dell'Iran e il ruolo della tecnicia

Un incontro privato di figure di spicco della diaspora iraniana si terrà presso la sede di Uber per discutere di tecnicia e del futuro dell'Iran. L'evento, rivelato da 404 Media, vedrà la partecipazione di venture capitalist, CEO del settore tech e il figlio dell'ex leader iraniano, evidenziando il potenziale impatto delle discussioni private sulle strategie tecniciche future.

2026-05-17 📰 Fonte
L'intelligenza artificiale ridefinisce il mercato del lavoro: emergono nuove figure professionali
📁 Market AI generated ℹ️ The Next Web

L'intelligenza artificiale ridefinisce il mercato del lavoro: emergono nuove figure professionali

L'avanzata dell'intelligenza artificiale sta trasformando radicalmente il panorama occupazionale, introducendo nuove figure professionali e modificando le strutture organizzative aziendali. Questo fenomeno non riguarda solo l'automazione, ma la creazione di ruoli inediti e la riqualificazione di professioni esistenti, richiedendo nuove competenze e strategie di deployment per gli LLM, specialmente in contesti self-hosted.

2026-05-17 📰 Fonte
Siri in iOS 27: controllo sulla cronologia chat e implicazioni per la sovranità dei dati
📁 Altro AI generated ℹ️ The Next Web

Siri in iOS 27: controllo sulla cronologia chat e implicazioni per la sovranità dei dati

Apple introdurrà una funzione di eliminazione automatica per le cronologie chat nell'app Siri standalone di iOS 27. Gli utenti potranno configurare la conservazione dei dati per periodi definiti o indefinitamente. Questa novità, sebbene rivolta al consumatore, solleva questioni rilevanti per le aziende che gestiscono LLM, evidenziando l'importanza della sovranità e del controllo sui dati in contesti enterprise.

2026-05-17 📰 Fonte
Soderbergh e l'AI di Meta nel documentario su Lennon: un caso studio controverso
📁 LLM AI generated ℹ️ The Next Web

Soderbergh e l'AI di Meta nel documentario su Lennon: un caso studio controverso

Il nuovo documentario di Steven Soderbergh, "John Lennon: The Last Interview", presentato al 79° Festival di Cannes, ha suscitato dibattito per l'uso dell'intelligenza artificiale di Meta. Basato su un'intervista inedita del 1980, il film ha ricevuto critiche negative, ma il regista suggerisce che la reazione fosse intenzionale, sollevando interrogativi sull'applicazione dell'AI nell'arte e nella conservazione storica.

2026-05-17 📰 Fonte
La speranza di un Gemma da 124B: implicazioni per il deployment on-premise
📁 LLM AI generated ℹ️ LocalLLaMA

La speranza di un Gemma da 124B: implicazioni per il deployment on-premise

Un post su Reddit ha acceso il dibattito sulla possibilità di avere LLM di grandi dimensioni, come un ipotetico Gemma da 124 miliardi di parametri, disponibili per il deployment self-hosted. Questa prospettiva solleva questioni cruciali riguardo ai requisiti hardware, alle sfide di Inference e ai trade-off tra controllo dei dati e costi infrastrutturali per le aziende che valutano soluzioni on-premise.

2026-05-17 📰 Fonte
OpenAI: Greg Brockman unifica ChatGPT e Codex per una piattaforma "agentica"
📁 LLM AI generated ℹ️ The Next Web

OpenAI: Greg Brockman unifica ChatGPT e Codex per una piattaforma "agentica"

Greg Brockman, presidente e co-fondatore di OpenAI, assume la guida della strategia di prodotto, consolidando ChatGPT, Codex e l'API per sviluppatori in un'unica organizzazione. Questa mossa mira a creare una piattaforma "agentica" unificata, ottimizzando lo sviluppo e il deployment di Large Language Models. La riorganizzazione sottolinea l'importanza di un approccio integrato per l'evoluzione dei sistemi AI, con implicazioni significative per le strategie di adozione e gestione dei modelli da parte delle aziende che valutano soluzioni self-hosted.

2026-05-17 📰 Fonte
La percezione dell'AI: una sfida per l'adozione e il deployment aziendale
📁 Altro AI generated ✅ TechCrunch AI

La percezione dell'AI: una sfida per l'adozione e il deployment aziendale

La crescente cautela pubblica verso l'intelligenza artificiale solleva interrogativi cruciali per le aziende che valutano strategie di deployment. Questa percezione influenza le decisioni su controllo, sovranità dei dati e TCO, spingendo verso soluzioni on-premise o ibride per garantire trasparenza e fiducia, elementi fondamentali per un'adozione responsabile e sostenibile degli LLM.

2026-05-17 📰 Fonte
Canonical rilascia ISO Ubuntu 'Concept' per la CPU AI CIX P1
📁 Hardware AI generated ✅ Phoronix

Canonical rilascia ISO Ubuntu 'Concept' per la CPU AI CIX P1

Canonical ha iniziato a rilasciare ISO "Concept" di Ubuntu specificamente ottimizzate per la CPU CIX P1, una piattaforma dedicata all'intelligenza artificiale. Queste distribuzioni mirano a fornire un supporto hardware all'avanguardia che non è ancora integrato nel kernel Linux principale, un approccio fondamentale per le aziende che cercano di massimizzare le performance e il controllo nei loro deployment AI on-premise.

2026-05-17 📰 Fonte
La corsa alle competenze AI nell'automotive: implicazioni per l'infrastruttura
📁 Altro AI generated ✅ TechCrunch AI

La corsa alle competenze AI nell'automotive: implicazioni per l'infrastruttura

Il settore automotive si trova al centro di una crescente "corsa alle competenze AI", che evidenzia la necessità di infrastrutture robuste e strategie di deployment ben definite. Le aziende devono bilanciare l'acquisizione di talenti con la costruzione di capacità computazionali adeguate, valutando attentamente le opzioni on-premise e cloud per garantire sovranità dei dati e controllo sui propri carichi di lavoro AI.

2026-05-17 📰 Fonte
llama.cpp: Ottimizzazione Cruciale Migliora la Velocità di Elaborazione dei Prompt
📁 Frameworks AI generated ℹ️ LocalLLaMA

llama.cpp: Ottimizzazione Cruciale Migliora la Velocità di Elaborazione dei Prompt

Un recente aggiornamento per `llama.cpp` promette un significativo incremento nella velocità di elaborazione dei prompt. La modifica, introdotta tramite una Pull Request, mira a evitare la copia dei logit durante la fase di decodifica in ambienti multi-thread, un'ottimizzazione che si traduce in maggiore efficienza per i deployment di Large Language Models on-premise e locali, con impatti positivi su latenza e Throughput.

2026-05-17 📰 Fonte
Quantization KV Cache per LLM on-premise: bilanciare VRAM e qualità
📁 LLM AI generated ℹ️ LocalLLaMA

Quantization KV Cache per LLM on-premise: bilanciare VRAM e qualità

Un dibattito tra sviluppatori evidenzia la sfida di ottimizzare l'uso della VRAM per i Large Language Models (LLM) in deployment on-premise. La questione centrale riguarda la quantization del KV cache (Q4_0 vs Q8_0) e il suo impatto sulla qualità del modello, specialmente con finestre di contesto estese. La necessità di ridurre il fabbisogno di VRAM si scontra con il timore di compromettere le performance, un dilemma comune per chi gestisce infrastrutture locali.

2026-05-17 📰 Fonte
LLM On-Premise: Controllo, Costi e Sovranità dei Dati nell'Era dell'AI
📁 Altro AI generated ℹ️ The Next Web

LLM On-Premise: Controllo, Costi e Sovranità dei Dati nell'Era dell'AI

L'adozione di Large Language Models (LLM) on-premise sta guadagnando terreno tra le aziende, spinte dalla necessità di maggiore controllo sui dati, compliance normativa e ottimizzazione del Total Cost of Ownership (TCO). Questo approccio self-hosted offre un'alternativa strategica alle soluzioni cloud, richiedendo un'attenta valutazione dei requisiti hardware, delle tecniche di ottimizzazione e delle implicazioni per la sovranità dei dati.

2026-05-17 📰 Fonte
ASML equipaggerà il primo impianto di chip commerciale indiano da 11 miliardi di dollari
📁 Market AI generated ℹ️ Tom's Hardware

ASML equipaggerà il primo impianto di chip commerciale indiano da 11 miliardi di dollari

ASML, leader mondiale nelle apparecchiature per la litografia, fornirà la tecnicia essenziale per il primo impianto di produzione di chip commerciale dell'India. Situato a Dholera, il progetto da 11 miliardi di dollari mira a produrre 50.000 wafer al mese, segnando un passo cruciale per l'India verso l'autosufficienza nel settore dei semiconduttori e la riduzione della dipendenza dalle catene di approvvigionamento globali. L'iniziativa ha profonde implicazioni per la sovranità tecnicica e la sicurezza economica del paese.

2026-05-17 📰 Fonte
L'infrastruttura IT come pilastro per le performance aziendali e l'AI
📁 Altro AI generated ℹ️ The Next Web

L'infrastruttura IT come pilastro per le performance aziendali e l'AI

Ogni azienda solida poggia su fondamenta robuste. L'infrastruttura IT, in particolare quella dedicata ai carichi di lavoro di Large Language Models (LLM), si rivela cruciale per sostenere la crescita, garantire efficienza operativa e massimizzare la produttività. Per le organizzazioni che valutano deployment on-premise, la scelta infrastrutturale è strategica per la sovranità dei dati e il Total Cost of Ownership (TCO).

2026-05-17 📰 Fonte
Iniezione di Prompt: quando i bot di LinkedIn parlano in Old English
📁 Altro AI generated ℹ️ Tom's Hardware

Iniezione di Prompt: quando i bot di LinkedIn parlano in Old English

Un utente ha sfruttato una tecnica di iniezione di prompt per manipolare i bot di reclutamento di LinkedIn, inducendoli a rispondere in prosa antica e a rivolgersi a lui come "My Lord". L'episodio evidenzia le vulnerabilità degli LLM e le sfide di sicurezza per le aziende che implementano soluzioni basate sull'intelligenza artificiale, sottolineando l'importanza di strategie di mitigazione robuste.

2026-05-17 📰 Fonte
ArXiv introduce un divieto di un anno per i paper generati da IA non verificati
📁 LLM AI generated ℹ️ The Next Web

ArXiv introduce un divieto di un anno per i paper generati da IA non verificati

ArXiv, il noto repository open-access per preprint scientifici, ha annunciato una nuova politica. Gli autori che sottoporranno articoli con evidenti segni di generazione automatica tramite intelligenza artificiale, senza adeguata revisione umana, saranno banditi per un anno. La misura, comunicata da Thomas Dietterich, mira a preservare l'integrità della ricerca distribuita sulla piattaforma da oltre trent'anni.

2026-05-17 📰 Fonte
Mikron trasforma i wafer di silicio in opere d'arte da collezione
📁 Hardware AI generated ℹ️ Tom's Hardware

Mikron trasforma i wafer di silicio in opere d'arte da collezione

Mikron, produttore russo di semiconduttori, ha lanciato una linea di souvenir insoliti: wafer di silicio incorniciati, contenenti fino a 120.000 processori di test. Disponibili in dodici design diversi e venduti a circa 170 dollari l'uno, questi oggetti d'arte da parete sono accompagnati da fiale di aria di camera bianca a 2 dollari. Un'iniziativa che celebra la microelettronica in una forma inaspettata, trasformando il cuore della tecnicia in un pezzo da collezione.

2026-05-17 📰 Fonte
Negoziati cruciali per Samsung: sciopero in fabbrica di chip minaccia la catena di fornitura
📁 Market AI generated ℹ️ The Next Web

Negoziati cruciali per Samsung: sciopero in fabbrica di chip minaccia la catena di fornitura

Samsung Electronics e il suo principale sindacato riprendono i negoziati in quella che il Primo Ministro sudcoreano ha definito "l'ultima possibilità" per evitare uno sciopero di 18 giorni. La potenziale interruzione nella produzione del più grande produttore mondiale di chip di memoria potrebbe avere ripercussioni significative sulla catena di fornitura globale, influenzando la disponibilità di hardware essenziale per i deployment AI on-premise.

2026-05-17 📰 Fonte
Un layer open source porta Reflex e Anti-Lag 2 su GPU AMD e Intel con Linux
📁 Hardware AI generated ✅ Phoronix

Un layer open source porta Reflex e Anti-Lag 2 su GPU AMD e Intel con Linux

Il progetto open source `low_latency_layer` introduce un layer Vulkan implicito che estende la compatibilità di tecnicie come AMD Anti-Lag 2 e NVIDIA Reflex 2. Questa soluzione, agnostica all'hardware e progettata per Linux, consente a schede grafiche AMD e Intel di sfruttare queste funzionalità di riduzione della latenza, superando le tradizionali limitazioni legate al produttore. Rappresenta un passo verso una maggiore flessibilità nell'utilizzo dell'hardware grafico in ambienti self-hosted.

2026-05-17 📰 Fonte
Destinus punta a una quotazione da 5 miliardi di euro con un nuovo round di finanziamento
📁 Market AI generated ℹ️ The Next Web

Destinus punta a una quotazione da 5 miliardi di euro con un nuovo round di finanziamento

La startup olandese Destinus, attiva nel settore della difesa con la produzione di missili da crociera e droni autonomi, sta negoziando per raccogliere circa 200 milioni di euro. L'operazione precede una potenziale offerta pubblica iniziale (IPO), con l'azienda che mira a una valutazione superiore ai 5 miliardi di euro, basata su previsioni di ricavi annuali di circa 500 milioni di euro.

2026-05-17 📰 Fonte
Valutazione delle tecniche di "abliteration" per LLM: un'analisi su Qwen3.6-27B
📁 LLM AI generated ℹ️ LocalLLaMA

Valutazione delle tecniche di "abliteration" per LLM: un'analisi su Qwen3.6-27B

Un'analisi approfondita ha confrontato cinque varianti "abliterated" del modello Qwen3.6-27B, impiegando 85 ore di GPU su una singola RTX 5090. Lo studio ha esaminato benchmark di capacità, sicurezza e modifiche a livello di pesi, rivelando come le diverse tecniche influenzino le performance e la rimozione dei contenuti indesiderati. Heretic e Huihui emergono per la migliore preservazione delle capacità, mentre altre mostrano compromessi significativi.

2026-05-17 📰 Fonte
L'Offensiva Cinese nel Mercato Canadese dei Veicoli Elettrici
📁 Market AI generated ℹ️ The Next Web

L'Offensiva Cinese nel Mercato Canadese dei Veicoli Elettrici

Il mercato canadese dei veicoli elettrici si prepara ad accogliere l'arrivo di modelli cinesi, con quasi 400 concessionari già in competizione per la loro distribuzione. Un dirigente del settore automobilistico canadese, Michael MacGillivray, ha espresso grande apprezzamento per la qualità dei materiali e la tecnicia osservata durante una recente visita al Salone dell'Auto di Pechino.

2026-05-17 📰 Fonte
LineShine: il supercomputer cinese da 1.54 exaflops con 2.4 milioni di core Armv9
📁 Hardware AI generated ℹ️ Tom's Hardware

LineShine: il supercomputer cinese da 1.54 exaflops con 2.4 milioni di core Armv9

La Cina ha svelato LineShine, un supercomputer da 1.54 exaflops basato esclusivamente su CPU, equipaggiato con 2.4 milioni di core Armv9 progettati da Huawei. Questa architettura CPU-only rappresenta una risposta strategica alle restrizioni sulle GPU imposte dagli Stati Uniti, evidenziando un percorso alternativo per raggiungere elevate capacità di calcolo e rafforzare la sovranità tecnicica in settori critici come l'HPC e l'AI.

2026-05-17 📰 Fonte
llama.cpp: Nuove Vette di Performance con Dual GPU e KV Cache Quantizzato
📁 Hardware AI generated ℹ️ LocalLLaMA

llama.cpp: Nuove Vette di Performance con Dual GPU e KV Cache Quantizzato

Un nuovo fork di llama.cpp risolve un problema di lunga data con il tensor parallelism, permettendo l'uso di KV cache quantizzati su configurazioni dual GPU. Questo porta a un incremento di oltre il 40% nelle prestazioni per l'inference di LLM, come dimostrato con un modello Qwen da 27B su hardware consumer. La soluzione è cruciale per chi cerca efficienza on-premise e un TCO ottimizzato.

2026-05-17 📰 Fonte
Costi LLM: OpenClaw spende 1,3 milioni di dollari in un mese per API OpenAI
📁 Market AI generated ℹ️ Tom's Hardware

Costi LLM: OpenClaw spende 1,3 milioni di dollari in un mese per API OpenAI

Il caso OpenClaw evidenzia i costi elevati dell'utilizzo intensivo di Large Language Models tramite API cloud. In un solo mese, il progetto ha sostenuto una spesa di 1,3 milioni di dollari per 603 miliardi di token e 7,6 milioni di richieste, gestite da 100 agenti di codifica. Questo episodio sottolinea l'importanza di valutare attentamente le strategie di deployment, confrontando i modelli basati su cloud con le alternative self-hosted per ottimizzare il TCO e la sovranità dei dati.

2026-05-17 📰 Fonte
Deepseek V4 e la finestra di contesto da 1M: limiti e opportunità pratiche
📁 LLM AI generated ℹ️ LocalLLaMA

Deepseek V4 e la finestra di contesto da 1M: limiti e opportunità pratiche

Un'analisi approfondita della finestra di contesto da 1 milione di token di Deepseek V4 rivela prestazioni solide fino a 150.000 token, ma una significativa degradazione della precisione e un'elevata latenza oltre i 300.000. I test su codebase reali evidenziano la necessità di tecniche di prompt engineering avanzate e di un layer di validazione per l'uso in produzione, sottolineando i compromessi critici per le aziende che valutano deployment on-premise di LLM con ampie finestre di contesto.

2026-05-17 📰 Fonte
Lightroom CC su Linux: un developer e Claude Code aprono nuove vie con Wine
📁 Altro AI generated ✅ Phoronix

Lightroom CC su Linux: un developer e Claude Code aprono nuove vie con Wine

Un developer open source, con il supporto di Claude Code, è riuscito a far funzionare Adobe Lightroom CC su Linux tramite Wine. Questo risultato evidenzia il potenziale delle soluzioni di compatibilità e dell'assistenza AI nel superare le barriere tra sistemi operativi proprietari e ambienti open source, offrendo nuove prospettive per il deployment di software professionali.

2026-05-17 📰 Fonte
La sovranità digitale nell'era dell'AI: implicazioni per i deployment on-premise
📁 Altro AI generated ℹ️ Tom's Hardware

La sovranità digitale nell'era dell'AI: implicazioni per i deployment on-premise

La recente dichiarazione di sovranità di Taiwan, sebbene di natura politica, solleva questioni più ampie sulla sovranità nell'era digitale. Per le aziende che adottano l'intelligenza artificiale, la sovranità dei dati e il controllo sull'infrastruttura diventano fattori critici. Questo articolo esplora come i deployment on-premise di Large Language Models (LLM) offrano soluzioni per affrontare le sfide di compliance, sicurezza e controllo strategico, analizzando i trade-off e le considerazioni infrastrutturali.

2026-05-17 📰 Fonte
Chatbot AI locale in valigia: Nvidia Jetson e Gemma 4 E4B per risposte in 200ms
📁 Altro AI generated ℹ️ Tom's Hardware

Chatbot AI locale in valigia: Nvidia Jetson e Gemma 4 E4B per risposte in 200ms

Un innovatore ha realizzato "Suitcase Eyes", un chatbot AI portatile e completamente locale, integrato in una valigia. Alimentato da Nvidia Jetson e basato sul modello Gemma 4 E4B, il sistema offre risposte rapide con una latenza di soli 200 millisecondi, dimostrando il potenziale del deployment AI on-premise e all'edge per applicazioni che richiedono controllo dei dati e bassa latenza.

2026-05-17 📰 Fonte
Jensen Huang (Nvidia): 'Le GPU non sono armi nucleari', critica le restrizioni globali
📁 Altro AI generated ℹ️ Tom's Hardware

Jensen Huang (Nvidia): 'Le GPU non sono armi nucleari', critica le restrizioni globali

Jensen Huang, CEO di Nvidia, ha criticato l'analogia che paragona le GPU ad armi nucleari, sostenendo che i governi dovrebbero consentire la vendita di queste tecnicie anche a paesi considerati 'avversari'. La dichiarazione, rilasciata durante un evento a Stanford, sottolinea la visione di Nvidia sulla diffusione globale delle GPU come strumenti di progresso tecnicico, piuttosto che come strumenti di conflitto, e solleva interrogativi sulle politiche di controllo delle esportazioni e il loro impatto sull'innovazione e la sovranità tecnicica.

2026-05-17 📰 Fonte
Ottimizzazione LLM on-premise: Llama.cpp e MTP su RTX 3090
📁 Altro AI generated ℹ️ LocalLLaMA

Ottimizzazione LLM on-premise: Llama.cpp e MTP su RTX 3090

Un'analisi pratica rivela come l'implementazione di Multi-GPU Tensor Parallelism (MTP) in llama.cpp possa migliorare significativamente i tempi di completamento per carichi di lavoro LLM con contesti ampi su una singola GPU NVIDIA RTX 3090. Nonostante un rallentamento nel prompt processing, la generazione di token più rapida porta a un risparmio di tempo complessivo del 41% per task che richiedono l'elaborazione di 85.000 token, evidenziando i trade-off nelle strategie di deployment on-premise.

2026-05-17 📰 Fonte
FluidX3D 3.7: Nuovi orizzonti per la fluidodinamica computazionale con OpenCL
📁 Frameworks AI generated ✅ Phoronix

FluidX3D 3.7: Nuovi orizzonti per la fluidodinamica computazionale con OpenCL

FluidX3D, il software di fluidodinamica computazionale (CFD) accelerato da CPU e GPU tramite OpenCL, ha raggiunto la versione 3.7. Questo aggiornamento introduce significativi miglioramenti prestazionali, consolidando la sua posizione come strumento chiave per simulazioni complesse che sfruttano l'hardware locale. La capacità di ottimizzare le risorse computazionali on-premise è fondamentale per gli specialisti che cercano controllo e sovranità dei dati.

2026-05-17 📰 Fonte
Ottimizzazione dell'Inference LLM: Test del Supporto MTP di llama.cpp su RTX 5090
📁 Frameworks AI generated ℹ️ LocalLLaMA

Ottimizzazione dell'Inference LLM: Test del Supporto MTP di llama.cpp su RTX 5090

Un recente test ha esplorato il supporto Multi-Token Pre-fill (MTP) di `llama.cpp` su una GPU NVIDIA RTX 5090 con 32 GB di VRAM. L'analisi, condotta con modelli Qwen3.6 quantizzati, ha mirato a isolare l'impatto dell'MTP sull'efficienza dell'inference, un aspetto cruciale per i deployment on-premise di Large Language Models. La metodologia ha confrontato l'MTP abilitato e disabilitato, utilizzando prompt di diversa lunghezza per valutare le prestazioni.

2026-05-17 📰 Fonte
G4-Meromero-31B-Uncensored-Heretic: un LLM per compiti creativi
📁 LLM AI generated ℹ️ LocalLLaMA

G4-Meromero-31B-Uncensored-Heretic: un LLM per compiti creativi

È stato rilasciato G4-Meromero-31B-Uncensored-Heretic, un LLM basato su Gemma 4 31B e ottimizzato per compiti creativi. Il modello, disponibile nei formati Safetensors e GGUF, presenta un basso tasso di rifiuto (15/100) e un KLD di 0.0100, suggerendo una maggiore flessibilità nella generazione di contenuti. La sua disponibilità in formati diversi lo rende adatto a vari scenari di deployment, inclusi quelli on-premise.

2026-05-17 📰 Fonte
Adlink e l'AI Fisica: focus su robotica, sanità e semiconduttori
📁 Hardware AI generated ✅ DigiTimes

Adlink e l'AI Fisica: focus su robotica, sanità e semiconduttori

Adlink sta puntando sull'Intelligenza Artificiale fisica, integrando l'AI direttamente in sistemi tangibili per settori critici come la robotica, la sanità e i semiconduttori. Questo approccio richiede soluzioni edge e on-premise per garantire bassa latenza, sovranità dei dati e affidabilità, ponendo nuove sfide e opportunità per l'infrastruttura hardware e il deployment.

2026-05-16 📰 Fonte
Aziende ottiche nel mercato degli smart snow goggles: nuove dinamiche nella supply chain
📁 Market AI generated ✅ DigiTimes

Aziende ottiche nel mercato degli smart snow goggles: nuove dinamiche nella supply chain

Le aziende ottiche stanno entrando nella supply chain degli smart snow goggles, un mercato caratterizzato da margini elevati. Questa mossa evidenzia l'evoluzione dei dispositivi “smart” e le crescenti esigenze tecniciche, inclusa la potenziale integrazione di capacità di intelligenza artificiale all'edge. L'espansione in settori ad alto valore aggiunto solleva interrogativi sulle implicazioni per la gestione dei dati, la sovranità e la complessità della catena di fornitura per l'hardware AI.

2026-05-16 📰 Fonte
I produttori taiwanesi di chip colmano i vuoti nell'offerta di HBM
📁 Market AI generated ✅ DigiTimes

I produttori taiwanesi di chip colmano i vuoti nell'offerta di HBM

Il mercato globale dei semiconduttori vede i produttori taiwanesi di chip, come Nanya, intensificare la produzione di High Bandwidth Memory (HBM). Questa mossa mira a colmare le lacune nell'offerta lasciate da un maggiore focus coreano su altre aree, garantendo una fornitura cruciale per le GPU di nuova generazione e i deployment AI on-premise, dove la disponibilità e il TCO dell'hardware sono fattori determinanti.

2026-05-16 📰 Fonte
L'AI stimola la domanda di infrastrutture di rete: Cisco e la filiera taiwanese
📁 Altro AI generated ✅ DigiTimes

L'AI stimola la domanda di infrastrutture di rete: Cisco e la filiera taiwanese

L'accelerazione nell'adozione dell'intelligenza artificiale, in particolare dei Large Language Models, sta generando un'impennata negli ordini per i fornitori di infrastrutture di rete. Cisco, attore chiave del settore, vede una crescita significativa, beneficiando al contempo la filiera di produzione taiwanese. Questa tendenza sottolinea l'importanza critica di reti ad alta capacità e bassa latenza per i deployment AI, sia on-premise che ibridi, e le implicazioni per la pianificazione infrastrutturale.

2026-05-16 📰 Fonte
Thunder Tiger e Shield AI: droni navali autonomi per la difesa di Taiwan
📁 Altro AI generated ✅ DigiTimes

Thunder Tiger e Shield AI: droni navali autonomi per la difesa di Taiwan

Thunder Tiger e Shield AI hanno annunciato una collaborazione strategica per lo sviluppo di droni navali autonomi. L'iniziativa mira a rafforzare le capacità di difesa asimmetrica di Taiwan, sfruttando l'intelligenza artificiale per operazioni marittime senza equipaggio. Questa partnership evidenzia la crescente importanza delle soluzioni AI self-hosted e resilienti per applicazioni critiche, con un focus sulla sovranità dei dati e l'efficienza operativa.

2026-05-16 📰 Fonte
Il boom dell'AI: le disuguaglianze nella corsa all'oro tecnicica
📁 Market AI generated ✅ TechCrunch AI

Il boom dell'AI: le disuguaglianze nella corsa all'oro tecnicica

Nonostante l'entusiasmo generale, il settore tecnicico percepisce un'inquietudine crescente riguardo all'attuale boom dell'intelligenza artificiale. La corsa all'oro dell'AI sta creando un divario significativo tra chi possiede le risorse e le infrastrutture necessarie e chi invece fatica ad accedervi, sollevando interrogativi sulla sostenibilità e l'accessibilità di questa rivoluzione.

2026-05-16 📰 Fonte
LLM locali vs. frontier: Qwen 3.6 sorprende nella generazione di animazioni HTML
📁 Altro AI generated ℹ️ LocalLLaMA

LLM locali vs. frontier: Qwen 3.6 sorprende nella generazione di animazioni HTML

Un recente esperimento ha messo a confronto le capacità di LLM locali, in particolare le varianti Qwen 3.6, con modelli "frontier" basati su cloud, nella generazione di codice HTML per animazioni complesse. I test, eseguiti su hardware modesto, hanno rivelato che un modello Qwen 3.6 quantizzato ha superato alcune controparti cloud per la qualità visiva e la fluidità del movimento, evidenziando il potenziale dei deployment on-premise per carichi di lavoro specifici.

2026-05-16 📰 Fonte
ArXiv inasprisce le regole sull'uso degli LLM: un anno di ban per chi abusa dell'AI
📁 Altro AI generated ✅ TechCrunch AI

ArXiv inasprisce le regole sull'uso degli LLM: un anno di ban per chi abusa dell'AI

La piattaforma di pre-pubblicazione ArXiv ha annunciato nuove misure per contrastare l'uso improprio dei Large Language Models (LLM) nella redazione di articoli scientifici. Gli autori che delegheranno completamente il lavoro all'intelligenza artificiale rischieranno un ban di un anno, evidenziando la crescente preoccupazione per l'integrità accademica e la necessità di una governance chiara nell'era dell'AI generativa.

2026-05-16 📰 Fonte
Beyond the Chatbot: MachinaOS
📁 General Editoriale

Beyond the Chatbot: MachinaOS

We’ve all seen the standard AI pitch: a chatbot awkwardly stapled to a dashboard, hallucinating system actions and masking its confusion behind "AI theater". Enter **MachinaOS** (available at machinaos.ai), an architecture that refuses to play that game.

2026-05-16
llama.cpp: la versione b9180 rafforza l'inference LLM on-premise
📁 Frameworks AI generated ℹ️ LocalLLaMA

llama.cpp: la versione b9180 rafforza l'inference LLM on-premise

La community di `llama.cpp` celebra il rilascio della versione `b9180`, un aggiornamento che introduce una nuova funzionalità identificata come "MTP". Questo sviluppo è particolarmente rilevante per gli specialisti che gestiscono Large Language Models in ambienti self-hosted, promettendo miglioramenti nelle capacità di deployment e nell'efficienza dell'inference su hardware locale.

2026-05-16 📰 Fonte
Strix Halo e llama.cpp: i benchmark MTP rivelano accelerazioni per i Large Language Models
📁 Hardware AI generated ℹ️ LocalLLaMA

Strix Halo e llama.cpp: i benchmark MTP rivelano accelerazioni per i Large Language Models

Nuovi benchmark su hardware AMD Strix Halo esplorano le prestazioni di llama.cpp con LLM Qwen3.6, confrontando le versioni standard e MTP. I risultati evidenziano un notevole miglioramento nella generazione di token per entrambi i modelli, con il 27B-MTP che mostra un'accelerazione complessiva significativa, specialmente in scenari di chat a lungo contesto. Il modello 35B-MTP, invece, presenta un framework più sfumato, con un incremento della generazione ma un tempo totale leggermente superiore in alcuni test.

2026-05-16 📰 Fonte
OpenAI: Greg Brockman alla guida della strategia di prodotto e integrazione
📁 LLM AI generated ✅ TechCrunch AI

OpenAI: Greg Brockman alla guida della strategia di prodotto e integrazione

Greg Brockman, co-fondatore di OpenAI, avrebbe assunto la direzione della strategia di prodotto dell'azienda. Questa mossa si inserisce in un contesto di riorganizzazione interna e precede i piani, anch'essi riportati, di integrare ChatGPT con Codex, il prodotto di programmazione di OpenAI, segnalando una potenziale evoluzione verso modelli più versatili e con implicazioni significative per le infrastrutture di Deployment.

2026-05-16 📰 Fonte
Conflitto in Texas: una contea blocca i data center AI, senatore contesta la legalità
📁 Altro AI generated ℹ️ Tom's Hardware

Conflitto in Texas: una contea blocca i data center AI, senatore contesta la legalità

Una contea del Texas ha imposto un divieto annuale sui data center nelle aree rurali, una mossa che segue lo spostamento di infrastrutture AI in località remote per eludere le normative. La decisione, tuttavia, è contestata da un senatore statale che ne mette in dubbio la legittimità legale. Questo scenario evidenzia le crescenti tensioni tra lo sviluppo tecnicico e la regolamentazione locale, con implicazioni significative per il deployment di carichi di lavoro AI.

2026-05-16 📰 Fonte
Qwen3.6-35B-A3B e 9B: i modelli open source che sfidano i giganti su Terminal-Bench 2.0
📁 LLM AI generated ℹ️ LocalLLaMA

Qwen3.6-35B-A3B e 9B: i modelli open source che sfidano i giganti su Terminal-Bench 2.0

I modelli Qwen3.6-35B-A3B e Qwen3.5-9B hanno fatto il loro ingresso nella classifica pubblica di Terminal-Bench 2.0. In particolare, la versione 35B, integrata con little-coder, ha raggiunto un punteggio del 24.6%, superando modelli come Gemini 2.5 Pro. Questo risultato evidenzia la crescente capacità dei Large Language Models (LLM) di dimensioni più contenute, inferiori ai 10 miliardi di parametri, di competere in benchmark complessi, aprendo nuove prospettive per i deployment on-premise e l'innovazione open source che mira a ridurre i requisiti computazionali.

2026-05-16 📰 Fonte
Supporto MTP integrato in llama.cpp: un passo avanti per l'inference locale
📁 Frameworks AI generated ℹ️ LocalLLaMA

Supporto MTP integrato in llama.cpp: un passo avanti per l'inference locale

Il progetto Open Source llama.cpp ha integrato il supporto per MTP (Media Transfer Protocol) attraverso la Pull Request #22673. Questo sviluppo rafforza la capacità del Framework di eseguire Large Language Models in modo efficiente su un'ampia gamma di hardware, consolidando la sua posizione come soluzione chiave per i deployment on-premise e per la sovranità dei dati.

2026-05-16 📰 Fonte
Un Aggiornamento Chiave per i LLaMA Locali Accende l'Entusiasmo On-Premise
📁 Altro AI generated ℹ️ LocalLLaMA

Un Aggiornamento Chiave per i LLaMA Locali Accende l'Entusiasmo On-Premise

Un recente merge di un pull request, identificato come "MTP", ha generato notevole entusiasmo nella comunità LLaMA, in particolare tra gli sviluppatori e le aziende che implementano Large Language Models on-premise. Questo sviluppo sottolinea l'importanza delle contribuzioni open source per ottimizzare l'esecuzione locale degli LLM, affrontando sfide come la gestione delle risorse hardware e la sovranità dei dati.

2026-05-16 📰 Fonte
Llama.cpp abbraccia il Multi-Processing: un passo avanti per gli LLM on-premise
📁 Frameworks AI generated ℹ️ LocalLLaMA

Llama.cpp abbraccia il Multi-Processing: un passo avanti per gli LLM on-premise

Il progetto open source llama.cpp si prepara a integrare il supporto per il Multi-Threaded Processing (MTP), una novità che promette di migliorare significativamente le performance nell'esecuzione di Large Language Models (LLM) su hardware locale. Questa evoluzione è particolarmente rilevante per gli ambienti on-premise, dove l'ottimizzazione delle risorse hardware esistenti è cruciale per il deployment efficiente di modelli AI, rafforzando la sovranità dei dati e il controllo.

2026-05-16 📰 Fonte
Anelli AI per la traduzione del linguaggio dei segni: un passo verso l'edge computing
📁 Altro AI generated 🏆 IEEE Spectrum

Anelli AI per la traduzione del linguaggio dei segni: un passo verso l'edge computing

Un nuovo studio presenta anelli elettronici wireless che, collegati a un sistema di intelligenza artificiale, sono in grado di tradurre il linguaggio dei segni in testo. Questa tecnicia supera i limiti dei sistemi precedenti, offrendo maggiore praticità e accuratezza. L'obiettivo è migrare l'elaborazione verso l'edge computing su smartphone, migliorando mobilità, privacy e riducendo la latenza per gli utenti.

2026-05-16 📰 Fonte
Faraday Future raccoglie 25 milioni per il piano robotico
📁 Market AI generated ℹ️ The Next Web

Faraday Future raccoglie 25 milioni per il piano robotico

Faraday Future ha annunciato di aver raccolto 25 milioni di dollari tramite note convertibili, portando il finanziamento totale a 70 milioni negli ultimi due mesi. L'azienda dichiara che questi fondi sono sufficienti per la Fase 1 del suo piano nel settore della robotica fino alla fine del 2026.

2026-05-16 📰 Fonte
← Precedente Page 21 / 119 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge