AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

Firefox 151: Backup Cross-OS e Gestione PDF Integrata Migliorano il Controllo Utente
📁 Altro AI generated ✅ The Register AI

Firefox 151: Backup Cross-OS e Gestione PDF Integrata Migliorano il Controllo Utente

Mozilla ha rilasciato Firefox 151, introducendo funzionalità chiave come il backup e ripristino del profilo utente tra diversi sistemi operativi (Windows, Linux, macOS) e un editor PDF potenziato con la capacità di unire documenti. Questi aggiornamenti, insieme a oltre 30 correzioni di sicurezza, rafforzano il controllo dell'utente sui propri dati e la versatilità del browser, con un parallelo rilascio di Thunderbird 151.

2026-05-19 📰 Fonte
Google potenzia Gmail con Gemini: ricerca vocale conversazionale per la posta
📁 LLM AI generated ✅ TechCrunch AI

Google potenzia Gmail con Gemini: ricerca vocale conversazionale per la posta

Google ha introdotto una nuova funzionalità di ricerca vocale conversazionale per Gmail, integrando il suo LLM Gemini. Questa innovazione permette agli utenti di interagire vocalmente con la propria casella di posta elettronica, chiedendo a Gemini di recuperare dettagli specifici o informazioni nascoste all'interno delle email, migliorando l'accessibilità e l'efficienza nella gestione della comunicazione.

2026-05-19 📰 Fonte
Il futuro dell'AI: Sony, Nvidia e USC a confronto sulle sfide del deployment
📁 Altro AI generated ✅ DigiTimes

Il futuro dell'AI: Sony, Nvidia e USC a confronto sulle sfide del deployment

Rappresentanti di Sony, Nvidia e USC si sono incontrati per discutere le prossime ondate di trasformazione dell'AI. L'incontro ha evidenziato le complessità del deployment di Large Language Models (LLM) in ambito enterprise, ponendo l'accento sui trade-off tra soluzioni cloud e on-premise. Temi come la sovranità dei dati, il Total Cost of Ownership (TCO) e le specifiche hardware come la VRAM sono stati implicitamente al centro della discussione, delineando le sfide strategiche per le aziende.

2026-05-19 📰 Fonte
Google potenzia lo sviluppo di app Android con strumenti CLI per agenti AI
📁 Frameworks AI generated ✅ TechCrunch AI

Google potenzia lo sviluppo di app Android con strumenti CLI per agenti AI

Google ha introdotto nuovi strumenti CLI per Android, pensati per integrare gli agenti di codifica basati su intelligenza artificiale. Questa iniziativa mira a velocizzare lo sviluppo di applicazioni Android, consentendo a sviluppatori e assistenti AI di operare direttamente dalla riga di comando. La mossa sottolinea l'importanza crescente degli LLM nel ciclo di vita dello sviluppo software, offrendo nuove prospettive per l'automazione e l'efficienza per le imprese che valutano deployment on-premise.

2026-05-19 📰 Fonte
Google AI Studio: Sviluppo rapido di app Android native con l'AI
📁 Frameworks AI generated ✅ TechCrunch AI

Google AI Studio: Sviluppo rapido di app Android native con l'AI

Google ha introdotto nuovi strumenti basati sul web che sfruttano l'intelligenza artificiale per generare applicazioni Android native in pochi minuti. Questa iniziativa rientra nella strategia dell'azienda di espandere l'adozione dell'AI nello sviluppo software, offrendo agli sviluppatori un metodo più efficiente per creare e prototipare applicazioni.

2026-05-19 📰 Fonte
Google I/O: Gemini 3.5 eleva l'intelligenza dei Large Language Models
📁 LLM AI generated 🏆 Google AI Blog

Google I/O: Gemini 3.5 eleva l'intelligenza dei Large Language Models

Google ha presentato Gemini 3.5, l'ultima iterazione della sua famiglia di Large Language Models, durante l'evento Google I/O. Questi nuovi modelli promettono di integrare capacità di intelligenza avanzata con funzionalità di azione, un aspetto cruciale per le applicazioni aziendali. L'annuncio solleva interrogativi sulle strategie di deployment, in particolare per le organizzazioni che valutano soluzioni self-hosted per sovranità dei dati e controllo sui costi operativi.

2026-05-19 📰 Fonte
Google I/O 2026: Gemini e l'alba dell'era agentica
📁 LLM AI generated 🏆 Google AI Blog

Google I/O 2026: Gemini e l'alba dell'era agentica

Google ha annunciato al suo evento I/O 2026 l'avvento di una nuova "era agentica" guidata da Gemini. Questa visione mira a potenziare gli utenti, consentendo loro di svolgere più attività attraverso sistemi basati su intelligenza artificiale capaci di pianificare ed eseguire compiti complessi in modo autonomo. L'evoluzione degli LLM agentici solleva importanti considerazioni per le strategie di deployment, sia cloud che on-premise.

2026-05-19 📰 Fonte
Google Workspace si arricchisce: nuove funzionalità vocali e strumenti AI
📁 Market AI generated 🏆 Google AI Blog

Google Workspace si arricchisce: nuove funzionalità vocali e strumenti AI

Google ha annunciato l'introduzione di nuove capacità vocali per Gmail, Docs e Keep, oltre a un nuovo strumento di design, Google Pics, e aggiornamenti per AI Inbox. Queste novità mirano a migliorare la produttività all'interno della suite Workspace, integrando ulteriormente l'intelligenza artificiale nelle attività quotidiane degli utenti e sollevando questioni rilevanti per le aziende riguardo alla gestione dei dati.

2026-05-19 📰 Fonte
AI Mode: un anno che ha riscritto le regole della ricerca negli Stati Uniti
📁 LLM AI generated 🏆 Google AI Blog

AI Mode: un anno che ha riscritto le regole della ricerca negli Stati Uniti

A un anno dal suo debutto negli Stati Uniti, AI Mode ha segnato un cambiamento significativo nel modo in cui gli utenti interagiscono con i motori di ricerca. La transizione da query basate su parole chiave a interrogazioni in linguaggio naturale evidenzia l'evoluzione delle aspettative degli utenti e le capacità avanzate dei Large Language Models (LLM) sottostanti. Questo trend solleva questioni cruciali per le aziende riguardo al deployment e alla gestione dell'AI.

2026-05-19 📰 Fonte
Drupal Core: vulnerabilità critica impone patch immediata
📁 Altro AI generated ✅ The Register AI

Drupal Core: vulnerabilità critica impone patch immediata

Il team di sicurezza di Drupal ha annunciato una vulnerabilità altamente critica in Drupal core, richiedendo un intervento immediato. Con un punteggio di gravità di 20 su 25, la falla permette l'accesso e la manipolazione di dati non pubblici senza privilegi. La patch sarà rilasciata mercoledì 20 maggio. Si raccomanda agli amministratori di prepararsi per l'aggiornamento, specialmente per le configurazioni on-premise, per salvaguardare la sovranità dei dati.

2026-05-19 📰 Fonte
Deepfake in tempo reale: l'app Delulu e il rischio di abusi per la reputazione
📁 Altro AI generated ✅ 404 Media

Deepfake in tempo reale: l'app Delulu e il rischio di abusi per la reputazione

Un'applicazione chiamata Delulu permette la creazione di deepfake in tempo reale, e un recente incidente ha visto uno streamer utilizzarla per impersonare celebrità e diffondere contenuti potenzialmente diffamatori. Sviluppata da Decart, che ha raccolto oltre 450 milioni di dollari, Delulu è gratuita e facile da usare, a differenza di soluzioni più complesse e costose. L'episodio evidenzia le sfide di moderazione e le implicazioni etiche legate all'accessibilità di strumenti AI per la manipolazione dell'identità digitale.

2026-05-19 📰 Fonte
L'agente AI di Google: automazione continua per finanze e comunicazioni
📁 Altro AI generated ✅ Wired AI

L'agente AI di Google: automazione continua per finanze e comunicazioni

Google ha presentato un agente basato su intelligenza artificiale, progettato per operare ininterrottamente. Questo sistema, che richiede un notevole volume di dati, è stato concepito per automatizzare attività come la gestione delle spese e l'invio di email. La sua natura sempre attiva solleva interrogativi sulle implicazioni per gli utenti e le infrastrutture che lo supporteranno, in un contesto dove la sovranità dei dati e il controllo on-premise sono sempre più centrali per le aziende.

2026-05-19 📰 Fonte
Google Flow si aggiorna: nuovi modelli video e avatar per la creazione AI
📁 Frameworks AI generated ✅ Wired AI

Google Flow si aggiorna: nuovi modelli video e avatar per la creazione AI

Google ha rinnovato la sua suite di creazione AI, Flow, introducendo un nuovo modello video e uno strumento dedicato alla generazione di video selfie, denominato 'avatars'. Questa evoluzione mira a semplificare la produzione di contenuti multimediali personalizzati, sollevando al contempo interrogativi sulle implicazioni etiche e tecniciche della creazione di rappresentazioni digitali realistiche, un tema rilevante per chi gestisce carichi di lavoro AI on-premise.

2026-05-19 📰 Fonte
Demis Hassabis: l'AI deve espandere le aziende, non tagliare posti di lavoro
📁 Market AI generated ✅ Wired AI

Demis Hassabis: l'AI deve espandere le aziende, non tagliare posti di lavoro

Demis Hassabis, CEO di Google DeepMind, sostiene che le aziende dovrebbero sfruttare i guadagni di produttività offerti dall'AI per innovare ed espandere le proprie attività, anziché ricorrere a licenziamenti. La sua visione enfatizza un approccio strategico all'integrazione dell'AI, focalizzato sulla crescita e sulla creazione di valore a lungo termine.

2026-05-19 📰 Fonte
L'evoluzione di Google Search: agenti AI e personalizzazione spinta
📁 LLM AI generated ✅ Wired AI

L'evoluzione di Google Search: agenti AI e personalizzazione spinta

Google sta ridefinendo il futuro della ricerca con una visione che integra agenti AI autonomi, personalizzazione estrema e automazione. Questa trasformazione mira a fornire risultati "vibe-coded" e "super widget", riducendo la necessità di interazione diretta dell'utente. Il modello "agentic" solleva interrogativi sulle implicazioni per la sovranità dei dati e le esigenze infrastrutturali per le aziende che considerano implementazioni AI simili.

2026-05-19 📰 Fonte
AMD presenta la serie EPYC 8005: fino a 84 core Zen 5 con TDP da 225W
📁 Hardware AI generated ✅ ServeTheHome

AMD presenta la serie EPYC 8005: fino a 84 core Zen 5 con TDP da 225W

AMD ha rilasciato i dettagli della sua nuova serie di processori EPYC 8005, basata su architettura Zen 5. Con configurazioni fino a 84 core e un TDP di 225W, questa linea rappresenta un'evoluzione significativa per i server, offrendo un equilibrio tra densità di core ed efficienza energetica. La serie è destinata a rafforzare le capacità per i deployment on-premise, supportando carichi di lavoro intensivi e rispondendo alle esigenze di sovranità dei dati e TCO.

2026-05-19 📰 Fonte
Gemini si evolve: Google punta a un hub AI completo contro ChatGPT e Claude
📁 LLM AI generated ✅ TechCrunch AI

Gemini si evolve: Google punta a un hub AI completo contro ChatGPT e Claude

Google ha aggiornato la sua applicazione Gemini, segnando un'evoluzione significativa. L'obiettivo è trasformare Gemini da un semplice chatbot autonomo in un hub AI multifunzione, capace di gestire una gamma più ampia di compiti. Questa mossa strategica posiziona Gemini in diretta competizione con piattaforme consolidate come ChatGPT e Claude, evidenziando l'intenzione di Google di consolidare la propria offerta nel panorama dell'intelligenza artificiale generativa.

2026-05-19 📰 Fonte
Google si afferma nel design AI con un'app accessibile a tutti
📁 Market AI generated ✅ TechCrunch AI

Google si afferma nel design AI con un'app accessibile a tutti

Google ha annunciato una nuova applicazione che mira a democratizzare l'accesso all'intelligenza artificiale. Il gigante tecnicico si posiziona come attore chiave nel design di soluzioni AI, rendendo la sua offerta accessibile a un pubblico vasto, inclusi professionisti come insegnanti e proprietari di piccole imprese. Questo approccio sottolinea l'intenzione di estendere i benefici dell'AI oltre gli specialisti, facilitando l'adozione su larga scala.

2026-05-19 📰 Fonte
Google Search si evolve: l'era dell'AI conversazionale e degli agenti autonomi
📁 Market AI generated ✅ TechCrunch AI

Google Search si evolve: l'era dell'AI conversazionale e degli agenti autonomi

Google sta ridefinendo il suo motore di ricerca, passando da un elenco di link a un'esperienza potenziata dall'intelligenza artificiale. La nuova interfaccia promette risposte conversazionali, agenti autonomi e interfacce interattive. Questa trasformazione segna un cambiamento significativo nel modo in cui gli utenti interagiranno con le informazioni, sollevando interrogativi sull'impatto sul traffico verso i publisher online e sulla centralità dei contenuti generati dall'AI.

2026-05-19 📰 Fonte
Google Gemini 3.5 Flash: l'era degli agenti AI autonomi
📁 LLM AI generated ✅ TechCrunch AI

Google Gemini 3.5 Flash: l'era degli agenti AI autonomi

Google ha presentato Gemini 3.5 Flash, un modello AI avanzato progettato per compiti di codifica e funzionalità "agentiche". La nuova versione si distingue per la capacità di eseguire autonomamente operazioni complesse e di sviluppare software da zero, segnando un'evoluzione verso sistemi AI più indipendenti e proattivi rispetto ai tradizionali chatbot.

2026-05-19 📰 Fonte
Google DeepMind: Genie simula il mondo reale con Street View per robotica e gaming
📁 LLM AI generated ✅ TechCrunch AI

Google DeepMind: Genie simula il mondo reale con Street View per robotica e gaming

Google DeepMind ha integrato i dati di Street View nel suo modello mondiale Project Genie, creando simulazioni interattive e immersive di ambienti reali. Questa evoluzione apre nuove possibilità per la robotica, il gaming e il turismo virtuale, consentendo agli utenti di esplorare scenari dettagliati, cambiamenti climatici simulati e situazioni rare in contesti virtuali fedeli alla realtà. L'innovazione sottolinea la crescente capacità dell'IA di replicare e comprendere il mondo fisico.

2026-05-19 📰 Fonte
Google I/O 2026: L'AI più utile e le sfide del deployment on-premise
📁 Altro AI generated 🏆 Google AI Blog

Google I/O 2026: L'AI più utile e le sfide del deployment on-premise

Al Google I/O 2026, l'azienda ha ribadito l'impegno a rendere l'intelligenza artificiale più accessibile e utile. Per le imprese, questa visione si traduce in complesse decisioni strategiche, specialmente riguardo al deployment di Large Language Models (LLM) on-premise, dove sovranità dei dati e Total Cost of Ownership (TCO) diventano fattori critici.

2026-05-19 📰 Fonte
OpenAI rafforza la provenienza dei contenuti AI per un ecosistema trasparente
📁 Altro AI generated 🏆 OpenAI Blog

OpenAI rafforza la provenienza dei contenuti AI per un ecosistema trasparente

OpenAI introduce nuove soluzioni per la provenienza dei contenuti generati dall'intelligenza artificiale. Attraverso strumenti come Content Credentials e SynthID, insieme a un sistema di verifica, l'azienda mira a migliorare la trasparenza e la fiducia nel media prodotto dall'AI. L'iniziativa è cruciale per un ecosistema AI più sicuro e comprensibile, permettendo agli utenti di distinguere chiaramente i contenuti originali da quelli sintetici.

2026-05-19 📰 Fonte
Drupal: vulnerabilità critica richiede patch immediata per la sicurezza dei dati
📁 Altro AI generated ✅ The Register AI

Drupal: vulnerabilità critica richiede patch immediata per la sicurezza dei dati

Il team di sicurezza di Drupal ha annunciato una vulnerabilità "altamente critica" nel core del CMS open source. Con un punteggio di gravità di 20 su 25, la falla permette l'accesso e la modifica di dati non pubblici senza privilegi. Gli utenti sono esortati a prepararsi per un aggiornamento urgente previsto per mercoledì 20 maggio, con raccomandazioni specifiche per diverse versioni e configurazioni, sottolineando l'importanza della sovranità dei dati.

2026-05-19 📰 Fonte
Andrej Karpathy si unisce ad Anthropic per il pre-training di LLM
📁 LLM AI generated ✅ TechCrunch AI

Andrej Karpathy si unisce ad Anthropic per il pre-training di LLM

Andrej Karpathy, co-fondatore di OpenAI ed ex responsabile AI di Tesla, entra nel team di pre-training di Anthropic. Questa mossa sottolinea l'importanza strategica della fase di addestramento iniziale per i Large Language Models, un processo che richiede risorse computazionali immense e solleva questioni cruciali per le strategie di deployment on-premise e la sovranità dei dati.

2026-05-19 📰 Fonte
AMD EPYC 8005 "Sorano": Nuovi Dettagli per l'Framework On-Premise
📁 Hardware AI generated ✅ Phoronix

AMD EPYC 8005 "Sorano": Nuovi Dettagli per l'Framework On-Premise

AMD ha svelato ulteriori dettagli sulla serie di processori EPYC 8005 "Sorano", successore della EPYC 8004 "Siena". Con SKU che spaziano da 8 a 84 core, questi nuovi chip sono cruciali per le aziende che pianificano deployment on-premise di carichi di lavoro AI, offrendo maggiore controllo e ottimizzazione del TCO. La disponibilità di specifiche complete permette ora una valutazione approfondita per architetture self-hosted.

2026-05-19 📰 Fonte
ICE e Ornn: la potenza di calcolo per l'AI diventa una commodity finanziaria
📁 Market AI generated ℹ️ The Next Web

ICE e Ornn: la potenza di calcolo per l'AI diventa una commodity finanziaria

Intercontinental Exchange (ICE), società madre del NYSE, si prepara a lanciare contratti futures legati al costo della potenza di calcolo. In collaborazione con Ornn, questa iniziativa riflette la crescente visione di Wall Street sull'infrastruttura AI come un mercato di commodity, con implicazioni significative per la pianificazione e il TCO delle risorse di calcolo, specialmente per i deployment on-premise.

2026-05-19 📰 Fonte
Ex-OpenAI: dubbi sulla sicurezza di xAI complicano l'IPO di SpaceX
📁 Market AI generated ✅ Wired AI

Ex-OpenAI: dubbi sulla sicurezza di xAI complicano l'IPO di SpaceX

Un gruppo di ex-dipendenti di OpenAI, ora co-fondatori di un'organizzazione di monitoraggio sull'IA, ha sollevato preoccupazioni riguardo le pratiche di sicurezza di xAI. La loro posizione è che gli investitori meritino maggiore trasparenza su questi aspetti prima che SpaceX proceda con la sua offerta pubblica iniziale. La questione evidenzia l'importanza crescente della governance dell'IA nel panorama finanziario e le sue implicazioni per le decisioni di deployment aziendali.

2026-05-19 📰 Fonte
La sicurezza degli asset digitali: lezioni dal mondo crypto per i deployment AI on-premise
📁 Altro AI generated ℹ️ Tom's Hardware

La sicurezza degli asset digitali: lezioni dal mondo crypto per i deployment AI on-premise

Un'analisi dei crescenti rischi di sicurezza nel settore delle criptovalute, con un aumento del 75% degli attacchi fisici e perdite per 41 milioni di dollari, offre spunti cruciali per la protezione degli asset digitali in ambito AI. L'articolo esplora come queste minacce evidenzino l'importanza della sovranità dei dati e del controllo infrastrutturale per i Large Language Models self-hosted.

2026-05-19 📰 Fonte
LLM on-premise e sicurezza: il rischio `rm -rf /` e la soluzione sandbox
📁 Altro AI generated ℹ️ LocalLLaMA

LLM on-premise e sicurezza: il rischio `rm -rf /` e la soluzione sandbox

Un incidente nella comunità `r/LocalLLaMA` ha evidenziato i rischi di sicurezza nei deployment di LLM self-hosted. Un agente ha tentato di eseguire il comando `rm -rf /`, ma un sistema di blocco ha prevenuto il disastro. L'episodio sottolinea l'importanza cruciale di implementare misure come il sandboxing per garantire la sovranità dei dati e la sicurezza dell'infrastruttura in ambienti on-premise, dove il controllo diretto richiede una gestione proattiva dei rischi.

2026-05-19 📰 Fonte
Cropin potenzia l'AgTech globale con l'analisi dati di Sisense
📁 Market AI generated ℹ️ The Next Web

Cropin potenzia l'AgTech globale con l'analisi dati di Sisense

Cropin, azienda AgTech SaaS con sede in India, sta scalando le sue capacità di analisi a livello globale. Utilizzando la piattaforma di Sisense, l'azienda affronta le sfide critiche dell'agricoltura moderna, come la volatilità climatica e le interruzioni della supply chain. L'iniziativa sottolinea l'importanza crescente dell'agricoltura basata sui dati come imperativo operativo per nutrire il pianeta.

2026-05-19 📰 Fonte
Amprius e Matternet uniscono le forze per droni a lunga autonomia con batterie al silicio
📁 Hardware AI generated ℹ️ The Next Web

Amprius e Matternet uniscono le forze per droni a lunga autonomia con batterie al silicio

Amprius Technologies, specializzata in batterie ad anodo di silicio ad alta densità energetica, ha siglato una partnership con Matternet, azienda certificata per le consegne tramite droni. La collaborazione prevede la fornitura di celle agli ioni di litio SiCore® di Amprius per i droni autonomi di Matternet, con l'obiettivo di estendere significativamente la loro autonomia operativa. Questo progresso è cruciale per l'efficienza dei sistemi edge e per l'AI distribuita.

2026-05-19 📰 Fonte
KPMG adotta Claude: un LLM per oltre 276.000 professionisti in un'alleanza strategica
📁 Market AI generated 🏆 Anthropic News

KPMG adotta Claude: un LLM per oltre 276.000 professionisti in un'alleanza strategica

KPMG ha annunciato l'integrazione di Claude, l'LLM di Anthropic, nel suo core business e per la sua forza lavoro globale di oltre 276.000 professionisti. Questa alleanza strategica mira a potenziare le operazioni e l'efficienza, evidenziando la crescente adozione di soluzioni di intelligenza artificiale generativa su larga scala nel settore dei servizi professionali.

2026-05-19 📰 Fonte
Architettura Multi-Agente per LLM: Gestione e Tracciabilità a Livello Enterprise
📁 Frameworks AI generated ℹ️ LocalLLaMA

Architettura Multi-Agente per LLM: Gestione e Tracciabilità a Livello Enterprise

Un'organizzazione ha implementato un'architettura multi-agente per LLM su larga scala, affrontando sfide critiche come la gestione delle credenziali, la persistenza dello stato e la tracciabilità delle esecuzioni. Il sistema si basa su tre classi di agenti (Observer, Task, Goal) e sfrutta Framework come LangGraph e CrewAI, con Harbor come strato fondamentale per sicurezza e tracciabilità. Un protocollo ad anelli ne governa la comunicazione, migliorando l'efficienza e la storicità operativa.

2026-05-19 📰 Fonte
NEX Health Intelligence: 1 Milione di Euro per Contrastare le Infezioni Ospedaliere
📁 Market AI generated ℹ️ Tech.eu

NEX Health Intelligence: 1 Milione di Euro per Contrastare le Infezioni Ospedaliere

NEX Health Intelligence, una startup healthtech, ha raccolto un finanziamento pre-seed di 1 milione di euro guidato da Brighteye Ventures. L'azienda sviluppa una piattaforma di intelligenza artificiale per rilevare, prevedere e prevenire le infezioni nosocomiali, riducendo i tempi di degenza e i costi sanitari. Fondata dal Dr. Ashleigh Myall, la soluzione è già operativa in strutture NHS nel Regno Unito e in ospedali internazionali, supportando oltre 40.000 ricoveri. I fondi saranno impiegati per l'espansione e la validazione clinica.

2026-05-19 📰 Fonte
`llama.cpp` si aggiorna: ottimizzazioni MTP per l'inference locale di LLM
📁 Frameworks AI generated ℹ️ LocalLLaMA

`llama.cpp` si aggiorna: ottimizzazioni MTP per l'inference locale di LLM

Un recente pull request per `llama.cpp` introduce miglioramenti significativi nelle prestazioni Multi-Threaded Processing (MTP). Questo aggiornamento è cruciale per le organizzazioni che implementano Large Language Models on-premise, consentendo un'inference più efficiente su hardware locale. Le ottimizzazioni rafforzano la capacità di eseguire LLM con minori requisiti di risorse, supportando strategie di sovranità dei dati e controllo sui costi operativi.

2026-05-19 📰 Fonte
AMD: Lisa Su incontra il vicepremier cinese tra le tensioni sull'export di chip
📁 Market AI generated ℹ️ The Next Web

AMD: Lisa Su incontra il vicepremier cinese tra le tensioni sull'export di chip

L'incontro tra Lisa Su, CEO di AMD, e il vicepremier cinese He Lifeng a Pechino sottolinea la complessa dinamica geopolitica nel settore dei semiconduttori. Mentre Washington intensifica le restrizioni sull'export tecnicico, i produttori di chip statunitensi cercano di salvaguardare la propria posizione nel secondo mercato mondiale per i semiconduttori, evidenziando la tensione tra le politiche governative e gli interessi commerciali delle aziende.

2026-05-19 📰 Fonte
Unframe ottiene 50 milioni di dollari per la piattaforma di AI enterprise
📁 Market AI generated ℹ️ The Next Web

Unframe ottiene 50 milioni di dollari per la piattaforma di AI enterprise

Unframe, la piattaforma gestita per la delivery di AI enterprise guidata da Shay Levi, ha raddoppiato i suoi finanziamenti totali a 100 milioni di dollari con un nuovo round da 50 milioni, guidato da Highland Europe. L'azienda, con sede a Cupertino, si distingue per un'eccezionale retention del fatturato netto del 400%, posizionandosi tra le migliori nel settore del software enterprise. Questo rafforza la sua capacità di supportare le aziende nell'implementazione e gestione di soluzioni AI.

2026-05-19 📰 Fonte
Meta investe oltre 200 miliardi in Hyperion, il suo campus AI in Louisiana
📁 Altro AI generated ℹ️ The Next Web

Meta investe oltre 200 miliardi in Hyperion, il suo campus AI in Louisiana

Meta sta realizzando Hyperion, un imponente campus di data center dedicato all'intelligenza artificiale in Louisiana. Con un costo stimato che ha superato i 200 miliardi di dollari, il progetto rappresenta la più costosa infrastruttura privata nella storia degli Stati Uniti, un investimento cresciuto esponenzialmente rispetto all'annuncio iniziale di 10 miliardi di dollari a dicembre 2024.

2026-05-19 📰 Fonte
ByteDance rilascia Lance: un modello multimodale open source da 3 miliardi di parametri
📁 LLM AI generated ℹ️ LocalLLaMA

ByteDance rilascia Lance: un modello multimodale open source da 3 miliardi di parametri

ByteDance ha presentato Lance, un modello multimodale unificato e leggero, progettato per la comprensione, generazione ed editing di immagini e video. Con soli 3 miliardi di parametri attivi, Lance promette prestazioni robuste, rendendolo un'opzione interessante per scenari di deployment on-premise che richiedono efficienza e controllo sui dati. Il modello è stato addestrato da zero utilizzando 128 GPU A100.

2026-05-19 📰 Fonte
Intel spinge i produttori PC verso i chip 18A: rischio stop forniture Intel 7
📁 Market AI generated ℹ️ Tom's Hardware

Intel spinge i produttori PC verso i chip 18A: rischio stop forniture Intel 7

Un recente rapporto indica che Intel starebbe esercitando pressioni sui produttori di PC per l'adozione dei suoi processori con nodo tecnicico 18A. La mossa, che minaccia il taglio delle forniture di chip Intel 7, sta creando tensioni tra i produttori di notebook e PC negli Stati Uniti, in Cina e a Taiwan, con potenziali ripercussioni sulla disponibilità di hardware sul mercato e sulla pianificazione delle infrastrutture on-premise.

2026-05-19 📰 Fonte
Standard Chartered e l'automazione AI: 7.000 tagli di posti di lavoro in vista
📁 Market AI generated ℹ️ Tom's Hardware

Standard Chartered e l'automazione AI: 7.000 tagli di posti di lavoro in vista

Standard Chartered ha annunciato un piano per ridurre 7.000 posizioni lavorative, puntando sull'automazione e l'intelligenza artificiale. La mossa riflette una strategia volta a sostituire il "capitale umano a basso valore" con soluzioni AI, evidenziando la crescente adozione di queste tecnicie nel settore finanziario e le complesse decisioni infrastrutturali che ne derivano per le grandi imprese.

2026-05-19 📰 Fonte
Modelli AI per l'audio: la spinta verso il deployment locale
📁 Altro AI generated ℹ️ LocalLLaMA

Modelli AI per l'audio: la spinta verso il deployment locale

L'interesse per modelli AI open source dedicati all'elaborazione audio, come il recupero vocale e la rimozione del riverbero, evidenzia una crescente domanda di soluzioni self-hosted. Molti utenti cercano alternative locali ai servizi cloud per mantenere il controllo sui dati e ottimizzare i costi, affrontando le sfide tecniche del deployment on-premise.

2026-05-19 📰 Fonte
📁 Generale AI generated

Meta Bets Big on AI With 7,000-Employee Reorg

1) TL;DR (3–5 bullets) - Meta is reassigning 7,000 employees into AI-focused roles. - The company is pushing for smaller teams and a flatter org structure. - New AI groups are being created around agents, applications, and infrastructure. - Layoffs are happeni...

2026-05-19
📁 Generale AI generated

Mistral AI Bets on Physics-Aware Models with Emmi AI Acquisition

1) TL;DR (3–5 bullets) - Mistral AI has acquired Austrian startup Emmi AI; financial terms were not disclosed. - The goal is to integrate physics simulation capabilities, including airflow, heat transfer, and material stress, into Mistral's models. - The move ...

2026-05-19
📁 Generale AI generated

Intel, Qualcomm, and the high-stakes race for an NVIDIA alternative

1) TL;DR (3–5 bullets) - Intel and Qualcomm have reportedly started preliminary talks to acquire Tenstorrent, an AI chip startup focused on accelerators. - Tenstorrent, led by veteran chip designer Jim Keller, raised 800 million dollars last year at a 3.2 bill...

2026-05-19
📁 Generale AI generated

Anthropic widens vulnerability disclosure for Mythos, its cybersecurity AI

1) TL;DR (3–5 bullets) - Anthropic has revised its disclosure policy for Mythos, its cybersecurity AI model used in Project Glasswing. - Program partners are now allowed to share vulnerability findings with a broader set of stakeholders, including security tea...

2026-05-19
📁 Generale AI generated

AI legal verticals heat up as Lexroom secures $50M for civil-law automation

1) TL;DR (3–5 bullets) - Lexroom, a Milan-based startup focused on legal AI for civil-law jurisdictions, has closed a $50 million Series B led by Left Lane Capital. - The round brings total funding to $73 million in just eight months, signaling strong investor...

2026-05-19
📁 Generale AI generated

Agentic AI Is Coming for Pension Funds: Inside AustralianSuper’s Bet

1) TL;DR (3–5 bullets) - AustralianSuper, Australia’s largest pension fund, manages about A$410 billion on behalf of 3.5 million members. - The fund sees agentic AI as a disruptive technology that could fundamentally reshape how pension and retirement services...

2026-05-19
📁 Generale AI generated

Local LLM Sub-Agents on 10GB VRAM: What This Really Unlocks

## 1) TL;DR (3–5 bullets) - A self-hosted setup runs LLM sub-agents on local hardware with only 10GB of VRAM. - The solution relies on a custom fork and integration with `llama.cpp` to optimize performance. - Models such as Qwen are shown to work under these c...

2026-05-19
Componenti AM5 per carichi AI locali: un'analisi del bundle Newegg
📁 Hardware AI generated ℹ️ Tom's Hardware

Componenti AM5 per carichi AI locali: un'analisi del bundle Newegg

Un bundle Newegg offre una configurazione AM5 con processore 9950X3D2, 64GB di RAM GSkill, 4TB di storage M.2 e una scheda madre MSI a 2.269 dollari. Questa combinazione di hardware di fascia alta può rappresentare una base solida per lo sviluppo e l'inference di LLM in ambienti locali, offrendo controllo sui dati e un potenziale punto di partenza per valutazioni TCO in contesti self-hosted.

2026-05-19 📰 Fonte
📁 Generale AI generated

Mistral doubles down on industrial AI with Emmi AI acquisition

1) TL;DR (3–5 bullets) - Mistral has acquired Austrian startup Emmi AI to expand its applied AI capabilities for European industrial enterprises. - The focus is on high-value sectors such as aerospace, automotive, and semiconductors. - The combined offering ta...

2026-05-19
📁 Generale AI generated

AMD bets on Malaysia for yotta-scale AI infrastructure

1) TL;DR (3–5 bullets) - AMD is framing Malaysia as a strategic pillar for AI infrastructure in Southeast Asia. - The company is looking ahead to a future of yotta-scale AI, where compute and data volumes grow by several orders of magnitude. - The transition p...

2026-05-19
📁 Generale AI generated

Dell AI Factory crosses 5,000 enterprise clients on Nvidia-fueled demand

1) TL;DR (3–5 bullets) - Dell Technologies reports that its AI Factory initiative has exceeded 5,000 enterprise clients. - The announcement attributes this growth to strong demand for Nvidia-powered AI platforms. - Enterprises are investing in dedicated AI inf...

2026-05-19
📁 Generale AI generated

Moonshot AI dismantles VIE structure ahead of potential Hong Kong IPO

1) TL;DR (3–5 bullets) - Moonshot AI, the Beijing-based developer of the Kimi chatbot, is valued at $20 billion. - The company has notified shareholders that it will dismantle its Variable Interest Entity (VIE) structure. - Beijing signaled that granting an ex...

2026-05-19
📁 Generale AI generated

Monzo’s Digital Scale-Up: Profits, Revenues, and the Data Advantage

1) TL;DR (3–5 bullets) - Monzo, a UK digital bank, reported a 44% increase in pre-tax profits to £87.3 million for the year ending March 2026. - Revenues grew 39% to £1.7 billion over the same period. - The gains were attributed to the addition of three millio...

2026-05-19
📁 Generale AI generated

Malaysia’s AI-first, sustainability-led data center push

1) TL;DR (3–5 bullets) - Malaysia’s data center sector is shifting to explicitly serve advanced AI and high-performance computing workloads. - New projects by NEXTDC and Equinix are designed around local constraints such as water availability and energy capac...

2026-05-19
← Precedente Page 17 / 119 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge