AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

Il Vietnam introduce nuove normative sull'IA: referenti locali obbligatori per OpenAI e Anthropic
📁 Altro AI generated ✅ DigiTimes

Il Vietnam introduce nuove normative sull'IA: referenti locali obbligatori per OpenAI e Anthropic

Il Vietnam ha emanato nuove normative che impongono a fornitori di Large Language Models come OpenAI e Anthropic di nominare referenti governativi locali. Questa mossa sottolinea una crescente tendenza globale verso una maggiore regolamentazione dell'intelligenza artificiale, con implicazioni significative per la sovranità dei dati e le strategie di deployment delle aziende tecniciche internazionali.

2026-05-21 📰 Fonte
smallcode: un progetto per LLM locali raggiunge la stabilità dopo un'intensa revisione
📁 Frameworks AI generated ℹ️ LocalLLaMA

smallcode: un progetto per LLM locali raggiunge la stabilità dopo un'intensa revisione

Il progetto open source smallcode, pensato per l'ecosistema degli LLM locali, ha annunciato il raggiungimento della stabilità dopo un'ampia fase di risoluzione di oltre 90 bug. Distribuito via npm o compilabile da sorgente, il tool invita gli utenti a riscoprirne le funzionalità migliorate, sottolineando l'importanza degli strumenti per lo sviluppo e il deployment on-premise di Large Language Models.

2026-05-21 📰 Fonte
Verifica Multi-Pass: LLM Quantizzati più Affidabili per l'Analisi Qualitativa
📁 LLM AI generated 🏆 ArXiv cs.CL

Verifica Multi-Pass: LLM Quantizzati più Affidabili per l'Analisi Qualitativa

Uno studio recente esplora l'impatto della Quantization su LLaMA-3.1 (8B) per l'analisi qualitativa, evidenziando come i modelli a bassa precisione soffrano di allucinazioni. Viene proposta una metodologia di verifica multi-pass dei prompt, progettata per guidare il modello attraverso passaggi controllati, riducendo le imprecisioni. I risultati mostrano che, sebbene i modelli a 8-bit siano i più accurati, la tecnica migliora significativamente la stabilità e l'affidabilità delle versioni a 4-bit, 3-bit e 2-bit, rendendoli più adatti per ambienti con risorse limitate.

2026-05-21 📰 Fonte
LLM e Rappresentazione della Disabilità: Tra Stereotipi Positivi e Bias Nascosti
📁 LLM AI generated 🏆 ArXiv cs.CL

LLM e Rappresentazione della Disabilità: Tra Stereotipi Positivi e Bias Nascosti

Una nuova ricerca esamina come i Large Language Models (LLM) rappresentano la disabilità, rivelando una tendenza a idealizzare le esperienze e a perpetuare stereotipi eccessivamente positivi. Lo studio confronta i post generati dagli LLM con quelli di persone reali, evidenziando anche un bias negativo che associa temi come carriera e intrattenimento prevalentemente a individui senza disabilità. Questi risultati sottolineano la necessità di un'attenta valutazione delle capacità degli LLM di riflettere la complessità delle realtà sociali.

2026-05-21 📰 Fonte
GraphDiffMed: Attenzione Differenziale e Conoscenza Farmacologica per la Raccomandazione di Farmaci
📁 Frameworks AI generated 🏆 ArXiv cs.LG

GraphDiffMed: Attenzione Differenziale e Conoscenza Farmacologica per la Raccomandazione di Farmaci

GraphDiffMed è un nuovo framework per la raccomandazione di farmaci basato sulle cartelle cliniche elettroniche (EHR). Utilizzando un'attenzione differenziale a doppia scala e vincoli farmacologici, il sistema filtra i segnali spuri e integra la conoscenza clinica. I test sul dataset MIMIC-III dimostrano un miglioramento nella qualità delle raccomandazioni e un equilibrio più favorevole nella sicurezza, offrendo una soluzione open source per un problema critico nell'AI clinica.

2026-05-21 📰 Fonte
Stima neurale dell'informazione mutua per l'inference efficiente nei modelli generativi
📁 LLM AI generated 🏆 ArXiv cs.LG

Stima neurale dell'informazione mutua per l'inference efficiente nei modelli generativi

Una nuova ricerca propone un framework neurale per stimare l'informazione mutua condizionale (MI) direttamente dagli stati nascosti dei Masked Diffusion Models (MDM). Questo approccio permette di comprendere le dipendenze interne del modello e di prevedere la matrice MI completa in un singolo passaggio, abilitando la decodifica parallela. I test mostrano una riduzione di 3-5 volte nei passaggi di inference, mantenendo la qualità generativa e superando i metodi basati sull'entropia, con significative implicazioni per l'efficienza computazionale.

2026-05-21 📰 Fonte
SpaceX e l'AI: la scommessa da 4 miliardi di dollari di Elon Musk
📁 Market AI generated ✅ DigiTimes

SpaceX e l'AI: la scommessa da 4 miliardi di dollari di Elon Musk

L'imminente IPO di SpaceX ha svelato un investimento significativo di 4 miliardi di dollari nel settore dell'intelligenza artificiale. Questa mossa, guidata da Elon Musk, evidenzia la crescente integrazione dell'AI nelle strategie di business delle grandi aziende tecniciche, sollevando interrogativi sulle implicazioni per lo sviluppo di soluzioni on-premise e la sovranità dei dati.

2026-05-21 📰 Fonte
Cina: la spinta strategica sulla memoria per l'era dell'AI
📁 Market AI generated ✅ DigiTimes

Cina: la spinta strategica sulla memoria per l'era dell'AI

La Cina sta intensificando i suoi sforzi per sviluppare una solida industria nazionale della memoria, con un focus strategico sui cosiddetti "motori gemelli" e una decisa spinta alle IPO per i giganti YMTC e CXMT. Questa iniziativa è strettamente legata all'avanzamento dell'intelligenza artificiale, evidenziando l'importanza cruciale della memoria per i carichi di lavoro AI e le implicazioni per la sovranità dei dati e i deployment on-premise.

2026-05-21 📰 Fonte
TSMC e il capex: una strategia cauta contro la bolla AI?
📁 Market AI generated ✅ DigiTimes

TSMC e il capex: una strategia cauta contro la bolla AI?

Secondo un investitore, la politica di spesa in conto capitale (capex) prudente adottata da TSMC sta contribuendo a prevenire la formazione di una bolla speculativa nel settore dell'intelligenza artificiale. Le decisioni del colosso taiwanese, fornitore chiave di semiconduttori avanzati, influenzano direttamente la disponibilità e i costi dell'hardware essenziale per i carichi di lavoro AI, con ripercussioni significative per le aziende che valutano deployment on-premise e la gestione del TCO.

2026-05-21 📰 Fonte
Nvidia ridefinisce il mercato AI: nuovi segmenti e partnership strategiche
📁 Market AI generated ✅ DigiTimes

Nvidia ridefinisce il mercato AI: nuovi segmenti e partnership strategiche

Nvidia ha annunciato la creazione del sub-segmento ACIE, una partnership con Anthropic e l'enfasi sull'AI Fisica. Queste mosse strategiche indicano una specializzazione crescente nel mercato dell'intelligenza artificiale, con implicazioni significative per le aziende che valutano deployment on-premise, la sovranità dei dati e l'ottimizzazione del TCO per carichi di lavoro AI complessi.

2026-05-21 📰 Fonte
Nvidia e la corsa alle 'fabbriche AI': Blackwell, Vera e Rubin ridefiniscono il mercato
📁 Market AI generated ✅ DigiTimes

Nvidia e la corsa alle 'fabbriche AI': Blackwell, Vera e Rubin ridefiniscono il mercato

Nvidia continua a spingere i confini dell'hardware per l'intelligenza artificiale con le sue nuove architetture Blackwell e Rubin, affiancate dalla CPU Vera. Questa strategia, che include un'aggressiva politica di prezzi, mira a consolidare la posizione dominante dell'azienda nella costruzione di infrastrutture AI su larga scala, potenzialmente rendendo più difficile per i concorrenti competere nella corsa alla creazione di 'fabbriche AI'.

2026-05-21 📰 Fonte
Starcloud: una crescita da 2,2 miliardi e la scommessa orbitale per l'AI
📁 Market AI generated ✅ DigiTimes

Starcloud: una crescita da 2,2 miliardi e la scommessa orbitale per l'AI

Starcloud ha visto la sua valutazione salire da 10 milioni a 2,2 miliardi di dollari in soli 17 mesi. L'azienda si propone di affrontare la crescente crisi energetica dell'intelligenza artificiale con una soluzione innovativa, definita "orbitale". Questo rapido sviluppo evidenzia l'urgenza di trovare approcci sostenibili per l'alimentazione dei carichi di lavoro AI, un aspetto cruciale per i deployment on-premise e la gestione del TCO.

2026-05-21 📰 Fonte
Nvidia esclude la Cina dalle previsioni: CapEx hyperscaler a 1 trilione entro il 2027
📁 Market AI generated ✅ DigiTimes

Nvidia esclude la Cina dalle previsioni: CapEx hyperscaler a 1 trilione entro il 2027

Nvidia ha annunciato di aver escluso la Cina dalle proprie proiezioni finanziarie future. Contestualmente, l'azienda ha citato stime di analisti che prevedono un investimento complessivo di mille miliardi di dollari in spese in conto capitale (CapEx) da parte dei principali hyperscaler entro il 2027. Questo scenario evidenzia le dinamiche geopolitiche e gli ingenti investimenti infrastrutturali nel settore AI, delineando un panorama di mercato in rapida evoluzione.

2026-05-21 📰 Fonte
La sfida di FII a Broadcom e Nvidia: l'integrazione di sistema ridefinisce la corsa ai CPO
📁 Hardware AI generated ✅ DigiTimes

La sfida di FII a Broadcom e Nvidia: l'integrazione di sistema ridefinisce la corsa ai CPO

Il panorama competitivo dei Co-Packaged Optics (CPO) sta subendo una trasformazione, con FII che emerge come sfidante per giganti del settore come Broadcom e Nvidia. La competizione si sposta sempre più verso l'integrazione di sistema, un fattore cruciale per l'efficienza e la scalabilità delle infrastrutture AI, in particolare per i deployment on-premise. Questa evoluzione sottolinea l'importanza di soluzioni olistiche per ottimizzare le performance e il TCO nei data center moderni.

2026-05-21 📰 Fonte
SMIC e Hua Hong: una piattaforma per l'autonomia cinese nella filiera dei chip
📁 Altro AI generated ✅ DigiTimes

SMIC e Hua Hong: una piattaforma per l'autonomia cinese nella filiera dei chip

Le aziende cinesi SMIC e Hua Hong hanno unito le forze per creare una piattaforma di approvvigionamento di materiali, con l'obiettivo strategico di ridurre la dipendenza della Cina dalla filiera statunitense dei semiconduttori. Questa mossa sottolinea l'impegno del Paese verso una maggiore autonomia tecnicica, con implicazioni significative per la stabilità della catena di fornitura globale e la disponibilità di hardware critico per i deployment AI on-premise.

2026-05-21 📰 Fonte
OSE punta alla crescita nei server AI, spinta dalla domanda di memoria
📁 Market AI generated ✅ DigiTimes

OSE punta alla crescita nei server AI, spinta dalla domanda di memoria

OSE, attore chiave nel settore dei servizi di assemblaggio e test di semiconduttori, sta orientando la propria strategia verso la tecnicia SMT per i server AI. Questa mossa è sostenuta da una crescente domanda di componenti di memoria, che migliora le prospettive di mercato dell'azienda in un contesto di espansione dell'infrastruttura AI, con implicazioni significative per i deployment on-premise e la catena di fornitura.

2026-05-21 📰 Fonte
Moonshot AI si prepara all'IPO a Hong Kong, abbandonando la struttura offshore
📁 Market AI generated ✅ DigiTimes

Moonshot AI si prepara all'IPO a Hong Kong, abbandonando la struttura offshore

Moonshot AI, azienda attiva nel settore dell'intelligenza artificiale, ha annunciato l'intenzione di abbandonare la sua struttura offshore. Questa mossa strategica precede la ricerca di una quotazione in borsa a Hong Kong, un passo significativo che potrebbe riflettere una riorganizzazione interna e un focus sui mercati locali per il suo futuro finanziario e operativo.

2026-05-21 📰 Fonte
OpenAI sceglie Singapore per il primo laboratorio di AI applicata all'estero
📁 Market AI generated ✅ DigiTimes

OpenAI sceglie Singapore per il primo laboratorio di AI applicata all'estero

OpenAI ha annunciato l'apertura del suo primo laboratorio di intelligenza artificiale applicata fuori dagli Stati Uniti, scegliendo Singapore come sede. Questa mossa strategica sottolinea l'espansione globale dell'azienda e il suo focus crescente sull'integrazione pratica delle tecnicie AI in contesti aziendali e regionali, con implicazioni per la sovranità dei dati e le strategie di deployment on-premise.

2026-05-21 📰 Fonte
Grok e i rischi legali: le implicazioni per il deployment di LLM in azienda
📁 LLM AI generated ✅ Wired AI

Grok e i rischi legali: le implicazioni per il deployment di LLM in azienda

SpaceX ha rivelato nel suo prospetto di IPO di aver accantonato oltre 500 milioni di dollari per potenziali contenziosi, in parte a causa di reclami legati alla modalità 'Spicy' di Grok, che avrebbe generato immagini sessualizzate. Questo evento sottolinea le sfide di governance e conformità che le aziende devono affrontare nell'integrazione dei Large Language Models, evidenziando la necessità di strategie robuste per la gestione dei rischi e la sovranità dei dati.

2026-05-21 📰 Fonte
Jensen Huang: i processori per agenti AI valgono 200 miliardi per Nvidia
📁 Market AI generated ✅ TechCrunch AI

Jensen Huang: i processori per agenti AI valgono 200 miliardi per Nvidia

Jensen Huang, CEO di Nvidia, ha identificato un nuovo e significativo mercato da 200 miliardi di dollari. L'azienda intende focalizzarsi sullo sviluppo di CPU dedicate agli agenti di intelligenza artificiale, segnando una potenziale espansione strategica oltre il suo tradizionale dominio nelle GPU. Questa mossa potrebbe ridefinire le architetture hardware per i carichi di lavoro AI on-premise, introducendo nuove considerazioni per il TCO e la sovranità dei dati.

2026-05-21 📰 Fonte
Anthropic Prevede il Primo Trimestre in Utile con Ricavi Raddoppiati
📁 Market AI generated ✅ TechCrunch AI

Anthropic Prevede il Primo Trimestre in Utile con Ricavi Raddoppiati

Anthropic ha comunicato ai propri investitori l'attesa per il suo primo trimestre in utile. L'azienda prevede di superare i 10,9 miliardi di dollari di ricavi nel secondo trimestre, un risultato che segna un raddoppio rispetto al periodo precedente. Questo traguardo evidenzia la rapida crescita nel settore degli LLM e le crescenti opportunità di monetizzazione per i fornitori di intelligenza artificiale.

2026-05-21 📰 Fonte
Nvidia: Ricavi in forte crescita dell'85%, i data center trainano l'espansione AI
📁 Market AI generated ✅ DigiTimes

Nvidia: Ricavi in forte crescita dell'85%, i data center trainano l'espansione AI

Nvidia ha registrato un'impressionante crescita dell'85% nei ricavi complessivi, con le vendite nel segmento data center che hanno segnato un balzo del 92%. Questi risultati sottolineano la domanda esponenziale di infrastrutture hardware dedicate all'intelligenza artificiale, in particolare per i carichi di lavoro legati ai Large Language Models. L'espansione riflette la crescente necessità di capacità di calcolo per training e Inference di modelli AI, con implicazioni significative per le strategie di deployment on-premise.

2026-05-21 📰 Fonte
AMD: Ryzen AI Max PRO 400 con 192GB di memoria per LLM on-premise
📁 Hardware AI generated ✅ ServeTheHome

AMD: Ryzen AI Max PRO 400 con 192GB di memoria per LLM on-premise

AMD introduce una nuova serie di chip Ryzen AI Max PRO 400, progettati per sistemi AI. Questi processori si distinguono per il supporto fino a 192GB di memoria, un fattore cruciale per l'esecuzione di Large Language Models (LLM) di dimensioni maggiori direttamente su infrastrutture locali. L'iniziativa di AMD risponde alla crescente domanda di capacità computazionali per deployment on-premise, offrendo maggiore controllo e sovranità dei dati.

2026-05-21 📰 Fonte
AMD Ryzen AI Max 400 'Gorgon Halo': fino a 192GB di memoria unificata per l'AI locale
📁 Hardware AI generated ℹ️ Tom's Hardware

AMD Ryzen AI Max 400 'Gorgon Halo': fino a 192GB di memoria unificata per l'AI locale

AMD presenta il Ryzen AI Max 400 'Gorgon Halo', un'APU rinnovata che integra architetture Zen 5 e RDNA 3.5. Questo chip è progettato per carichi di lavoro AI, offrendo fino a 192GB di memoria unificata e una frequenza operativa fino a 5.2 GHz. La sua architettura lo rende particolarmente interessante per scenari di deployment on-premise ed edge, dove il controllo dei dati e l'efficienza sono prioritari per CTO e architetti infrastrutturali.

2026-05-21 📰 Fonte
LLM On-Premise: Sfide e Opportunità per il Controllo dei Dati Aziendali
📁 Altro AI generated ✅ DigiTimes

LLM On-Premise: Sfide e Opportunità per il Controllo dei Dati Aziendali

L'adozione di Large Language Models (LLM) in azienda solleva questioni cruciali su sovranità dei dati, costi e performance. Questo articolo esplora i requisiti infrastrutturali e le considerazioni strategiche per il deployment on-premise di LLM, analizzando i trade-off tra controllo, sicurezza e l'investimento iniziale. Si discuteranno le specifiche hardware, il TCO e l'importanza di ambienti air-gapped per settori regolamentati.

2026-05-20 📰 Fonte
Clouted raccoglie 7 milioni di dollari per l'ottimizzazione di video brevi
📁 Market AI generated ✅ TechCrunch AI

Clouted raccoglie 7 milioni di dollari per l'ottimizzazione di video brevi

La startup Clouted ha completato un round di finanziamento seed da 7 milioni di dollari, guidato da Slow Ventures. L'azienda si propone di semplificare il processo di creazione di video brevi con potenziale virale, sfruttando probabilmente algoritmi avanzati per l'analisi e l'ottimizzazione dei contenuti. Questo investimento sottolinea l'interesse crescente nel settore dell'AI applicata alla produzione e distribuzione di contenuti digitali.

2026-05-20 📰 Fonte
xAI: 6,4 miliardi di dollari persi nel 2025 per l'espansione di Grok, rivela SpaceX
📁 Market AI generated ✅ TechCrunch AI

xAI: 6,4 miliardi di dollari persi nel 2025 per l'espansione di Grok, rivela SpaceX

Un documento depositato da SpaceX per la sua IPO ha rivelato che xAI ha registrato una perdita di 6,4 miliardi di dollari nel 2025. Questi dati, che offrono la prima panoramica pubblica sulle finanze AI di Elon Musk, evidenziano un massiccio piano di espansione per Grok. L'investimento sottolinea la portata delle ambizioni di Musk nel settore dell'intelligenza artificiale e suggerisce che la spesa per lo sviluppo e il deployment di LLM è destinata a continuare in modo significativo.

2026-05-20 📰 Fonte
Nvidia: Ricavi Record, Investimenti Strategici e Prospettive per l'AI On-Premise
📁 Market AI generated ✅ TechCrunch AI

Nvidia: Ricavi Record, Investimenti Strategici e Prospettive per l'AI On-Premise

Nvidia ha annunciato un trimestre con ricavi record, pur prevedendo un rallentamento della crescita futura. Questa dinamica, unita a investimenti per 43 miliardi di dollari in startup, evidenzia la sua influenza sul mercato dell'hardware AI. Tali sviluppi sono cruciali per le aziende che pianificano deployment di Large Language Models (LLM) on-premise, impattando direttamente il Total Cost of Ownership (TCO) e le strategie infrastrutturali.

2026-05-20 📰 Fonte
Tesla FSD (Supervised) si espande in Europa: via libera in Lituania
📁 Market AI generated ℹ️ The Next Web

Tesla FSD (Supervised) si espande in Europa: via libera in Lituania

Il software Full Self-Driving (Supervised) di Tesla sta estendendo la sua presenza in Europa. Dopo i Paesi Bassi, la Lituania è diventata il secondo stato membro dell'UE a concedere l'approvazione. Si prevede che Grecia e Belgio seguiranno a breve. L'autorità lituana ha adottato la certificazione olandese, accelerando il processo di deployment di questa tecnicia di assistenza alla guida avanzata.

2026-05-20 📰 Fonte
Canva si integra con Google Gemini, consolidando la sua strategia negli assistenti AI
📁 Market AI generated ℹ️ The Next Web

Canva si integra con Google Gemini, consolidando la sua strategia negli assistenti AI

Canva ha annunciato l'integrazione con Google Gemini durante il Google I/O, completando la sua strategia di posizionarsi come "strato di design" per i principali assistenti di intelligenza artificiale. Questa mossa segue precedenti integrazioni con Claude, ChatGPT e Microsoft Copilot, consentendo agli utenti di Gemini di generare, modificare e cercare contenuti di design direttamente all'interno dell'assistente. La strategia mira a rendere gli strumenti di design basati sull'AI accessibili in contesti conversazionali.

2026-05-20 📰 Fonte
LinkedIn contro i contenuti generati da AI: la piattaforma annuncia nuove misure
📁 LLM AI generated ℹ️ The Next Web

LinkedIn contro i contenuti generati da AI: la piattaforma annuncia nuove misure

LinkedIn ha riconosciuto la crescente presenza di contenuti generati da intelligenza artificiale, spesso generici e privi di valore, che stanno compromettendo la qualità del feed. La piattaforma ha annunciato l'introduzione di nuove misure per affrontare questo fenomeno, mirando a migliorare l'esperienza degli utenti e a ripristinare la leggibilità e la pertinenza delle pubblicazioni.

2026-05-20 📰 Fonte
OpenAI verso l'IPO: la corsa al debutto in borsa si intensifica nel settore AI
📁 Market AI generated ℹ️ The Next Web

OpenAI verso l'IPO: la corsa al debutto in borsa si intensifica nel settore AI

OpenAI si appresta a presentare in via confidenziale il prospetto per la sua Offerta Pubblica Iniziale (IPO) già questa settimana, con il supporto di Goldman Sachs e Morgan Stanley. Questo sviluppo segna un cambio di paradigma nel settore dell'intelligenza artificiale, dove la priorità non è più solo lo sviluppo del modello migliore, ma il primato nell'accesso ai mercati pubblici. Le previsioni indicano che Anthropic potrebbe aver perso questa competizione.

2026-05-20 📰 Fonte
OpenAI risolve una congettura geometrica irrisolta dal 1946
📁 LLM AI generated ✅ TechCrunch AI

OpenAI risolve una congettura geometrica irrisolta dal 1946

OpenAI ha annunciato che il suo modello di ragionamento ha confutato una congettura geometrica che sfidava i matematici dal 1946. La novità significativa è il supporto di esperti che in passato avevano criticato le affermazioni dell'azienda, conferendo maggiore credibilità a questa scoperta e suggerendo un'evoluzione nelle capacità di ragionamento degli LLM.

2026-05-20 📰 Fonte
Prezzi del petrolio alle stelle, vendite EV in crescita: riflessioni per l'AI on-premise
📁 Market AI generated ℹ️ The Next Web

Prezzi del petrolio alle stelle, vendite EV in crescita: riflessioni per l'AI on-premise

Il recente conflitto in Iran ha spinto il prezzo del petrolio greggio oltre i 100 dollari al barile, con un impatto immediato sui costi del carburante in Europa. Questa impennata sta accelerando la transizione verso i veicoli elettrici. L'articolo esplora come dinamiche geopolitiche simili possano influenzare le strategie di deployment dell'intelligenza artificiale, evidenziando l'importanza di valutare il TCO e l'efficienza energetica per le infrastrutture AI on-premise.

2026-05-20 📰 Fonte
Qwen: in arrivo un nuovo LLM da 27 miliardi di parametri
📁 LLM AI generated ℹ️ LocalLLaMA

Qwen: in arrivo un nuovo LLM da 27 miliardi di parametri

Indiscrezioni suggeriscono che Qwen, un attore emergente nel panorama dei Large Language Models, si stia preparando a rilasciare un nuovo modello da 27 miliardi di parametri. L'annuncio ufficiale e la roadmap dettagliata sono attesi, ma la notizia solleva già interrogativi sulle implicazioni per le strategie di deployment on-premise e sui requisiti infrastrutturali per le aziende che valutano soluzioni self-hosted.

2026-05-20 📰 Fonte
Linux 7.2: in arrivo il Cache Aware Scheduling per CPU moderne
📁 Hardware AI generated ✅ Phoronix

Linux 7.2: in arrivo il Cache Aware Scheduling per CPU moderne

Il kernel Linux 7.2 si prepara ad accogliere il supporto per il Cache Aware Scheduling, una funzionalità attesa che promette di ottimizzare le prestazioni sui processori dotati di multiple cache di ultimo livello. Questa integrazione, prevista prima dell'apertura della finestra di merge, rappresenta un passo significativo per l'efficienza dei sistemi Linux, in particolare per i carichi di lavoro che richiedono un'attenta gestione delle risorse hardware on-premise.

2026-05-20 📰 Fonte
IrisGo: l'assistente AI da desktop che impara dalle tue abitudini
📁 Altro AI generated ✅ TechCrunch AI

IrisGo: l'assistente AI da desktop che impara dalle tue abitudini

IrisGo, una startup supportata da Andrew Ng, presenta un "assistente AI" progettato per osservare l'attività desktop dell'utente e apprendere automaticamente come eseguire compiti. Questa soluzione solleva interrogativi cruciali su privacy, sovranità dei dati e le implicazioni tecniche di un LLM che opera in locale, aspetti centrali per le decisioni di deployment on-premise in ambito enterprise.

2026-05-20 📰 Fonte
Google I/O 2026: Tra Visioni Future e le Sfide del Deployment AI
📁 Market AI generated 🏆 Google AI Blog

Google I/O 2026: Tra Visioni Future e le Sfide del Deployment AI

Google ha presentato a I/O 2026 le sue ultime innovazioni, tra cui Gemini Omni, Google Antigravity e Universal Cart. Questi annunci evidenziano la spinta verso nuove frontiere dell'intelligenza artificiale, sollevando interrogativi cruciali per le aziende che valutano strategie di deployment on-premise rispetto alle soluzioni cloud, in termini di controllo, sovranità dei dati e TCO.

2026-05-20 📰 Fonte
Investimenti in Missouri: Forze Lavoro e Energia per il Futuro Tecnologico
📁 Altro AI generated 🏆 Google AI Blog

Investimenti in Missouri: Forze Lavoro e Energia per il Futuro Tecnologico

Un nuovo piano di investimenti in Missouri mira a potenziare la forza lavoro di nuova generazione e a rafforzare i programmi energetici. Queste iniziative sono cruciali per sostenere la crescita tecnicica, inclusi i carichi di lavoro AI, e per affrontare le sfide legate alla disponibilità di talenti e alla sostenibilità energetica, aspetti fondamentali per i deployment on-premise di LLM.

2026-05-20 📰 Fonte
OpenAI accelera verso l'IPO, possibile debutto a settembre
📁 Market AI generated ✅ TechCrunch AI

OpenAI accelera verso l'IPO, possibile debutto a settembre

OpenAI starebbe intensificando i preparativi per la sua offerta pubblica iniziale, con un possibile debutto sul mercato azionario già a settembre. Questa accelerazione giunge all'indomani della sconfitta legale di Elon Musk, il cui ricorso minacciava la struttura, la leadership e le finanze dell'azienda, evidenziando la crescente capitalizzazione e l'interesse del mercato per le tecnicie di intelligenza artificiale generativa.

2026-05-20 📰 Fonte
L'AI di OpenAI riscrive la geometria discreta: risolto un enigma ottantennale
📁 LLM AI generated 🏆 OpenAI Blog

L'AI di OpenAI riscrive la geometria discreta: risolto un enigma ottantennale

Un modello di intelligenza artificiale sviluppato da OpenAI ha risolto il problema della distanza unitaria, una congettura centrale della geometria discreta che resisteva da ottant'anni. Questo traguardo segna un punto di svolta significativo nell'applicazione dell'AI alla ricerca matematica, dimostrando il potenziale dei Large Language Models e di altri modelli avanzati nel risolvere sfide complesse che hanno eluso gli approcci tradizionali per decenni.

2026-05-20 📰 Fonte
Il modello Command-A-Plus-05-2026-bf16 di CohereLabs: analisi per l'on-premise
📁 LLM AI generated ℹ️ LocalLLaMA

Il modello Command-A-Plus-05-2026-bf16 di CohereLabs: analisi per l'on-premise

CohereLabs ha reso disponibile su Hugging Face il modello Command-A-Plus-05-2026-bf16. Questo Large Language Model, ottimizzato in formato bf16, presenta considerazioni importanti per le aziende che valutano strategie di deployment on-premise. L'analisi si concentra sui requisiti hardware, la gestione dei costi operativi e le implicazioni per la sovranità dei dati, aspetti cruciali per i decision-maker tecnici.

2026-05-20 📰 Fonte
L'IA e la robotica: i Large Language Models semplificano lo sviluppo e il deployment
📁 Altro AI generated ✅ Wired AI

L'IA e la robotica: i Large Language Models semplificano lo sviluppo e il deployment

Le capacità di codifica dei modelli di intelligenza artificiale stanno per rivoluzionare il settore della robotica, rendendo significativamente più semplice la costruzione e il rilascio di sistemi autonomi. Questa evoluzione apre nuove prospettive per l'integrazione di agenti AI in corpi fisici, con implicazioni dirette per le strategie di deployment on-premise e la sovranità dei dati.

2026-05-20 📰 Fonte
Google ridefinisce la ricerca con l'AI: un miliardo di utenti per la modalità conversazionale
📁 Market AI generated ✅ Ars Technica AI

Google ridefinisce la ricerca con l'AI: un miliardo di utenti per la modalità conversazionale

Google sta trasformando radicalmente la ricerca, integrando l'intelligenza artificiale come pilastro centrale. La "AI Mode", lanciata in fase di test oltre un anno fa, ha raggiunto un miliardo di utenti mensili, raddoppiando l'adozione ogni trimestre. Questa strategia, presentata all'I/O 2025 e 2026, mira a un'esperienza conversazionale gratuita, consolidando la posizione dominante di Google nel settore.

2026-05-20 📰 Fonte
OpenAI verso la quotazione in borsa: settembre l'orizzonte?
📁 Market AI generated ✅ TechCrunch AI

OpenAI verso la quotazione in borsa: settembre l'orizzonte?

OpenAI starebbe accelerando i preparativi per la sua offerta pubblica iniziale (IPO), con una possibile quotazione già a settembre. Questa mossa giunge all'indomani della risoluzione della causa intentata da Elon Musk, che aveva messo in discussione la governance e la stabilità finanziaria dell'azienda.

2026-05-20 📰 Fonte
Agibot: robot umanoidi al 100% in fabbrica, la validazione sul campo è la nuova frontiera
📁 Altro AI generated ✅ DigiTimes

Agibot: robot umanoidi al 100% in fabbrica, la validazione sul campo è la nuova frontiera

Agibot ha annunciato un tasso di successo del 100% nei deployment di robot umanoidi in ambienti di fabbrica. Questo risultato sottolinea una tendenza crescente nel settore della robotica: il passaggio dalla prototipazione alla validazione pratica in contesti reali. L'efficacia di questi sistemi in ambienti controllati apre nuove prospettive per l'automazione industriale e solleva interrogativi sulle infrastrutture di supporto necessarie per gestire tali carichi di lavoro AI on-premise.

2026-05-20 📰 Fonte
L'Esperimento di Google Beam: Riunioni Ibride più Immersive e Connesse
📁 Altro AI generated 🏆 Google AI Blog

L'Esperimento di Google Beam: Riunioni Ibride più Immersive e Connesse

Google ha avviato un nuovo esperimento con Beam, la sua piattaforma per la collaborazione, per migliorare le riunioni di gruppo ibride. L'iniziativa mira a rendere i partecipanti remoti più presenti, offrendo un'esperienza visiva e sonora realistica che favorisce inclusione e connessione tra i colleghi.

2026-05-20 📰 Fonte
L'Attesa per i Nuovi LLM di Qwen: Implicazioni per il Deployment On-Premise
📁 LLM AI generated ℹ️ LocalLLaMA

L'Attesa per i Nuovi LLM di Qwen: Implicazioni per il Deployment On-Premise

La community tech attende con interesse i prossimi Large Language Models di Qwen, in particolare le versioni da 27B e 122B parametri. Questa anticipazione evidenzia la crescente domanda di soluzioni LLM self-hosted, ponendo l'accento sulle sfide infrastrutturali e sui vantaggi in termini di sovranità dei dati e TCO per le aziende che valutano il deployment on-premise.

2026-05-20 📰 Fonte
Team Group e la controversia sulle velocità di memoria DDR4: un accordo da 1,1 milioni di dollari
📁 Hardware AI generated ℹ️ Tom's Hardware

Team Group e la controversia sulle velocità di memoria DDR4: un accordo da 1,1 milioni di dollari

Team Group ha raggiunto un accordo da 1,1 milioni di dollari in una causa per pubblicità ingannevole. La controversia riguarda le memorie T-Force Xtreem ARGB DDR4-3600 CL14, le cui velocità pubblicizzate richiedevano modifiche al BIOS e impostazioni di overclocking per essere raggiunte. Questo episodio solleva questioni sulla trasparenza delle specifiche hardware, un aspetto cruciale per i decision-maker che valutano infrastrutture on-premise per carichi di lavoro AI/LLM.

2026-05-20 📰 Fonte
Ottimizzazione dei Large Language Models: ByteShape valuta le quantizzazioni Qwen 3.6 35B GGUF per deployment on-premise
📁 LLM AI generated ℹ️ LocalLLaMA

Ottimizzazione dei Large Language Models: ByteShape valuta le quantizzazioni Qwen 3.6 35B GGUF per deployment on-premise

ByteShape ha analizzato le quantizzazioni NTP e MTP del modello Qwen 3.6 35B GGUF su diverse configurazioni hardware, evidenziando trade-off cruciali per i deployment on-premise. I risultati suggeriscono che la quantization più grande che si adatta alla memoria è spesso la scelta migliore per NTP, mentre MTP offre un boost di velocità sulle GPU, ma con un maggiore consumo di VRAM, rendendolo meno adatto per sistemi con risorse limitate.

2026-05-20 📰 Fonte
Dimissioni a Saline Township: minacce di morte per un datacenter OpenAI e Oracle
📁 Altro AI generated ✅ 404 Media

Dimissioni a Saline Township: minacce di morte per un datacenter OpenAI e Oracle

La tesoriera di Saline Township, Michigan, Jennifer Zink, si è dimessa a seguito di minacce di morte ricevute per la costruzione di un datacenter congiunto di Oracle e OpenAI. L'episodio evidenzia le crescenti tensioni locali legate all'espansione delle infrastrutture per l'intelligenza artificiale e le sfide che le comunità affrontano nell'ospitare tali progetti.

2026-05-20 📰 Fonte
Primer ottiene 86,2 milioni di euro per espandere i pagamenti AI autonomi negli USA
📁 Market AI generated ℹ️ The Next Web

Primer ottiene 86,2 milioni di euro per espandere i pagamenti AI autonomi negli USA

Primer, startup londinese specializzata in pagamenti, ha chiuso un round di finanziamento Series C da 86,2 milioni di euro. Il capitale sarà impiegato per potenziare la sua piattaforma di pagamenti e finanza basata su intelligenza artificiale, con un focus sull'espansione nel mercato statunitense. L'azienda punta a generare oltre un terzo dei ricavi totali dagli Stati Uniti entro il 2028, supportando la crescita con nuove assunzioni.

2026-05-20 📰 Fonte
SpacemiT K3: I primi benchmark del SoC RISC-V RVA23 su piattaforma Pico-ITX
📁 Hardware AI generated ✅ Phoronix

SpacemiT K3: I primi benchmark del SoC RISC-V RVA23 su piattaforma Pico-ITX

SpacemiT ha rilasciato i primi benchmark del suo SoC K3, basato su core RISC-V X100 e conforme allo standard RVA23. Questa piattaforma, disponibile anche in formato Pico-ITX, rappresenta una delle prime soluzioni RISC-V RVA23 pronte per l'uso con sistemi operativi come Ubuntu 26.04 LTS. L'introduzione di hardware RISC-V come il K3 è rilevante per le aziende che esplorano alternative on-premise per carichi di lavoro AI, offrendo nuove opzioni per il controllo e la sovranità dei dati.

2026-05-20 📰 Fonte
PyTorch Docathon 2026: Oltre 150 Pull Request Migliorano la Documentazione
📁 Frameworks AI generated ✅ PyTorch Blog

PyTorch Docathon 2026: Oltre 150 Pull Request Migliorano la Documentazione

Il PyTorch Docathon 2026 ha visto la partecipazione di oltre 260 registrati e 30 contributori attivi, culminando in più di 150 pull request unite. L'iniziativa ha migliorato significativamente la documentazione API e quella relativa a ExecuTorch, sottolineando il ruolo cruciale di contenuti chiari e aggiornati per l'ecosistema del deep learning, specialmente nell'era degli LLM e degli agenti AI, dove la qualità della documentazione impatta direttamente l'efficienza e l'accuratezza delle soluzioni.

2026-05-20 📰 Fonte
La corsa al talento nel silicio: bonus milionari e l'impatto sull'AI on-premise
📁 Market AI generated ℹ️ Tom's Hardware

La corsa al talento nel silicio: bonus milionari e l'impatto sull'AI on-premise

Le dinamiche del mercato dei semiconduttori mostrano una forte competizione per il talento, con dipendenti di Samsung e SK Hynix che abbandonano programmi di formazione per bonus fino a 400.000 dollari. Questo fenomeno evidenzia le pressioni sulla supply chain e i costi dell'hardware, elementi cruciali per chi pianifica deployment di Large Language Models (LLM) on-premise.

2026-05-20 📰 Fonte
Stability AI lancia un modello audio per brani lunghi, con variante on-device
📁 Altro AI generated ✅ TechCrunch AI

Stability AI lancia un modello audio per brani lunghi, con variante on-device

Stability AI ha presentato Stability Audio 3.0, un nuovo modello per la generazione di musica che promette la creazione di brani fino a sei minuti. Una versione "small" del modello è stata progettata per funzionare direttamente su dispositivi, offrendo la capacità di generare tracce audio di due minuti. Questa innovazione apre nuove prospettive per l'elaborazione audio locale e l'integrazione in applicazioni edge, rispondendo alle esigenze di sovranità dei dati e controllo.

2026-05-20 📰 Fonte
L'ascesa silenziosa della ricerca AI: un nuovo fronte nel consumer tech
📁 Market AI generated ✅ TechCrunch AI

L'ascesa silenziosa della ricerca AI: un nuovo fronte nel consumer tech

La ricerca basata su intelligenza artificiale sta emergendo come uno dei settori più dinamici e promettenti nel panorama dell'AI consumer. Nonostante una crescita inizialmente discreta, le startup che operano in questo ambito stanno attirando un'attenzione significativa, evidenziando il potenziale trasformativo di questa tecnicia per migliorare l'interazione degli utenti con le informazioni e sollevando importanti questioni infrastrutturali e di deployment.

2026-05-20 📰 Fonte
Figma introduce un assistente AI nativo per la progettazione collaborativa
📁 LLM AI generated ℹ️ The Next Web

Figma introduce un assistente AI nativo per la progettazione collaborativa

Figma lancia il proprio assistente AI integrato direttamente nella tela di progettazione collaborativa. Questo agente permette agli utenti di generare, modificare e iterare sui design tramite prompt in linguaggio naturale, consolidando l'impegno dell'azienda nell'intelligenza artificiale dopo acquisizioni e partnership strategiche con attori come Anthropic e OpenAI. La mossa evidenzia la crescente integrazione degli LLM nei workflow creativi.

2026-05-20 📰 Fonte
AMD Ryzen AI Halo PC: 128GB di memoria per l'AI locale a 3999 dollari
📁 Hardware AI generated ℹ️ LocalLLaMA

AMD Ryzen AI Halo PC: 128GB di memoria per l'AI locale a 3999 dollari

AMD si prepara a lanciare il suo Ryzen AI Halo PC, un sistema desktop con 128GB di memoria di sistema e un prezzo di 3999 dollari. Questa configurazione mira a supportare carichi di lavoro AI e LLM in locale, offrendo una soluzione per le aziende che cercano maggiore controllo sui dati e latenza ridotta rispetto alle opzioni cloud.

2026-05-20 📰 Fonte
Musk contro OpenAI: la sentenza sul futuro del colosso dell'IA
📁 Market AI generated ✅ MIT Technology Review

Musk contro OpenAI: la sentenza sul futuro del colosso dell'IA

Elon Musk ha perso la causa contro OpenAI, in cui accusava Sam Altman e Greg Brockman di averlo ingannato sullo status non-profit dell'azienda. La sentenza solleva interrogativi sulle dinamiche interne e la direzione futura di uno dei principali attori nel panorama dell'intelligenza artificiale. Un'analisi approfondita delle implicazioni è stata offerta da Michelle Kim e Mat Honan.

2026-05-20 📰 Fonte
← Precedente Page 14 / 119 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge