AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

Boom del Testing AI a Taiwan: KYEC, MPI e WinWay verso ricavi record nel 2026
📁 Market AI generated ✅ DigiTimes

Boom del Testing AI a Taiwan: KYEC, MPI e WinWay verso ricavi record nel 2026

Le aziende taiwanesi KYEC, MPI e WinWay si preparano a raggiungere ricavi record entro il 2026, spinte dalla crescente domanda nel settore del testing per l'intelligenza artificiale. Questo trend evidenzia l'importanza cruciale della validazione rigorosa per le infrastrutture AI, specialmente in contesti di deployment on-premise, dove la precisione e l'affidabilità sono fondamentali per le operazioni critiche.

2026-05-12 📰 Fonte
Kuaishou punta a 20 miliardi di dollari per Kling AI, spin-off per la generazione video
📁 Altro AI generated ✅ DigiTimes

Kuaishou punta a 20 miliardi di dollari per Kling AI, spin-off per la generazione video

Kuaishou, gigante cinese della tecnicia, mira a una valutazione di 20 miliardi di dollari per Kling AI, il suo spin-off dedicato alla generazione di video. Questa mossa strategica evidenzia la crescente domanda di soluzioni AI per la creazione di contenuti visivi e solleva questioni cruciali sull'infrastruttura necessaria per gestire carichi di lavoro così intensivi, spingendo le aziende a valutare attentamente le opzioni di deployment on-premise rispetto al cloud per garantire sovranità dei dati e controllo sui costi operativi.

2026-05-12 📰 Fonte
Soluzioni termiche per server AI: Taiwan guida la crescita fino al 2026
📁 Market AI generated ✅ DigiTimes

Soluzioni termiche per server AI: Taiwan guida la crescita fino al 2026

Il crescente fabbisogno di server AI ad alte prestazioni sta alimentando un boom per le aziende taiwanesi specializzate in soluzioni termiche. Entro il 2026, si prevede che aziende come AVC e Auras guideranno una significativa espansione del mercato, rispondendo alla domanda critica di raffreddamento efficiente per le infrastrutture AI, in particolare per i deployment on-premise che richiedono un controllo rigoroso su performance e TCO.

2026-05-12 📰 Fonte
SalesSim: Valutare e Allineare i Modelli Multimodali per la Simulazione Utente nel Retail
📁 LLM AI generated 🏆 ArXiv cs.CL

SalesSim: Valutare e Allineare i Modelli Multimodali per la Simulazione Utente nel Retail

Un nuovo framework, SalesSim, è stato introdotto per valutare la capacità dei Large Language Models multimodali (MLLM) di simulare comportamenti realistici di clienti nel retail online. La ricerca ha rivelato lacune significative, come bassa diversità lessicale e scarsa aderenza alle specifiche di persona, con il modello migliore che raggiunge meno del 79% di allineamento. Per affrontare queste sfide, è stato proposto UserGRPO, un approccio di reinforcement learning che migliora l'allineamento delle decisioni e la qualità conversazionale.

2026-05-12 📰 Fonte
PathBoost: il Gradient Boosting basato su percorsi per l'analisi dei grafi
📁 Frameworks AI generated 🏆 ArXiv cs.LG

PathBoost: il Gradient Boosting basato su percorsi per l'analisi dei grafi

PathBoost è un nuovo metodo di gradient tree boosting per la classificazione e regressione a livello di grafo. Apprende caratteristiche basate su percorsi direttamente dalla struttura del grafo, estendendo lavori precedenti con adattamento alla classificazione binaria, gestione di attributi multipli e selezione automatica dei nodi di ancoraggio. I benchmark mostrano che PathBoost è competitivo con le reti neurali grafiche e gli approcci kernel, specialmente su grafi con un numero elevato di nodi, offrendo un'alternativa ai modelli black-box più complessi.

2026-05-12 📰 Fonte
RL-Kirigami: L'IA accelera la progettazione di metamateriali kirigami
📁 Frameworks AI generated 🏆 ArXiv cs.LG

RL-Kirigami: L'IA accelera la progettazione di metamateriali kirigami

Un nuovo framework, RL-Kirigami, combina Optimal-Transport Conditional Flow Matching e Reinforcement Learning per la progettazione inversa di metamateriali kirigami. Il sistema riduce drasticamente le valutazioni del simulatore e migliora la precisione, consentendo la prototipazione rapida di componenti fisici in pochi minuti. Questo approccio promette di trasformare i workflow di design e produzione, con implicazioni significative per l'efficienza e la sovranità dei dati in contesti industriali.

2026-05-12 📰 Fonte
Auto-Rubric as Reward: Criteri Espliciti per Allineare i Modelli Generativi Multimodali
📁 Frameworks AI generated 🏆 ArXiv cs.AI

Auto-Rubric as Reward: Criteri Espliciti per Allineare i Modelli Generativi Multimodali

Un nuovo framework, Auto-Rubric as Reward (ARR), mira a migliorare l'allineamento dei modelli generativi multimodali con le preferenze umane. Superando i limiti degli approcci RLHF tradizionali che usano etichette implicite, ARR introduce una decomposizione basata su criteri espliciti. Questo metodo estrapola la conoscenza interna dei VLM in rubriche specifiche, riducendo i bias di valutazione e migliorando l'efficienza dei dati. In combinazione con Rubric Policy Optimization (RPO), ARR-RPO ha dimostrato prestazioni superiori nei benchmark di generazione testo-immagine e di editing di immagini.

2026-05-12 📰 Fonte
Contesto Spaziale Supera il Priming Semantico per l'Estrazione Dati da Grafici con LLM
📁 LLM AI generated 🏆 ArXiv cs.AI

Contesto Spaziale Supera il Priming Semantico per l'Estrazione Dati da Grafici con LLM

Una nuova ricerca esplora strategie per migliorare l'accuratezza degli LLM multimodali nell'estrazione di dati da grafici scientifici non standardizzati. Lo studio rivela che l'applicazione di un contesto spaziale esplicito, tramite una griglia di coordinate, riduce significativamente gli errori rispetto a metodi di priming semantico. Questa tecnica offre un approccio più affidabile per l'attuale generazione di modelli, con una riduzione del SMAPE dal 25,5% al 19,5%.

2026-05-12 📰 Fonte
Dinamiche di Mercato e Adozione Tecnologica: Lezioni per l'Framework AI
📁 Altro AI generated ✅ DigiTimes

Dinamiche di Mercato e Adozione Tecnologica: Lezioni per l'Framework AI

L'accelerata penetrazione dei veicoli a nuova energia in Cina, spinta dai prezzi del petrolio, offre uno spunto di riflessione sulle dinamiche che guidano l'adozione di nuove tecnicie. Questo scenario evidenzia come fattori economici e strategici influenzino le scelte infrastrutturali, un parallelo rilevante per il deployment di Large Language Models (LLM) on-premise, dove TCO e sovranità dei dati sono cruciali.

2026-05-12 📰 Fonte
La domanda di server AI spinge i ricavi record di WPG Holdings e WT Microelectronics
📁 Market AI generated ✅ DigiTimes

La domanda di server AI spinge i ricavi record di WPG Holdings e WT Microelectronics

WPG Holdings e WT Microelectronics hanno registrato ricavi record ad aprile, trainati dalla forte domanda di server dedicati all'intelligenza artificiale. Questo trend evidenzia la crescente adozione di soluzioni AI, con implicazioni significative per le strategie di deployment on-premise e la catena di fornitura hardware, sottolineando l'importanza di infrastrutture robuste per i carichi di lavoro LLM.

2026-05-12 📰 Fonte
Lezioni dall'Estremo Oriente: Le Sfide Nascoste dell'Framework per i Deployment Critici
📁 Altro AI generated ✅ DigiTimes

Lezioni dall'Estremo Oriente: Le Sfide Nascoste dell'Framework per i Deployment Critici

I recenti rallentamenti nello sviluppo delle infrastrutture di ricarica per veicoli elettrici a Taiwan, dovuti a problemi di rete e condizioni del suolo, offrono uno spaccato delle complesse sfide che attendono qualsiasi deployment tecnicico critico. Questa situazione evidenzia l'importanza di una pianificazione meticolosa e della valutazione dei siti, aspetti cruciali anche per le architetture on-premise dedicate ai Large Language Models, dove la resilienza e il TCO dipendono da fondamenta solide.

2026-05-12 📰 Fonte
AcBel Polytech, OmniOn e Kinpo Group uniscono le forze per l'alimentazione AI
📁 Hardware AI generated ✅ DigiTimes

AcBel Polytech, OmniOn e Kinpo Group uniscono le forze per l'alimentazione AI

AcBel Polytech, OmniOn e Kinpo Group hanno stretto una collaborazione strategica per sviluppare soluzioni di alimentazione dedicate al crescente mercato dell'intelligenza artificiale. L'iniziativa mira a rispondere alla domanda di infrastrutture robuste ed efficienti, essenziali per i carichi di lavoro intensivi di LLM e per i deployment on-premise, dove l'efficienza energetica e la gestione termica sono fattori critici per il TCO.

2026-05-12 📰 Fonte
OpenAI: un fondo da 4 miliardi per spingere l'AI nelle imprese
📁 Market AI generated ✅ DigiTimes

OpenAI: un fondo da 4 miliardi per spingere l'AI nelle imprese

OpenAI ha lanciato una nuova iniziativa di deployment da 4 miliardi di dollari, mirata ad accelerare l'adozione dell'intelligenza artificiale all'interno delle aziende. L'investimento sottolinea l'impegno a facilitare l'integrazione dei Large Language Models (LLM) nei contesti aziendali, affrontando le complessità legate alla scalabilità, alla sovranità dei dati e ai requisiti infrastrutturali che le imprese devono gestire nell'implementazione di soluzioni AI.

2026-05-12 📰 Fonte
Nvidia e Corning rafforzano la partnership: la fibra ottica al centro dell'AI
📁 Altro AI generated ✅ DigiTimes

Nvidia e Corning rafforzano la partnership: la fibra ottica al centro dell'AI

Nvidia sta intensificando la sua collaborazione con Corning, puntando sulla fibra ottica per le infrastrutture AI. Questa transizione dal rame al silicio ottico è cruciale per supportare le crescenti esigenze di larghezza di banda e latenza dei Large Language Models (LLM) e delle applicazioni di intelligenza artificiale, influenzando anche il mercato cinese dell'ottica. La mossa sottolinea l'importanza di connessioni ad alte prestazioni per i deployment on-premise.

2026-05-12 📰 Fonte
La strategia modulare di Nvidia accelera la filiera AI: il caso Delta Electronics
📁 Market AI generated ✅ DigiTimes

La strategia modulare di Nvidia accelera la filiera AI: il caso Delta Electronics

L'approccio modulare di Nvidia allo sviluppo di soluzioni hardware per l'intelligenza artificiale sta generando un significativo impulso per i suoi fornitori. Delta Electronics, in particolare, sta beneficiando di questa strategia, evidenziando come la domanda di componenti specifici per l'AI stia rimodellando la catena di approvvigionamento. Questo trend ha implicazioni dirette per le aziende che pianificano infrastrutture on-premise per carichi di lavoro LLM.

2026-05-12 📰 Fonte
Raffreddamento custom per DGX: un approccio on-premise per LLM ad alte prestazioni
📁 Hardware AI generated ℹ️ LocalLLaMA

Raffreddamento custom per DGX: un approccio on-premise per LLM ad alte prestazioni

Un utente ha dimostrato un metodo di raffreddamento a circuito aperto con acqua di rubinetto per un sistema DGX, mantenendo le GPU sotto i 68°C con un utilizzo del 95%. La configurazione gestisce un LLM Qwen3.5-122b-a10B con precisione Q6_K, utilizzando 110 GB di memoria e una finestra di contesto di 80k, raggiungendo 18.77 token/secondo per analisi di visione continue. Questo evidenzia le sfide e le soluzioni creative per i deployment AI on-premise.

2026-05-12 📰 Fonte
Cresce la domanda di CPU Arm per AGI, l'offerta è a rischio
📁 Market AI generated ✅ DigiTimes

Cresce la domanda di CPU Arm per AGI, l'offerta è a rischio

La richiesta di CPU Arm destinate a carichi di lavoro di intelligenza artificiale generale (AGI) sta subendo un'impennata, sollevando preoccupazioni riguardo a potenziali vincoli nella catena di fornitura. Questa situazione evidenzia le sfide infrastrutturali che le aziende devono affrontare nel pianificare deployment AI on-premise, dove la disponibilità hardware e il TCO sono fattori critici per la sovranità dei dati e il controllo operativo.

2026-05-12 📰 Fonte
Compeq si afferma come fornitore chiave nel boom di AI e satelliti a bassa orbita
📁 Market AI generated ✅ DigiTimes

Compeq si afferma come fornitore chiave nel boom di AI e satelliti a bassa orbita

Compeq si posiziona come attore fondamentale nella catena di fornitura per i settori in rapida espansione dell'intelligenza artificiale e dei satelliti a bassa orbita. L'azienda beneficia della crescente domanda di componenti avanzati, essenziali per supportare l'infrastruttura hardware necessaria allo sviluppo e al deployment di Large Language Models e altre applicazioni AI, in particolare per le soluzioni self-hosted.

2026-05-12 📰 Fonte
Infineon vince la disputa sui brevetti GaN negli Stati Uniti contro Innoscience
📁 Market AI generated ✅ DigiTimes

Infineon vince la disputa sui brevetti GaN negli Stati Uniti contro Innoscience

Infineon Technologies ha ottenuto una vittoria legale negli Stati Uniti, con un tribunale che ha riconosciuto la validità dei suoi brevetti sulla tecnicia del nitruro di gallio (GaN) contro il concorrente cinese Innoscience. Questa sentenza rafforza la posizione di Infineon nel mercato dei semiconduttori di potenza, evidenziando l'importanza della proprietà intellettuale in un settore strategico per l'efficienza energetica delle infrastrutture IT, inclusi i deployment on-premise.

2026-05-12 📰 Fonte
Dinamiche nel panorama LLM: il segnale di Anthropic dopo il passo di xAI
📁 Market AI generated ✅ DigiTimes

Dinamiche nel panorama LLM: il segnale di Anthropic dopo il passo di xAI

L'uscita di xAI dal panorama competitivo, evidenziando la forza di Anthropic, sottolinea le continue evoluzioni nel mercato dei Large Language Models. Questo scenario impone alle aziende una riflessione strategica sulle scelte di deployment, bilanciando innovazione, sovranità dei dati e costi totali di proprietà per le proprie infrastrutture AI.

2026-05-12 📰 Fonte
Taiwan e l'AI per l'auto: oltre i componenti, verso i sistemi autonomi
📁 Market AI generated ✅ DigiTimes

Taiwan e l'AI per l'auto: oltre i componenti, verso i sistemi autonomi

Taiwan sta ridefinendo il suo ruolo nell'industria automobilistica, spostando il focus dalla produzione di componenti alla progettazione e integrazione di sistemi autonomi avanzati. Questa evoluzione strategica sottolinea la crescente importanza dell'intelligenza artificiale e delle soluzioni di deployment locali, come l'edge computing, per gestire le complesse esigenze di elaborazione e sovranità dei dati nei veicoli di nuova generazione.

2026-05-12 📰 Fonte
L'Asia Sud-Orientale si posiziona come hub strategico per i semiconduttori AI
📁 Market AI generated ✅ DigiTimes

L'Asia Sud-Orientale si posiziona come hub strategico per i semiconduttori AI

L'industria dei semiconduttori nel Sud-Est asiatico sta ridefinendo la propria strategia, orientandosi sempre più verso la produzione di componenti cruciali per l'intelligenza artificiale. Questa transizione posiziona la regione come un hub strategico fondamentale, con implicazioni significative per la catena di fornitura globale e per le strategie di deployment di LLM on-premise, influenzando la disponibilità e il TCO dell'hardware.

2026-05-12 📰 Fonte
Driver Open Source Radeon R300-R500: Ristrutturazione del Codice in Arrivo nel 2026
📁 Hardware AI generated ✅ Phoronix

Driver Open Source Radeon R300-R500: Ristrutturazione del Codice in Arrivo nel 2026

Il driver open source "R300g" per le GPU ATI (AMD) Radeon delle serie R300 e R500, risalenti a oltre due decenni fa, riceverà una significativa ristrutturazione del codice nel 2026. Questo sforzo, guidato da un singolo sviluppatore della comunità, sottolinea la longevità e la dedizione dei progetti open source, garantendo supporto e miglioramenti anche per hardware considerato obsoleto.

2026-05-12 📰 Fonte
Robinhood prepara un secondo fondo di venture capital, tra rally AI e nuove startup
📁 Market AI generated ✅ TechCrunch AI

Robinhood prepara un secondo fondo di venture capital, tra rally AI e nuove startup

Robinhood ha avviato in via confidenziale la creazione del suo secondo fondo di venture capital. L'iniziativa si inserisce nel contesto dell'attuale rally dell'intelligenza artificiale e mira a sostenere sia startup in fase iniziale che aziende già in crescita. Questo movimento strategico riflette l'interesse crescente per l'innovazione tecnicica e la diversificazione degli investimenti nel settore tech.

2026-05-12 📰 Fonte
Nemotron-3 Super 64B: 500.000 token di contesto su 48 GB VRAM per il coding
📁 LLM AI generated ℹ️ LocalLLaMA

Nemotron-3 Super 64B: 500.000 token di contesto su 48 GB VRAM per il coding

Un'implementazione del modello Nemotron-3 Super 64B, ottimizzata per il formato GGUF, dimostra la capacità di gestire una finestra di contesto di 500.000 token con soli 48 GB di VRAM, raggiungendo 21 token/secondo per compiti di coding. Questa scoperta evidenzia il potenziale degli LLM per il deployment on-premise, offrendo controllo sui dati e efficienza per carichi di lavoro specializzati, anche su hardware prosumer come una doppia TITAN RTX.

2026-05-12 📰 Fonte
Ilya Sutskever difende il suo ruolo nell'allontanamento di Altman: 'Non volevo fosse distrutta'
📁 Market AI generated ✅ Wired AI

Ilya Sutskever difende il suo ruolo nell'allontanamento di Altman: 'Non volevo fosse distrutta'

L'ex capo scienziato di OpenAI, Ilya Sutskever, ha rotto il silenzio sulla sua partecipazione all'allontanamento di Sam Altman, dichiarando di aver agito per prevenire la distruzione dell'azienda. La sua testimonianza, nonostante l'attuale estraneità dalla società, evidenzia le tensioni interne e le visioni divergenti che possono plasmare il futuro dei Large Language Models e le loro implicazioni per il deployment aziendale.

2026-05-12 📰 Fonte
Wise lascia Londra per il Nasdaq: un cambio di rotta strategico per la fintech
📁 Market AI generated ℹ️ The Next Web

Wise lascia Londra per il Nasdaq: un cambio di rotta strategico per la fintech

Wise, la fintech fondata a Londra, ha spostato la sua quotazione principale dal London Stock Exchange al Nasdaq di New York. L'operazione, che ha visto le azioni aprire a 15,96 dollari, segna un'evoluzione strategica per l'azienda, che aveva debuttato a Londra nel luglio 2021 con una valutazione di 11 miliardi di dollari. La mossa include anche la richiesta di una licenza bancaria negli Stati Uniti, indicando un'ambizione che va oltre il semplice cambio di listino.

2026-05-11 📰 Fonte
GitLab si ristruttura per l'era degli agenti AI: tagli e riorganizzazione
📁 Market AI generated ℹ️ The Next Web

GitLab si ristruttura per l'era degli agenti AI: tagli e riorganizzazione

GitLab ha annunciato una significativa ristrutturazione aziendale, che include tagli di posti di lavoro e una riorganizzazione interna. L'obiettivo è accelerare gli investimenti negli agenti AI, automatizzando processi interni come revisioni e approvazioni. L'azienda intende appiattire la gerarchia manageriale, suddividere i team R&D in unità autonome e ridurre la propria presenza geografica. Questa mossa segna un chiaro orientamento verso l'integrazione dell'intelligenza artificiale nelle operazioni core.

2026-05-11 📰 Fonte
L'adozione di ChatGPT si espande nel 2026: un segnale per l'IA mainstream
📁 Market AI generated 🏆 OpenAI Blog

L'adozione di ChatGPT si espande nel 2026: un segnale per l'IA mainstream

Nel primo trimestre del 2026, l'adozione di ChatGPT ha registrato una crescita significativa, in particolare tra gli utenti over 35 e con un uso più equilibrato tra i generi. Questi dati indicano una progressiva integrazione dell'IA nel quotidiano, ponendo nuove sfide per le strategie di deployment enterprise e la gestione dell'infrastruttura.

2026-05-11 📰 Fonte
Output JSON dagli LLM: un'analisi delle criticità e una soluzione per i deployment locali
📁 Frameworks AI generated ℹ️ LocalLLaMA

Output JSON dagli LLM: un'analisi delle criticità e una soluzione per i deployment locali

Una ricerca approfondita su 288 chiamate a LLM rivela le sette principali modalità di fallimento nella generazione di output JSON, comuni sia ai modelli open source che proprietari. Le soluzioni convenzionali spesso non bastano per i deployment on-premise. Viene presentato OutputGuard, un framework Python open source che valida e ripara l'output JSON (e altri formati) con 15 strategie, migliorando l'affidabilità e riducendo il TCO per le infrastrutture self-hosted.

2026-05-11 📰 Fonte
Un modello ML svela i fattori di abbandono nei lavori tech: risultati inattesi
📁 Market AI generated ℹ️ The Next Web

Un modello ML svela i fattori di abbandono nei lavori tech: risultati inattesi

Un esperto di People Analytics con un decennio di esperienza, inclusa una parentesi in Meta, ha sviluppato un modello di Machine Learning per prevedere l'abbandono dei dipendenti nel settore tecnicico entro il primo anno. Contrariamente alle sue ipotesi iniziali su due fattori chiave, i risultati ottenuti dal modello si sono rivelati sorprendenti, offrendo una nuova prospettiva sulle dinamiche di retention del talento.

2026-05-11 📰 Fonte
Vulkan 1.4.351: Nuove estensioni per grafica e calcolo ad alte prestazioni
📁 Frameworks AI generated ✅ Phoronix

Vulkan 1.4.351: Nuove estensioni per grafica e calcolo ad alte prestazioni

L'API Vulkan si aggiorna alla versione 1.4.351, introducendo sei nuove estensioni che ne potenziano le capacità. Tra le novità spicca un miglioramento significativo per il ray-tracing, consolidando il ruolo di Vulkan come interfaccia cruciale per applicazioni grafiche e di calcolo intensivo. Questo aggiornamento ha implicazioni dirette per l'ottimizzazione dell'hardware e la gestione dei carichi di lavoro, specialmente in scenari di deployment on-premise dove l'efficienza delle risorse è fondamentale.

2026-05-11 📰 Fonte
Lodestellar: Trasparenza Ambientale nell'Edilizia per Gare Milionarie
📁 Market AI generated ℹ️ The Next Web

Lodestellar: Trasparenza Ambientale nell'Edilizia per Gare Milionarie

Lodestellar, uno strumento da 7 euro, sta rivoluzionando il settore delle costruzioni. Offre ai produttori una soluzione economica per garantire trasparenza sui loro impatti ambientali, superando le pratiche di greenwashing. Questo approccio basato sui dati non solo migliora la credibilità, ma si rivela cruciale per aggiudicarsi appalti di valore elevato, promuovendo decisioni più informate e sostenibili nel settore.

2026-05-11 📰 Fonte
Il futuro dei modelli Qwen3.6: attesa e incertezze per il deployment on-premise
📁 LLM AI generated ℹ️ LocalLLaMA

Il futuro dei modelli Qwen3.6: attesa e incertezze per il deployment on-premise

La comunità tech, in particolare quella focalizzata sui Large Language Models (LLM) da eseguire in locale, si interroga sul futuro della serie Qwen3.6. L'assenza di annunci riguardo a versioni più grandi, come Qwen3.6-122B, o specializzate, come Qwen3.6-coder, sta generando incertezza tra gli sviluppatori e le aziende che valutano soluzioni self-hosted per la sovranità dei dati e il controllo infrastrutturale.

2026-05-11 📰 Fonte
AMD: Nuova GPU RDNA 4 entry-level con 8GB VRAM e 2048 core in arrivo
📁 Hardware AI generated ℹ️ Tom's Hardware

AMD: Nuova GPU RDNA 4 entry-level con 8GB VRAM e 2048 core in arrivo

Voci di corridoio suggeriscono che AMD stia preparando una GPU RDNA 4 di fascia entry-level, la RX 9050, dotata di 8GB di VRAM e 2048 core. Questa potenziale aggiunta alla gamma Radeon potrebbe offrire nuove opzioni per carichi di lavoro AI più leggeri e deployment on-premise, bilanciando costo e capacità per specifiche esigenze di inference.

2026-05-11 📰 Fonte
AMD potenzia il driver Linux AMDGPU con HDMI 2.1 e DSC
📁 Hardware AI generated ✅ Phoronix

AMD potenzia il driver Linux AMDGPU con HDMI 2.1 e DSC

AMD ha rilasciato aggiornamenti significativi per il driver kernel AMDGPU su Linux, introducendo il supporto per HDMI 2.1 Fixed Rate Link (FRL) e Display Stream Compression (DSC). Questi miglioramenti consentono risoluzioni e frequenze di aggiornamento superiori, consolidando la posizione del driver open source come soluzione robusta per l'hardware AMD in ambienti che richiedono prestazioni grafiche avanzate e controllo infrastrutturale.

2026-05-11 📰 Fonte
MiniCPM 4.6: Un LLM compatto per scenari di deployment locali
📁 LLM AI generated ℹ️ LocalLLaMA

MiniCPM 4.6: Un LLM compatto per scenari di deployment locali

MiniCPM 4.6 si presenta come un Large Language Model progettato per l'efficienza, aprendo nuove possibilità per il deployment in ambienti self-hosted. Questo modello compatto è particolarmente rilevante per le organizzazioni che cercano di mantenere la sovranità dei dati e ottimizzare il TCO, riducendo i requisiti di VRAM e di potenza di calcolo per l'inference locale.

2026-05-11 📰 Fonte
Digg rilancia con un aggregatore di notizie focalizzato sull'IA
📁 Market AI generated ✅ TechCrunch AI

Digg rilancia con un aggregatore di notizie focalizzato sull'IA

Digg tenta un nuovo ritorno sulla scena digitale, questa volta posizionandosi come aggregatore di notizie focalizzato sull'intelligenza artificiale. L'iniziativa si inserisce nel crescente panorama dei servizi che sfruttano l'IA per la curatela e la presentazione dei contenuti, sollevando interrogativi sulle metodologie di selezione e sulla gestione dei dati in un contesto di rapida evoluzione tecnicica.

2026-05-11 📰 Fonte
System76 Thelio Major: la workstation Linux all-AMD per carichi AI
📁 Hardware AI generated ✅ Phoronix

System76 Thelio Major: la workstation Linux all-AMD per carichi AI

System76 ha presentato la workstation Thelio Major, un sistema Linux di fascia alta completamente basato su hardware AMD. Dotata di processori Ryzen Threadripper 9000 e grafica Radeon AI PRO R9700, questa macchina offre una soluzione potente e open-source, ideale per gli sviluppatori e i professionisti che necessitano di elevate prestazioni per carichi di lavoro intensivi, inclusi quelli legati all'intelligenza artificiale, mantenendo il controllo completo sull'ambiente operativo e sulla sovranità dei dati.

2026-05-11 📰 Fonte
Novo Nordisk affida a Cellular Intelligence la terapia per il Parkinson basata su cellule staminali e AI
📁 Market AI generated ℹ️ The Next Web

Novo Nordisk affida a Cellular Intelligence la terapia per il Parkinson basata su cellule staminali e AI

Novo Nordisk ha trasferito la terapia sperimentale STEM-PD per il Parkinson, basata su cellule staminali, alla startup Cellular Intelligence. Quest'ultima, sostenuta da Zuckerberg, intende applicare la propria piattaforma di intelligenza artificiale al progetto, precedentemente interrotto da Novo Nordisk. L'accordo prevede una partecipazione azionaria di Novo Nordisk in Cellular Intelligence, oltre a futuri pagamenti per milestone e royalty.

2026-05-11 📰 Fonte
Meta sotto accusa: la Contea di Santa Clara denuncia gli annunci truffa
📁 Market AI generated ℹ️ The Next Web

Meta sotto accusa: la Contea di Santa Clara denuncia gli annunci truffa

La Contea di Santa Clara ha intentato una causa contro Meta Platforms in un tribunale statale della California. L'accusa principale è che l'azienda tragga profitto da annunci pubblicitari fraudolenti su Facebook e Instagram. Secondo la denuncia, Meta guadagnerebbe fino a 7 miliardi di dollari all'anno da queste inserzioni “ad alto rischio” e avrebbe tollerato la pratica. La contea chiede risarcimenti, danni civili e un'ingiunzione per conto dei residenti della California.

2026-05-11 📰 Fonte
Alphabet finanzia l'espansione AI con obbligazioni in yen: un debutto strategico
📁 Market AI generated ℹ️ The Next Web

Alphabet finanzia l'espansione AI con obbligazioni in yen: un debutto strategico

Alphabet ha annunciato la sua prima emissione di obbligazioni denominate in yen, un'operazione strategica per finanziare lo sviluppo delle sue capacità di intelligenza artificiale. Questa mossa rientra in un vasto programma di spesa in conto capitale da 180-190 miliardi di dollari, che ha già visto emissioni in diverse valute. L'iniziativa sottolinea l'ingente investimento richiesto per la costruzione di infrastrutture AI avanzate.

2026-05-11 📰 Fonte
Shein contro Temu: la battaglia legale sulle immagini e le implicazioni per l'AI nell'e-commerce
📁 Altro AI generated ℹ️ The Next Web

Shein contro Temu: la battaglia legale sulle immagini e le implicazioni per l'AI nell'e-commerce

Il tribunale di Londra ospita un processo di due settimane tra i giganti dell'e-commerce Shein e Temu. Shein accusa Temu di violazione di copyright su 'scala industriale' per circa 2.300 immagini di prodotti, mentre Temu risponde con accuse di pratiche anticoncorrenziali. La disputa evidenzia le sfide legali e tecniciche nella gestione di grandi volumi di dati digitali, con implicazioni dirette per le strategie di deployment AI.

2026-05-11 📰 Fonte
OpenAI lancia una società di deployment da 4 miliardi di dollari
📁 Market AI generated ℹ️ The Next Web

OpenAI lancia una società di deployment da 4 miliardi di dollari

OpenAI ha annunciato la creazione di OpenAI Deployment Company, una nuova entità con un finanziamento iniziale di oltre 4 miliardi di dollari. La società, che sarà controllata a maggioranza da OpenAI, ha attratto un consorzio di 19 investitori, tra cui TPG, Advent International, Bain Capital e Brookfield come partner fondatori principali. L'iniziativa mira a rafforzare le capacità di deployment dei Large Language Models in contesti enterprise.

2026-05-11 📰 Fonte
L'onnipresenza dell'IA e il suo impatto sulla percezione umana
📁 LLM AI generated ✅ 404 Media

L'onnipresenza dell'IA e il suo impatto sulla percezione umana

L'articolo esplora il crescente impatto dell'intelligenza artificiale sulla nostra percezione del contenuto online. Con l'IA che permea ogni aspetto del web, dalla pubblicità ai forum, gli utenti si trovano a dover discernere costantemente tra creazioni umane e generate da algoritmi. Questa "fatica cognitiva" porta a una diffusa sfiducia e alla difficoltà di distinguere il vero dal falso, evidenziando le implicazioni psicologiche e sociali dell'adozione massiva dell'IA.

2026-05-11 📰 Fonte
L'ascesa degli agenti AI di Claude e la crescente domanda di Mac mini
📁 Altro AI generated ℹ️ The Next Web

L'ascesa degli agenti AI di Claude e la crescente domanda di Mac mini

La crescente adozione degli agenti AI di Claude, in particolare per attività di coding e agentic workflow, sta generando un'impennata nella domanda di Mac mini. Questo trend evidenzia un interesse per soluzioni di elaborazione AI locali e self-hosted, anche in contesti edge. Per aziende e professionisti, il Mac mini rappresenta una piattaforma compatta ed efficiente per l'Inference di LLM, offrendo controllo sui dati e potenziale ottimizzazione del TCO rispetto ai servizi cloud.

2026-05-11 📰 Fonte
Unsloth ottimizza i modelli Qwen per deployment LLM locali in formato GGUF
📁 LLM AI generated ℹ️ LocalLLaMA

Unsloth ottimizza i modelli Qwen per deployment LLM locali in formato GGUF

Unsloth ha reso disponibili versioni ottimizzate dei Large Language Models Qwen 3.6-27B e 3.6-35B nel formato GGUF. Questa iniziativa, emersa dalla comunità LocalLLaMA, facilita il deployment di LLM su infrastrutture self-hosted, offrendo ai decision-maker tech maggiore controllo sui dati e potenziale riduzione del TCO per carichi di lavoro AI.

2026-05-11 📰 Fonte
Algorithmiq sposta la sede globale a Milano e raccoglie 18 milioni di euro per il software quantistico
📁 Market AI generated ℹ️ Tech.eu

Algorithmiq sposta la sede globale a Milano e raccoglie 18 milioni di euro per il software quantistico

Algorithmiq, azienda specializzata in software quantistico, ha stabilito la sua sede globale a Milano, dopo aver raccolto 18 milioni di euro. Questo finanziamento, il più grande in Italia per una startup quantistica, porta il totale a 36 milioni di euro. La mossa sottolinea la crescente importanza dell'Italia e dell'Europa nello sviluppo di algoritmi quantistici e riflette una strategia che privilegia lo strato software rispetto alla corsa all'hardware.

2026-05-11 📰 Fonte
Intel IGC 2.34.4: Nuovi Miglioramenti per il Compilatore Grafico e Compute
📁 Frameworks AI generated ✅ Phoronix

Intel IGC 2.34.4: Nuovi Miglioramenti per il Compilatore Grafico e Compute

Il compilatore grafico Intel IGC 2.34.4 è stato rilasciato, introducendo miglioramenti significativi. Essenziale per il runtime di calcolo Intel, supporta Level Zero e OpenCL per l'accelerazione su hardware grafico Intel. Questa versione è cruciale anche per la compilazione degli shader grafici in ambiente Windows, sottolineando l'importanza di un software ottimizzato per sfruttare al meglio le capacità hardware, un aspetto chiave per i deployment on-premise.

2026-05-11 📰 Fonte
L'evoluzione del software in Polonia: dall'outsourcing all'AI-native per l'impresa
📁 Market AI generated ℹ️ Tech.eu

L'evoluzione del software in Polonia: dall'outsourcing all'AI-native per l'impresa

La Polonia, da hub di outsourcing IT, si sta affermando come pioniere nello sviluppo software AI-native. Aziende come Miquido guidano questa transizione, integrando l'AI generativa e agentica nel ciclo di vita del software. L'intervista al CEO Jerzy Biernacki evidenzia il cambiamento del ruolo degli sviluppatori, l'adozione rapida delle startup e le sfide di governance per le grandi imprese, posizionando la Polonia come leader nell'AI-augmented enterprise delivery.

2026-05-11 📰 Fonte
L'accelerazione dell'AI: strategie e hardware per i deployment on-premise
📁 Hardware AI generated ℹ️ Tom's Hardware

L'accelerazione dell'AI: strategie e hardware per i deployment on-premise

L'industria tecnicica, in particolare nel settore dell'intelligenza artificiale, evolve a ritmi senza precedenti. Per CTO e architetti infrastrutturali, mantenere il passo significa comprendere le implicazioni dei nuovi sviluppi hardware e delle strategie di deployment. Questo richiede un'analisi approfondita delle opzioni on-premise, dei costi e della sovranità dei dati, aspetti cruciali per decisioni informate.

2026-05-11 📰 Fonte
Cowboy Space punta ai data center in orbita: 275 milioni per i razzi di lancio
📁 Altro AI generated ✅ TechCrunch AI

Cowboy Space punta ai data center in orbita: 275 milioni per i razzi di lancio

Cowboy Space Corporation ha raccolto 275 milioni di dollari per realizzare la sua ambiziosa visione: posizionare data center nello spazio. L'azienda intende affrontare la carenza di capacità di lancio sviluppando i propri razzi, un passo fondamentale per abilitare un'infrastruttura computazionale orbitale e potenzialmente offrire nuove soluzioni per la sovranità dei dati e l'efficienza energetica.

2026-05-11 📰 Fonte
OpenAI lancia DeployCo: accelerare il deployment di LLM avanzati nelle aziende
📁 Market AI generated 🏆 OpenAI Blog

OpenAI lancia DeployCo: accelerare il deployment di LLM avanzati nelle aziende

OpenAI ha annunciato DeployCo, una nuova entità dedicata al deployment di soluzioni AI per le imprese. L'obiettivo è supportare le organizzazioni nell'integrare i Large Language Models più recenti nei loro flussi di lavoro, trasformando l'intelligenza artificiale in un valore aziendale tangibile. Questa iniziativa sottolinea la crescente domanda di strategie di implementazione robuste e scalabili per l'AI.

2026-05-11 📰 Fonte
Attenzione agli spazi extra nella configurazione JSON di llama-server con Qwen3.6
📁 Frameworks AI generated ℹ️ LocalLLaMA

Attenzione agli spazi extra nella configurazione JSON di llama-server con Qwen3.6

Un recente avviso evidenzia un'insidiosa problematica di parsing in `llama-server` che influisce sulla configurazione dei Large Language Models come Qwen3.6. Spazi extra nelle stringhe JSON per `chat-template-kwargs` nel file `models.ini` possono impedire il corretto funzionamento di parametri cruciali come `preserve_thinking`, con implicazioni dirette sulla coerenza del comportamento del modello in ambienti self-hosted.

2026-05-11 📰 Fonte
Scienziati somministrano psichedelici a pesci aggressivi: una svolta nella ricerca comportamentale
📁 LLM AI generated ✅ 404 Media

Scienziati somministrano psichedelici a pesci aggressivi: una svolta nella ricerca comportamentale

Una ricerca innovativa ha dimostrato che la psilocibina, il composto psicoattivo dei funghi allucinogeni, riduce l'aggressività in una specie di pesce, il rivulus di mangrovie. Pubblicato su *Frontiers in Behavioral Neuroscience*, lo studio è il primo a evidenziare tale effetto in un modello animale, aprendo nuove prospettive sulla comprensione dei meccanismi neurali alla base dei cambiamenti comportamentali. La specie scelta, nota per la sua aggressività e capacità di auto-fertilizzazione, ha permesso di isolare variabili genetiche.

2026-05-11 📰 Fonte
I modelli GGUF su Hugging Face raddoppiano: un segnale per l'on-premise
📁 Altro AI generated ℹ️ LocalLLaMA

I modelli GGUF su Hugging Face raddoppiano: un segnale per l'on-premise

I caricamenti di modelli LLM in formato GGUF su Hugging Face sono quasi raddoppiati in soli due mesi, come evidenziato da osservatori del settore. Questa crescita rapida sottolinea il crescente interesse e la fattibilità dell'esecuzione di Large Language Models in ambienti self-hosted, offrendo nuove opportunità per la sovranità dei dati e il controllo sui costi infrastrutturali.

2026-05-11 📰 Fonte
Intel e SK Hynix: accordo sul packaging per l'integrazione HBM
📁 Hardware AI generated ℹ️ Tom's Hardware

Intel e SK Hynix: accordo sul packaging per l'integrazione HBM

Le azioni di Intel e SK Hynix hanno registrato un'impennata a seguito delle indiscrezioni su una potenziale partnership strategica nel campo del packaging dei chip. La collaborazione vedrebbe SK Hynix testare la tecnicia 2.5D EMIB di Intel per l'integrazione di memorie HBM. Questa mossa sottolinea la crescente importanza delle tecnicie di packaging avanzato per le applicazioni AI e LLM, con implicazioni significative per le performance e l'efficienza nell'hardware di nuova generazione.

2026-05-11 📰 Fonte
Data center AI: la strategia delle aree rurali per aggirare vincoli e burocrazia
📁 Altro AI generated ℹ️ Tom's Hardware

Data center AI: la strategia delle aree rurali per aggirare vincoli e burocrazia

Lo sviluppo di data center per l'intelligenza artificiale si sta spostando verso le aree rurali. Questa scelta strategica permette alle aziende di eludere complessi iter burocratici urbani, come approvazioni comunali e revisioni sull'uso del suolo, riducendo al contempo il controllo pubblico. Un esempio significativo è il progetto di Meta in Louisiana, che evidenzia come la pianificazione della localizzazione sia cruciale per i deployment di infrastrutture AI.

2026-05-11 📰 Fonte
L'Europa supera i 200 miliardi di euro di investimenti cumulativi nei veicoli elettrici
📁 Market AI generated ℹ️ The Next Web

L'Europa supera i 200 miliardi di euro di investimenti cumulativi nei veicoli elettrici

L'Europa ha superato i 200 miliardi di euro di investimenti cumulativi nel settore dei veicoli elettrici, secondo i dati di New AutoMotive. Tuttavia, il report solleva interrogativi sulla politica industriale, evidenziando che circa 600 GWh di capacità produttiva di batterie annunciata è stata posticipata o cancellata, mettendo in discussione l'efficacia di tali investimenti nella produzione su larga scala.

2026-05-11 📰 Fonte
TextWeb: un renderer Markdown per LLM on-premise e agenti AI
📁 Frameworks AI generated ℹ️ LocalLLaMA

TextWeb: un renderer Markdown per LLM on-premise e agenti AI

Uno sviluppatore ha presentato TextWeb, un renderer web che converte le pagine in formato Markdown per l'elaborazione nativa da parte degli LLM. Questo approccio evita l'uso di costosi screenshot e modelli di visione, offrendo una soluzione più efficiente per gli agenti AI. TextWeb supporta l'esecuzione JavaScript completa e l'annotazione degli elementi interattivi, risultando compatibile con l'interfaccia web di llama.cpp, ideale per deployment on-premise.

2026-05-11 📰 Fonte
← Precedente Page 29 / 119 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge