AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

Il finanziamento tech europeo rallenta ad aprile: investitori più selettivi
📁 Market AI generated ℹ️ Tech.eu

Il finanziamento tech europeo rallenta ad aprile: investitori più selettivi

Ad aprile 2026, le startup europee hanno raccolto 5,1 miliardi di euro attraverso 290 accordi, segnando un rallentamento nei finanziamenti. Il settore cleantech ha guidato gli investimenti, mentre il Regno Unito è rimasto il principale beneficiario, nonostante una diminuzione complessiva del capitale. Gli investitori mostrano una crescente selettività.

2026-05-08 📰 Fonte
I giocattoli AI per bambini: tra innovazione, privacy e sfide normative
📁 Altro AI generated ✅ Wired AI

I giocattoli AI per bambini: tra innovazione, privacy e sfide normative

I nuovi giocattoli connessi basati sull'intelligenza artificiale stanno ridefinendo il gioco e le interazioni quotidiane dei bambini. Tuttavia, la loro capacità di elaborare e interagire con i dati solleva significative preoccupazioni in termini di privacy e sicurezza, spingendo alcuni legislatori a considerare misure restrittive. Questo scenario evidenzia la crescente necessità di bilanciare l'innovazione tecnicica con la protezione dei dati sensibili, specialmente in contesti vulnerabili.

2026-05-08 📰 Fonte
Nvidia e Corning: un'alleanza strategica per l'infrastruttura AI negli USA
📁 Altro AI generated ✅ DigiTimes

Nvidia e Corning: un'alleanza strategica per l'infrastruttura AI negli USA

Nvidia e Corning hanno siglato una partnership per potenziare l'infrastruttura e le catene di approvvigionamento dell'intelligenza artificiale negli Stati Uniti. L'iniziativa prevede l'espansione della produzione di fibra ottica, elemento cruciale per la connettività ad alta velocità richiesta dai carichi di lavoro AI. L'annuncio, fatto dal CEO di Nvidia Jensen Huang, sottolinea l'importanza di rafforzare le capacità tecniciche nazionali.

2026-05-08 📰 Fonte
TSMC e la filiera dei chip AI: l'influenza asiatica sui deployment on-premise
📁 Market AI generated ✅ DigiTimes

TSMC e la filiera dei chip AI: l'influenza asiatica sui deployment on-premise

L'aumento dei ricavi di TSMC sottolinea il ruolo cruciale dell'Asia nella fornitura di chip per l'intelligenza artificiale. Questo scenario ha implicazioni significative per le aziende che pianificano deployment di Large Language Models (LLM) on-premise, influenzando la disponibilità e i costi dell'hardware essenziale.

2026-05-08 📰 Fonte
Colloqui USA-Cina: Nvidia e i CEO tech al centro delle discussioni commerciali
📁 Market AI generated ✅ DigiTimes

Colloqui USA-Cina: Nvidia e i CEO tech al centro delle discussioni commerciali

Il presidente degli Stati Uniti sta valutando di invitare i vertici di aziende tecniciche chiave, inclusa Nvidia, a prossimi colloqui commerciali con la Cina. Questa mossa sottolinea la crescente importanza strategica del settore tecnicico, in particolare del silicio e delle GPU, nel contesto delle relazioni internazionali e delle catene di approvvigionamento globali, con potenziali ripercussioni significative per i deployment di Large Language Models.

2026-05-08 📰 Fonte
Contrabbando di chip Nvidia: OBON Corp. al centro di un'indagine USA
📁 Market AI generated ℹ️ The Next Web

Contrabbando di chip Nvidia: OBON Corp. al centro di un'indagine USA

I procuratori statunitensi stanno indagando su OBON Corp., un'azienda thailandese di infrastrutture AI, accusata di aver facilitato il contrabbando di server Supermicro equipaggiati con GPU Nvidia verso la Cina. La società, partner della strategia nazionale AI della Thailandia, avrebbe movimentato miliardi di dollari in hardware, con Alibaba tra i destinatari finali. La vicenda solleva interrogativi sulla catena di approvvigionamento globale per l'AI e la sovranità dei dati.

2026-05-08 📰 Fonte
La scommessa di Nvidia sul raffreddamento di nuova generazione per l'AI
📁 Hardware AI generated ✅ DigiTimes

La scommessa di Nvidia sul raffreddamento di nuova generazione per l'AI

Nvidia sta investendo in soluzioni di raffreddamento avanzate per l'intelligenza artificiale, un passo cruciale per gestire il calore generato dai potenti acceleratori GPU. Questa strategia è fondamentale per sostenere le crescenti esigenze di calcolo degli LLM e dei carichi di lavoro AI, influenzando direttamente la progettazione dei data center e il TCO per i deployment on-premise.

2026-05-08 📰 Fonte
Novatek: prospettive di margine in crescita per mix prodotti e consegne accelerate
📁 Market AI generated ✅ DigiTimes

Novatek: prospettive di margine in crescita per mix prodotti e consegne accelerate

Novatek ha annunciato un miglioramento delle proprie prospettive di margine, attribuendolo a un mix di prodotti più solido e a consegne anticipate. Questa notizia, sebbene focalizzata su un singolo fornitore di semiconduttori, evidenzia l'importanza della stabilità della supply chain per le aziende che pianificano deployment di Large Language Models (LLM) on-premise. La disponibilità e i tempi di consegna dell'hardware sono fattori critici per il TCO e la fattibilità dei progetti AI self-hosted.

2026-05-08 📰 Fonte
Ottimizzazione e costi: la sfida dell'addestramento per LLM di piccole dimensioni
📁 LLM AI generated ℹ️ LocalLLaMA

Ottimizzazione e costi: la sfida dell'addestramento per LLM di piccole dimensioni

Un'iniziativa accademica evidenzia le sfide e i costi associati all'addestramento di Large Language Models (LLM) di dimensioni contenute, con l'obiettivo di migliorarne la coerenza e ridurre le allucinazioni. L'impegno, finanziato da una docente universitaria, sottolinea l'importanza di investire in cicli di training mirati per modelli che vanno da 1.5 a 35 miliardi di parametri, anche con tecniche di Quantization come Q8_0, per renderli più affidabili in contesti applicativi critici.

2026-05-08 📰 Fonte
La domanda di AI mette sotto pressione la catena di fornitura dei materiali PCB
📁 Market AI generated ✅ DigiTimes

La domanda di AI mette sotto pressione la catena di fornitura dei materiali PCB

L'esplosione della domanda di intelligenza artificiale sta generando una crescente tensione nella catena di fornitura di materiali chiave per i circuiti stampati (PCB). Questo fenomeno, alimentato dalla necessità di hardware sempre più potente per l'Inference e il training di LLM, ha implicazioni dirette sui costi e i tempi di consegna per le aziende che pianificano deployment AI, in particolare in ambienti self-hosted.

2026-05-08 📰 Fonte
Coherent: ordini per ottiche 1.6T e semiconduttori fino al 2030
📁 Hardware AI generated ✅ DigiTimes

Coherent: ordini per ottiche 1.6T e semiconduttori fino al 2030

Coherent Corp. ha annunciato che il suo portafoglio ordini si estende fino al 2030, con una forte domanda per ottiche 1.6T e capacità produttiva di semiconduttori InP da 6 pollici. Questo indica una crescita sostenuta nelle infrastrutture di rete e di calcolo, cruciali per i carichi di lavoro AI e LLM, e suggerisce tempi di consegna prolungati per componenti chiave.

2026-05-08 📰 Fonte
Big Tech finanzia SK Hynix: la corsa alla memoria AI si intensifica
📁 Market AI generated ✅ DigiTimes

Big Tech finanzia SK Hynix: la corsa alla memoria AI si intensifica

Le maggiori aziende tecniciche starebbero offrendo finanziamenti a SK Hynix per la costruzione di nuove fabbriche e l'acquisto di strumenti EUV. Questa mossa evidenzia l'intensificarsi della competizione nel settore delle memorie dedicate all'intelligenza artificiale, cruciali per lo sviluppo e il deployment di Large Language Models e altre applicazioni AI. L'investimento mira a garantire la fornitura di componenti essenziali in un mercato in rapida crescita.

2026-05-08 📰 Fonte
TSMC: ricavi in crescita del 30% nei primi quattro mesi del 2026 grazie al boom dell'AI
📁 Market AI generated ✅ DigiTimes

TSMC: ricavi in crescita del 30% nei primi quattro mesi del 2026 grazie al boom dell'AI

TSMC, leader nella produzione di semiconduttori, ha registrato un aumento del 30% nei ricavi nei primi quattro mesi del 2026. Questo incremento è attribuito al crescente "boom dell'AI", che sta alimentando una domanda senza precedenti di silicio avanzato. L'andamento evidenzia la centralità dei produttori di chip nell'ecosistema dell'intelligenza artificiale e le implicazioni per le strategie di deployment on-premise.

2026-05-08 📰 Fonte
Investimenti taiwanesi negli USA: 50 miliardi per l'ecosistema tech
📁 Market AI generated ✅ DigiTimes

Investimenti taiwanesi negli USA: 50 miliardi per l'ecosistema tech

Gli investimenti delle aziende taiwanesi negli Stati Uniti hanno superato le previsioni, con il governo di Taipei che ha stanziato un finanziamento di 50 miliardi di dollari. Questa mossa strategica rafforza l'interdipendenza tecnicica tra le due nazioni, con implicazioni significative per settori chiave come i semiconduttori e l'intelligenza artificiale, influenzando la disponibilità e il costo dell'hardware essenziale per i deployment di LLM.

2026-05-08 📰 Fonte
Compal e Verda: server GPU a liquido per la sovranità dei dati nell'AI
📁 Altro AI generated ✅ DigiTimes

Compal e Verda: server GPU a liquido per la sovranità dei dati nell'AI

Compal e Verda hanno stretto una partnership strategica per fornire server GPU con raffreddamento a liquido. Questa collaborazione mira a supportare i deployment di intelligenza artificiale che richiedono sovranità dei dati e controllo infrastrutturale. L'adozione di soluzioni a liquido per i server GPU è cruciale per gestire l'elevato calore generato dai carichi di lavoro AI più intensivi, garantendo efficienza e prestazioni ottimali in ambienti on-premise.

2026-05-08 📰 Fonte
Automazione AI nel back office: tra aumento di produttività e sovraccarico
📁 Altro AI generated ✅ TechCrunch AI

Automazione AI nel back office: tra aumento di produttività e sovraccarico

Basata, un'azienda di intelligenza artificiale, si confronta con il dilemma dell'automazione nel back office. Mentre il settore discute l'impatto degli LLM sulla forza lavoro, il personale amministrativo di Basata è più preoccupato dal sovraccarico di lavoro che dalla sostituzione, evidenziando le sfide operative immediate dell'integrazione AI.

2026-05-08 📰 Fonte
L'IA Generativa Valuta il Pensiero Critico: Uno Studio sui Contro-Argomenti
📁 LLM AI generated 🏆 ArXiv cs.CL

L'IA Generativa Valuta il Pensiero Critico: Uno Studio sui Contro-Argomenti

Uno studio esplora l'uso di LLM per valutare il pensiero critico negli studenti, in particolare la capacità di formulare contro-argomenti. La ricerca ha coinvolto 36 studenti e ha confrontato le valutazioni umane con quelle di sei LLM di frontiera, usando rubriche standardizzate. I risultati indicano che gli studenti mantengono capacità logiche anche con l'IA generativa, e che gli LLM possono valutare efficacemente i lavori scritti su larga scala, con un allineamento generale alle valutazioni umane. Questo apre a nuove prospettive per l'adozione dell'IA nell'istruzione, pur riconoscendo i rischi di abuso.

2026-05-08 📰 Fonte
AdaGATE: RAG multi-hop più robusta con selezione di evidenze token-efficiente
📁 LLM AI generated 🏆 ArXiv cs.CL

AdaGATE: RAG multi-hop più robusta con selezione di evidenze token-efficiente

AdaGATE è un nuovo controller per la Retrieval-Augmented Generation (RAG) multi-hop, progettato per affrontare la fragilità dei sistemi attuali con evidenze rumorose o ridondanti e contesti limitati. Senza richiedere training, AdaGATE ottimizza la selezione delle evidenze risolvendo un problema di "riparazione" vincolato dai token. Il sistema bilancia copertura delle lacune, corroborazione, novità e rilevanza. I test su HotpotQA mostrano un miglioramento dell'F1 e un'efficienza 2.6 volte superiore nell'uso dei token rispetto ad approcci esistenti, rendendo la RAG più robusta.

2026-05-08 📰 Fonte
Previsione della rinosinusite cronica con dati EHR nazionali e modelli stratificati
📁 Frameworks AI generated 🏆 ArXiv cs.LG

Previsione della rinosinusite cronica con dati EHR nazionali e modelli stratificati

Un nuovo studio sfrutta i dati longitudinali delle cartelle cliniche elettroniche (EHR) del programma *All of Us* per prevedere la rinosinusite cronica (CRS). Il team ha sviluppato una pipeline ibrida per selezionare 100 caratteristiche da oltre 110.000 codici e ha addestrato modelli stratificati per sesso ed età. Il framework ha raggiunto un'AUC di 0.8461, migliorando la discriminazione e supportando una stratificazione del rischio più efficace nella cura primaria.

2026-05-08 📰 Fonte
Minimi piatti: un'illusione nella generalizzazione dei modelli AI?
📁 LLM AI generated 🏆 ArXiv cs.LG

Minimi piatti: un'illusione nella generalizzazione dei modelli AI?

Una nuova ricerca mette in discussione il ruolo dei "minimi piatti" nella generalizzazione delle reti neurali. Lo studio suggerisce che la "debolezza" (weakness), definita dal comportamento del modello, sia un predittore più robusto e invariante rispetto alla riparametrizzazione. Le implicazioni sono significative per la comprensione e l'ottimizzazione dell'addestramento dei Large Language Models, spostando il focus dalla geometria dello spazio dei pesi alle capacità funzionali del modello, con potenziali benefici per il TCO e l'affidabilità nei deployment on-premise.

2026-05-08 📰 Fonte
ZAYA1-8B: L'LLM MoE di Zyphra Affina il Ragionamento su Piattaforma AMD
📁 LLM AI generated 🏆 ArXiv cs.AI

ZAYA1-8B: L'LLM MoE di Zyphra Affina il Ragionamento su Piattaforma AMD

Zyphra ha presentato ZAYA1-8B, un Large Language Model (LLM) Mixture-of-Experts (MoE) focalizzato sul ragionamento, con 700 milioni di parametri attivi e 8 miliardi totali. Addestrato su una piattaforma AMD completa, il modello dimostra performance competitive in matematica e coding, eguagliando o superando modelli più grandi. L'introduzione di Markovian RSA, un metodo di calcolo innovativo per l'inference, ne potenzia ulteriormente le capacità, riducendo il divario con LLM di dimensioni superiori e offrendo nuove prospettive per i deployment on-premise.

2026-05-08 📰 Fonte
APM: Decifrare le Politiche di Sicurezza degli LLM per Deployment Più Trasparenti
📁 LLM AI generated 🏆 ArXiv cs.AI

APM: Decifrare le Politiche di Sicurezza degli LLM per Deployment Più Trasparenti

Un nuovo approccio, gli Annotator Policy Models (APM), promette di migliorare la comprensione delle politiche di sicurezza degli LLM. Analizzando il comportamento degli annotatori, sia umani che basati su LLM, gli APM identificano ambiguità e differenze di prospettiva, senza richiedere sforzi aggiuntivi. Questo supporta la creazione di sistemi AI più robusti e allineati con le aspettative di sicurezza, cruciale per le aziende che implementano soluzioni AI.

2026-05-08 📰 Fonte
Shenmao e il boom dell'infrastruttura AI: crescita record dei ricavi
📁 Market AI generated ✅ DigiTimes

Shenmao e il boom dell'infrastruttura AI: crescita record dei ricavi

Shenmao registra una crescita record dei ricavi, spinta dalla crescente domanda di infrastrutture per l'intelligenza artificiale. Questo trend riflette l'espansione del mercato, dove le aziende cercano soluzioni robuste per il deployment di LLM, bilanciando controllo, sovranità dei dati e TCO, in particolare per carichi di lavoro on-premise e ibridi.

2026-05-08 📰 Fonte
Accton e gli investimenti AI: il segnale degli hyperscaler sull'infrastruttura
📁 Altro AI generated ✅ DigiTimes

Accton e gli investimenti AI: il segnale degli hyperscaler sull'infrastruttura

Il recente trimestre record di Accton indica che i grandi fornitori di servizi cloud, gli hyperscaler, stanno mantenendo un elevato livello di investimenti nelle infrastrutture dedicate all'intelligenza artificiale. Questo trend sottolinea la crescente domanda di capacità di calcolo e storage per i carichi di lavoro AI, influenzando le strategie di deployment sia cloud che on-premise e la valutazione del TCO per le aziende.

2026-05-08 📰 Fonte
La geopolitica dei chip: Taiwan al centro delle strategie AI on-premise
📁 Market AI generated ✅ DigiTimes

La geopolitica dei chip: Taiwan al centro delle strategie AI on-premise

Il ruolo cruciale dell'industria taiwanese dei semiconduttori emerge come fattore chiave nelle dinamiche geopolitiche globali, con implicazioni dirette per le strategie di deployment di Large Language Models (LLM). Le tensioni internazionali evidenziano i rischi della catena di approvvigionamento, influenzando la disponibilità di hardware essenziale per infrastrutture AI self-hosted e la sovranità dei dati.

2026-05-08 📰 Fonte
Profitti AI: i lavoratori Samsung chiedono una quota maggiore, sciopero in vista
📁 Market AI generated ✅ DigiTimes

Profitti AI: i lavoratori Samsung chiedono una quota maggiore, sciopero in vista

I dipendenti di Samsung Electronics stanno chiedendo una maggiore partecipazione ai profitti generati dall'intelligenza artificiale, con la minaccia di uno sciopero che si profila all'orizzonte. Questa situazione evidenzia le crescenti tensioni sulla distribuzione del valore nell'era dell'AI, con potenziali ripercussioni sull'intera filiera tecnicica, inclusa la fornitura di componenti cruciali per i deployment on-premise.

2026-05-08 📰 Fonte
L'infrastruttura AI spinge i ricavi dei distributori di componenti: un anno di crescita record
📁 Market AI generated ✅ DigiTimes

L'infrastruttura AI spinge i ricavi dei distributori di componenti: un anno di crescita record

Un recente report evidenzia come la spesa per l'infrastruttura dedicata all'intelligenza artificiale abbia raddoppiato i ricavi di un distributore di circuiti integrati in un solo anno. Questo dato sottolinea la crescente domanda di hardware specializzato per supportare carichi di lavoro AI, in particolare per i Large Language Models (LLM). La tendenza riflette l'accelerazione degli investimenti in soluzioni on-premise e ibride, dove il controllo sui dati e l'ottimizzazione del TCO diventano prioritari per le aziende.

2026-05-08 📰 Fonte
Decifrare il Pensiero degli LLM: Anthropic Rilascia i Pesi NLA per Gemma 3
📁 LLM AI generated ℹ️ LocalLLaMA

Decifrare il Pensiero degli LLM: Anthropic Rilascia i Pesi NLA per Gemma 3

Anthropic ha svelato una nuova ricerca che permette di comprendere i processi interni degli LLM durante la generazione di testo. Utilizzando i Natural Language Autoencoders (NLA), è ora possibile visualizzare i "pensieri" di un modello come Gemma 3 27b instruct. Questa innovazione, con i pesi NLA resi pubblici, offre strumenti preziosi per la trasparenza, il debugging e il controllo dei modelli, aspetti cruciali per i deployment on-premise.

2026-05-08 📰 Fonte
Skymizer lancia la HTX301: una scheda PCIe da 384GB per l'inference AI on-prem
📁 Hardware AI generated ℹ️ LocalLLaMA

Skymizer lancia la HTX301: una scheda PCIe da 384GB per l'inference AI on-prem

La taiwanese Skymizer ha annunciato la HTX301, una scheda PCIe progettata per l'inference AI on-premise. Il dispositivo si distingue per i suoi 384GB di memoria e un consumo energetico di circa 240 Watt, posizionandosi come una soluzione mirata a soddisfare le esigenze di sovranità dei dati e controllo infrastrutturale per i carichi di lavoro LLM.

2026-05-08 📰 Fonte
LLMSearchIndex: Ricerca Web Locale Open Source con oltre 200 milioni di pagine per RAG
📁 Altro AI generated ℹ️ LocalLLaMA

LLMSearchIndex: Ricerca Web Locale Open Source con oltre 200 milioni di pagine per RAG

LLMSearchIndex è una nuova libreria Python open source che offre una soluzione di ricerca web completamente locale, progettata per i sistemi RAG basati su LLM. Con un indice altamente compresso di circa 2 GB, che include oltre 200 milioni di pagine web da FineWeb e Wikipedia, il progetto mira a superare la dipendenza da API a pagamento o scraper, consentendo retrieval rapidi su hardware comune e rafforzando la sovranità dei dati nei deployment on-premise.

2026-05-08 📰 Fonte
Horus: L'LLM Open Source Egiziano che Punta a Ridefinire il Panorama AI Regionale
📁 LLM AI generated ℹ️ LocalLLaMA

Horus: L'LLM Open Source Egiziano che Punta a Ridefinire il Panorama AI Regionale

Il progetto Horus, sviluppato da Assem Sabry e TokenAI, segna un traguardo significativo come il primo Large Language Model (LLM) interamente creato da zero in Egitto. Open source e disponibile su piattaforme come Hugging Face e GitHub, Horus si prepara al rilascio della versione 1.5 Instruct, che promette un aumento di 5 volte nelle prestazioni e una lunghezza del contesto di 64K token. L'iniziativa sottolinea l'emergere di capacità AI locali e la spinta verso la sovranità dei dati nella regione.

2026-05-08 📰 Fonte
Retroscena Microsoft-OpenAI: I dubbi del 2018 e la strategia anti-Amazon
📁 Market AI generated ✅ Wired AI

Retroscena Microsoft-OpenAI: I dubbi del 2018 e la strategia anti-Amazon

Documenti interni di Microsoft risalenti al 2018 rivelano lo scetticismo dei dirigenti verso OpenAI. Allo stesso tempo, emerge una chiara preoccupazione strategica: evitare che la nascente entità finisse per allearsi con Amazon, un rivale chiave nel settore cloud e AI. Queste rivelazioni offrono uno sguardo sulle dinamiche competitive che hanno plasmato il panorama dell'intelligenza artificiale.

2026-05-08 📰 Fonte
Ottimizzazione LLaMA.cpp: Multi-Token Prediction accelera Gemma 4 su hardware locale
📁 Frameworks AI generated ℹ️ LocalLLaMA

Ottimizzazione LLaMA.cpp: Multi-Token Prediction accelera Gemma 4 su hardware locale

Un'implementazione di Multi-Token Prediction (MTP) per LLaMA.cpp ha dimostrato un aumento del 40% nella velocità di generazione di token per il modello Gemma 26B, quantizzato in formato GGUF. I test, condotti su un MacBook Pro M5Max, evidenziano il potenziale per migliorare l'efficienza dell'inference LLM su hardware self-hosted, un aspetto cruciale per i deployment on-premise.

2026-05-08 📰 Fonte
M3 da 512GB introvabile: sfide per gli LLM on-premise e l'inference locale
📁 Hardware AI generated ℹ️ LocalLLaMA

M3 da 512GB introvabile: sfide per gli LLM on-premise e l'inference locale

La scarsità di hardware con elevata memoria unificata, come i chip M3 di Apple da 512GB o 256GB, sta creando difficoltà per chi intende eseguire Large Language Models (LLM) in locale. Questa situazione spinge sviluppatori e aziende a riconsiderare le strategie di deployment on-premise, valutando alternative come l'inference su CPU e i relativi compromessi in termini di performance e latenza. La dipendenza da specifici componenti hardware evidenzia l'importanza di una pianificazione resiliente per la sovranità dei dati e il TCO.

2026-05-08 📰 Fonte
Qwen 3.6 27B su iGPU AMD: un test di Inference locale con LLAMA CPP
📁 Altro AI generated ℹ️ LocalLLaMA

Qwen 3.6 27B su iGPU AMD: un test di Inference locale con LLAMA CPP

Un utente ha testato il modello Qwen 3.6 27B, in formato GGUF e con Quantization Q4.0, su una iGPU AMD dotata di 64GB di memoria unificata, utilizzando il Framework LLAMA CPP. I risultati indicano una performance sorprendente, paragonabile a quella di modelli più piccoli come Qwen 3.5 9B. Questo esperimento sottolinea il potenziale delle soluzioni on-premise per l'Inference di Large Language Models, anche su hardware non specialistico, promuovendo sovranità dei dati e controllo.

2026-05-08 📰 Fonte
K2.6 eccelle in un benchmark di coding indipendente, superando modelli noti
📁 LLM AI generated ℹ️ LocalLLaMA

K2.6 eccelle in un benchmark di coding indipendente, superando modelli noti

Un benchmark di coding indipendente, akitaonrails, ha posizionato il modello K2.6 nella fascia A con un punteggio di 87, superando concorrenti come Qwen 3.6 plus e Deepseek v4 flash. Questo risultato, basato su una metodologia fissa, evidenzia le capacità di K2.6 e sottolinea le sfide legate alla catena di strumenti per i deployment on-premise di LLM open source.

2026-05-08 📰 Fonte
LLM on-premise: Qwen 27B vs 35B MoE su RTX 5080 con 16GB VRAM
📁 Hardware AI generated ℹ️ LocalLLaMA

LLM on-premise: Qwen 27B vs 35B MoE su RTX 5080 con 16GB VRAM

Un professionista sta valutando due versioni del modello Qwen3.6, una dense da 27 miliardi di parametri e una MoE da 35 miliardi, per carichi di lavoro di coding e agenti su una GPU RTX 5080 con 16GB di VRAM. La sfida è ottimizzare le performance, la gestione del contesto esteso e la qualità dell'output in un ambiente self-hosted, considerando i trade-off tra efficienza dei parametri attivi e consistenza dei modelli dense, il tutto con vincoli di spazio su disco.

2026-05-08 📰 Fonte
Google lancia Fitbit Air: un tracker senza schermo per il mercato di massa
📁 Altro AI generated ✅ DigiTimes

Google lancia Fitbit Air: un tracker senza schermo per il mercato di massa

Google, parte di Alphabet, ha introdotto Fitbit Air, un nuovo tracker di attività senza schermo progettato per il mercato di massa. Con un prezzo di 99 dollari, il dispositivo mira a rendere il monitoraggio della salute più accessibile, sollevando discussioni sulle implicazioni per la gestione dei dati e le infrastrutture di elaborazione, temi centrali per le decisioni di deployment on-premise.

2026-05-08 📰 Fonte
Zhen Ding Tech: vendite record per server e substrati IC spinti dalla domanda AI
📁 Market AI generated ✅ DigiTimes

Zhen Ding Tech: vendite record per server e substrati IC spinti dalla domanda AI

Zhen Ding Tech ha registrato un'impennata nelle vendite di server e substrati per circuiti integrati (IC), raggiungendo cifre record grazie alla crescente domanda di infrastrutture per l'intelligenza artificiale. Questo trend evidenzia la corsa globale alla costruzione di capacità computazionali dedicate agli LLM e ad altre applicazioni di AI, con implicazioni significative per i deployment on-premise e la catena di approvvigionamento hardware.

2026-05-08 📰 Fonte
L'energia per l'AI on-premise: la prospettiva di Pegatron sull'approvvigionamento
📁 Altro AI generated ✅ DigiTimes

L'energia per l'AI on-premise: la prospettiva di Pegatron sull'approvvigionamento

La richiesta del presidente di Pegatron di preordinare combustibile nucleare evidenzia le crescenti preoccupazioni per la stabilità energetica a Taiwan. Questo scenario ha implicazioni dirette per l'industria tecnicica globale e, in particolare, per le aziende che valutano il deployment di infrastrutture AI on-premise, dove il fabbisogno energetico è un fattore critico per il TCO e la sovranità operativa.

2026-05-08 📰 Fonte
Chenbro Micom: forte domanda di server AI prevista per il 2026
📁 Market AI generated ✅ DigiTimes

Chenbro Micom: forte domanda di server AI prevista per il 2026

Chenbro Micom, un attore chiave nel settore server, anticipa un'impennata nella domanda di server nella seconda metà del 2026. Questa previsione è legata alla continua espansione delle infrastrutture AI, suggerendo un trend di crescita sostenuta per i deployment di Large Language Models e altri carichi di lavoro intensivi. Le aziende si preparano a investire in soluzioni hardware robuste, con un focus crescente sulle opzioni self-hosted.

2026-05-08 📰 Fonte
Gli investimenti AI degli hyperscaler ridefiniscono il mercato e le strategie di supply chain
📁 Market AI generated ✅ DigiTimes

Gli investimenti AI degli hyperscaler ridefiniscono il mercato e le strategie di supply chain

I massicci investimenti in intelligenza artificiale da parte dei principali hyperscaler stanno profondamente alterando il panorama competitivo dei servizi di produzione elettronica (EMS) e le strategie globali di supply chain. Questa dinamica crea nuove sfide e opportunità, influenzando la disponibilità e i costi dell'hardware, con ripercussioni significative anche per le aziende che valutano deployment di LLM on-premise, dove la pianificazione del TCO e la sovranità dei dati sono prioritarie.

2026-05-08 📰 Fonte
Syncmold punta sull'internet satellitare per la prossima fase di crescita
📁 Altro AI generated ✅ DigiTimes

Syncmold punta sull'internet satellitare per la prossima fase di crescita

L'azienda taiwanese Syncmold sta orientando la propria strategia verso il crescente mercato dell'internet satellitare. Questa mossa riflette un'attenzione alle nuove infrastrutture di connettività, cruciali per l'elaborazione dati distribuita e le applicazioni di intelligenza artificiale all'edge, con implicazioni significative per le decisioni di deployment on-premise e la sovranità dei dati in ambienti remoti.

2026-05-08 📰 Fonte
Dirty Frag: exploit Linux dal 2017 offre accesso root immediato, nessuna patch
📁 Altro AI generated ℹ️ Tom's Hardware

Dirty Frag: exploit Linux dal 2017 offre accesso root immediato, nessuna patch

Un nuovo exploit critico, denominato "Dirty Frag", è emerso, garantendo accesso root immediato sulla maggior parte delle macchine Linux sin dal 2017. La vulnerabilità, descritta come simile a "Copy Fail", non dispone ancora di patch e la sua divulgazione è avvenuta nonostante un embargo. Questo solleva serie preoccupazioni per la sicurezza dei deployment on-premise e la sovranità dei dati, evidenziando le sfide nella gestione delle infrastrutture self-hosted.

2026-05-08 📰 Fonte
Dirty Frag: Nuova vulnerabilità Linux concede privilegi di root, senza patch
📁 Altro AI generated ✅ Phoronix

Dirty Frag: Nuova vulnerabilità Linux concede privilegi di root, senza patch

Una nuova vulnerabilità di escalation dei privilegi locali, denominata "Dirty Frag", è stata resa pubblica per i sistemi Linux. La falla consente di ottenere privilegi di root su tutte le distribuzioni, ma al momento non sono disponibili patch o identificativi CVE. La divulgazione anticipata da parte del ricercatore di sicurezza ha preceduto il rilascio delle correzioni, lasciando gli amministratori di sistema in una situazione critica.

2026-05-08 📰 Fonte
Il 'sim-to-real problem': perché i modelli AI faticano a passare dalla simulazione alla realtà
📁 Altro AI generated ✅ DigiTimes

Il 'sim-to-real problem': perché i modelli AI faticano a passare dalla simulazione alla realtà

Il 'sim-to-real problem' evidenzia una delle sfide più complesse nello sviluppo dell'intelligenza artificiale: la difficoltà per i sistemi addestrati in ambienti simulati di replicare le prestazioni nel mondo reale. Questo divario è cruciale per il deployment di Large Language Models (LLM) e altri modelli AI in contesti operativi, specialmente in scenari on-premise o edge, dove la fedeltà all'ambiente fisico è determinante per il successo e la sicurezza.

2026-05-08 📰 Fonte
Taiwan rafforza i parchi scientifici: impatto sulla supply chain AI e i deployment on-premise
📁 Market AI generated ✅ DigiTimes

Taiwan rafforza i parchi scientifici: impatto sulla supply chain AI e i deployment on-premise

Il governo di Taiwan espande i propri parchi scientifici in risposta alle tensioni tecniciche tra Stati Uniti e Cina. Questa mossa strategica sottolinea l'importanza cruciale dell'isola nella produzione di semiconduttori avanzati, fondamentali per l'infrastruttura AI. Per le aziende che considerano deployment on-premise di Large Language Models, la stabilità della supply chain del silicio diventa un fattore determinante per il TCO e la sovranità dei dati.

2026-05-08 📰 Fonte
Il boom dell'AI ridefinisce la supply chain EMS: Taiwan consolida la leadership
📁 Market AI generated ✅ DigiTimes

Il boom dell'AI ridefinisce la supply chain EMS: Taiwan consolida la leadership

L'esplosione dell'intelligenza artificiale sta profondamente trasformando la catena di fornitura globale dei servizi di produzione elettronica (EMS). Le aziende taiwanesi stanno estendendo la loro posizione dominante, un fenomeno che riflette le crescenti e specifiche esigenze hardware dettate dai Large Language Models (LLM) e da altre applicazioni AI. Questa dinamica ha implicazioni significative per le strategie di deployment on-premise e la disponibilità di infrastrutture critiche.

2026-05-08 📰 Fonte
Chrome scarica un LLM da 4GB in locale: un caso di controllo e privacy
📁 Altro AI generated ℹ️ LocalLLaMA

Chrome scarica un LLM da 4GB in locale: un caso di controllo e privacy

Google Chrome ha iniziato a scaricare silenziosamente un modello Large Language Model (LLM) da 4GB sui PC degli utenti, senza alcun consenso esplicito. Questa pratica solleva interrogativi significativi sulla privacy dei dati, il controllo delle risorse locali e la trasparenza delle operazioni software. L'episodio evidenzia le sfide emergenti nel deployment di intelligenza artificiale direttamente sui dispositivi degli utenti e le implicazioni per chi gestisce infrastrutture on-premise.

2026-05-07 📰 Fonte
LLM locali: la soglia di 'sufficienza' si alza, cambiano le architetture AI
📁 Altro AI generated ℹ️ LocalLLaMA

LLM locali: la soglia di 'sufficienza' si alza, cambiano le architetture AI

Una tendenza emergente mostra che i Large Language Models (LLM) locali stanno diventando sufficientemente performanti per molti carichi di lavoro quotidiani, riducendo la dipendenza dai modelli cloud di punta. Questo sposta il focus verso architetture ibride e 'workload-aware', ottimizzate per latenza e costo, piuttosto che per i soli benchmark. Le implicazioni per i deployment on-premise sono significative, offrendo maggiore controllo e sovranità dei dati.

2026-05-07 📰 Fonte
OpenAI introduce nuove funzionalità vocali nella sua API
📁 LLM AI generated ✅ TechCrunch AI

OpenAI introduce nuove funzionalità vocali nella sua API

OpenAI ha rilasciato nuove funzionalità di intelligenza vocale accessibili tramite la sua API. Queste innovazioni mirano a migliorare i sistemi di assistenza clienti e trovano applicazione in settori diversi come l'istruzione e le piattaforme per creatori di contenuti. L'integrazione di tali capacità solleva considerazioni tecniche per i deployment on-premise, specialmente in termini di latenza e sovranità dei dati.

2026-05-07 📰 Fonte
Regolamentazione AI: L'Amministrazione Trump Valuta un Ordine Esecutivo
📁 Altro AI generated ✅ Wired AI

Regolamentazione AI: L'Amministrazione Trump Valuta un Ordine Esecutivo

Recenti report indicano che l'amministrazione Trump sta considerando un ordine esecutivo per stabilire una supervisione federale sui nuovi modelli di intelligenza artificiale. Questa mossa potrebbe avere implicazioni significative per le aziende che sviluppano e implementano LLM, in particolare per quelle che privilegiano deployment on-premise per ragioni di sovranità dei dati e compliance.

2026-05-07 📰 Fonte
ARC-AGI-2: Un Modello Ricorsivo Sfida i Giganti con una Sola RTX 4090
📁 Altro AI generated ℹ️ LocalLLaMA

ARC-AGI-2: Un Modello Ricorsivo Sfida i Giganti con una Sola RTX 4090

Un team ha sviluppato TOPAS, un modello ricorsivo da 100 milioni di parametri, dimostrando che l'innovazione architetturale può superare la pura potenza di calcolo. Valutato localmente al 36% e sulla leaderboard pubblica al 11.67% a causa di vincoli di tempo, il progetto mira a ridefinire le capacità dell'AI su hardware consumer, offrendo spunti cruciali per i deployment on-premise.

2026-05-07 📰 Fonte
OpenAI potenzia la cybersecurity con GPT-5.5 e accesso controllato
📁 Altro AI generated 🏆 OpenAI Blog

OpenAI potenzia la cybersecurity con GPT-5.5 e accesso controllato

OpenAI sta ampliando il suo programma "Trusted Access for Cyber" con i nuovi modelli GPT-5.5 e GPT-5.5-Cyber. L'iniziativa mira a supportare i difensori verificati nell'accelerare la ricerca di vulnerabilità e nella protezione delle infrastrutture critiche. Questo solleva questioni cruciali sulla sovranità dei dati e sul deployment on-premise per settori sensibili, evidenziando il bilanciamento tra accessibilità e controllo.

2026-05-07 📰 Fonte
Slate Auto: la rappresentante di Bezos lascia il board, nessun camion prodotto
📁 Market AI generated ℹ️ The Next Web

Slate Auto: la rappresentante di Bezos lascia il board, nessun camion prodotto

Melinda Lewison, che gestisce l'ufficio di famiglia di Jeff Bezos, ha lasciato il consiglio di amministrazione di Slate Auto, una startup di veicoli elettrici che ha raccolto 1,4 miliardi di dollari. La sua partenza avviene mesi prima del previsto rilascio del primo camion, sollevando interrogativi sulla governance e sulla capacità dell'azienda di trasformare i cospicui investimenti in prodotti tangibili. La vicenda evidenzia le sfide nel portare innovazioni complesse sul mercato.

2026-05-07 📰 Fonte
Pit, la nuova startup AI dai fondatori di Voi, raccoglie 16 milioni di dollari
📁 Market AI generated ✅ TechCrunch AI

Pit, la nuova startup AI dai fondatori di Voi, raccoglie 16 milioni di dollari

Pit, una nuova startup nel settore dell'intelligenza artificiale, ha annunciato un round di finanziamento seed da 16 milioni di dollari. L'iniziativa, guidata dai cofondatori del gigante europeo degli scooter Voi, ha visto la partecipazione di a16z come investitore principale. Con sede a Stoccolma, Pit si posiziona come un nuovo attore nel panorama AI, attirando l'attenzione per il suo team di fondatori esperti e il significativo supporto finanziario.

2026-05-07 📰 Fonte
OpenAI rafforza la sicurezza di ChatGPT con la funzione 'Contatto Fidato'
📁 Altro AI generated ✅ TechCrunch AI

OpenAI rafforza la sicurezza di ChatGPT con la funzione 'Contatto Fidato'

OpenAI ha introdotto una nuova funzionalità, denominata 'Contatto Fidato', per migliorare la protezione degli utenti di ChatGPT. L'iniziativa mira a gestire situazioni delicate in cui le conversazioni potrebbero indicare un rischio di autolesionismo, ampliando gli sforzi dell'azienda per garantire un ambiente digitale più sicuro e responsabile.

2026-05-07 📰 Fonte
Perplexity porta gli agenti AI su Mac: implicazioni per il deployment locale
📁 Altro AI generated ✅ TechCrunch AI

Perplexity porta gli agenti AI su Mac: implicazioni per il deployment locale

Perplexity ha reso disponibile a tutti la sua soluzione "Personal Computer" per Mac, introducendo agenti AI direttamente sui dispositivi degli utenti. Questa mossa evidenzia una crescente tendenza verso l'esecuzione locale di carichi di lavoro AI, sollevando considerazioni cruciali per le aziende riguardo sovranità dei dati, controllo e TCO rispetto alle architetture cloud.

2026-05-07 📰 Fonte
Mozilla e Mythos: 271 vulnerabilità Firefox con "quasi zero falsi positivi"
📁 LLM AI generated ✅ Ars Technica AI

Mozilla e Mythos: 271 vulnerabilità Firefox con "quasi zero falsi positivi"

Mozilla ha rivelato dettagli sull'uso di Anthropic Mythos, un modello AI per la rilevazione di vulnerabilità. In due mesi, sono state identificate 271 falle di sicurezza in Firefox, con un tasso di falsi positivi "quasi nullo". Questo successo, che sfida lo scetticismo iniziale, è attribuito ai miglioramenti del modello e a un "harness" personalizzato sviluppato da Mozilla per l'analisi del codice sorgente, segnando un passo avanti rispetto ai precedenti tentativi AI afflitti da "allucinazioni".

2026-05-07 📰 Fonte
La causa di Elon Musk mette sotto esame la sicurezza di OpenAI e la governance dell'AI
📁 Altro AI generated ✅ TechCrunch AI

La causa di Elon Musk mette sotto esame la sicurezza di OpenAI e la governance dell'AI

La recente azione legale di Elon Musk contro OpenAI solleva interrogativi cruciali sulla sicurezza dei Large Language Models avanzati e sulla fiducia riposta nei leader tecnicici. Il dibattito si concentra sulla governance dell'intelligenza artificiale e sulle implicazioni per il controllo e la sovranità dei dati in contesti di deployment on-premise.

2026-05-07 📰 Fonte
← Precedente Page 33 / 119 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge