AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes

🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.

👥 160+ membri · Iscriviti gratis →

📡

Il Segnale del Giorno

Benvenuti al Circo dell’IA: Indagare i Veri Motori Dietro la Frenesia dei Modelli di Frontiera

Between July 1 and July 16, 2026, the artificial intelligence landscape compressed what used to be years of technological progress into a mere 16 days...

✍️ Editoriale 2026-07-26

⚡ In Tendenza

View All →

📊 Statistiche

Archivio Totale

Articoli indicizzati nel sistema RAG

Categorie

📡 RSS Feed

🛠️ Guide & Osservatorio On-Premise

🚀 Esegui i modelli in locale → Tutte le guide →

Riferimenti evergreen e pratici per far girare l'AI in locale — hardware, costi, privacy e stack completo.

🖥️ Osservatorio LLM On-Premise Hardware, stack, governance e architetture di riferimento per l'AI in locale. →

⚡ Le migliori GPU per LLM locali 💰 Quanto costa un LLM in locale 🧩 Ollama vs LM Studio 🔒 ChatGPT privato per aziende 📉 Quantizzazione LLM spiegata 📊 Quanta VRAM per Llama 70B 🚀 Esegui i modelli in locale (Qwen, Llama, R1…)

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

📁 Altro AI generated ℹ️ AI News

Allarme sicurezza: Malware su Hugging Face si spaccia per rilascio OpenAI

Una recente indagine di HiddenLayer ha rivelato un repository malevolo su Hugging Face, camuffato da rilascio ufficiale di OpenAI, che ha distribuito un infostealer a macchine Windows. Con circa 244.000 download prima della rimozione, l'incidente evidenzia i crescenti rischi nella supply chain del software AI, specialmente per le organizzazioni che integrano modelli da registry pubblici nei loro ambienti aziendali, inclusi quelli self-hosted, con implicazioni dirette sulla sovranità dei dati e la sicurezza infrastrutturale.

2026-05-12 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Benchmark Gemma 4 su H100: MTP e DFlash a confronto per LLM dense e MoE

Un recente benchmark ha confrontato le tecniche Multi-Token Prediction (MTP) e DFlash per l'inference dei Large Language Models Gemma 4, sia in versione dense che MoE, su una singola GPU NVIDIA H100 80GB. I risultati evidenziano come l'efficienza vari significativamente in base all'architettura del modello e al carico di lavoro, con MTP più veloce per i modelli dense e DFlash per i MoE. Lo studio sottolinea l'importanza di testare diverse configurazioni per ottimizzare i deployment on-premise.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ Tom's Hardware

Jensen Huang escluso dalla delegazione presidenziale per la Cina

Jensen Huang, CEO di Nvidia, non ha fatto parte della delegazione presidenziale statunitense per la visita di stato in Cina, a differenza di altri leader tecnicici come Tim Cook di Apple ed Elon Musk. L'assenza solleva interrogativi sulle dinamiche diplomatiche e sul ruolo delle aziende chiave nel settore del silicio e dell'intelligenza artificiale, cruciale per i deployment on-premise e la sovranità dei dati.

2026-05-12 📰 Fonte

📁 Frameworks AI generated ℹ️ LocalLLaMA

llama.cpp introduce llama-eval: la valutazione locale dei modelli diventa realtà

Il progetto Open Source llama.cpp ha integrato un nuovo strumento, llama-eval, che abilita la valutazione locale dei Large Language Models. Questa funzionalità è cruciale per gli specialisti IT che desiderano confrontare modelli quantizzati e sottoposti a Fine-tuning direttamente su infrastrutture on-premise, garantendo maggiore controllo e sovranità sui dati senza dipendere da servizi cloud esterni.

2026-05-12 📰 Fonte

📁 Altro AI generated ✅ 404 Media

Palantir e ICE: 20 milioni di profili accessibili via iPhone per operazioni sul campo

Un alto funzionario dell'ICE ha rivelato che i sistemi Palantir consentono agli agenti di accedere a un elenco di 20 milioni di persone tramite iPhone, accelerando le operazioni di identificazione e arresto. La tecnicia ha aumentato il tasso di successo nel localizzare i bersagli dall'27% a quasi l'80%, riducendo i tempi di indagine da ore a minuti. Questo solleva questioni critiche sulla sovranità dei dati e l'etica del deployment di piattaforme di analisi avanzate.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

NHS Inghilterra: Palantir ottiene accesso esteso ai dati sensibili dei pazienti

NHS England ha concesso ai contractor, inclusa Palantir, un accesso più ampio ai dati identificabili dei pazienti tramite un nuovo ruolo amministrativo sulla Federated Data Platform da 330 milioni di sterline. Questa modifica consente al personale esterno di bypassare le approvazioni caso per caso, sollevando preoccupazioni tra i gruppi di pazienti e i parlamentari laburisti che la definiscono una mossa pericolosa per la privacy.

2026-05-12 📰 Fonte

📁 Frameworks AI generated 🏆 Microsoft Research

MatterSim: L'AI accelera la scoperta di materiali con validazione e modelli multi-task

Microsoft Research ha annunciato aggiornamenti significativi per MatterSim, il suo modello AI per la scienza dei materiali. Le novità includono la validazione sperimentale di un nuovo conduttore termico (TaP), un'accelerazione dell'inference del modello fino a 5 volte e il rilascio di MatterSim-MT. Quest'ultimo è un foundation model multi-task che permette simulazioni *in silico* complesse, estendendo le capacità di caratterizzazione dei materiali e promettendo di ridurre drasticamente i cicli di sviluppo nel settore.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ TechCrunch AI

Dessn raccoglie 6 milioni per strumenti di design AI integrati nel codice

La startup Dessn ha ottenuto un finanziamento di 6 milioni di dollari per sviluppare strumenti di design potenziati dall'intelligenza artificiale. La peculiarità di questi strumenti risiede nella loro capacità di operare direttamente con le codebase di produzione, mirando a colmare il divario tra design e sviluppo e a ottimizzare i flussi di lavoro aziendali.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Paymentology ottiene 175 milioni di dollari per espandere i servizi di elaborazione pagamenti e l'AI

Paymentology, piattaforma globale di elaborazione per emittenti di carte, ha ottenuto un investimento di 175 milioni di dollari da Apis Partners e Aspirity Partners. L'azienda mira a modernizzare i sistemi di pagamento per banche e fintech, offrendo una piattaforma multi-cloud in tempo reale. I fondi supporteranno l'espansione internazionale, lo sviluppo di prodotti e l'ingresso in nuove aree come la finanza basata sull'AI e l'infrastruttura per stablecoin.

2026-05-12 📰 Fonte

📁 Altro AI generated 🏆 IEEE Spectrum

La prossima query AI: dove l'energia è più accessibile

L'industria dell'intelligenza artificiale sta esplorando nuove strategie per gestire il crescente fabbisogno energetico dei data center. Nvidia e i suoi partner stanno sviluppando un progetto pilota per micro data center distribuiti, posizionati strategicamente vicino alle sottostazioni elettriche. L'obiettivo è ottimizzare l'utilizzo dell'energia disponibile e migliorare la flessibilità operativa, spostando i carichi di lavoro di inference in base alla disponibilità della rete, un approccio cruciale per i deployment on-premise e ibridi.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ Tom's Hardware

Attacco supply chain: pacchetti Mistral AI e TanStack compromettono credenziali

Una recente campagna di attacchi alla supply chain, denominata 'mini Shai Hulud', ha colpito gli ecosistemi di sviluppo npm e AI. Pacchetti compromessi di Mistral AI e TanStack potrebbero aver esposto credenziali sensibili di GitHub, ambienti cloud e sistemi CI/CD. L'incidente evidenzia i rischi crescenti per la sicurezza delle pipeline di sviluppo e l'importanza di pratiche robuste per la protezione dei dati e la sovranità, specialmente in contesti di deployment on-premise e ibridi.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ LocalLLaMA

LLM on-premise: ottimizzare i consumi GPU senza intaccare le performance

Un caso studio su Reddit dimostra come sia possibile ridurre il consumo energetico di una GPU RTX 4090 fino al 40% del suo limite massimo durante l'Inference di LLM con `llama.cpp`, senza sacrificare le performance. Questa ottimizzazione, ottenuta tramite la limitazione del power limit, offre vantaggi significativi in termini di TCO, gestione termica e longevità dell'hardware per i deployment self-hosted.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ Tom's Hardware

SoftBank punta a batterie proprie per i data center AI: produzione su scala GWh entro il 2028

SoftBank ha annunciato l'intenzione di produrre batterie proprietarie basate su tecnicia ad acqua per alimentare i propri data center dedicati all'intelligenza artificiale. L'obiettivo è raggiungere una capacità di produzione su scala gigawatt-ora entro il 2028, una mossa strategica per gestire l'elevato consumo energetico delle infrastrutture AI e rafforzare l'autonomia energetica.

2026-05-12 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Gemma 4 E4B: un alleato rapido per trascrizioni brevi e multilingue in contesti locali

Il modello Gemma 4 E4B si distingue per l'efficienza e l'affidabilità nella trascrizione di brevi frammenti audio, anche in lingue diverse dall'inglese. Sebbene non sia la soluzione ideale per contenuti di lunga durata, dove strumenti come Whisper mantengono il primato, la sua rapidità lo rende un'opzione interessante per carichi di lavoro specifici che richiedono bassa latenza e potenziali deployment on-premise, offrendo un equilibrio tra prestazioni e requisiti computazionali.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ Tom's Hardware

L'AI genera zero-day: Google rileva minacce che aggirano la 2FA e ridefiniscono il cybercrime

Google ha identificato una vulnerabilità zero-day sviluppata da intelligenza artificiale, capace di aggirare l'autenticazione a due fattori. Questa scoperta, insieme all'emergere di malware auto-modificanti e backdoor basate su Gemini, segna l'inizio di una nuova era nel cybercrime. L'automazione avanzata, come i robot che producono altri robot, evidenzia la crescente complessità delle infrastrutture che necessitano di protezione contro queste minacce evolute.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Ilya Sutskever rivela una quota da 7 miliardi di dollari in OpenAI

Ilya Sutskever, ex capo scienziato di OpenAI e ora alla guida di Safe Superintelligence Inc., ha dichiarato sotto giuramento di possedere una quota di 7 miliardi di dollari in OpenAI. Questa rivelazione, avvenuta durante la causa legale tra Musk e OpenAI, lo colloca tra i maggiori azionisti individuali dell'azienda, evidenziando le dinamiche finanziarie e di leadership nel settore degli LLM.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

L'export cinese vola a ritmi record: i beni legati all'AI trainano la crescita

Le esportazioni cinesi hanno raggiunto un valore di circa 500 milioni di dollari all'ora, un dato record trainato in larga parte dai beni legati all'intelligenza artificiale. Secondo i calcoli di Bloomberg, questi prodotti contribuiscono per circa la metà alla crescita annuale, portando il totale delle esportazioni di aprile a 359,4 miliardi di dollari, con un aumento del 14,1% rispetto all'anno precedente.

2026-05-12 📰 Fonte

📁 Hardware AI generated ℹ️ Tom's Hardware

Loongson: le CPU e GPU cinesi puntano a eguagliare Intel 12th Gen e AMD RX 550 entro il 2027

I chip cinesi di prossima generazione Loongson 3B6600 (CPU) e 9A1000 (GPU) mirano a raggiungere le prestazioni di Intel 12th Gen e AMD RX 550 entro il 2027. Questo sviluppo evidenzia l'ambizione della Cina di rafforzare la propria autonomia tecnicica nel settore dei semiconduttori, con implicazioni per la sovranità dei dati e le strategie di deployment on-premise.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ Tech.eu

Sovranità dei dati e LLM in sanità: Tandem Health e il vantaggio europeo

Il CEO della startup svedese Tandem Health, Lukas Saari, evidenzia le difficoltà per i competitor statunitensi nel mercato europeo, spinto dalla crescente preferenza per fornitori locali, specialmente nel settore sanitario. Tandem, che impiega Large Language Models per un co-pilota AI clinico, capitalizza su questa tendenza, rafforzando la sua posizione come attore chiave in un contesto dove la sovranità dei dati e la compliance sono priorità assolute per le istituzioni europee.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ DigiTimes

L'onda dell'AI infrastrutturale: Taiwan al centro della filiera globale

L'industria taiwanese sta capitalizzando l'esplosione della domanda di infrastrutture per l'intelligenza artificiale, dai substrati ai server. Questo fenomeno evidenzia la crescente necessità di componenti hardware robusti per supportare i carichi di lavoro degli LLM, con implicazioni significative per le aziende che valutano deployment on-premise e la sovranità dei dati.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Negoziati USA-Cina: l'AI al centro delle tensioni su terre rare e dazi

I recenti negoziati commerciali tra Stati Uniti e Cina mettono in evidenza la crescente interconnessione tra geopolitica e tecnicia. Le discussioni vertono su terre rare, dazi e, in particolare, sul futuro dell'intelligenza artificiale. Questi fattori influenzano direttamente la catena di approvvigionamento e i costi dell'hardware AI, con significative implicazioni per le strategie di deployment on-premise e la sovranità tecnicica delle aziende.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ DigiTimes

BTL Group intensifica i test sui server AI: la domanda on-premise spinge le consegne

BTL Group sta accelerando i test sui propri server dedicati all'intelligenza artificiale, in risposta a un volume di ordini che si estende fino a settembre. Questa attività evidenzia la crescente domanda di infrastrutture AI robuste e self-hosted, con aziende che cercano soluzioni on-premise per gestire carichi di lavoro complessi e garantire la sovranità dei dati.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Ventory raccoglie 2,65 milioni di euro per espandere AI e integrazioni ERP

Ventory, piattaforma di gestione dell'inventario che connette i sistemi ERP aziendali con le operazioni sul campo, ha chiuso un round di finanziamento da 2,65 milioni di euro. L'investimento, guidato da KBC Securities, supporterà l'espansione della roadmap di prodotto AI, l'integrazione con nuovi ERP e l'espansione geografica in Europa occidentale, consolidando la sua offerta per la gestione in tempo reale dell'inventario in settori critici.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

L'UE punta alla verifica dell'età sui social media per la protezione dei minori

La Presidente della Commissione Europea, Ursula von der Leyen, ha annunciato l'intenzione di estendere le protezioni online per i minori, proponendo regole a livello di blocco per l'età minima sui social media. Un'applicazione UE per la verifica dell'età è tecnicamente pronta, mentre alcuni Stati membri come Francia e Spagna hanno già avviato iniziative nazionali. Questo solleva questioni importanti sulla sovranità dei dati e l'implementazione di soluzioni conformi.

2026-05-12 📰 Fonte

📁 Altro AI generated ✅ Phoronix

Haiku OS: Il supporto ARM64 SMP debutta, aprendo nuove prospettive

Il sistema operativo open source Haiku, erede spirituale di BeOS, ha raggiunto un traguardo significativo con l'introduzione del supporto SMP multi-core per architetture ARM64. Questa funzionalità, già operativa in ambienti virtualizzati, segna un passo avanti per l'OS, affiancandosi a una serie di altri miglioramenti implementati nel corso di aprile. L'avanzamento apre scenari interessanti per il deployment su hardware diversificato, inclusi potenziali ambienti on-premise.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Jensen Huang di Nvidia assente dalla delegazione USA in Cina

Jensen Huang, CEO di Nvidia, non parteciperà alla delegazione commerciale statunitense in Cina guidata dal Presidente Trump. La missione, che vedrà la presenza di figure come Tim Cook di Apple ed Elon Musk di Tesla, si concentrerà su settori quali agricoltura, manifattura e aviazione. L'assenza di Huang, riportata da Reuters, si inserisce nel complesso scenario delle relazioni geopolitiche e commerciali che modellano il settore tecnicico globale.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ DigiTimes

SK Hynix rafforza la catena di fornitura AI con un'acquisizione strategica in Silicon Valley

SK Hynix avrebbe acquisito una proprietà nella Silicon Valley, una mossa che sottolinea la crescente importanza della memoria ad alte prestazioni per l'intelligenza artificiale. L'operazione mira a consolidare la catena di fornitura di componenti cruciali, come le memorie HBM, essenziali per i carichi di lavoro di Large Language Models e per i deployment on-premise, influenzando la disponibilità e il TCO dell'hardware AI.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Prosus punta a 3,6 miliardi di dollari da Just Eat Takeaway

Prosus, l'investitore controllato da Napers, ha annunciato un obiettivo di ricavi annuali di 3,6 miliardi di dollari per Just Eat Takeaway. L'azienda europea di food delivery, acquisita per 4,1 miliardi di euro lo scorso anno, è stata oggetto di un processo di integrazione durato nove mesi. Questo traguardo commerciale definisce le aspettative a breve termine per l'asset strategico.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Netflix sotto accusa in Texas: raccolta dati senza consenso e design 'addictivo'

Il procuratore generale del Texas, Ken Paxton, ha avviato un'azione legale contro Netflix, accusando la piattaforma di streaming di raccogliere dati utente senza consenso e di utilizzare il design 'addictivo' dell'autoplay, specialmente per i bambini. Netflix ha respinto le accuse, definendole prive di fondamento. La vicenda solleva questioni cruciali sulla sovranità dei dati e il controllo delle informazioni personali, temi centrali per le decisioni di deployment tecnicico.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Holmes raccoglie 1,1 milioni di euro per il testing software autonomo nell'era AI

Holmes, startup con sede a Gand, ha ottenuto un finanziamento pre-seed di 1,1 milioni di euro per la sua piattaforma di Quality Assurance autonoma. L'azienda mira a risolvere il collo di bottiglia del testing software, sempre più evidente con l'accelerazione dello sviluppo tramite strumenti AI. La piattaforma apprende il funzionamento dei prodotti e le interazioni utente, generando e aggiornando automaticamente i test per garantire la qualità continua.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Ditto ottiene 7,6 milioni di euro per riassunti AI di visite mediche

Ditto, una startup olandese nel settore health-tech, ha annunciato una raccolta fondi di 7,6 milioni di euro. L'azienda sviluppa soluzioni basate sull'intelligenza artificiale per generare riassunti delle visite mediche destinati ai pazienti. Il capitale, guidato da Heal Capital, supporterà l'espansione in mercati chiave come Germania, Regno Unito e Spagna. Questo tipo di applicazione AI nel settore sanitario solleva importanti questioni riguardo la sovranità dei dati e le scelte di deployment.

2026-05-12 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Applied Materials e TSMC: una partnership strategica per i chip AI

Applied Materials e TSMC hanno annunciato una collaborazione presso l'EPIC Center per accelerare lo sviluppo di chip dedicati all'intelligenza artificiale. Questa iniziativa mira a ottimizzare i processi produttivi e le tecnicie di base, con implicazioni significative per l'efficienza e la disponibilità dell'hardware AI, cruciale per le aziende che valutano deployment on-premise e la gestione della sovranità dei dati.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Disputa in Samsung: impatto sulla supply chain globale e le implicazioni per l'AI

Una disputa di lavoro in Samsung Electronics, gigante della tecnicia e fornitore chiave di componenti, sta generando incertezze nella supply chain globale. Questo scenario solleva interrogativi significativi per le aziende che pianificano o gestiscono deployment on-premise di Large Language Models, influenzando la disponibilità e i costi dell'hardware essenziale per l'infrastruttura AI.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Pillar raccoglie 12 milioni di euro per un OS basato sull'AI per l'edilizia

La startup italiana Pillar ha ottenuto un finanziamento seed di 12 milioni di euro, portando il capitale totale a 15,2 milioni in meno di otto mesi dal lancio pubblico. L'azienda sviluppa una piattaforma software basata sull'intelligenza artificiale per modernizzare le operazioni e la gestione finanziaria nel settore edile, automatizzando processi amministrativi e fornendo visibilità in tempo reale. Il nuovo capitale servirà a consolidare la posizione in Italia e a espandersi a livello internazionale.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Paymentology raccoglie 175 milioni di dollari per l'elaborazione dei pagamenti

Paymentology, un'azienda londinese specializzata nell'elaborazione globale di pagamenti per emittenti, ha annunciato un significativo round di finanziamento da 175 milioni di dollari. L'operazione è stata co-guidata da Apis Partners, attraverso il suo Apis Growth Fund III, e da Aspirity Partners, una società di private equity pan-europea con un focus sulla tecnicia finanziaria. Questo investimento sottolinea la continua fiducia del mercato nel potenziale di crescita e innovazione nel settore dei pagamenti digitali.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

White Circle raccoglie 11 milioni di dollari per il controllo dell'AI in produzione

White Circle ha chiuso un round Seed da 11 milioni di dollari per la sua piattaforma di monitoraggio, sicurezza e controllo dei modelli AI in produzione. Il supporto di figure chiave del settore e una base clienti che include grandi banche digitali evidenziano la crescente domanda di soluzioni per la gestione dell'intelligenza artificiale in ambienti enterprise.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Adfin raccoglie 18 milioni di dollari per la sua piattaforma finanziaria "agentic"

La fintech londinese Adfin ha chiuso un round di Serie A da 18 milioni di dollari, guidato da Index Ventures, portando il finanziamento totale oltre i 30 milioni. L'azienda sviluppa una piattaforma "agentic" per la gestione dei flussi di denaro, che ha già dimostrato di ridurre significativamente i ritardi nei pagamenti per le PMI. Il successo evidenzia la crescente fiducia nelle soluzioni AI-driven per il settore finanziario.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Happl ottiene 11 milioni di dollari per espandere la sua piattaforma AI-native di benefit

Happl, fornitore di soluzioni AI-native per la gestione dei benefit aziendali, ha raccolto 11 milioni di dollari in un round di Serie A. L'investimento, guidato da Portage Ventures, mira ad accelerare lo sviluppo e la scalabilità della piattaforma per le aziende multinazionali. L'architettura AI-native solleva considerazioni cruciali sulla sovranità dei dati, la compliance e il TCO per le decisioni di deployment on-premise o cloud.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Nscale ottiene 790 milioni di dollari per il data center AI di Narvik

Nscale, azienda specializzata in infrastrutture AI, ha ottenuto un finanziamento di 790 milioni di dollari per proseguire la costruzione del suo data center dedicato all'intelligenza artificiale a Narvik, nel nord della Norvegia. L'operazione sottolinea l'importanza degli investimenti in infrastrutture fisiche per supportare carichi di lavoro AI, un aspetto cruciale per le aziende che valutano deployment on-premise e la sovranità dei dati.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ Tech.eu

Ditto raccoglie 7,6 milioni di euro per l'espansione europea e l'AI nella sanità

La startup olandese Ditto ha ottenuto 7,6 milioni di euro in un round di finanziamento guidato da Heal Capital. I fondi supporteranno l'espansione europea e lo sviluppo della sua piattaforma di comunicazione per pazienti basata su AI. L'applicazione, che genera riassunti di consultazioni mediche e non archivia i dati centralmente, mira a migliorare la comprensione dei pazienti e alleggerire il carico amministrativo degli operatori sanitari.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Crescita dei server AI a Taiwan: un ecosistema in espansione

Il mercato dei server AI a Taiwan sta vivendo una fase di espansione significativa, con benefici che si estendono oltre il ruolo consolidato di TSMC. Questa diversificazione indica una maturazione della supply chain locale, offrendo nuove opportunità per le aziende che cercano soluzioni hardware robuste per carichi di lavoro di intelligenza artificiale, inclusi i deployment on-premise, e sollevando considerazioni cruciali su TCO e sovranità dei dati.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Regulate raccoglie 1,4 milioni di euro per il breathwork nelle aziende

Regulate, una piattaforma di breathwork per il benessere aziendale, ha concluso un round di finanziamento Seed da 1,4 milioni di euro. L'investimento, guidato da 4impact.vc e sostenuto da angel investor di spicco, mira a espandere l'offerta di sessioni scientificamente validate e personalizzate. La piattaforma, che integra dati da dispositivi indossabili e sistemi di gestione del lavoro, aiuta i professionisti a migliorare concentrazione e resilienza, rispondendo alle crescenti pressioni del mondo lavorativo moderno.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Tolemy Bio si assicura 1,4 milioni per l'AI nella biologia cellulare

La startup biotech Tolemy Bio ha raccolto 1,4 milioni di euro in un round di finanziamento pre-seed. L'obiettivo è avanzare nello sviluppo di Orbit, una piattaforma basata sull'intelligenza artificiale progettata per risolvere la frammentazione dei dati nella ricerca biologica e nello sviluppo biofarmaceutico. Il sistema mira a unificare i workflow sperimentali, integrando strumenti di laboratorio e modelli cellulari virtuali per ottimizzare la comprensione e l'applicazione delle cellule viventi.

2026-05-12 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Adfin raccoglie 18 milioni di dollari per espandere la sua piattaforma AI di gestione finanziaria

La fintech londinese Adfin ha chiuso un round di finanziamento Series A da 18 milioni di dollari, portando il capitale totale raccolto a oltre 30 milioni. L'investimento, guidato da Index Ventures, supporterà l'espansione della sua piattaforma basata su AI. Questa soluzione mira ad automatizzare la gestione dei pagamenti e del flusso di cassa per le aziende, migliorando l'efficienza operativa e la visibilità finanziaria, in particolare per le PMI che affrontano ritardi nei pagamenti.

2026-05-12 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

VSO Electronics: la crescita passa dai cavi per l'infrastruttura AI e nuove linee produttive

VSO Electronics punta a una crescita significativa, trainata dalla crescente domanda di cavi specifici per l'infrastruttura AI. L'azienda prevede inoltre di attivare una nuova linea interna per il rilevamento delle perdite entro la fine del 2026, consolidando le proprie capacità produttive e di controllo qualità in un mercato in rapida evoluzione.

2026-05-12 📰 Fonte

📁 Altro AI generated ℹ️ LocalLLaMA

Ottimizzare la velocità di elaborazione dei prompt per LLM on-premise: il ruolo del micro-batching

Una recente analisi su `llama.cpp` ha rivelato come l'aumento del micro-batch size (`ubatch`) possa migliorare drasticamente la velocità di prefill dei prompt per Large Language Models parzialmente offloadati su GPU consumer come la RTX 3090. Questo approccio, sebbene comporti un leggero calo nella generazione di token e un maggiore offloading su CPU, offre un notevole incremento del throughput, evidenziando trade-off cruciali per i deployment on-premise.

2026-05-12 📰 Fonte

📁 LLM AI generated ✅ TechCrunch AI

Thinking Machines: un nuovo paradigma per l'interazione con gli LLM

Thinking Machines sta esplorando un approccio innovativo per i Large Language Models, mirando a superare l'attuale modalità sequenziale di interazione. L'obiettivo è sviluppare un modello capace di elaborare l'input dell'utente e generare una risposta simultaneamente, emulando la fluidità di una conversazione telefonica. Questa evoluzione potrebbe ridefinire le aspettative di latenza e reattività nei sistemi AI.

2026-05-12 📰 Fonte

📁 LLM AI generated 🏆 ArXiv cs.CL

Rilevare le Allucinazioni nei LLM: Un Nuovo Approccio al Ragionamento a Pipeline

Un nuovo studio esplora l'efficacia dei metodi di rilevamento delle allucinazioni nei Large Language Models (LLM), specialmente per il ragionamento a catena. La ricerca evidenzia come tali metodi possano essere ingannati da correlati superficiali, anziché valutare il ragionamento effettivo. Attraverso una metodologia di invarianza controllata, gli autori dimostrano che un rilevamento robusto non richiede necessariamente rappresentazioni complesse. Uno scorer leggero, TRACT, basato su caratteristiche lessicali, si rivela competitivo, suggerendo che la sfida principale sia isolare il segnale di ragionamento dai segnali di superficie.

2026-05-12 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

La domanda energetica dell'AI e la resilienza della rete: le priorità di Taipower

Il nuovo presidente di Taipower ha posto l'accento sulla crescente domanda di energia generata dall'intelligenza artificiale e sulla necessità di rafforzare la resilienza della rete elettrica. Questa focalizzazione evidenzia le sfide infrastrutturali che le utilities devono affrontare per supportare l'espansione dei carichi di lavoro AI, sia in contesti cloud che on-premise, sottolineando l'importanza di una fornitura energetica stabile e affidabile.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Tempi di Consegna dei Componenti: L'Impatto sulla Crescita di Viking AI

Viking AI registra un aumento del 12% nei ricavi, ma l'industria affronta sfide significative. I tempi di consegna per i resistori si sono estesi a 15 settimane, evidenziando le crescenti pressioni sulla catena di approvvigionamento di componenti elettronici. Questa situazione può influenzare la disponibilità di hardware essenziale per i deployment on-premise di soluzioni AI, un aspetto cruciale per le aziende che puntano alla sovranità dei dati e al controllo infrastrutturale.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Boom del Testing AI a Taiwan: KYEC, MPI e WinWay verso ricavi record nel 2026

Le aziende taiwanesi KYEC, MPI e WinWay si preparano a raggiungere ricavi record entro il 2026, spinte dalla crescente domanda nel settore del testing per l'intelligenza artificiale. Questo trend evidenzia l'importanza cruciale della validazione rigorosa per le infrastrutture AI, specialmente in contesti di deployment on-premise, dove la precisione e l'affidabilità sono fondamentali per le operazioni critiche.

2026-05-12 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

Kuaishou punta a 20 miliardi di dollari per Kling AI, spin-off per la generazione video

Kuaishou, gigante cinese della tecnicia, mira a una valutazione di 20 miliardi di dollari per Kling AI, il suo spin-off dedicato alla generazione di video. Questa mossa strategica evidenzia la crescente domanda di soluzioni AI per la creazione di contenuti visivi e solleva questioni cruciali sull'infrastruttura necessaria per gestire carichi di lavoro così intensivi, spingendo le aziende a valutare attentamente le opzioni di deployment on-premise rispetto al cloud per garantire sovranità dei dati e controllo sui costi operativi.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Soluzioni termiche per server AI: Taiwan guida la crescita fino al 2026

Il crescente fabbisogno di server AI ad alte prestazioni sta alimentando un boom per le aziende taiwanesi specializzate in soluzioni termiche. Entro il 2026, si prevede che aziende come AVC e Auras guideranno una significativa espansione del mercato, rispondendo alla domanda critica di raffreddamento efficiente per le infrastrutture AI, in particolare per i deployment on-premise che richiedono un controllo rigoroso su performance e TCO.

2026-05-12 📰 Fonte

📁 LLM AI generated 🏆 ArXiv cs.CL

SalesSim: Valutare e Allineare i Modelli Multimodali per la Simulazione Utente nel Retail

Un nuovo framework, SalesSim, è stato introdotto per valutare la capacità dei Large Language Models multimodali (MLLM) di simulare comportamenti realistici di clienti nel retail online. La ricerca ha rivelato lacune significative, come bassa diversità lessicale e scarsa aderenza alle specifiche di persona, con il modello migliore che raggiunge meno del 79% di allineamento. Per affrontare queste sfide, è stato proposto UserGRPO, un approccio di reinforcement learning che migliora l'allineamento delle decisioni e la qualità conversazionale.

2026-05-12 📰 Fonte

📁 Frameworks AI generated 🏆 ArXiv cs.LG

PathBoost: il Gradient Boosting basato su percorsi per l'analisi dei grafi

PathBoost è un nuovo metodo di gradient tree boosting per la classificazione e regressione a livello di grafo. Apprende caratteristiche basate su percorsi direttamente dalla struttura del grafo, estendendo lavori precedenti con adattamento alla classificazione binaria, gestione di attributi multipli e selezione automatica dei nodi di ancoraggio. I benchmark mostrano che PathBoost è competitivo con le reti neurali grafiche e gli approcci kernel, specialmente su grafi con un numero elevato di nodi, offrendo un'alternativa ai modelli black-box più complessi.

2026-05-12 📰 Fonte

📁 Frameworks AI generated 🏆 ArXiv cs.LG

RL-Kirigami: L'IA accelera la progettazione di metamateriali kirigami

Un nuovo framework, RL-Kirigami, combina Optimal-Transport Conditional Flow Matching e Reinforcement Learning per la progettazione inversa di metamateriali kirigami. Il sistema riduce drasticamente le valutazioni del simulatore e migliora la precisione, consentendo la prototipazione rapida di componenti fisici in pochi minuti. Questo approccio promette di trasformare i workflow di design e produzione, con implicazioni significative per l'efficienza e la sovranità dei dati in contesti industriali.

2026-05-12 📰 Fonte

📁 Frameworks AI generated 🏆 ArXiv cs.AI

Auto-Rubric as Reward: Criteri Espliciti per Allineare i Modelli Generativi Multimodali

Un nuovo framework, Auto-Rubric as Reward (ARR), mira a migliorare l'allineamento dei modelli generativi multimodali con le preferenze umane. Superando i limiti degli approcci RLHF tradizionali che usano etichette implicite, ARR introduce una decomposizione basata su criteri espliciti. Questo metodo estrapola la conoscenza interna dei VLM in rubriche specifiche, riducendo i bias di valutazione e migliorando l'efficienza dei dati. In combinazione con Rubric Policy Optimization (RPO), ARR-RPO ha dimostrato prestazioni superiori nei benchmark di generazione testo-immagine e di editing di immagini.

2026-05-12 📰 Fonte

📁 LLM AI generated 🏆 ArXiv cs.AI

Contesto Spaziale Supera il Priming Semantico per l'Estrazione Dati da Grafici con LLM

Una nuova ricerca esplora strategie per migliorare l'accuratezza degli LLM multimodali nell'estrazione di dati da grafici scientifici non standardizzati. Lo studio rivela che l'applicazione di un contesto spaziale esplicito, tramite una griglia di coordinate, riduce significativamente gli errori rispetto a metodi di priming semantico. Questa tecnica offre un approccio più affidabile per l'attuale generazione di modelli, con una riduzione del SMAPE dal 25,5% al 19,5%.

2026-05-12 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

Dinamiche di Mercato e Adozione Tecnologica: Lezioni per l'Framework AI

L'accelerata penetrazione dei veicoli a nuova energia in Cina, spinta dai prezzi del petrolio, offre uno spunto di riflessione sulle dinamiche che guidano l'adozione di nuove tecnicie. Questo scenario evidenzia come fattori economici e strategici influenzino le scelte infrastrutturali, un parallelo rilevante per il deployment di Large Language Models (LLM) on-premise, dove TCO e sovranità dei dati sono cruciali.

2026-05-12 📰 Fonte

📁 Market AI generated ✅ DigiTimes

La domanda di server AI spinge i ricavi record di WPG Holdings e WT Microelectronics

WPG Holdings e WT Microelectronics hanno registrato ricavi record ad aprile, trainati dalla forte domanda di server dedicati all'intelligenza artificiale. Questo trend evidenzia la crescente adozione di soluzioni AI, con implicazioni significative per le strategie di deployment on-premise e la catena di fornitura hardware, sottolineando l'importanza di infrastrutture robuste per i carichi di lavoro LLM.

2026-05-12 📰 Fonte

← Precedente Page 100 / 121 Successiva →

Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

LAUNCHING SOON ON LaunchTry

AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il Segnale del Giorno

Benvenuti al Circo dell’IA: Indagare i Veri Motori Dietro la Frenesia dei Modelli di Frontiera

⚡ In Tendenza

🛠️ Guide &amp; Osservatorio On-Premise

Ultime analisi & news dal radar

🛠️ Guide & Osservatorio On-Premise