AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

A* di Kevin Hartz: un fondo da 450 milioni contro i megafondi AI
📁 Market AI generated ℹ️ The Next Web

A* di Kevin Hartz: un fondo da 450 milioni contro i megafondi AI

A*, la società di venture capital di San Francisco guidata dal co-fondatore di Eventbrite Kevin Hartz, ha chiuso un nuovo fondo da 450 milioni di dollari. Questa mossa si distingue nel panorama degli investimenti in intelligenza artificiale, dove la tendenza dominante è la creazione di megafondi da miliardi di dollari. L'approccio di A*, descritto come "less-is-more", suggerisce una strategia di investimento più mirata, potenzialmente focalizzata su soluzioni AI efficienti e ottimizzate per il TCO, in contrasto con la corsa a capitali ingenti per il training e il deployment di LLM su vasta scala.

2026-05-12 📰 Fonte
OpenAI lancia Daybreak: una nuova sfida nella cyber difesa aziendale
📁 Altro AI generated ℹ️ The Next Web

OpenAI lancia Daybreak: una nuova sfida nella cyber difesa aziendale

OpenAI ha presentato Daybreak, una nuova iniziativa di cybersecurity. La piattaforma mira a identificare vulnerabilità software, generare patch e validare correzioni all'interno delle codebase aziendali. Daybreak integra varianti di GPT-5.5 e Codex Security, collaborando con partner di sicurezza enterprise. Questa mossa posiziona OpenAI in diretta competizione con Mythos di Anthropic, segnando un'espansione significativa nel settore della difesa informatica basata su Large Language Models (LLM).

2026-05-12 📰 Fonte
La sfida del PC silenzioso: implicazioni per l'hardware AI on-premise
📁 Hardware AI generated ℹ️ Tom's Hardware

La sfida del PC silenzioso: implicazioni per l'hardware AI on-premise

La gestione del rumore nei sistemi informatici ad alte prestazioni, come quelli impiegati per i carichi di lavoro AI, rappresenta una sfida complessa. Componenti quali case, ventole e sistemi di raffreddamento a liquido All-in-One (AIO) sono cruciali per la dissipazione del calore, ma sono anche le principali fonti di rumore. Questo aspetto assume particolare rilevanza negli ambienti on-premise, dove l'integrazione dell'hardware AI richiede un'attenta valutazione dei trade-off tra performance, efficienza termica e impatto acustico.

2026-05-12 📰 Fonte
Meta testa l'integrazione AI in Threads: contesto in tempo reale nelle conversazioni
📁 LLM AI generated ✅ TechCrunch AI

Meta testa l'integrazione AI in Threads: contesto in tempo reale nelle conversazioni

Meta sta sperimentando una nuova funzionalità AI all'interno di Threads, progettata per fornire agli utenti contesto in tempo reale su tendenze e notizie, oltre a suggerimenti personalizzati, direttamente nelle conversazioni. L'approccio ricorda quello adottato da Grok, puntando a migliorare l'interazione utente attraverso l'assistenza intelligente.

2026-05-12 📰 Fonte
Waymo richiama migliaia di robotaxi per un difetto software legato a strade allagate
📁 Altro AI generated ℹ️ The Next Web

Waymo richiama migliaia di robotaxi per un difetto software legato a strade allagate

Waymo ha annunciato il richiamo di 3.791 robotaxi negli Stati Uniti. La decisione, sollecitata dalle autorità federali, è dovuta a un difetto software che potrebbe indurre i veicoli a percorrere strade allagate a velocità elevate. Il problema riguarda le versioni di quinta e sesta generazione del sistema di guida autonoma Waymo Driver, evidenziando le sfide nella gestione della complessità dei sistemi AI in ambienti reali e l'importanza di rigorose pipeline di testing e validazione.

2026-05-12 📰 Fonte
L'AI all'Edge con ExecuTorch: Ottimizzazione su CPU e NPU Arm per Deployment Locali
📁 Altro AI generated ✅ PyTorch Blog

L'AI all'Edge con ExecuTorch: Ottimizzazione su CPU e NPU Arm per Deployment Locali

ExecuTorch estende l'ecosistema PyTorch per l'inference AI su dispositivi edge con risorse limitate. Arm ha rilasciato laboratori pratici Jupyter che esplorano il deployment su CPU e NPU Arm (Cortex-A, Cortex-M, Ethos-U), evidenziando i benefici in termini di latenza e privacy. L'articolo analizza come ExecuTorch ottimizzi i modelli per l'esecuzione locale, affrontando le sfide hardware e i trade-off di performance, un aspetto cruciale per i deployment on-premise.

2026-05-12 📰 Fonte
MagicQuant v2.0: Ottimizzare i Large Language Models per l'Framework On-Premise
📁 LLM AI generated ℹ️ LocalLLaMA

MagicQuant v2.0: Ottimizzare i Large Language Models per l'Framework On-Premise

MagicQuant v2.0 introduce una pipeline innovativa per la creazione di modelli GGUF ibridi e quantizzati, ottimizzati per l'inference su hardware locale. Il progetto analizza le configurazioni di quantization esistenti per identificare i migliori compromessi tra dimensione del modello e accuratezza (misurata in KLD), con un'enfasi sulla gestione efficiente della VRAM. Offre ai decision-maker tecnici strumenti per massimizzare il valore dei deployment on-premise, affrontando le sfide di costo e performance.

2026-05-12 📰 Fonte
N8n raddoppia la valutazione a 5,2 miliardi di dollari con l'investimento SAP
📁 Market AI generated ℹ️ Tech.eu

N8n raddoppia la valutazione a 5,2 miliardi di dollari con l'investimento SAP

La startup berlinese n8n ha visto la sua valutazione superare i 5,2 miliardi di dollari, più che raddoppiando in meno di un anno, grazie a un investimento strategico del colosso software SAP. L'operazione, avvenuta tramite una vendita di azioni secondarie, segna l'ingresso di SAP nel capitale di n8n e include un accordo commerciale pluriennale per integrare la piattaforma di orchestrazione AI di n8n nell'offerta Joule Studio di SAP.

2026-05-12 📰 Fonte
eBay: l'offerta GameStop da 56 miliardi di dollari non è credibile né attraente
📁 Market AI generated ℹ️ The Next Web

eBay: l'offerta GameStop da 56 miliardi di dollari non è credibile né attraente

Il consiglio di amministrazione di eBay ha formalmente respinto l'offerta di acquisizione da 56 miliardi di dollari avanzata da GameStop. La proposta, che prevedeva un prezzo di 125 dollari per azione e un finanziamento parziale da TD Securities, è stata giudicata "né credibile né attraente" dal gigante dell'e-commerce, segnando la fine di una trattativa complessa che ha visto anche il proponente Ryan Cohen affrontare restrizioni sulla piattaforma.

2026-05-12 📰 Fonte
Allarme sicurezza: Malware su Hugging Face si spaccia per rilascio OpenAI
📁 Altro AI generated ℹ️ AI News

Allarme sicurezza: Malware su Hugging Face si spaccia per rilascio OpenAI

Una recente indagine di HiddenLayer ha rivelato un repository malevolo su Hugging Face, camuffato da rilascio ufficiale di OpenAI, che ha distribuito un infostealer a macchine Windows. Con circa 244.000 download prima della rimozione, l'incidente evidenzia i crescenti rischi nella supply chain del software AI, specialmente per le organizzazioni che integrano modelli da registry pubblici nei loro ambienti aziendali, inclusi quelli self-hosted, con implicazioni dirette sulla sovranità dei dati e la sicurezza infrastrutturale.

2026-05-12 📰 Fonte
Benchmark Gemma 4 su H100: MTP e DFlash a confronto per LLM dense e MoE
📁 LLM AI generated ℹ️ LocalLLaMA

Benchmark Gemma 4 su H100: MTP e DFlash a confronto per LLM dense e MoE

Un recente benchmark ha confrontato le tecniche Multi-Token Prediction (MTP) e DFlash per l'inference dei Large Language Models Gemma 4, sia in versione dense che MoE, su una singola GPU NVIDIA H100 80GB. I risultati evidenziano come l'efficienza vari significativamente in base all'architettura del modello e al carico di lavoro, con MTP più veloce per i modelli dense e DFlash per i MoE. Lo studio sottolinea l'importanza di testare diverse configurazioni per ottimizzare i deployment on-premise.

2026-05-12 📰 Fonte
Jensen Huang escluso dalla delegazione presidenziale per la Cina
📁 Market AI generated ℹ️ Tom's Hardware

Jensen Huang escluso dalla delegazione presidenziale per la Cina

Jensen Huang, CEO di Nvidia, non ha fatto parte della delegazione presidenziale statunitense per la visita di stato in Cina, a differenza di altri leader tecnicici come Tim Cook di Apple ed Elon Musk. L'assenza solleva interrogativi sulle dinamiche diplomatiche e sul ruolo delle aziende chiave nel settore del silicio e dell'intelligenza artificiale, cruciale per i deployment on-premise e la sovranità dei dati.

2026-05-12 📰 Fonte
llama.cpp introduce llama-eval: la valutazione locale dei modelli diventa realtà
📁 Frameworks AI generated ℹ️ LocalLLaMA

llama.cpp introduce llama-eval: la valutazione locale dei modelli diventa realtà

Il progetto Open Source llama.cpp ha integrato un nuovo strumento, llama-eval, che abilita la valutazione locale dei Large Language Models. Questa funzionalità è cruciale per gli specialisti IT che desiderano confrontare modelli quantizzati e sottoposti a Fine-tuning direttamente su infrastrutture on-premise, garantendo maggiore controllo e sovranità sui dati senza dipendere da servizi cloud esterni.

2026-05-12 📰 Fonte
Palantir e ICE: 20 milioni di profili accessibili via iPhone per operazioni sul campo
📁 Altro AI generated ✅ 404 Media

Palantir e ICE: 20 milioni di profili accessibili via iPhone per operazioni sul campo

Un alto funzionario dell'ICE ha rivelato che i sistemi Palantir consentono agli agenti di accedere a un elenco di 20 milioni di persone tramite iPhone, accelerando le operazioni di identificazione e arresto. La tecnicia ha aumentato il tasso di successo nel localizzare i bersagli dall'27% a quasi l'80%, riducendo i tempi di indagine da ore a minuti. Questo solleva questioni critiche sulla sovranità dei dati e l'etica del deployment di piattaforme di analisi avanzate.

2026-05-12 📰 Fonte
NHS Inghilterra: Palantir ottiene accesso esteso ai dati sensibili dei pazienti
📁 Altro AI generated ℹ️ The Next Web

NHS Inghilterra: Palantir ottiene accesso esteso ai dati sensibili dei pazienti

NHS England ha concesso ai contractor, inclusa Palantir, un accesso più ampio ai dati identificabili dei pazienti tramite un nuovo ruolo amministrativo sulla Federated Data Platform da 330 milioni di sterline. Questa modifica consente al personale esterno di bypassare le approvazioni caso per caso, sollevando preoccupazioni tra i gruppi di pazienti e i parlamentari laburisti che la definiscono una mossa pericolosa per la privacy.

2026-05-12 📰 Fonte
MatterSim: L'AI accelera la scoperta di materiali con validazione e modelli multi-task
📁 Frameworks AI generated 🏆 Microsoft Research

MatterSim: L'AI accelera la scoperta di materiali con validazione e modelli multi-task

Microsoft Research ha annunciato aggiornamenti significativi per MatterSim, il suo modello AI per la scienza dei materiali. Le novità includono la validazione sperimentale di un nuovo conduttore termico (TaP), un'accelerazione dell'inference del modello fino a 5 volte e il rilascio di MatterSim-MT. Quest'ultimo è un foundation model multi-task che permette simulazioni *in silico* complesse, estendendo le capacità di caratterizzazione dei materiali e promettendo di ridurre drasticamente i cicli di sviluppo nel settore.

2026-05-12 📰 Fonte
Dessn raccoglie 6 milioni per strumenti di design AI integrati nel codice
📁 Market AI generated ✅ TechCrunch AI

Dessn raccoglie 6 milioni per strumenti di design AI integrati nel codice

La startup Dessn ha ottenuto un finanziamento di 6 milioni di dollari per sviluppare strumenti di design potenziati dall'intelligenza artificiale. La peculiarità di questi strumenti risiede nella loro capacità di operare direttamente con le codebase di produzione, mirando a colmare il divario tra design e sviluppo e a ottimizzare i flussi di lavoro aziendali.

2026-05-12 📰 Fonte
Paymentology ottiene 175 milioni di dollari per espandere i servizi di elaborazione pagamenti e l'AI
📁 Market AI generated ℹ️ Tech.eu

Paymentology ottiene 175 milioni di dollari per espandere i servizi di elaborazione pagamenti e l'AI

Paymentology, piattaforma globale di elaborazione per emittenti di carte, ha ottenuto un investimento di 175 milioni di dollari da Apis Partners e Aspirity Partners. L'azienda mira a modernizzare i sistemi di pagamento per banche e fintech, offrendo una piattaforma multi-cloud in tempo reale. I fondi supporteranno l'espansione internazionale, lo sviluppo di prodotti e l'ingresso in nuove aree come la finanza basata sull'AI e l'infrastruttura per stablecoin.

2026-05-12 📰 Fonte
La prossima query AI: dove l'energia è più accessibile
📁 Altro AI generated 🏆 IEEE Spectrum

La prossima query AI: dove l'energia è più accessibile

L'industria dell'intelligenza artificiale sta esplorando nuove strategie per gestire il crescente fabbisogno energetico dei data center. Nvidia e i suoi partner stanno sviluppando un progetto pilota per micro data center distribuiti, posizionati strategicamente vicino alle sottostazioni elettriche. L'obiettivo è ottimizzare l'utilizzo dell'energia disponibile e migliorare la flessibilità operativa, spostando i carichi di lavoro di inference in base alla disponibilità della rete, un approccio cruciale per i deployment on-premise e ibridi.

2026-05-12 📰 Fonte
Attacco supply chain: pacchetti Mistral AI e TanStack compromettono credenziali
📁 Altro AI generated ℹ️ Tom's Hardware

Attacco supply chain: pacchetti Mistral AI e TanStack compromettono credenziali

Una recente campagna di attacchi alla supply chain, denominata 'mini Shai Hulud', ha colpito gli ecosistemi di sviluppo npm e AI. Pacchetti compromessi di Mistral AI e TanStack potrebbero aver esposto credenziali sensibili di GitHub, ambienti cloud e sistemi CI/CD. L'incidente evidenzia i rischi crescenti per la sicurezza delle pipeline di sviluppo e l'importanza di pratiche robuste per la protezione dei dati e la sovranità, specialmente in contesti di deployment on-premise e ibridi.

2026-05-12 📰 Fonte
LLM on-premise: ottimizzare i consumi GPU senza intaccare le performance
📁 Altro AI generated ℹ️ LocalLLaMA

LLM on-premise: ottimizzare i consumi GPU senza intaccare le performance

Un caso studio su Reddit dimostra come sia possibile ridurre il consumo energetico di una GPU RTX 4090 fino al 40% del suo limite massimo durante l'Inference di LLM con `llama.cpp`, senza sacrificare le performance. Questa ottimizzazione, ottenuta tramite la limitazione del power limit, offre vantaggi significativi in termini di TCO, gestione termica e longevità dell'hardware per i deployment self-hosted.

2026-05-12 📰 Fonte
SoftBank punta a batterie proprie per i data center AI: produzione su scala GWh entro il 2028
📁 Altro AI generated ℹ️ Tom's Hardware

SoftBank punta a batterie proprie per i data center AI: produzione su scala GWh entro il 2028

SoftBank ha annunciato l'intenzione di produrre batterie proprietarie basate su tecnicia ad acqua per alimentare i propri data center dedicati all'intelligenza artificiale. L'obiettivo è raggiungere una capacità di produzione su scala gigawatt-ora entro il 2028, una mossa strategica per gestire l'elevato consumo energetico delle infrastrutture AI e rafforzare l'autonomia energetica.

2026-05-12 📰 Fonte
Gemma 4 E4B: un alleato rapido per trascrizioni brevi e multilingue in contesti locali
📁 LLM AI generated ℹ️ LocalLLaMA

Gemma 4 E4B: un alleato rapido per trascrizioni brevi e multilingue in contesti locali

Il modello Gemma 4 E4B si distingue per l'efficienza e l'affidabilità nella trascrizione di brevi frammenti audio, anche in lingue diverse dall'inglese. Sebbene non sia la soluzione ideale per contenuti di lunga durata, dove strumenti come Whisper mantengono il primato, la sua rapidità lo rende un'opzione interessante per carichi di lavoro specifici che richiedono bassa latenza e potenziali deployment on-premise, offrendo un equilibrio tra prestazioni e requisiti computazionali.

2026-05-12 📰 Fonte
L'AI genera zero-day: Google rileva minacce che aggirano la 2FA e ridefiniscono il cybercrime
📁 Altro AI generated ℹ️ Tom's Hardware

L'AI genera zero-day: Google rileva minacce che aggirano la 2FA e ridefiniscono il cybercrime

Google ha identificato una vulnerabilità zero-day sviluppata da intelligenza artificiale, capace di aggirare l'autenticazione a due fattori. Questa scoperta, insieme all'emergere di malware auto-modificanti e backdoor basate su Gemini, segna l'inizio di una nuova era nel cybercrime. L'automazione avanzata, come i robot che producono altri robot, evidenzia la crescente complessità delle infrastrutture che necessitano di protezione contro queste minacce evolute.

2026-05-12 📰 Fonte
Ilya Sutskever rivela una quota da 7 miliardi di dollari in OpenAI
📁 Market AI generated ℹ️ The Next Web

Ilya Sutskever rivela una quota da 7 miliardi di dollari in OpenAI

Ilya Sutskever, ex capo scienziato di OpenAI e ora alla guida di Safe Superintelligence Inc., ha dichiarato sotto giuramento di possedere una quota di 7 miliardi di dollari in OpenAI. Questa rivelazione, avvenuta durante la causa legale tra Musk e OpenAI, lo colloca tra i maggiori azionisti individuali dell'azienda, evidenziando le dinamiche finanziarie e di leadership nel settore degli LLM.

2026-05-12 📰 Fonte
L'export cinese vola a ritmi record: i beni legati all'AI trainano la crescita
📁 Market AI generated ℹ️ The Next Web

L'export cinese vola a ritmi record: i beni legati all'AI trainano la crescita

Le esportazioni cinesi hanno raggiunto un valore di circa 500 milioni di dollari all'ora, un dato record trainato in larga parte dai beni legati all'intelligenza artificiale. Secondo i calcoli di Bloomberg, questi prodotti contribuiscono per circa la metà alla crescita annuale, portando il totale delle esportazioni di aprile a 359,4 miliardi di dollari, con un aumento del 14,1% rispetto all'anno precedente.

2026-05-12 📰 Fonte
Loongson: le CPU e GPU cinesi puntano a eguagliare Intel 12th Gen e AMD RX 550 entro il 2027
📁 Hardware AI generated ℹ️ Tom's Hardware

Loongson: le CPU e GPU cinesi puntano a eguagliare Intel 12th Gen e AMD RX 550 entro il 2027

I chip cinesi di prossima generazione Loongson 3B6600 (CPU) e 9A1000 (GPU) mirano a raggiungere le prestazioni di Intel 12th Gen e AMD RX 550 entro il 2027. Questo sviluppo evidenzia l'ambizione della Cina di rafforzare la propria autonomia tecnicica nel settore dei semiconduttori, con implicazioni per la sovranità dei dati e le strategie di deployment on-premise.

2026-05-12 📰 Fonte
Sovranità dei dati e LLM in sanità: Tandem Health e il vantaggio europeo
📁 Altro AI generated ℹ️ Tech.eu

Sovranità dei dati e LLM in sanità: Tandem Health e il vantaggio europeo

Il CEO della startup svedese Tandem Health, Lukas Saari, evidenzia le difficoltà per i competitor statunitensi nel mercato europeo, spinto dalla crescente preferenza per fornitori locali, specialmente nel settore sanitario. Tandem, che impiega Large Language Models per un co-pilota AI clinico, capitalizza su questa tendenza, rafforzando la sua posizione come attore chiave in un contesto dove la sovranità dei dati e la compliance sono priorità assolute per le istituzioni europee.

2026-05-12 📰 Fonte
L'onda dell'AI infrastrutturale: Taiwan al centro della filiera globale
📁 Market AI generated ✅ DigiTimes

L'onda dell'AI infrastrutturale: Taiwan al centro della filiera globale

L'industria taiwanese sta capitalizzando l'esplosione della domanda di infrastrutture per l'intelligenza artificiale, dai substrati ai server. Questo fenomeno evidenzia la crescente necessità di componenti hardware robusti per supportare i carichi di lavoro degli LLM, con implicazioni significative per le aziende che valutano deployment on-premise e la sovranità dei dati.

2026-05-12 📰 Fonte
Negoziati USA-Cina: l'AI al centro delle tensioni su terre rare e dazi
📁 Market AI generated ✅ DigiTimes

Negoziati USA-Cina: l'AI al centro delle tensioni su terre rare e dazi

I recenti negoziati commerciali tra Stati Uniti e Cina mettono in evidenza la crescente interconnessione tra geopolitica e tecnicia. Le discussioni vertono su terre rare, dazi e, in particolare, sul futuro dell'intelligenza artificiale. Questi fattori influenzano direttamente la catena di approvvigionamento e i costi dell'hardware AI, con significative implicazioni per le strategie di deployment on-premise e la sovranità tecnicica delle aziende.

2026-05-12 📰 Fonte
BTL Group intensifica i test sui server AI: la domanda on-premise spinge le consegne
📁 Market AI generated ✅ DigiTimes

BTL Group intensifica i test sui server AI: la domanda on-premise spinge le consegne

BTL Group sta accelerando i test sui propri server dedicati all'intelligenza artificiale, in risposta a un volume di ordini che si estende fino a settembre. Questa attività evidenzia la crescente domanda di infrastrutture AI robuste e self-hosted, con aziende che cercano soluzioni on-premise per gestire carichi di lavoro complessi e garantire la sovranità dei dati.

2026-05-12 📰 Fonte
Ventory raccoglie 2,65 milioni di euro per espandere AI e integrazioni ERP
📁 Market AI generated ℹ️ Tech.eu

Ventory raccoglie 2,65 milioni di euro per espandere AI e integrazioni ERP

Ventory, piattaforma di gestione dell'inventario che connette i sistemi ERP aziendali con le operazioni sul campo, ha chiuso un round di finanziamento da 2,65 milioni di euro. L'investimento, guidato da KBC Securities, supporterà l'espansione della roadmap di prodotto AI, l'integrazione con nuovi ERP e l'espansione geografica in Europa occidentale, consolidando la sua offerta per la gestione in tempo reale dell'inventario in settori critici.

2026-05-12 📰 Fonte
L'UE punta alla verifica dell'età sui social media per la protezione dei minori
📁 Altro AI generated ℹ️ The Next Web

L'UE punta alla verifica dell'età sui social media per la protezione dei minori

La Presidente della Commissione Europea, Ursula von der Leyen, ha annunciato l'intenzione di estendere le protezioni online per i minori, proponendo regole a livello di blocco per l'età minima sui social media. Un'applicazione UE per la verifica dell'età è tecnicamente pronta, mentre alcuni Stati membri come Francia e Spagna hanno già avviato iniziative nazionali. Questo solleva questioni importanti sulla sovranità dei dati e l'implementazione di soluzioni conformi.

2026-05-12 📰 Fonte
Haiku OS: Il supporto ARM64 SMP debutta, aprendo nuove prospettive
📁 Altro AI generated ✅ Phoronix

Haiku OS: Il supporto ARM64 SMP debutta, aprendo nuove prospettive

Il sistema operativo open source Haiku, erede spirituale di BeOS, ha raggiunto un traguardo significativo con l'introduzione del supporto SMP multi-core per architetture ARM64. Questa funzionalità, già operativa in ambienti virtualizzati, segna un passo avanti per l'OS, affiancandosi a una serie di altri miglioramenti implementati nel corso di aprile. L'avanzamento apre scenari interessanti per il deployment su hardware diversificato, inclusi potenziali ambienti on-premise.

2026-05-12 📰 Fonte
Jensen Huang di Nvidia assente dalla delegazione USA in Cina
📁 Market AI generated ℹ️ The Next Web

Jensen Huang di Nvidia assente dalla delegazione USA in Cina

Jensen Huang, CEO di Nvidia, non parteciperà alla delegazione commerciale statunitense in Cina guidata dal Presidente Trump. La missione, che vedrà la presenza di figure come Tim Cook di Apple ed Elon Musk di Tesla, si concentrerà su settori quali agricoltura, manifattura e aviazione. L'assenza di Huang, riportata da Reuters, si inserisce nel complesso scenario delle relazioni geopolitiche e commerciali che modellano il settore tecnicico globale.

2026-05-12 📰 Fonte
SK Hynix rafforza la catena di fornitura AI con un'acquisizione strategica in Silicon Valley
📁 Market AI generated ✅ DigiTimes

SK Hynix rafforza la catena di fornitura AI con un'acquisizione strategica in Silicon Valley

SK Hynix avrebbe acquisito una proprietà nella Silicon Valley, una mossa che sottolinea la crescente importanza della memoria ad alte prestazioni per l'intelligenza artificiale. L'operazione mira a consolidare la catena di fornitura di componenti cruciali, come le memorie HBM, essenziali per i carichi di lavoro di Large Language Models e per i deployment on-premise, influenzando la disponibilità e il TCO dell'hardware AI.

2026-05-12 📰 Fonte
Prosus punta a 3,6 miliardi di dollari da Just Eat Takeaway
📁 Market AI generated ℹ️ The Next Web

Prosus punta a 3,6 miliardi di dollari da Just Eat Takeaway

Prosus, l'investitore controllato da Napers, ha annunciato un obiettivo di ricavi annuali di 3,6 miliardi di dollari per Just Eat Takeaway. L'azienda europea di food delivery, acquisita per 4,1 miliardi di euro lo scorso anno, è stata oggetto di un processo di integrazione durato nove mesi. Questo traguardo commerciale definisce le aspettative a breve termine per l'asset strategico.

2026-05-12 📰 Fonte
Netflix sotto accusa in Texas: raccolta dati senza consenso e design 'addictivo'
📁 Altro AI generated ℹ️ The Next Web

Netflix sotto accusa in Texas: raccolta dati senza consenso e design 'addictivo'

Il procuratore generale del Texas, Ken Paxton, ha avviato un'azione legale contro Netflix, accusando la piattaforma di streaming di raccogliere dati utente senza consenso e di utilizzare il design 'addictivo' dell'autoplay, specialmente per i bambini. Netflix ha respinto le accuse, definendole prive di fondamento. La vicenda solleva questioni cruciali sulla sovranità dei dati e il controllo delle informazioni personali, temi centrali per le decisioni di deployment tecnicico.

2026-05-12 📰 Fonte
Holmes raccoglie 1,1 milioni di euro per il testing software autonomo nell'era AI
📁 Market AI generated ℹ️ Tech.eu

Holmes raccoglie 1,1 milioni di euro per il testing software autonomo nell'era AI

Holmes, startup con sede a Gand, ha ottenuto un finanziamento pre-seed di 1,1 milioni di euro per la sua piattaforma di Quality Assurance autonoma. L'azienda mira a risolvere il collo di bottiglia del testing software, sempre più evidente con l'accelerazione dello sviluppo tramite strumenti AI. La piattaforma apprende il funzionamento dei prodotti e le interazioni utente, generando e aggiornando automaticamente i test per garantire la qualità continua.

2026-05-12 📰 Fonte
Ditto ottiene 7,6 milioni di euro per riassunti AI di visite mediche
📁 Altro AI generated ℹ️ The Next Web

Ditto ottiene 7,6 milioni di euro per riassunti AI di visite mediche

Ditto, una startup olandese nel settore health-tech, ha annunciato una raccolta fondi di 7,6 milioni di euro. L'azienda sviluppa soluzioni basate sull'intelligenza artificiale per generare riassunti delle visite mediche destinati ai pazienti. Il capitale, guidato da Heal Capital, supporterà l'espansione in mercati chiave come Germania, Regno Unito e Spagna. Questo tipo di applicazione AI nel settore sanitario solleva importanti questioni riguardo la sovranità dei dati e le scelte di deployment.

2026-05-12 📰 Fonte
Applied Materials e TSMC: una partnership strategica per i chip AI
📁 Hardware AI generated ✅ DigiTimes

Applied Materials e TSMC: una partnership strategica per i chip AI

Applied Materials e TSMC hanno annunciato una collaborazione presso l'EPIC Center per accelerare lo sviluppo di chip dedicati all'intelligenza artificiale. Questa iniziativa mira a ottimizzare i processi produttivi e le tecnicie di base, con implicazioni significative per l'efficienza e la disponibilità dell'hardware AI, cruciale per le aziende che valutano deployment on-premise e la gestione della sovranità dei dati.

2026-05-12 📰 Fonte
Disputa in Samsung: impatto sulla supply chain globale e le implicazioni per l'AI
📁 Market AI generated ✅ DigiTimes

Disputa in Samsung: impatto sulla supply chain globale e le implicazioni per l'AI

Una disputa di lavoro in Samsung Electronics, gigante della tecnicia e fornitore chiave di componenti, sta generando incertezze nella supply chain globale. Questo scenario solleva interrogativi significativi per le aziende che pianificano o gestiscono deployment on-premise di Large Language Models, influenzando la disponibilità e i costi dell'hardware essenziale per l'infrastruttura AI.

2026-05-12 📰 Fonte
Pillar raccoglie 12 milioni di euro per un OS basato sull'AI per l'edilizia
📁 Market AI generated ℹ️ Tech.eu

Pillar raccoglie 12 milioni di euro per un OS basato sull'AI per l'edilizia

La startup italiana Pillar ha ottenuto un finanziamento seed di 12 milioni di euro, portando il capitale totale a 15,2 milioni in meno di otto mesi dal lancio pubblico. L'azienda sviluppa una piattaforma software basata sull'intelligenza artificiale per modernizzare le operazioni e la gestione finanziaria nel settore edile, automatizzando processi amministrativi e fornendo visibilità in tempo reale. Il nuovo capitale servirà a consolidare la posizione in Italia e a espandersi a livello internazionale.

2026-05-12 📰 Fonte
Paymentology raccoglie 175 milioni di dollari per l'elaborazione dei pagamenti
📁 Market AI generated ℹ️ The Next Web

Paymentology raccoglie 175 milioni di dollari per l'elaborazione dei pagamenti

Paymentology, un'azienda londinese specializzata nell'elaborazione globale di pagamenti per emittenti, ha annunciato un significativo round di finanziamento da 175 milioni di dollari. L'operazione è stata co-guidata da Apis Partners, attraverso il suo Apis Growth Fund III, e da Aspirity Partners, una società di private equity pan-europea con un focus sulla tecnicia finanziaria. Questo investimento sottolinea la continua fiducia del mercato nel potenziale di crescita e innovazione nel settore dei pagamenti digitali.

2026-05-12 📰 Fonte
White Circle raccoglie 11 milioni di dollari per il controllo dell'AI in produzione
📁 Altro AI generated ℹ️ The Next Web

White Circle raccoglie 11 milioni di dollari per il controllo dell'AI in produzione

White Circle ha chiuso un round Seed da 11 milioni di dollari per la sua piattaforma di monitoraggio, sicurezza e controllo dei modelli AI in produzione. Il supporto di figure chiave del settore e una base clienti che include grandi banche digitali evidenziano la crescente domanda di soluzioni per la gestione dell'intelligenza artificiale in ambienti enterprise.

2026-05-12 📰 Fonte
Adfin raccoglie 18 milioni di dollari per la sua piattaforma finanziaria "agentic"
📁 Market AI generated ℹ️ The Next Web

Adfin raccoglie 18 milioni di dollari per la sua piattaforma finanziaria "agentic"

La fintech londinese Adfin ha chiuso un round di Serie A da 18 milioni di dollari, guidato da Index Ventures, portando il finanziamento totale oltre i 30 milioni. L'azienda sviluppa una piattaforma "agentic" per la gestione dei flussi di denaro, che ha già dimostrato di ridurre significativamente i ritardi nei pagamenti per le PMI. Il successo evidenzia la crescente fiducia nelle soluzioni AI-driven per il settore finanziario.

2026-05-12 📰 Fonte
Happl ottiene 11 milioni di dollari per espandere la sua piattaforma AI-native di benefit
📁 Market AI generated ℹ️ The Next Web

Happl ottiene 11 milioni di dollari per espandere la sua piattaforma AI-native di benefit

Happl, fornitore di soluzioni AI-native per la gestione dei benefit aziendali, ha raccolto 11 milioni di dollari in un round di Serie A. L'investimento, guidato da Portage Ventures, mira ad accelerare lo sviluppo e la scalabilità della piattaforma per le aziende multinazionali. L'architettura AI-native solleva considerazioni cruciali sulla sovranità dei dati, la compliance e il TCO per le decisioni di deployment on-premise o cloud.

2026-05-12 📰 Fonte
Nscale ottiene 790 milioni di dollari per il data center AI di Narvik
📁 Altro AI generated ℹ️ The Next Web

Nscale ottiene 790 milioni di dollari per il data center AI di Narvik

Nscale, azienda specializzata in infrastrutture AI, ha ottenuto un finanziamento di 790 milioni di dollari per proseguire la costruzione del suo data center dedicato all'intelligenza artificiale a Narvik, nel nord della Norvegia. L'operazione sottolinea l'importanza degli investimenti in infrastrutture fisiche per supportare carichi di lavoro AI, un aspetto cruciale per le aziende che valutano deployment on-premise e la sovranità dei dati.

2026-05-12 📰 Fonte
Ditto raccoglie 7,6 milioni di euro per l'espansione europea e l'AI nella sanità
📁 Altro AI generated ℹ️ Tech.eu

Ditto raccoglie 7,6 milioni di euro per l'espansione europea e l'AI nella sanità

La startup olandese Ditto ha ottenuto 7,6 milioni di euro in un round di finanziamento guidato da Heal Capital. I fondi supporteranno l'espansione europea e lo sviluppo della sua piattaforma di comunicazione per pazienti basata su AI. L'applicazione, che genera riassunti di consultazioni mediche e non archivia i dati centralmente, mira a migliorare la comprensione dei pazienti e alleggerire il carico amministrativo degli operatori sanitari.

2026-05-12 📰 Fonte
Crescita dei server AI a Taiwan: un ecosistema in espansione
📁 Market AI generated ✅ DigiTimes

Crescita dei server AI a Taiwan: un ecosistema in espansione

Il mercato dei server AI a Taiwan sta vivendo una fase di espansione significativa, con benefici che si estendono oltre il ruolo consolidato di TSMC. Questa diversificazione indica una maturazione della supply chain locale, offrendo nuove opportunità per le aziende che cercano soluzioni hardware robuste per carichi di lavoro di intelligenza artificiale, inclusi i deployment on-premise, e sollevando considerazioni cruciali su TCO e sovranità dei dati.

2026-05-12 📰 Fonte
Regulate raccoglie 1,4 milioni di euro per il breathwork nelle aziende
📁 Market AI generated ℹ️ Tech.eu

Regulate raccoglie 1,4 milioni di euro per il breathwork nelle aziende

Regulate, una piattaforma di breathwork per il benessere aziendale, ha concluso un round di finanziamento Seed da 1,4 milioni di euro. L'investimento, guidato da 4impact.vc e sostenuto da angel investor di spicco, mira a espandere l'offerta di sessioni scientificamente validate e personalizzate. La piattaforma, che integra dati da dispositivi indossabili e sistemi di gestione del lavoro, aiuta i professionisti a migliorare concentrazione e resilienza, rispondendo alle crescenti pressioni del mondo lavorativo moderno.

2026-05-12 📰 Fonte
Tolemy Bio si assicura 1,4 milioni per l'AI nella biologia cellulare
📁 Market AI generated ℹ️ Tech.eu

Tolemy Bio si assicura 1,4 milioni per l'AI nella biologia cellulare

La startup biotech Tolemy Bio ha raccolto 1,4 milioni di euro in un round di finanziamento pre-seed. L'obiettivo è avanzare nello sviluppo di Orbit, una piattaforma basata sull'intelligenza artificiale progettata per risolvere la frammentazione dei dati nella ricerca biologica e nello sviluppo biofarmaceutico. Il sistema mira a unificare i workflow sperimentali, integrando strumenti di laboratorio e modelli cellulari virtuali per ottimizzare la comprensione e l'applicazione delle cellule viventi.

2026-05-12 📰 Fonte
Adfin raccoglie 18 milioni di dollari per espandere la sua piattaforma AI di gestione finanziaria
📁 Market AI generated ℹ️ Tech.eu

Adfin raccoglie 18 milioni di dollari per espandere la sua piattaforma AI di gestione finanziaria

La fintech londinese Adfin ha chiuso un round di finanziamento Series A da 18 milioni di dollari, portando il capitale totale raccolto a oltre 30 milioni. L'investimento, guidato da Index Ventures, supporterà l'espansione della sua piattaforma basata su AI. Questa soluzione mira ad automatizzare la gestione dei pagamenti e del flusso di cassa per le aziende, migliorando l'efficienza operativa e la visibilità finanziaria, in particolare per le PMI che affrontano ritardi nei pagamenti.

2026-05-12 📰 Fonte
VSO Electronics: la crescita passa dai cavi per l'infrastruttura AI e nuove linee produttive
📁 Hardware AI generated ✅ DigiTimes

VSO Electronics: la crescita passa dai cavi per l'infrastruttura AI e nuove linee produttive

VSO Electronics punta a una crescita significativa, trainata dalla crescente domanda di cavi specifici per l'infrastruttura AI. L'azienda prevede inoltre di attivare una nuova linea interna per il rilevamento delle perdite entro la fine del 2026, consolidando le proprie capacità produttive e di controllo qualità in un mercato in rapida evoluzione.

2026-05-12 📰 Fonte
Ottimizzare la velocità di elaborazione dei prompt per LLM on-premise: il ruolo del micro-batching
📁 Altro AI generated ℹ️ LocalLLaMA

Ottimizzare la velocità di elaborazione dei prompt per LLM on-premise: il ruolo del micro-batching

Una recente analisi su `llama.cpp` ha rivelato come l'aumento del micro-batch size (`ubatch`) possa migliorare drasticamente la velocità di prefill dei prompt per Large Language Models parzialmente offloadati su GPU consumer come la RTX 3090. Questo approccio, sebbene comporti un leggero calo nella generazione di token e un maggiore offloading su CPU, offre un notevole incremento del throughput, evidenziando trade-off cruciali per i deployment on-premise.

2026-05-12 📰 Fonte
Thinking Machines: un nuovo paradigma per l'interazione con gli LLM
📁 LLM AI generated ✅ TechCrunch AI

Thinking Machines: un nuovo paradigma per l'interazione con gli LLM

Thinking Machines sta esplorando un approccio innovativo per i Large Language Models, mirando a superare l'attuale modalità sequenziale di interazione. L'obiettivo è sviluppare un modello capace di elaborare l'input dell'utente e generare una risposta simultaneamente, emulando la fluidità di una conversazione telefonica. Questa evoluzione potrebbe ridefinire le aspettative di latenza e reattività nei sistemi AI.

2026-05-12 📰 Fonte
Rilevare le Allucinazioni nei LLM: Un Nuovo Approccio al Ragionamento a Pipeline
📁 LLM AI generated 🏆 ArXiv cs.CL

Rilevare le Allucinazioni nei LLM: Un Nuovo Approccio al Ragionamento a Pipeline

Un nuovo studio esplora l'efficacia dei metodi di rilevamento delle allucinazioni nei Large Language Models (LLM), specialmente per il ragionamento a catena. La ricerca evidenzia come tali metodi possano essere ingannati da correlati superficiali, anziché valutare il ragionamento effettivo. Attraverso una metodologia di invarianza controllata, gli autori dimostrano che un rilevamento robusto non richiede necessariamente rappresentazioni complesse. Uno scorer leggero, TRACT, basato su caratteristiche lessicali, si rivela competitivo, suggerendo che la sfida principale sia isolare il segnale di ragionamento dai segnali di superficie.

2026-05-12 📰 Fonte
La domanda energetica dell'AI e la resilienza della rete: le priorità di Taipower
📁 Altro AI generated ✅ DigiTimes

La domanda energetica dell'AI e la resilienza della rete: le priorità di Taipower

Il nuovo presidente di Taipower ha posto l'accento sulla crescente domanda di energia generata dall'intelligenza artificiale e sulla necessità di rafforzare la resilienza della rete elettrica. Questa focalizzazione evidenzia le sfide infrastrutturali che le utilities devono affrontare per supportare l'espansione dei carichi di lavoro AI, sia in contesti cloud che on-premise, sottolineando l'importanza di una fornitura energetica stabile e affidabile.

2026-05-12 📰 Fonte
Tempi di Consegna dei Componenti: L'Impatto sulla Crescita di Viking AI
📁 Market AI generated ✅ DigiTimes

Tempi di Consegna dei Componenti: L'Impatto sulla Crescita di Viking AI

Viking AI registra un aumento del 12% nei ricavi, ma l'industria affronta sfide significative. I tempi di consegna per i resistori si sono estesi a 15 settimane, evidenziando le crescenti pressioni sulla catena di approvvigionamento di componenti elettronici. Questa situazione può influenzare la disponibilità di hardware essenziale per i deployment on-premise di soluzioni AI, un aspetto cruciale per le aziende che puntano alla sovranità dei dati e al controllo infrastrutturale.

2026-05-12 📰 Fonte
← Precedente Page 28 / 119 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge