AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes

🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.

👥 160+ membri · Iscriviti gratis →

📡

Il Segnale del Giorno

Quantization statisticamente lossless: il trade-off che cambia le regole dell’on-premise

Un nuovo paper introduce la quantization “statisticamente senza perdita” (SLQ), che garantisce la qualità dell’output in termini probabilistici senza ...

📡 Segnale AI 2026-07-25

⚡ In Tendenza

View All →

📊 Statistiche

Archivio Totale

Articoli indicizzati nel sistema RAG

Categorie

📡 RSS Feed

🛠️ Guide & Osservatorio On-Premise

🚀 Esegui i modelli in locale → Tutte le guide →

Riferimenti evergreen e pratici per far girare l'AI in locale — hardware, costi, privacy e stack completo.

🖥️ Osservatorio LLM On-Premise Hardware, stack, governance e architetture di riferimento per l'AI in locale. →

⚡ Le migliori GPU per LLM locali 💰 Quanto costa un LLM in locale 🧩 Ollama vs LM Studio 🔒 ChatGPT privato per aziende 📉 Quantizzazione LLM spiegata 📊 Quanta VRAM per Llama 70B 🚀 Esegui i modelli in locale (Qwen, Llama, R1…)

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

📁 Altro AI generated ✅ TechCrunch AI

Stability AI lancia un modello audio per brani lunghi, con variante on-device

Stability AI ha presentato Stability Audio 3.0, un nuovo modello per la generazione di musica che promette la creazione di brani fino a sei minuti. Una versione "small" del modello è stata progettata per funzionare direttamente su dispositivi, offrendo la capacità di generare tracce audio di due minuti. Questa innovazione apre nuove prospettive per l'elaborazione audio locale e l'integrazione in applicazioni edge, rispondendo alle esigenze di sovranità dei dati e controllo.

2026-05-20 📰 Fonte

📁 Market AI generated ✅ TechCrunch AI

L'ascesa silenziosa della ricerca AI: un nuovo fronte nel consumer tech

La ricerca basata su intelligenza artificiale sta emergendo come uno dei settori più dinamici e promettenti nel panorama dell'AI consumer. Nonostante una crescita inizialmente discreta, le startup che operano in questo ambito stanno attirando un'attenzione significativa, evidenziando il potenziale trasformativo di questa tecnicia per migliorare l'interazione degli utenti con le informazioni e sollevando importanti questioni infrastrutturali e di deployment.

2026-05-20 📰 Fonte

📁 LLM AI generated ℹ️ The Next Web

Figma introduce un assistente AI nativo per la progettazione collaborativa

Figma lancia il proprio assistente AI integrato direttamente nella tela di progettazione collaborativa. Questo agente permette agli utenti di generare, modificare e iterare sui design tramite prompt in linguaggio naturale, consolidando l'impegno dell'azienda nell'intelligenza artificiale dopo acquisizioni e partnership strategiche con attori come Anthropic e OpenAI. La mossa evidenzia la crescente integrazione degli LLM nei workflow creativi.

2026-05-20 📰 Fonte

📁 Hardware AI generated ℹ️ LocalLLaMA

AMD Ryzen AI Halo PC: 128GB di memoria per l'AI locale a 3999 dollari

AMD si prepara a lanciare il suo Ryzen AI Halo PC, un sistema desktop con 128GB di memoria di sistema e un prezzo di 3999 dollari. Questa configurazione mira a supportare carichi di lavoro AI e LLM in locale, offrendo una soluzione per le aziende che cercano maggiore controllo sui dati e latenza ridotta rispetto alle opzioni cloud.

2026-05-20 📰 Fonte

📁 Market AI generated ✅ MIT Technology Review

Musk contro OpenAI: la sentenza sul futuro del colosso dell'IA

Elon Musk ha perso la causa contro OpenAI, in cui accusava Sam Altman e Greg Brockman di averlo ingannato sullo status non-profit dell'azienda. La sentenza solleva interrogativi sulle dinamiche interne e la direzione futura di uno dei principali attori nel panorama dell'intelligenza artificiale. Un'analisi approfondita delle implicazioni è stata offerta da Michelle Kim e Mat Honan.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Il 'capability overhang' frena l'adozione AI in Europa: la sfida delle aziende

Le aziende europee faticano a estrarre valore dai modelli AI in rapida evoluzione, creando un "capability overhang". OpenAI risponde con una nuova business unit e l'acquisizione di Tomoro, integrando ingegneri direttamente presso i clienti per facilitare l'adozione e massimizzare la produttività dei propri LLM.

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

La Francia punta a una gigafactory AI europea con una proposta da 10 miliardi di dollari

Un consorzio di aziende francesi, guidato da Scaleway di Iliad, ha presentato una proposta da circa 10 miliardi di dollari per ospitare una delle cinque 'AI gigafactory' previste dall'Unione Europea. Il consorzio AION, che include partner come Hugging Face e SiPearl, mira a posizionare la Francia come polo centrale per l'infrastruttura AI, competendo con le candidature multi-stato di Spagna, Germania e Paesi Bassi per un'iniziativa strategica per la sovranità digitale europea.

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

GitHub: migliaia di repository interni violati tramite estensione VS Code compromessa

GitHub ha confermato una significativa violazione di sicurezza che ha portato all'esfiltrazione di circa 3.800 repository di codice interni. L'attacco è avvenuto compromettendo il dispositivo di un dipendente tramite un'estensione malevola per Visual Studio Code. L'incidente sottolinea le crescenti sfide nella sicurezza della supply chain software e l'importanza di proteggere gli ambienti di sviluppo, un aspetto cruciale per le organizzazioni che gestiscono carichi di lavoro AI e LLM, specialmente in contesti self-hosted dove la sovranità dei dati è prioritaria.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ Tom's Hardware

Sberbank e la ricerca di chip cinesi per GigaChat: le sfide delle sanzioni

Sberbank, la principale banca russa, sta cercando di procurarsi chip cinesi per alimentare il suo Large Language Model GigaChat. Questa mossa è una diretta conseguenza delle sanzioni occidentali, che hanno limitato l'accesso a tecnicie cruciali. La banca si trova però ad affrontare una lunga attesa, dovendo competere con giganti tecnicici cinesi come ByteDance e Alibaba per l'approvvigionamento di hardware.

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ Tech.eu

Quantum Bridge Technologies ottiene 8 milioni di dollari per la cybersecurity quantum-safe

Quantum Bridge Technologies ha chiuso un round di finanziamento Series A da 8 milioni di dollari, guidato da Primo Capital SGR. L'obiettivo è accelerare la transizione globale verso infrastrutture di cybersecurity resilienti ai computer quantistici. La società, fondata nel 2019, offre un protocollo brevettato per la gestione decentralizzata delle chiavi, garantendo sicurezza e scalabilità senza interruzioni per le infrastrutture esistenti.

2026-05-20 📰 Fonte

📁 Altro AI generated ✅ Phoronix

Red Hat: RHEL 10.2 introduce l'assistenza AI per la riga di comando

Red Hat ha annunciato il rilascio di Red Hat Enterprise Linux 10.2, che introduce una nuova funzionalità di assistenza basata su intelligenza artificiale direttamente nella riga di comando. Questa novità mira a semplificare la gestione del sistema per amministratori e sviluppatori, offrendo supporto contestuale. Parallelamente, è stata rilasciata anche la versione RHEL 9.8. L'integrazione di capacità AI a livello di sistema operativo sottolinea la crescente importanza di strumenti intelligenti per l'ottimizzazione delle operazioni infrastrutturali, specialmente in contesti on-premise.

2026-05-20 📰 Fonte

📁 Market AI generated ✅ TechCrunch AI

NanoCo: 12 milioni di seed funding per NanoClaw, rifiutata un'offerta da 20M

NanoCo, l'azienda dietro NanoClaw, un'alternativa emergente a OpenClaw, ha completato un round di finanziamento seed da 12 milioni di dollari. Questo avviene dopo un lancio di successo e la decisione strategica di rifiutare una precedente offerta di acquisizione da 20 milioni di dollari, sottolineando la fiducia dell'azienda nel proprio prodotto e nella strategia di crescita indipendente nel dinamico mercato delle soluzioni AI.

2026-05-20 📰 Fonte

📁 LLM AI generated ℹ️ The Next Web

LLM e voto: i modelli attuali non sono pronti per informare gli elettori

Una recente ricerca evidenzia come LLM di punta come ChatGPT, Claude, Gemini e Grok non siano ancora in grado di fornire risposte affidabili su questioni elettorali cruciali, dalla procedura di voto alla verifica delle informazioni. Questo solleva interrogativi significativi sull'impiego di tali tecnicie in contesti sensibili e sull'importanza di strategie di deployment che garantiscano accuratezza e integrità dei dati.

2026-05-20 📰 Fonte

📁 Altro AI generated ✅ 404 Media

Bandera dice no alla sorveglianza AI: un consigliere propone il "ritorno al 1880"

Il consiglio comunale di Bandera, Texas, ha votato per terminare il contratto con Flock Safety, azienda di sorveglianza basata su telecamere AI per la lettura delle targhe. La decisione, maturata dopo mesi di proteste e atti vandalici, ha visto un consigliere, Jeff Flowers, reagire proponendo un divieto totale di telefoni, internet e tecnicia, in nome di una "Dichiarazione di Indipendenza Digitale" che riporterebbe la città al 1880 per garantire la privacy. Il caso evidenzia le tensioni tra tecnicia e sovranità dei dati locali.

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ Tech.eu

AVIAN raccoglie 2,6 milioni di dollari per l'intelligenza termica industriale 24/7

L'azienda svizzera AVIAN ha chiuso un round pre-seed da 2,6 milioni di dollari, guidato da Founderful, per espandere la sua soluzione di monitoraggio termico continuo basato su AI. Specializzata nella prevenzione di incendi e fermi macchina in impianti industriali ad alto rischio, AVIAN offre un sistema "always-on" che rileva anomalie di calore precoci in componenti critici. Questo approccio innovativo si contrappone ai metodi di ispezione tradizionali, garantendo maggiore sicurezza e riducendo i costi operativi.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

QuberTech raccoglie 3,4 milioni di sterline per la gomma naturale da tarassaco ingegnerizzato

QuberTech, azienda britannica di biotecnicie, ha ottenuto 3,4 milioni di sterline in finanziamenti e investimenti per accelerare lo sviluppo di una piattaforma che produce gomma naturale sostenibile da tarassaco ingegnerizzato. L'iniziativa mira a creare alternative locali e resilienti alle attuali catene di approvvigionamento globali, vulnerabili a fattori climatici e geopolitici, offrendo un approccio innovativo alla produzione di materiali industriali strategici.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Wove: la nuova app che svela PFAS e microplastiche nei tessuti

Lanciata questa settimana, Wove è la prima app mobile progettata per analizzare i capi d'abbigliamento quotidiani, identificando la presenza di PFAS e il potenziale rilascio di microplastiche. L'obiettivo è colmare una lacuna informativa per i consumatori attenti alla salute, estendendo la consapevolezza dai prodotti alimentari e cosmetici anche al settore tessile.

2026-05-20 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

HuggingFace introduce il filtro per dimensione nei benchmark dei modelli

HuggingFace ha implementato una nuova funzionalità nei suoi dataset di benchmark, consentendo agli utenti di filtrare i Large Language Models (LLM) in base alla loro dimensione. Questa aggiunta è particolarmente utile per identificare i modelli più performanti che rientrano in specifici vincoli di parametri, come quelli inferiori a 32 miliardi, facilitando la scelta per deployment on-premise con risorse hardware limitate e ottimizzando il Total Cost of Ownership (TCO).

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

QIZ Security e Google Cloud: la corsa alla crittografia post-quantistica

QIZ Security e Google Cloud uniscono le forze per accelerare la migrazione delle aziende verso la crittografia resistente ai computer quantistici. La collaborazione risponde all'urgente necessità di proteggere i dati sensibili, combinando la piattaforma di gestione della postura crittografica di QIZ con le capacità di Google Cloud per affrontare le future minacce quantistiche.

2026-05-20 📰 Fonte

📁 LLM AI generated ✅ TechCrunch AI

Figma integra un assistente AI nella sua piattaforma di design collaborativo

Figma ha annunciato l'introduzione di un assistente basato sull'intelligenza artificiale per potenziare la sua tela collaborativa. La nuova funzionalità sarà inizialmente disponibile all'interno di Figma Design, promettendo di ottimizzare i flussi di lavoro e l'interazione degli utenti con gli strumenti di progettazione. Questa mossa riflette la crescente tendenza all'integrazione dell'AI nelle piattaforme professionali, mirando a migliorare l'efficienza e la creatività nel processo di sviluppo.

2026-05-20 📰 Fonte

📁 Altro AI generated ✅ Phoronix

Greg KH: Un Appello per Più Sviluppatori Rust nel Kernel Linux

Greg Kroah-Hartman, figura chiave nello sviluppo del kernel Linux, ha lanciato un appello per l'incremento di sviluppatori Rust. L'iniziativa, presentata alla Rust Week, segue la sua esperienza nell'uso di LLM per scovare bug nel kernel. L'adozione di Rust mira a migliorare la sicurezza e la stabilità del sistema operativo, offrendo una base più robusta per i deployment on-premise di intelligenza artificiale, cruciale per la sovranità dei dati e la riduzione del TCO.

2026-05-20 📰 Fonte

📁 Hardware AI generated ℹ️ Tech.eu

Neurosoft Bioelectronics: 7,5 milioni per interfacce cervello-computer minimamente invasive

Neurosoft Bioelectronics ha chiuso un round di finanziamento seed da 7,5 milioni di dollari, portando il totale a oltre 20 milioni. L'azienda svizzera sviluppa interfacce cervello-computer (BCI) minimamente invasive con elettrodi morbidi e scalabili. L'obiettivo è creare una piattaforma di dati neurali per modelli fondamentali della corteccia umana, migliorando le prestazioni delle BCI. I fondi supporteranno l'avanzamento clinico e la commercializzazione negli Stati Uniti.

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Oltre il Cloud: Le Strategie On-Premise Riconquistano la Fiducia nell'AI

L'adozione di Large Language Models (LLM) sta spingendo le aziende a riconsiderare le strategie di deployment. Mentre il cloud ha dominato, un crescente interesse per le soluzioni on-premise emerge, spinto dalla necessità di sovranità dei dati, controllo sui costi operativi (TCO) e requisiti specifici di performance. Questo approccio "self-hosted" sta dimostrando di poter "rompere gli schemi" tradizionali, offrendo un'alternativa concreta per carichi di lavoro AI critici.

2026-05-20 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Gemma 4 MTP su `llama.cpp`: un'integrazione in divenire per LLM on-premise

Un nuovo pull request su `llama.cpp` introduce il supporto sperimentale per Gemma 4 MTP, segnando un passo avanti per il deployment locale di Large Language Models. Sebbene il progetto sia ancora in fase di sviluppo e richieda la compilazione manuale, evidenzia l'impegno della community open source nell'ottimizzare gli LLM per l'esecuzione su infrastrutture self-hosted, offrendo maggiore controllo e sovranità dei dati agli utenti enterprise.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ Tom's Hardware

La Cina blocca la Nvidia 5090D V2: un segnale per l'indipendenza tecnicica nell'AI

Durante la visita del CEO Jensen Huang, la Cina avrebbe vietato la GPU Nvidia 5090D V2. La mossa rientra nella strategia di Pechino per promuovere l'adozione di chip prodotti localmente da parte delle aziende tecniciche nazionali, evidenziando le crescenti tensioni geopolitiche nel settore dell'intelligenza artificiale e le implicazioni per i deployment on-premise.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Skybound VC raccoglie 38 milioni per il Deeptech, puntando su infrastrutture e AI

Skybound Venture Capital ha annunciato il lancio di un fondo da 38 milioni di dollari, sostenuto dal Fondo Europeo per gli Investimenti. Con sede ad Atene, il fondo si concentra su startup deeptech in fase pre-seed e seed, investendo in tecnicie complesse che spaziano dall'infrastruttura all'advanced computing, con l'obiettivo di supportare innovazioni con impatto industriale e sociale a lungo termine.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Prelude: 20 milioni di dollari per l'onboarding digitale e la prevenzione frodi AI

La startup francese Prelude ha raccolto 20 milioni di dollari in un round di finanziamento di Serie A, guidato da 20VC. L'azienda mira a rivoluzionare l'onboarding digitale, affrontando i costi nascosti e le frodi che affliggono le imprese. Sfruttando l'intelligenza artificiale e i dati di telecomunicazione, Prelude offre una piattaforma completa per la verifica e la protezione continua degli utenti, promettendo risparmi e maggiore sicurezza in un panorama digitale sempre più complesso.

2026-05-20 📰 Fonte

📁 Hardware AI generated ℹ️ LocalLLaMA

RTX 5080 16GB e Qwen3.6 35B MoE: l'efficienza a 128k di contesto e il ruolo inatteso di MTP

Un'analisi approfondita delle prestazioni dei Large Language Models Qwen3.6 su una GPU RTX 5080 da 16GB rivela risultati sorprendenti. Il benchmark, focalizzato su scenari di deployment on-premise, evidenzia come il modello 35B MoE raggiunga 56 token/secondo con un contesto di 128k. Contrariamente alle aspettative, la funzionalità Multi-Token Prediction (MTP) di llama.cpp non offre vantaggi significativi in questo scenario, suggerendo ottimizzazioni diverse per massimizzare l'efficienza su hardware locale.

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ Tom's Hardware

Attacco a GitHub: 3.800 repository interni compromessi tramite plugin malevolo

Un gruppo di hacker, TeamPCP, ha compromesso 3.800 repository interni di GitHub. L'attacco è avvenuto attraverso un plugin malevolo per VS Code installato da un dipendente. Il gruppo rivendica il furto di codice sorgente e ha tentato di venderlo per 50.000 dollari, sollevando interrogativi sulla sicurezza della supply chain software e la protezione della proprietà intellettuale.

2026-05-20 📰 Fonte

📁 Hardware AI generated ℹ️ AI News

Alibaba ridefinisce la corsa all'AI con chip e LLM per agenti

Alibaba ha presentato il processore AI Zhenwu M890, una roadmap pluriennale per il silicio e il nuovo LLM Qwen 3.7-Max. Questa mossa strategica mira a costruire uno stack AI integrato, focalizzato sugli AI agenti e sulla sovranità tecnicica, riducendo la dipendenza da fornitori esterni. L'investimento massiccio e l'esperienza di deployment preesistente evidenziano un impegno a lungo termine nel settore.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Google lancia Pics, un generatore di immagini AI per Workspace con editing di precisione

Google ha presentato Pics, un generatore di immagini basato su AI e integrato in Workspace. Alimentato dal modello Nano Banana 2, consente agli utenti di creare immagini da prompt testuali e di manipolare singoli elementi (spostare, ridimensionare, tradurre) senza rigenerare l'intera composizione. Il servizio sarà disponibile per gli abbonati Workspace Business Standard e superiori, oltre che per Google AI Pro e Ultra, posizionandosi come alternativa per l'editing di precisione.

2026-05-20 📰 Fonte

📁 Altro AI generated ✅ Phoronix

Intel llm-scaler-vllm PV 1.4: il nuovo stack Docker per vLLM su Arc Graphics

Intel ha rilasciato la versione 1.4 del suo stack software llm-scaler-vllm PV, disponibile come build Docker. Questa soluzione è progettata per ottimizzare l'esecuzione di vLLM su hardware Intel Arc (Pro) Graphics, offrendo una configurazione performante e pronta all'uso. L'aggiornamento introduce il supporto specifico per le schede Arc Pro B70, mirando a semplificare il deployment di Large Language Models in ambienti locali.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ Tom's Hardware

Sistema di consegna AI di Pizza Hut sotto accusa: tempi dilatati e causa da 100 milioni

Una causa da 100 milioni di dollari è stata intentata contro Pizza Hut da alcuni franchisee, che denunciano un peggioramento significativo dei tempi di consegna a seguito dell'introduzione di un nuovo sistema di gestione basato sull'intelligenza artificiale. Le consegne sarebbero passate da meno di 30 minuti a oltre 45 minuti, sollevando interrogativi sull'affidabilità dei sistemi AI in contesti operativi reali.

2026-05-20 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

AI Fisica: Guida Autonoma e Robotica Accelerano al Tech Forum 2026

Il Tech Forum 2026 ha messo in luce il potenziale trasformativo dell'AI Fisica, destinata ad accelerare significativamente i settori della guida autonoma e della robotica. Gli analisti prevedono un impatto profondo, che richiederà alle aziende di valutare attentamente le strategie di deployment. Questo include l'analisi dei requisiti hardware specifici, l'implementazione di infrastrutture on-premise o ibride e la gestione della sovranità dei dati per carichi di lavoro AI critici.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Meta avvia il taglio del 10% della forza lavoro: prime notifiche dall'Asia

Meta Platforms ha iniziato a notificare migliaia di dipendenti riguardo ai licenziamenti, come riportato da Bloomberg. Le comunicazioni, che rappresentano una riduzione del 10% della forza lavoro, sono partite dall'hub asiatico di Singapore alle 4 del mattino ora locale, per poi estendersi a Europa e Stati Uniti nello stesso giorno. Questa mossa si inserisce in un contesto di riorganizzazione aziendale e ricerca di maggiore efficienza.

2026-05-20 📰 Fonte

📁 LLM AI generated ℹ️ The Next Web

Google DeepMind svela Gemini Omni Flash: video da testo, immagini e audio

Google DeepMind ha presentato Gemini Omni Flash alla conferenza I/O 2026, il primo modello della nuova famiglia Omni. Questa soluzione multimodale è in grado di generare e modificare video partendo da una combinazione di input come immagini, audio, video e testo. Una funzionalità di editing vocale è stata momentaneamente sospesa, mentre la filigrana digitale SynthID è attiva per impostazione predefinita, garantendo la tracciabilità dei contenuti generati.

2026-05-20 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Alibaba T-Head rafforza l'infrastruttura AI con il nuovo Zhenwu M890

Alibaba T-Head, la divisione semiconduttori del colosso cinese, sta intensificando il proprio impegno nello sviluppo di infrastrutture dedicate all'intelligenza artificiale. L'introduzione del Zhenwu M890 segna un passo significativo in questa direzione, puntando a rafforzare le capacità di calcolo per carichi di lavoro AI. Questa mossa evidenzia la crescente importanza di soluzioni hardware proprietarie per gestire le esigenze computazionali degli LLM e dell'AI generativa, con implicazioni per le strategie di deployment on-premise e ibride.

2026-05-20 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

ASML: consegne imminenti per i primi chip High-NA, tra innovazione e costi

ASML si prepara a consegnare i primi sistemi di litografia High-NA EUV nei prossimi mesi. Questa tecnicia è cruciale per la produzione di chip di nuova generazione, fondamentali per l'avanzamento dell'intelligenza artificiale e dei Large Language Models. Tuttavia, le preoccupazioni sui costi associati a questa innovazione sollevano interrogativi sul TCO per le infrastrutture AI on-premise.

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ TechWire Asia

ESET investe 40 milioni di dollari nella cybersecurity AI, rafforzando la difesa on-premise

ESET ha annunciato un investimento di 40 milioni di dollari nella cybersecurity basata sull'AI, focalizzandosi su capacità interne, protezione dei sistemi AI e nuove metodologie di elaborazione dati. L'azienda ha evidenziato i rischi emergenti da progetti come OpenClaw, ha lanciato soluzioni "Private" per deployment personalizzati e air-gapped, e ha annunciato l'ingresso nel settore della sicurezza di rete, con un'enfasi sulla sovranità dei dati e il controllo locale.

2026-05-20 📰 Fonte

📁 Hardware AI generated ℹ️ The Next Web

Alibaba presenta Zhenwu M890: la spinta cinese verso alternative hardware AI

Alibaba, tramite la sua divisione T-Head, ha svelato il Zhenwu M890, un nuovo chip AI di classe GPU. Questo sviluppo segna un passo significativo nella strategia cinese di creare alternative hardware domestiche ai prodotti NVIDIA, in un contesto di crescenti controlli sulle esportazioni. L'azienda ha dichiarato che il chip è già in produzione di massa su larga scala.

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Dunia Innovations investe 280 milioni di euro in un GigaLab autonomo per materiali AI a Berlino

Dunia Innovations, azienda deeptech con sede a Berlino, ha annunciato un investimento di 280 milioni di euro per la costruzione del GigaLab, una struttura di ricerca e sviluppo autonoma di 6.000 metri quadrati. L'iniziativa, supportata da partner industriali e tecnicici di rilievo, mira a risolvere il collo di bottiglia nella verifica dei materiali generato dalla progettazione assistita dall'intelligenza artificiale, posizionandosi come una risposta strategica europea per l'innovazione on-premise nel settore.

2026-05-20 📰 Fonte

📁 Altro AI generated 🏆 OpenAI Blog

OpenAI e l'AI nell'istruzione: espansione globale e sfide infrastrutturali

OpenAI prosegue l'iniziativa "Education for Countries", puntando a integrare l'intelligenza artificiale nelle scuole tramite nuove partnership, formazione per docenti e strumenti didattici. L'espansione solleva interrogativi sulla sovranità dei dati e sulle infrastrutture necessarie per un deployment responsabile dell'AI in contesti educativi.

2026-05-20 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Raffreddamento a liquido: una necessità per i server AI al Tech Forum 2026

Al Tech Forum 2026, il raffreddamento a liquido è emerso come soluzione indispensabile per i server AI. La crescente densità di potenza degli stack hardware dedicati all'intelligenza artificiale, essenziali per i Large Language Models, spinge verso l'adozione di tecnicie di dissipazione termica più efficienti. Il Dr. Clyde Chu di META Green Cooling Technology ha evidenziato questa transizione, sottolineando l'importanza di affrontare le sfide termiche nei deployment on-premise.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

OpenAI apre il suo primo laboratorio di AI applicata a Singapore con un investimento da 235 milioni di dollari

OpenAI ha annunciato l'apertura del suo primo laboratorio di intelligenza artificiale applicata fuori dagli Stati Uniti, scegliendo Singapore. L'iniziativa prevede un investimento di circa 235 milioni di dollari e l'assunzione di circa 200 dipendenti. Il laboratorio si concentrerà sull'allineamento con le priorità strategiche di Singapore nei settori pubblico, finanziario, sanitario e dell'infrastruttura digitale.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Meta apre WhatsApp ai chatbot AI rivali: accesso gratuito limitato per la UE

Meta ha presentato una nuova proposta alla Commissione Europea per consentire ai chatbot AI concorrenti, come ChatGPT e Claude, di accedere gratuitamente a WhatsApp. L'accesso sarà limitato da un tetto di utilizzo, oltre il quale si applicherà una tariffa. Questa mossa, che segue un precedente divieto totale e l'introduzione di una tariffa per messaggio, si inserisce nel contesto delle richieste normative europee, influenzando le strategie di deployment degli LLM e le dinamiche di mercato.

2026-05-20 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Qwen 3.7 Max: le valutazioni di Artificial Analysis e l'attesa per i modelli 27B/35B

Artificial Analysis ha pubblicato le sue valutazioni per Qwen 3.7 Max, posizionandolo al quinto posto complessivo. Il modello si allinea con le performance di GPT 5.4 (xhigh) e supera Gemini 3.5 Flash. L'analisi evidenzia un divario di 6 punti rispetto a Qwen3.6 27B e genera aspettative per le future versioni 27B e 35B di Qwen3.7, cruciali per chi valuta deployment on-premise.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Viktor raccoglie 75 milioni di dollari per integrare agenti AI in Slack e Teams

Viktor, una startup fondata da ex ingegneri di Meta con sedi a Varsavia e Monaco, ha chiuso un round di finanziamento Series A da 75 milioni di dollari guidato da Accel. L'azienda sviluppa agenti AI progettati per operare all'interno di piattaforme collaborative come Slack e Teams, raggiungendo un fatturato ricorrente annualizzato di 15 milioni di dollari in sole dieci settimane.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

L'IA e il futuro del lavoro: la Gen Z tra promesse e incertezze

L'ex CEO di Google, Eric Schmidt, ha descritto l'impatto dell'intelligenza artificiale come "più grande, più rapido e più significativo" di qualsiasi esperienza precedente per i neolaureati. Nonostante l'intento rassicurante, la percezione diffusa tra la Gen Z riflette una crescente preoccupazione per la ridefinizione del mercato del lavoro, spingendo le aziende a valutare strategie di deployment AI che bilancino innovazione e controllo.

2026-05-20 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

Telecamere AI: dall'impresa al settore critico, le implicazioni per il deployment

Le telecamere basate su intelligenza artificiale stanno espandendo il loro raggio d'azione, passando da applicazioni aziendali generiche a settori più sensibili come quello sanitario. Questa evoluzione solleva questioni cruciali legate alla sovranità dei dati, alla privacy e alla latenza, spingendo le organizzazioni a valutare attentamente le strategie di deployment on-premise rispetto alle soluzioni cloud per la gestione e l'elaborazione di informazioni critiche.

2026-05-20 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

L'espansione delle reti distribuite: il caso Gaia Motors e l'AI on-premise

L'annuncio di Gaia Motors sull'espansione della sua rete di veicoli elettrici Rapide 3 a Taiwan offre uno spunto per analizzare le implicazioni dell'intelligenza artificiale nella gestione di infrastrutture distribuite. L'articolo esplora come le soluzioni AI, in particolare quelle on-premise ed edge, possano affrontare le sfide legate alla sovranità dei dati, alla latenza e al TCO in contesti operativi complessi.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Overwatch AI ottiene 1,5 milioni di dollari per ottimizzare le operazioni aeree

Overwatch AI, una piattaforma di intelligence operativa per l'aviazione, ha raccolto 1,5 milioni di dollari in finanziamenti pre-seed. L'azienda, fondata nel 2025, mira a semplificare la gestione delle operazioni di volo per piloti ed equipaggi, integrando dati frammentati e documentazione tramite query in linguaggio naturale. La soluzione è già impiegata da diverse compagnie aeree, gestendo oltre 30.000 voli al mese, e i nuovi fondi saranno destinati all'espansione del team e allo sviluppo della piattaforma.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

RemotePass raccoglie 17,4 milioni di dollari: il fintech incontra l'occupazione globale

RemotePass, piattaforma globale per l'occupazione e la gestione delle buste paga fondata a Dubai, ha chiuso un round di finanziamento Series B da 17,4 milioni di dollari. Guidato da EBRD Venture Capital con la partecipazione di 500 Global, l'investimento segue il raggiungimento della redditività da parte dell'azienda all'inizio del 2025. L'operazione sottolinea la crescente convergenza tra servizi finanziari e soluzioni per la forza lavoro distribuita, evidenziando l'importanza della gestione dei dati sensibili.

2026-05-20 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

CircuitHub: 28 milioni di dollari per automatizzare i PCB, emulando il modello cloud

CircuitHub, azienda con sede in Massachusetts, ha ottenuto un finanziamento di 28 milioni di dollari guidato da Plural. Specializzata nella produzione automatizzata di schede a circuito stampato (PCB), l'azienda ha consegnato oltre due milioni di schede a 20.000 ingegneri. L'investimento mira a capitalizzare il trend di reshoring, con l'obiettivo di replicare per i PCB l'efficienza e la scalabilità del modello "as-a-service" tipico del cloud computing.

2026-05-20 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

L'industria automobilistica si rivolge a Taiwan per accelerare lo sviluppo dell'elettronica veicolare

Le case automobilistiche stanno intensificando la collaborazione con Taiwan per velocizzare lo sviluppo di elettronica avanzata per i veicoli. Questa mossa strategica riflette la crescente domanda di capacità di calcolo per l'intelligenza artificiale a bordo, i sistemi ADAS e l'infotainment. La scelta di Taiwan sottolinea il ruolo cruciale dell'isola nella catena di fornitura globale dei semiconduttori, fondamentale per l'innovazione e il deployment di soluzioni AI on-premise e edge.

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ Tech.eu

Qurie ottiene 2,2 milioni per il raffreddamento sostenibile di data center ed elettronica

La startup tedesca Qurie ha raccolto 2,2 milioni di euro per sviluppare sistemi di raffreddamento basati su materiali elettrocalorici. Questa tecnicia, spin-off del Fraunhofer IPM, promette maggiore efficienza energetica e dimensioni compatte rispetto ai sistemi tradizionali a compressore. L'innovazione risponde alla crescente pressione normativa e ambientale, offrendo soluzioni sostenibili per il raffreddamento di infrastrutture industriali, elettronica e data center, con un impatto positivo sul TCO.

2026-05-20 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Google e Blackstone: una joint venture per il leasing di TPU e l'impatto sul mercato ASIC

Google e Blackstone hanno annunciato una joint venture per il leasing di Tensor Processing Units (TPU). Questa iniziativa mira a facilitare l'accesso a hardware specializzato per l'AI, potenzialmente incrementando la domanda di Application-Specific Integrated Circuits (ASIC) e offrendo nuove opzioni di deployment per le aziende che valutano soluzioni on-premise o ibride per i carichi di lavoro LLM.

2026-05-20 📰 Fonte

📁 Altro AI generated ℹ️ Tech.eu

Dunia Innovations inaugura GigaLab a Berlino: un polo da 280 milioni per la scoperta di materiali con l'AI

Dunia Innovations ha annunciato il Berlin GigaLab, una struttura da 6.000 m² e 280 milioni di euro dedicata alla scoperta e allo sviluppo di materiali avanzati su scala industriale. Il polo, che creerà oltre 200 posti di lavoro e sarà operativo nel 2028, integra AI, automazione di laboratorio e simulazione. Un consorzio industriale con Siemens, ABB Robotics, NVIDIA e AWS fornirà la tecnicia chiave, sottolineando l'importanza strategica per la sovranità europea.

2026-05-20 📰 Fonte

📁 LLM AI generated 🏆 ArXiv cs.CL

Valutazione ASR Commerciali su Speech Code-Switching: Nuovi Benchmark Multilingue

Un nuovo studio ha esaminato le prestazioni dei sistemi ASR commerciali in contesti di code-switching, dove gli utenti alternano lingue diverse nella stessa frase. La ricerca ha valutato cinque provider su quattro coppie linguistiche (arabo-inglese, persiano-inglese, tedesco-inglese) utilizzando un innovativo pipeline di preparazione dati basato su LLM, che ha ridotto i costi di scoring del 91%. ElevenLabs Scribe v2 ha mostrato le migliori performance complessive, evidenziando l'importanza di metriche specifiche per scenari multilingue complessi.

2026-05-20 📰 Fonte

📁 Altro AI generated 🏆 ArXiv cs.CL

LLM e il Paradosso dell'Annotazione: La Sfida della Valutazione Autentica

Nonostante la crescita esplosiva dell'NLP a basse risorse, emerge un paradosso critico: la capacità tecnica di scalare i Large Language Models supera di gran lunga l'infrastruttura umana necessaria per una valutazione autentica. La scarsità di expertise sociolinguistica e pratiche come il 'ghost work' minacciano la validità dei progressi. Superare questo collo di bottiglia richiede un cambio di paradigma verso una governance dei dati basata sulla sovranità e sulla proprietà condivisa, cruciale per chi gestisce deployment on-premise.

2026-05-20 📰 Fonte

📁 LLM AI generated 🏆 ArXiv cs.LG

Compressione dei modelli Transformer con B-spline: efficienza e stabilità

Una nuova ricerca introduce un framework di decoupling basato su B-spline per la compressione dei modelli Transformer. Questa metodologia, denominata R-CMTF-BSD, promette una riduzione significativa dei parametri mantenendo un'elevata accuratezza. Supera i limiti delle tecniche esistenti offrendo maggiore stabilità numerica ed espressività, un fattore cruciale per l'ottimizzazione dei carichi di lavoro AI, specialmente in contesti on-premise con risorse limitate.

2026-05-20 📰 Fonte

← Precedente Page 87 / 123 Successiva →

Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

LAUNCHING SOON ON LaunchTry

AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il Segnale del Giorno

Quantization statisticamente lossless: il trade-off che cambia le regole dell’on-premise

⚡ In Tendenza

🛠️ Guide &amp; Osservatorio On-Premise

Ultime analisi & news dal radar

🛠️ Guide & Osservatorio On-Premise