AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

Modelli LLM Densi: La Sfida dell'Inference On-Premise per le Aziende
📁 LLM AI generated ℹ️ LocalLLaMA

Modelli LLM Densi: La Sfida dell'Inference On-Premise per le Aziende

Il panorama dei Large Language Models (LLM) sta assistendo a una crescente preferenza per architetture più dense, come quelle proposte da Mistral AI. Questa tendenza, sebbene promettente per le capacità dei modelli, pone nuove sfide significative per le aziende che mirano a implementare soluzioni di intelligenza artificiale on-premise, richiedendo un'attenta valutazione dell'hardware e dell'infrastruttura per garantire efficienza e controllo sui dati.

2026-04-29 📰 Fonte
Google accelera sulle sottoscrizioni: YouTube e Google One trainano la crescita
📁 Market AI generated ✅ TechCrunch AI

Google accelera sulle sottoscrizioni: YouTube e Google One trainano la crescita

Google ha registrato un aumento significativo nel primo trimestre, aggiungendo 25 milioni di nuove sottoscrizioni a pagamento. Questo incremento porta il totale a 350 milioni, con YouTube e Google One identificati come i principali motori di questa espansione. La performance evidenzia la capacità dell'azienda di consolidare la propria base utenti attraverso servizi diversificati.

2026-04-29 📰 Fonte
Deepfake e furto di dati: l'AI minaccia la sicurezza personale
📁 Altro AI generated ✅ Wired AI

Deepfake e furto di dati: l'AI minaccia la sicurezza personale

Ricercatori hanno evidenziato come truffatori sfruttino filmati manipolati tramite intelligenza artificiale, spesso interviste a celebrità, per ingannare gli utenti e indurli a condividere dati personali. Questo fenomeno, esemplificato da annunci deepfake su piattaforme come TikTok, solleva serie preoccupazioni sulla sovranità dei dati e la necessità di difese robuste contro l'abuso dell'AI.

2026-04-29 📰 Fonte
Apple corregge una falla che consentiva all'FBI di recuperare messaggi Signal eliminati
📁 Altro AI generated ✅ 404 Media

Apple corregge una falla che consentiva all'FBI di recuperare messaggi Signal eliminati

Apple ha rilasciato un aggiornamento cruciale per iOS, risolvendo una vulnerabilità che permetteva all'FBI di estrarre copie di messaggi Signal in arrivo da iPhone, anche dopo l'eliminazione dell'applicazione. La falla, che conservava i dati nel database delle notifiche, è stata corretta in seguito a un'indagine di 404 Media. L'intervento di Apple impedisce ora il salvataggio di tali messaggi e ne elimina le copie esistenti, rafforzando la privacy degli utenti.

2026-04-29 📰 Fonte
Il Futuro degli LLM Locali: Verso un Modello "Plug-and-Play" e Servizi Specializzati
📁 Altro AI generated ℹ️ LocalLLaMA

Il Futuro degli LLM Locali: Verso un Modello "Plug-and-Play" e Servizi Specializzati

Un utente Reddit ha condiviso una visione audace: entro i prossimi cinque anni, gli LLM locali potrebbero diventare comuni come gli elettrodomestici, dando vita a una nuova economia di servizi specializzati per l'installazione e la manutenzione. Questa prospettiva solleva interrogativi sulle implicazioni per il deployment on-premise e la gestione dell'infrastruttura AI in contesti aziendali, sottolineando la crescente domanda di controllo e sovranità dei dati.

2026-04-29 📰 Fonte
Il mistero dei goblin nei prompt di sistema di OpenAI Codex
📁 LLM AI generated ✅ Ars Technica AI

Il mistero dei goblin nei prompt di sistema di OpenAI Codex

Una recente scoperta nel codice open source di OpenAI Codex CLI ha rivelato una direttiva sorprendente per il modello GPT-5.5: "non parlare mai di goblin". Questa insolita istruzione, ripetuta due volte in un set di oltre 3.500 parole di istruzioni di base, suggerisce una sfida inattesa nel controllo del comportamento degli LLM. La trasparenza e la personalizzazione dei prompt di sistema sono cruciali per le aziende che cercano sovranità dei dati e controllo sui deployment on-premise.

2026-04-29 📰 Fonte
Runway: dal video AI ai "world models", la visione del CEO
📁 Market AI generated ✅ TechCrunch AI

Runway: dal video AI ai "world models", la visione del CEO

Runway, azienda di New York valutata 5,3 miliardi di dollari con quasi 860 milioni di finanziamenti, si afferma nel settore del video generativo AI. I suoi modelli competono con giganti come Google e OpenAI. Il CEO dell'azienda anticipa che la prossima frontiera dell'intelligenza artificiale saranno i "world models", superando l'attuale focus sul video.

2026-04-29 📰 Fonte
Parallel Web Systems raggiunge una valutazione di 2 miliardi di dollari
📁 Market AI generated ✅ TechCrunch AI

Parallel Web Systems raggiunge una valutazione di 2 miliardi di dollari

La startup Parallel Web Systems, fondata dall'ex CEO di Twitter Parag Agrawal e specializzata in strumenti per agenti AI, ha completato un nuovo round di finanziamento da 100 milioni di dollari, guidato da Sequoia. Questo porta la sua valutazione a 2 miliardi di dollari, a pochi mesi da un precedente aumento di capitale di pari entità, evidenziando un rapido interesse nel settore.

2026-04-29 📰 Fonte
Intel Lunar Lake: l'evoluzione delle performance CPU su Linux
📁 Hardware AI generated ✅ Phoronix

Intel Lunar Lake: l'evoluzione delle performance CPU su Linux

L'analisi si concentra sull'evoluzione delle performance della CPU Intel Lunar Lake su sistemi Linux. Dopo aver esaminato i guadagni prestazionali della grafica integrata Xe2, l'attenzione si sposta sulle capacità di calcolo del processore. I benchmark, condotti su un periodo di un anno a partire da aprile 2025, mirano a delineare come le prestazioni della CPU si siano sviluppate in questo ambiente operativo, offrendo spunti per chi valuta l'hardware per carichi di lavoro on-premise.

2026-04-29 📰 Fonte
SenseTime lancia un modello di immagini ottimizzato per chip cinesi e l'Open Source
📁 Hardware AI generated ✅ Wired AI

SenseTime lancia un modello di immagini ottimizzato per chip cinesi e l'Open Source

Nonostante le restrizioni statunitensi che limitano l'accesso a tecnicie avanzate, l'azienda cinese SenseTime ha rilasciato un nuovo modello di intelligenza artificiale per l'elaborazione di immagini. Il modello è stato progettato per la velocità e ottimizzato per funzionare su chip di produzione cinese, segnando un'accelerazione nell'adozione di strategie Open Source.

2026-04-29 📰 Fonte
Sviluppo data center in Medio Oriente in pausa dopo attacchi: impatto su AI e cloud
📁 Market AI generated ✅ Ars Technica AI

Sviluppo data center in Medio Oriente in pausa dopo attacchi: impatto su AI e cloud

Pure Data Centres Group ha sospeso gli investimenti in Medio Oriente a seguito di danni subiti da una sua struttura per un attacco iraniano. La decisione riflette una più ampia riconsiderazione da parte di investitori e aziende tech sui piani di espansione di data center per AI e cloud nei Paesi del Golfo, stimati in un trilione di dollari, a causa dell'escalation del conflitto.

2026-04-29 📰 Fonte
LLM: un esperimento svela la facilità di manipolazione e i rischi per l'integrità dei dati
📁 Altro AI generated ✅ The Register AI

LLM: un esperimento svela la facilità di manipolazione e i rischi per l'integrità dei dati

Un recente esperimento ha dimostrato quanto sia semplice indurre i Large Language Models a generare informazioni false, manipolando fonti web con un costo minimo. Un ingegnere della sicurezza ha convinto diversi chatbot dell'esistenza di un campione mondiale inesistente, evidenziando le sfide per l'integrità dei dati e la fiducia nelle risposte. Questo solleva interrogativi cruciali per le aziende che valutano deployment on-premise e la sovranità dei dati.

2026-04-29 📰 Fonte
Conferenza RightsCon 2026 a Lusaka: il governo dello Zambia ne annuncia il rinvio improvviso
📁 Altro AI generated ✅ 404 Media

Conferenza RightsCon 2026 a Lusaka: il governo dello Zambia ne annuncia il rinvio improvviso

La conferenza RightsCon 2026, uno degli appuntamenti globali più rilevanti sui diritti umani digitali, è stata improvvisamente rinviata dal governo dello Zambia pochi giorni prima del suo inizio a Lusaka. L'annuncio, che ha colto di sorpresa migliaia di ricercatori e partecipanti, ha generato confusione. Le motivazioni ufficiali riguardano la necessità di allineamento con procedure nazionali e protocolli diplomatici, oltre a questioni di autorizzazione per alcuni relatori.

2026-04-29 📰 Fonte
Google Photos e l'AI: il guardaroba di 'Clueless' diventa realtà virtuale
📁 LLM AI generated ✅ TechCrunch AI

Google Photos e l'AI: il guardaroba di 'Clueless' diventa realtà virtuale

Google Photos sfrutta l'intelligenza artificiale per ricreare il celebre guardaroba di Cher Horowitz dal film 'Clueless'. Questa iniziativa evidenzia come l'AI stia integrandosi in applicazioni di consumo per offrire esperienze interattive e personalizzate, dimostrando la maturità delle tecnicie di visione artificiale e di elaborazione del linguaggio. L'applicazione, sebbene consumer-oriented, solleva questioni sulle capacità di inference e sui requisiti infrastrutturali per carichi di lavoro AI complessi.

2026-04-29 📰 Fonte
Mistral Medium 3.5: Nuove Opzioni di Deployment con Licenza Specifiche
📁 LLM AI generated ℹ️ LocalLLaMA

Mistral Medium 3.5: Nuove Opzioni di Deployment con Licenza Specifiche

Mistral AI ha rilasciato Mistral Medium 3.5, un Large Language Model che si distingue per le sue "Open Weights" e una licenza MIT modificata. Quest'ultima richiede il pagamento di una licenza per l'uso commerciale, introducendo considerazioni importanti per le aziende che valutano deployment on-premise e la sovranità dei dati. Il modello promette prestazioni elevate in relazione al suo numero di parametri, un fattore chiave per l'efficienza infrastrutturale.

2026-04-29 📰 Fonte
LG Electronics e Nvidia: colloqui su robotica, data center AI e mobilità
📁 Market AI generated ℹ️ The Next Web

LG Electronics e Nvidia: colloqui su robotica, data center AI e mobilità

LG Electronics e Nvidia hanno avviato discussioni per una potenziale collaborazione strategica in robotica, data center per l'intelligenza artificiale e mobilità. L'iniziativa, partita da Nvidia, mira a rafforzare le ambizioni di LG nell'AI fisica e a espandere la presenza di Nvidia nel settore dell'elettronica di consumo, in un momento cruciale per l'adozione dell'AI in ambito industriale.

2026-04-29 📰 Fonte
IBM presenta la famiglia Granite 4.1: modelli da 3 a 30 miliardi di parametri
📁 LLM AI generated ℹ️ LocalLLaMA

IBM presenta la famiglia Granite 4.1: modelli da 3 a 30 miliardi di parametri

IBM ha annunciato la nuova famiglia di Large Language Models Granite 4.1, disponibile in versioni da 3, 8 e 30 miliardi di parametri. Questi modelli offrono alle aziende opzioni flessibili per il deployment di LLM, bilanciando requisiti di performance, risorse infrastrutturali e considerazioni sulla sovranità dei dati, aspetti cruciali per le strategie on-premise.

2026-04-29 📰 Fonte
OpenAI Abbandona i Data Center Stargate: Priorità alla Flessibilità e al Leasing di Compute
📁 Altro AI generated ℹ️ Tom's Hardware

OpenAI Abbandona i Data Center Stargate: Priorità alla Flessibilità e al Leasing di Compute

OpenAI ha rivisto la sua strategia infrastrutturale, abbandonando l'idea di data center proprietari dedicati al progetto Stargate. L'azienda preferisce ora il leasing di risorse di calcolo per maggiore flessibilità, chiarendo che "Stargate" è un termine ombrello piuttosto che un'iniziativa di costruzione di infrastrutture fisiche. Questo cambio evidenzia un'evoluzione nelle decisioni di deployment per i carichi di lavoro AI.

2026-04-29 📰 Fonte
Cina avverte l'UE: ritorsioni se Huawei e ZTE saranno escluse dalle reti europee
📁 Altro AI generated ℹ️ The Next Web

Cina avverte l'UE: ritorsioni se Huawei e ZTE saranno escluse dalle reti europee

Il Ministero del Commercio cinese ha formalmente avvertito la Commissione Europea che il suo progetto di Cybersecurity Act, che potrebbe imporre per la prima volta l'esclusione di fornitori specifici dalle reti europee, scatenerebbe ritorsioni. Pechino ha presentato un documento di 30 pagine, minacciando misure reciproche contro le aziende europee in Cina qualora Huawei e ZTE venissero bandite. La mossa evidenzia le crescenti tensioni geopolitiche nel settore tecnicico.

2026-04-29 📰 Fonte
Mistral Medium 3.5: Un LLM da 128B con finestra di contesto da 256k
📁 LLM AI generated ℹ️ LocalLLaMA

Mistral Medium 3.5: Un LLM da 128B con finestra di contesto da 256k

Mistral AI ha presentato Mistral Medium 3.5, un LLM denso da 128 miliardi di parametri con una finestra di contesto di 256k token. Il modello è multimodale, supporta funzionalità di ragionamento configurabili e si propone come soluzione unificata per istruzioni, ragionamento e coding, sostituendo le versioni precedenti. La sua architettura lo rende un candidato interessante per deployment on-premise che richiedono controllo e sovranità dei dati.

2026-04-29 📰 Fonte
OpenCL introduce estensioni Cooperative Matrix per l'Inference AI
📁 Frameworks AI generated ✅ Phoronix

OpenCL introduce estensioni Cooperative Matrix per l'Inference AI

L'API OpenCL sta integrando estensioni Cooperative Matrix, una mossa che segue l'introduzione di funzionalità simili in Vulkan nel 2023. Queste estensioni sono progettate per ottimizzare le operazioni di Inference di machine learning e intelligenza artificiale, offrendo nuove opportunità per l'accelerazione hardware e il deployment on-premise di carichi di lavoro AI, migliorando l'efficienza e il TCO.

2026-04-29 📰 Fonte
AutoSP: Semplificare il Training di LLM con Contesti Estesi su Multi-GPU
📁 Frameworks AI generated ✅ PyTorch Blog

AutoSP: Semplificare il Training di LLM con Contesti Estesi su Multi-GPU

AutoSP, una soluzione basata su compilatore, automatizza l'implementazione della Sequence Parallelism (SP) per il training di Large Language Models (LLM) con contesti lunghi. Integrato in DeepSpeed, risolve i problemi di memoria (OOM) e la complessità associata alla gestione di token oltre i 100k su configurazioni multi-GPU. Questo approccio consente di estendere la lunghezza massima del contesto addestrabile con un impatto minimo sulle performance, semplificando lo sviluppo per i team che operano su infrastrutture self-hosted.

2026-04-29 📰 Fonte
Un supercluster DGX Spark da 16 unità: potenziale e sfide on-premise
📁 Altro AI generated ℹ️ LocalLLaMA

Un supercluster DGX Spark da 16 unità: potenziale e sfide on-premise

Un utente ha condiviso i dettagli di un ambizioso progetto: assemblare un cluster di 16 unità DGX Spark in un laboratorio domestico, equipaggiato con 2 TB di memoria unificata e una rete ad alta velocità. L'iniziativa solleva interrogativi sulle potenzialità di un tale sistema per carichi di lavoro AI e LLM, evidenziando le implicazioni di un deployment on-premise su larga scala.

2026-04-29 📰 Fonte
llama.cpp: NVFP4 nativo accelera l'elaborazione dei prompt su Blackwell
📁 Hardware AI generated ℹ️ LocalLLaMA

llama.cpp: NVFP4 nativo accelera l'elaborazione dei prompt su Blackwell

Un recente benchmark su llama.cpp rivela che il supporto nativo per NVFP4 migliora significativamente le prestazioni di elaborazione dei prompt (fino al 68%) per il modello Qwen3.6-27B-NVFP4 su una GPU NVIDIA RTX 5090. La velocità di generazione dei token rimane invariata. Questo vantaggio è cruciale per carichi di lavoro on-premise che richiedono l'ingestione rapida di contesti lunghi, come RAG e analisi documentale.

2026-04-29 📰 Fonte
Claude e la sicurezza: l'AI scopre una falla critica in GitHub
📁 LLM AI generated ✅ The Register AI

Claude e la sicurezza: l'AI scopre una falla critica in GitHub

I ricercatori di Wiz hanno scoperto una vulnerabilità di elevata gravità nell'infrastruttura `git` di GitHub, che consentiva l'accesso completo a repository privati. L'assistenza di Claude, un Large Language Model, ha accelerato significativamente il processo di scoperta, trasformando mesi di lavoro in tempi rapidi e portando a un riconoscimento per il team di Wiz.

2026-04-29 📰 Fonte
Firestorm Labs raccoglie 82 milioni per portare la produzione di droni sul campo
📁 Altro AI generated ✅ TechCrunch AI

Firestorm Labs raccoglie 82 milioni per portare la produzione di droni sul campo

La startup Firestorm Labs ha ottenuto un finanziamento di 82 milioni di dollari per sviluppare fabbriche di droni mobili. L'iniziativa mira a integrare la produzione direttamente in container marittimi, consentendo il deployment di capacità manifatturiere avanzate in ambienti operativi remoti, come le linee del fronte. Questo approccio sottolinea l'importanza della logistica e della sovranità operativa in contesti critici, riducendo la dipendenza da catene di approvvigionamento tradizionali.

2026-04-29 📰 Fonte
La "lotteria del silicio": variabilità inattesa nelle prestazioni GPU cloud
📁 Hardware AI generated 🏆 IEEE Spectrum

La "lotteria del silicio": variabilità inattesa nelle prestazioni GPU cloud

Una ricerca congiunta rivela significative variazioni prestazionali tra GPU dello stesso modello, un fenomeno noto come "lotteria del silicio". Questo impatta il valore del noleggio di risorse cloud per carichi di lavoro AI, con differenze fino al 38% nella larghezza di banda della memoria per le H200 SXM. La causa principale risiede nelle variazioni di fabbricazione dei chip stessi, rendendo il benchmarking delle istanze noleggiate una pratica essenziale.

2026-04-29 📰 Fonte
Università dell'Arizona: un tool AI acquisisce lezioni senza consenso, scoppia la polemica
📁 Altro AI generated ✅ 404 Media

Università dell'Arizona: un tool AI acquisisce lezioni senza consenso, scoppia la polemica

L'Università dell'Arizona si trova al centro di una controversia per il rilascio di un tool basato su intelligenza artificiale. Lo strumento genera lezioni acquisendo contenuti dai corsi dei professori senza la loro autorizzazione, sollevando questioni etiche e di sovranità dei dati. Si discute anche di una ricerca Google che nega la coscienza alle Large Language Models.

2026-04-29 📰 Fonte
Shapes: L'integrazione di LLM nei canali di comunicazione di gruppo
📁 LLM AI generated ✅ TechCrunch AI

Shapes: L'integrazione di LLM nei canali di comunicazione di gruppo

Shapes introduce personaggi AI nelle chat di gruppo, richiamando l'esperienza di piattaforme come Discord. Questa innovazione solleva questioni cruciali per le aziende riguardo al deployment degli LLM, alla sovranità dei dati e ai requisiti infrastrutturali per gestire l'inference on-premise, bilanciando costi e controllo.

2026-04-29 📰 Fonte
Qwen presenta FlashQLA: ottimizzazione delle performance per LLM su dispositivi edge
📁 Frameworks AI generated ℹ️ LocalLLaMA

Qwen presenta FlashQLA: ottimizzazione delle performance per LLM su dispositivi edge

Qwen ha introdotto FlashQLA, un set di kernel di attenzione lineare ad alte prestazioni basato su TileLang. Progettato per l'AI agentica su dispositivi personali, FlashQLA promette un aumento della velocità di 2-3 volte per il forward pass e di 2 volte per il backward pass. La soluzione mira a migliorare l'utilizzo degli SM e l'efficienza per modelli di piccole dimensioni e carichi di lavoro a lungo contesto, specialmente in scenari di deployment on-premise ed edge.

2026-04-29 📰 Fonte
Framework: il nuovo modulo grafico RTX 5070 da 12GB debutta a 1.199 dollari
📁 Hardware AI generated ℹ️ Tom's Hardware

Framework: il nuovo modulo grafico RTX 5070 da 12GB debutta a 1.199 dollari

Framework ha introdotto un nuovo modulo grafico RTX 5070 con 12GB di VRAM, proposto a 1.199 dollari. Questo prezzo rappresenta un aumento del 72% rispetto alla precedente versione da 8GB, che costava 699 dollari. L'azienda ha dichiarato che il costo finale del modulo è influenzato da fattori esterni, evidenziando le sfide nella catena di approvvigionamento e nella determinazione dei prezzi nel settore hardware.

2026-04-29 📰 Fonte
OpenAI sotto accusa: le decisioni sulla sicurezza degli utenti e le implicazioni legali
📁 Altro AI generated ✅ Ars Technica AI

OpenAI sotto accusa: le decisioni sulla sicurezza degli utenti e le implicazioni legali

OpenAI è oggetto di sette azioni legali in California, accusata di non aver prevenuto una sparatoria di massa in Canada. Le denunce sostengono che l'azienda abbia ignorato le raccomandazioni del proprio team di sicurezza interno, che aveva identificato un utente di ChatGPT come una minaccia credibile di violenza armata. Nonostante le indicazioni di allertare le forze dell'ordine, OpenAI avrebbe privilegiato la privacy dell'utente, disattivando l'account e fornendo istruzioni per aggirare il blocco.

2026-04-29 📰 Fonte
USA bloccano l'export di strumenti a Hua Hong e Huali per la produzione a 7 nm
📁 Market AI generated ℹ️ Tom's Hardware

USA bloccano l'export di strumenti a Hua Hong e Huali per la produzione a 7 nm

Gli Stati Uniti hanno imposto un blocco all'esportazione di strumenti tecnicici destinati a Hua Hong e Huali Microelectronics, il secondo produttore di chip cinese. La misura arriva mentre le due aziende sarebbero prossime all'avvio di una fabbrica per la produzione di semiconduttori a 7 nanometri a Shanghai, evidenziando le crescenti tensioni nel settore e le implicazioni per la catena di approvvigionamento globale.

2026-04-29 📰 Fonte
Qwen3.6 27B su doppia RTX 5060 Ti 16GB: analisi delle prestazioni on-premise
📁 Hardware AI generated ℹ️ LocalLLaMA

Qwen3.6 27B su doppia RTX 5060 Ti 16GB: analisi delle prestazioni on-premise

Un'analisi dettagliata esplora le capacità del modello Qwen3.6 27B su una configurazione locale basata su due GPU NVIDIA RTX 5060 Ti da 16GB. I test evidenziano prestazioni di circa 60-66 token al secondo e la gestione di un contesto esteso fino a 204.800 token, seppur con margini di VRAM molto ridotti. Lo studio offre spunti concreti per chi valuta il deployment di LLM on-premise con hardware di fascia media.

2026-04-29 📰 Fonte
Palit centralizza la gestione di Galax: il brand GPU prosegue l'attività
📁 Hardware AI generated ℹ️ Tom's Hardware

Palit centralizza la gestione di Galax: il brand GPU prosegue l'attività

Palit Group ha annunciato una riorganizzazione interna che centralizza la gestione del brand di GPU Galax. Nonostante il cambiamento, l'azienda ha confermato che il marchio Galax, noto per le sue schede grafiche ad alte prestazioni come la linea HOF, continuerà a operare sul mercato. Questa mossa, definita "pre-pianificata", mira a ottimizzare le operazioni sotto l'ombrello del gruppo Palit, assicurando continuità ai clienti e al settore.

2026-04-29 📰 Fonte
Controllo proprietario e Open Source: il caso Bambu Lab e le implicazioni per l'AI on-premise
📁 Altro AI generated ℹ️ Tom's Hardware

Controllo proprietario e Open Source: il caso Bambu Lab e le implicazioni per l'AI on-premise

Un developer ha riabilitato funzionalità disabilitate su stampanti 3D Bambu Lab, portando a minacce legali e alla chiusura del progetto OrcaSlicer-BambuLab. Questo evento evidenzia le tensioni tra controllo proprietario e comunità Open Source, un tema cruciale per le aziende che valutano deployment di Large Language Models (LLM) on-premise. La capacità di modificare e controllare l'hardware e il software sottostante è fondamentale per la sovranità dei dati e l'ottimizzazione del TCO in ambienti self-hosted.

2026-04-29 📰 Fonte
mbiomics raccoglie 30 milioni di euro per terapie oncologiche basate sul microbioma
📁 Market AI generated ℹ️ The Next Web

mbiomics raccoglie 30 milioni di euro per terapie oncologiche basate sul microbioma

L'azienda techbio mbiomics GmbH, con sede a Monaco, ha completato il suo round di finanziamento Series A, raccogliendo 30 milioni di euro. I fondi saranno impiegati per portare avanti lo sviluppo di un prodotto batterico vivo, mirato a migliorare la risposta agli inibitori del checkpoint immunitario nel melanoma avanzato, con uno studio di Fase 1B previsto per il 2027.

2026-04-29 📰 Fonte
AI e costi operativi: quando la spesa supera il lavoro umano, ma non frena le aziende
📁 Market AI generated ℹ️ Tom's Hardware

AI e costi operativi: quando la spesa supera il lavoro umano, ma non frena le aziende

Un dirigente Nvidia ha evidenziato come l'implementazione di soluzioni AI possa superare i costi del personale umano. Nonostante questa spesa maggiore, alcune aziende non considerano tali investimenti un aspetto negativo, suggerendo una valutazione strategica che va oltre il mero confronto economico diretto. Questo scenario apre a riflessioni sui trade-off tra CapEx e OpEx nel deployment di LLM on-premise e sull'importanza della sovranità dei dati.

2026-04-29 📰 Fonte
Intel 18A: l'ottimizzazione dei wafer aumenta i ricavi e la disponibilità di CPU
📁 Hardware AI generated ℹ️ Tom's Hardware

Intel 18A: l'ottimizzazione dei wafer aumenta i ricavi e la disponibilità di CPU

Nuovi dettagli rivelano come Intel stia incrementando i ricavi per wafer, grazie a un'attenta ottimizzazione della produzione. Secondo le analisi, la riduzione della variabilità di resa su ciascun wafer, in particolare per il nodo 18A, permette di ottenere un maggior numero di CPU commercializzabili, migliorando l'efficienza e la redditività del processo produttivo.

2026-04-29 📰 Fonte
OpenAI e la cyber-difesa: un piano in cinque punti per l'era dell'AI
📁 Altro AI generated 🏆 OpenAI Blog

OpenAI e la cyber-difesa: un piano in cinque punti per l'era dell'AI

OpenAI ha presentato un piano d'azione in cinque punti per rafforzare la cybersecurity nell'era dell'intelligenza artificiale. L'iniziativa mira a democratizzare le capacità di difesa informatica basate sull'AI e a salvaguardare i sistemi critici, evidenziando l'importanza di strategie proattive per la sicurezza digitale.

2026-04-29 📰 Fonte
GitHub si scusa per i disservizi: l'affidabilità delle piattaforme è cruciale
📁 Altro AI generated ✅ The Register AI

GitHub si scusa per i disservizi: l'affidabilità delle piattaforme è cruciale

GitHub, la piattaforma di code hosting di Microsoft, ha rilasciato un'ampia dichiarazione di scuse per i recenti problemi di disponibilità e affidabilità. L'incidente, evidenziato anche dalle critiche di un co-fondatore di HashiCorp, solleva interrogativi sulla dipendenza da servizi esterni e sull'importanza della stabilità infrastrutturale per lo sviluppo software, inclusi i progetti LLM.

2026-04-29 📰 Fonte
Hipfire: un nuovo motore di inference per GPU AMD con focus sulla quantization
📁 Frameworks AI generated ℹ️ LocalLLaMA

Hipfire: un nuovo motore di inference per GPU AMD con focus sulla quantization

Hipfire è un nuovo motore di inference progettato per ottimizzare le prestazioni dei Large Language Models (LLM) su tutte le GPU AMD. Utilizza una metodologia di quantization `mq4` e, secondo il sito di benchmarking Localmaxxing, offre notevoli accelerazioni nell'inference. Sebbene non sia un progetto ufficiale di AMD, Hipfire rappresenta un'alternativa open source rilevante per i deployment self-hosted, offrendo nuove opportunità per bilanciare costi e controllo nei carichi di lavoro AI.

2026-04-29 📰 Fonte
Qwen3.6 27B: vLLM e INT4 su Docker per inference locale ad alte prestazioni su 2x RTX 3090
📁 Altro AI generated ℹ️ LocalLLaMA

Qwen3.6 27B: vLLM e INT4 su Docker per inference locale ad alte prestazioni su 2x RTX 3090

Un recente progetto open source dimostra come sia possibile eseguire il modello Qwen3.6 27B in locale con prestazioni notevoli. Utilizzando un container Docker basato su vLLM, ottimizzato con quantization Lorbus AutoRound INT4 e decodifica speculativa MTP, il sistema raggiunge 118 token al secondo su due GPU NVIDIA RTX 3090. Questa soluzione offre un percorso efficiente per il deployment on-premise di Large Language Models, bilanciando costi e controllo dei dati.

2026-04-29 📰 Fonte
Bolle AI e Prezzi GPU: Il Dilemma dell'Framework Locale
📁 Market AI generated ℹ️ LocalLLaMA

Bolle AI e Prezzi GPU: Il Dilemma dell'Framework Locale

Il rapido sviluppo dell'intelligenza artificiale ha alimentato un'intensa domanda di GPU, ma un'ipotetica "bolla AI" potrebbe alterare radicalmente il mercato. L'articolo esplora due scenari contrapposti: un aumento dei prezzi delle GPU consumer per l'inference locale o un crollo dei prezzi dovuto a un eccesso di offerta di hardware enterprise, analizzando le implicazioni per le strategie di deployment on-premise.

2026-04-29 📰 Fonte
Heard: Una voce per gli agenti di codice, open source e con esecuzione locale
📁 Altro AI generated ℹ️ LocalLLaMA

Heard: Una voce per gli agenti di codice, open source e con esecuzione locale

Heard è un nuovo progetto open source che offre una soluzione per dotare gli agenti di codice di una voce, fornendo output intermedi in tempo reale. Sviluppato come daemon Python e app macOS, Heard si distingue per la sua capacità di operare interamente in locale, garantendo la sovranità dei dati e l'assenza di telemetria. Supporta diversi agenti e offre opzioni per la sintesi vocale, privilegiando l'esecuzione on-device per chi cerca controllo e privacy.

2026-04-29 📰 Fonte
Ottimizzare gli LLM per il codice: il dibattito sul "pensiero" artificiale
📁 LLM AI generated ℹ️ LocalLLaMA

Ottimizzare gli LLM per il codice: il dibattito sul "pensiero" artificiale

Nel panorama degli LLM per la generazione di codice, emerge una pratica diffusa: disabilitare le fasi di "pensiero" intermedio. Questa strategia, sebbene raccomandata da molti, solleva interrogativi sulle sue motivazioni profonde. L'analisi di questa scelta rivela implicazioni dirette su efficienza, latenza e TCO, aspetti cruciali per i deployment on-premise, dove il controllo delle risorse è prioritario per CTO e architetti di infrastruttura.

2026-04-29 📰 Fonte
Lisuan Tech: la GPU LX 7G100 ottiene la certificazione Microsoft WHQL, un primato cinese
📁 Hardware AI generated ℹ️ Tom's Hardware

Lisuan Tech: la GPU LX 7G100 ottiene la certificazione Microsoft WHQL, un primato cinese

Lisuan Tech, produttore cinese di GPU, ha ottenuto la certificazione Microsoft WHQL per la sua scheda grafica LX 7G100. Questo traguardo posiziona l'azienda come il quarto produttore globale a raggiungere tale standard, affiancandosi a Nvidia, AMD e Intel, e segna un primato per una società cinese nel settore. La certificazione è cruciale per l'affidabilità dei driver in ambienti enterprise e per i deployment on-premise.

2026-04-29 📰 Fonte
Dex raccoglie 5,3 milioni di dollari per il recruiting di ingegneri AI
📁 Market AI generated ℹ️ The Next Web

Dex raccoglie 5,3 milioni di dollari per il recruiting di ingegneri AI

Dex, una startup specializzata nel recruiting di talenti AI, ha annunciato un round di finanziamento seed da 5,3 milioni di dollari. Fondata da un ex consulente di Atomico, l'azienda si propone di connettere ingegneri AI con le imprese che ne hanno più bisogno, operando con un modello di business basato sul successo. Ha già raggiunto 1,8 milioni di dollari di ARR in meno di sei mesi, evidenziando la forte domanda di specialisti nel settore.

2026-04-29 📰 Fonte
Robotica: oltre l'automazione, l'intelligenza fisica di Eka
📁 Altro AI generated ✅ Wired AI

Robotica: oltre l'automazione, l'intelligenza fisica di Eka

I robot di Eka, capaci di compiti complessi come smistare alimenti e avvitare lampadine, mostrano un realismo sorprendente. L'industria si interroga sulla loro effettiva intelligenza fisica, un passo cruciale per replicare la flessibilità umana in ambienti dinamici. Questo scenario evoca il potenziale di un "momento ChatGPT" per la robotica, dove la comprensione del mondo fisico diventa centrale per nuove applicazioni e richiede deployment on-premise per latenza e sovranità dei dati.

2026-04-29 📰 Fonte
Scout AI Raccoglie 100 Milioni per Addestrare Modelli AI in Contesti Militari
📁 Altro AI generated ✅ TechCrunch AI

Scout AI Raccoglie 100 Milioni per Addestrare Modelli AI in Contesti Militari

Scout AI, guidata da Coby Adcock, ha ottenuto un finanziamento di 100 milioni di dollari. L'azienda si concentra sullo sviluppo di agenti AI per applicazioni militari, consentendo ai soldati di controllare flotte di veicoli autonomi. Il "campo di addestramento" di Scout AI evidenzia l'impegno verso ambienti controllati e self-hosted per lo sviluppo di queste tecnicie critiche, sottolineando l'importanza della sovranità dei dati e della sicurezza nel settore della difesa.

2026-04-29 📰 Fonte
GM integra Google Gemini in quattro milioni di veicoli: un'espansione AI su larga scala
📁 Altro AI generated ℹ️ The Next Web

GM integra Google Gemini in quattro milioni di veicoli: un'espansione AI su larga scala

General Motors ha annunciato il rilascio di Google Gemini su circa quattro milioni di veicoli negli Stati Uniti tramite aggiornamento OTA. L'integrazione, che sostituisce Google Assistant, rappresenta uno dei più vasti deployment di intelligenza artificiale in ambito automobilistico, sebbene avvenga in un periodo segnato da controversie sulla condivisione dei dati e un imminente ordine della FTC.

2026-04-29 📰 Fonte
Cognizant acquisisce Astreya per 600 milioni di dollari, rafforzando l'infrastruttura AI
📁 Altro AI generated ℹ️ The Next Web

Cognizant acquisisce Astreya per 600 milioni di dollari, rafforzando l'infrastruttura AI

Cognizant ha annunciato l'acquisizione di Astreya, una società specializzata in servizi IT gestiti per l'AI, per 600 milioni di dollari. Questa mossa strategica mira a colmare una lacuna nella sua offerta, potenziando la capacità di progettare, costruire e gestire l'infrastruttura fisica dei data center necessaria per i carichi di lavoro di intelligenza artificiale in ambito enterprise. L'operazione sottolinea l'importanza crescente delle fondamenta hardware e infrastrutturali per il deployment di soluzioni AI.

2026-04-29 📰 Fonte
SAP restringe l'uso delle API per l'AI: timori di lock-in e sovranità dei dati
📁 Altro AI generated ✅ The Register AI

SAP restringe l'uso delle API per l'AI: timori di lock-in e sovranità dei dati

SAP ha introdotto una nuova policy che vieta l'uso delle sue API per l'integrazione con sistemi di intelligenza artificiale esterni alle architetture approvate. Questa mossa genera preoccupazioni tra partner e clienti, che temono un "lock-in" tecnicico. Esperti del settore suggeriscono che tale restrizione potrebbe spingere all'adozione di API non documentate, compromettendo la flessibilità e la sovranità dei dati per le aziende che desiderano utilizzare soluzioni AI di terze parti con i propri dati SAP.

2026-04-29 📰 Fonte
Luxshare, fornitore Apple: utili in crescita, ma il flusso di cassa preoccupa
📁 Market AI generated ✅ DigiTimes

Luxshare, fornitore Apple: utili in crescita, ma il flusso di cassa preoccupa

Luxshare, un fornitore chiave di Apple, ha annunciato un aumento degli utili, segnalando una performance positiva sul fronte della redditività. Tuttavia, l'azienda continua a fronteggiare una debolezza nel flusso di cassa. Questa dinamica finanziaria, sebbene specifica per Luxshare, riflette le complessità e le sfide che possono caratterizzare la catena di approvvigionamento globale nel settore dell'elettronica.

2026-04-29 📰 Fonte
Reliance investe 17 miliardi in un mega-cluster AI in India: la corsa all'infrastruttura
📁 Altro AI generated ✅ DigiTimes

Reliance investe 17 miliardi in un mega-cluster AI in India: la corsa all'infrastruttura

Reliance sta pianificando un investimento massiccio di 17 miliardi di dollari per un cluster di data center dedicati all'intelligenza artificiale a Visakhapatnam, in India. Questa mossa strategica si inserisce nella crescente competizione del paese per costruire capacità computazionale AI, sottolineando l'importanza di infrastrutture locali per la sovranità dei dati e il controllo tecnicico. L'iniziativa riflette una tendenza globale verso deployment on-premise per carichi di lavoro AI critici.

2026-04-29 📰 Fonte
Qwen 3.6 e Gemma 4: l'efficienza degli LLM on-premise su singola GPU
📁 Altro AI generated ℹ️ LocalLLaMA

Qwen 3.6 e Gemma 4: l'efficienza degli LLM on-premise su singola GPU

L'esecuzione locale di Large Language Models come Qwen 3.6 e Gemma 4 sta dimostrando la sua efficacia in scenari lavorativi complessi. Un utente ha evidenziato come questi modelli, se supportati da hardware adeguato come una singola NVIDIA RTX 3090, possano gestire compiti specialistici, offrendo un'alternativa concreta e conveniente ai servizi cloud e garantendo maggiore controllo sui dati.

2026-04-29 📰 Fonte
AI e Resistenza agli Antibiotici: La Sfida dell'Innovazione al Paziente
📁 Market AI generated ✅ Wired AI

AI e Resistenza agli Antibiotici: La Sfida dell'Innovazione al Paziente

Il chirurgo britannico Ara Darzi ha evidenziato come l'intelligenza artificiale possa rivoluzionare la diagnosi e il trattamento delle infezioni resistenti ai farmaci. Tuttavia, la mancanza di incentivi adeguati rischia di ostacolare l'adozione di queste innovazioni, impedendo loro di raggiungere efficacemente i pazienti e di generare un impatto concreto sulla salute pubblica.

2026-04-29 📰 Fonte
DeepSeek avvia i test per il suo modello multimodale con capacità visive
📁 LLM AI generated ℹ️ LocalLLaMA

DeepSeek avvia i test per il suo modello multimodale con capacità visive

DeepSeek ha dato il via alla fase di "grayscale testing" per il suo nuovo modello, "DeepSeek with Vision". Questa mossa indica un passo significativo nello sviluppo di Large Language Models multimodali, che integrano la comprensione visiva. Il processo di testing graduale è cruciale per validare le performance e la stabilità prima di un rilascio più ampio, ponendo nuove sfide per le strategie di deployment, in particolare per le implementazioni self-hosted.

2026-04-29 📰 Fonte
← Precedente Page 48 / 120 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge