AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

Mozilla e Mythos: 271 vulnerabilità Firefox con "quasi zero falsi positivi"
📁 LLM AI generated ✅ Ars Technica AI

Mozilla e Mythos: 271 vulnerabilità Firefox con "quasi zero falsi positivi"

Mozilla ha rivelato dettagli sull'uso di Anthropic Mythos, un modello AI per la rilevazione di vulnerabilità. In due mesi, sono state identificate 271 falle di sicurezza in Firefox, con un tasso di falsi positivi "quasi nullo". Questo successo, che sfida lo scetticismo iniziale, è attribuito ai miglioramenti del modello e a un "harness" personalizzato sviluppato da Mozilla per l'analisi del codice sorgente, segnando un passo avanti rispetto ai precedenti tentativi AI afflitti da "allucinazioni".

2026-05-07 📰 Fonte
La causa di Elon Musk mette sotto esame la sicurezza di OpenAI e la governance dell'AI
📁 Altro AI generated ✅ TechCrunch AI

La causa di Elon Musk mette sotto esame la sicurezza di OpenAI e la governance dell'AI

La recente azione legale di Elon Musk contro OpenAI solleva interrogativi cruciali sulla sicurezza dei Large Language Models avanzati e sulla fiducia riposta nei leader tecnicici. Il dibattito si concentra sulla governance dell'intelligenza artificiale e sulle implicazioni per il controllo e la sovranità dei dati in contesti di deployment on-premise.

2026-05-07 📰 Fonte
AMD Instinct MI350P: 144GB HBM3E e +40% in FP16/FP8 per l'AI PCIe
📁 Hardware AI generated ℹ️ Tom's Hardware

AMD Instinct MI350P: 144GB HBM3E e +40% in FP16/FP8 per l'AI PCIe

AMD ha annunciato la scheda acceleratrice AI Instinct MI350P in formato PCIe. Dotata di 144GB di memoria HBM3E, questa nuova soluzione promette un incremento prestazionale teorico di circa il 40% nelle operazioni FP16 e FP8 rispetto al concorrente Nvidia H200 NVL. L'introduzione della MI350P rafforza l'offerta di AMD nel segmento degli acceleratori per carichi di lavoro di intelligenza artificiale, mirando a soddisfare le esigenze di deployment on-premise e cloud.

2026-05-07 📰 Fonte
Bumble dice addio allo "swipe": un cambio di paradigma nell'interazione utente
📁 Market AI generated ✅ TechCrunch AI

Bumble dice addio allo "swipe": un cambio di paradigma nell'interazione utente

La CEO Whitney Wolfe Herd ha annunciato che l'app di incontri Bumble eliminerà la celebre funzionalità dello "swipe", un gesto iconico che ha definito l'interazione in molte piattaforme sociali. La mossa segnala un'evoluzione nel design delle interfacce utente, con implicazioni per le future strategie di engagement digitale.

2026-05-07 📰 Fonte
Allerta Malware su Hugging Face: Un Falso LLM Minaccia la Sicurezza dei Sistemi
📁 Altro AI generated ℹ️ LocalLLaMA

Allerta Malware su Hugging Face: Un Falso LLM Minaccia la Sicurezza dei Sistemi

È stata lanciata un'allerta critica riguardo a un modello fraudolento su Hugging Face, denominato `Open-OSS/privacy-filter`. Questo falso LLM è stato identificato come veicolo per il download e l'esecuzione di malware sui sistemi degli utenti. L'attacco sfrutta uno script `loader.py` per scaricare file eseguibili e batch malevoli. La comunità è invitata a prestare la massima attenzione e a utilizzare esclusivamente il modello legittimo `openai/privacy-filter` per evitare rischi di sicurezza.

2026-05-07 📰 Fonte
AMD e le GPU PCIe: una nuova opzione per i deployment LLM locali
📁 Hardware AI generated ℹ️ LocalLLaMA

AMD e le GPU PCIe: una nuova opzione per i deployment LLM locali

AMD si prepara a introdurre una nuova GPU con fattore di forma PCIe, potenzialmente ampliando le opzioni hardware per le implementazioni di Large Language Models (LLM) in ambienti self-hosted. L'attenzione del mercato si concentra sul posizionamento di prezzo e sulle specifiche tecniche che potrebbero renderla una soluzione competitiva per l'inference LLM on-premise, offrendo alternative ai professionisti che gestiscono infrastrutture locali.

2026-05-07 📰 Fonte
La Casa Bianca valuta il controllo governativo sui modelli AI prima del rilascio
📁 Altro AI generated ℹ️ Tom's Hardware

La Casa Bianca valuta il controllo governativo sui modelli AI prima del rilascio

La Casa Bianca starebbe valutando l'introduzione di un controllo governativo obbligatorio sui modelli di intelligenza artificiale prima del loro rilascio. Un ordine esecutivo è in fase di discussione per definire i meccanismi di questa supervisione. La notizia emerge mentre il CEO di OpenAI, Sam Altman, ha partecipato a un incontro della Task Force della Casa Bianca sull'educazione all'intelligenza artificiale, evidenziando il crescente interesse dell'amministrazione per la governance dell'AI.

2026-05-07 📰 Fonte
ChatGPT introduce 'Trusted Contact': una nuova funzione di sicurezza per il benessere degli utenti
📁 Altro AI generated 🏆 OpenAI Blog

ChatGPT introduce 'Trusted Contact': una nuova funzione di sicurezza per il benessere degli utenti

OpenAI ha lanciato 'Trusted Contact' per ChatGPT, una funzione di sicurezza opzionale che notifica un contatto fidato se il sistema rileva preoccupazioni serie legate all'autolesionismo. Questa novità sottolinea l'impegno verso il benessere degli utenti, ma solleva anche interrogativi importanti sulla gestione dei dati sensibili e sulla privacy, temi cruciali per le aziende che valutano deployment di Large Language Models (LLM) on-premise.

2026-05-07 📰 Fonte
L'evoluzione dell'intelligenza vocale: nuovi modelli in tempo reale via API
📁 LLM AI generated 🏆 OpenAI Blog

L'evoluzione dell'intelligenza vocale: nuovi modelli in tempo reale via API

OpenAI introduce nuovi modelli vocali in tempo reale accessibili tramite API, capaci di ragionare, tradurre e trascrivere il parlato. Questa innovazione mira a rendere le interazioni vocali più naturali e intelligenti, ponendo nuove sfide e opportunità per le aziende che valutano strategie di deployment on-premise o basate su cloud per le proprie applicazioni AI.

2026-05-07 📰 Fonte
ZAYA1-8B: Zyphra punta sull'efficienza per i Large Language Models on-premise
📁 LLM AI generated ℹ️ LocalLLaMA

ZAYA1-8B: Zyphra punta sull'efficienza per i Large Language Models on-premise

Zyphra ha introdotto ZAYA1-8B, un Large Language Model da 8 miliardi di parametri. Il modello è progettato per offrire un'elevata 'densità di intelligenza', rendendolo particolarmente adatto per deployment on-premise e in ambienti con risorse hardware limitate. Questa soluzione risponde alla crescente domanda di LLM efficienti che garantiscano controllo sui dati e ottimizzazione del TCO.

2026-05-07 📰 Fonte
Allerta Malware: Un Falso Filtro Privacy LLM Minaccia gli Ambienti Windows su Hugging Face
📁 Altro AI generated ℹ️ LocalLLaMA

Allerta Malware: Un Falso Filtro Privacy LLM Minaccia gli Ambienti Windows su Hugging Face

È stato scoperto un malware infostealer camuffato da "filtro privacy" per LLM, distribuito su Hugging Face. Il virus, che prende di mira esclusivamente sistemi Windows, utilizza un dropper Python per installare un eseguibile malevolo, compromettendo la sicurezza dei dati in ambienti di deployment AI. L'incidente sottolinea l'importanza della vigilanza e della sicurezza della supply chain per i deployment on-premise.

2026-05-07 📰 Fonte
ChatGPT e le sue peculiarità linguistiche: un caso di studio tra USA e Cina
📁 LLM AI generated ✅ Wired AI

ChatGPT e le sue peculiarità linguistiche: un caso di studio tra USA e Cina

Il chatbot di OpenAI, ChatGPT, mostra curiose peculiarità linguistiche quando utilizzato in cinese, generando frustrazione tra gli utenti. Questo fenomeno evidenzia le complesse sfide legate alla localizzazione dei Large Language Models e alla loro capacità di adattarsi a contesti culturali e idiomatici diversi. La comprensione di tali "tic" è cruciale per le aziende che valutano il deployment di LLM in ambienti multilingue e per garantire la fedeltà del messaggio.

2026-05-07 📰 Fonte
Supporto nativo per Realtek RTL8159 10GbE USB Ethernet nel kernel Linux 7.2
📁 Hardware AI generated ✅ Phoronix

Supporto nativo per Realtek RTL8159 10GbE USB Ethernet nel kernel Linux 7.2

Il kernel Linux 7.2 introdurrà il supporto nativo per il controller Realtek RTL8159, un componente chiave per gli adattatori di rete USB 10GbE. Questa integrazione eliminerà la necessità di driver esterni, semplificando l'adozione di soluzioni di connettività ad alta velocità, disponibili anche a costi contenuti, per server e workstation. L'aggiornamento è atteso per l'estate, migliorando stabilità e gestione per i deployment on-premise.

2026-05-07 📰 Fonte
Mythos di Anthropic: un LLM che ridefinisce la sicurezza di Firefox
📁 Altro AI generated ✅ TechCrunch AI

Mythos di Anthropic: un LLM che ridefinisce la sicurezza di Firefox

I ricercatori di Mozilla hanno scoperto numerose vulnerabilità di elevata gravità in Firefox, grazie all'impiego di Mythos, un Large Language Model sviluppato da Anthropic. Questo episodio evidenzia il crescente ruolo degli LLM nell'analisi della sicurezza software, sollevando questioni cruciali su deployment, sovranità dei dati e TCO per le aziende che adottano queste tecnicie per la protezione delle proprie infrastrutture.

2026-05-07 📰 Fonte
Riorganizzazione del driver AMD RadeonSI: verso build multimediali dedicate
📁 Hardware AI generated ✅ Phoronix

Riorganizzazione del driver AMD RadeonSI: verso build multimediali dedicate

Una riorganizzazione del codice del driver AMD RadeonSI Gallium3D è stata integrata in Mesa 26.2-devel. L'obiettivo è separare le funzionalità grafiche da quelle di accelerazione multimediale, consentendo la creazione di driver specifici per carichi di lavoro multimediali. Questa mossa ottimizza le risorse e riduce il footprint software, con implicazioni positive per deployment on-premise e sistemi embedded, dove l'efficienza è cruciale.

2026-05-07 📰 Fonte
Lian Li DK07 Wood: la scrivania motorizzata che ospita due PC E-ATX
📁 Hardware AI generated ℹ️ Tom's Hardware

Lian Li DK07 Wood: la scrivania motorizzata che ospita due PC E-ATX

Lian Li presenta la DK07 Wood, una scrivania motorizzata che integra un chassis per due sistemi PC completi, compatibile con schede madri E-ATX e configurazioni di raffreddamento avanzate. Questa soluzione offre un ambiente di lavoro ergonomico e una potente piattaforma hardware in un unico elemento d'arredo, ideale per professionisti e sviluppatori che necessitano di elevate capacità di calcolo on-premise.

2026-05-07 📰 Fonte
Google lancia Fitbit Air: un dispositivo essenziale per un servizio AI di coaching
📁 Market AI generated ℹ️ The Next Web

Google lancia Fitbit Air: un dispositivo essenziale per un servizio AI di coaching

Google ha presentato Fitbit Air, un dispositivo da 100 dollari privo di schermo e funzionalità autonome. L'hardware, una fascia in tessuto con un sensore da cinque grammi, traccia battito cardiaco e passi. Il vero focus dell'offerta è un servizio di coaching sanitario basato su intelligenza artificiale, disponibile tramite abbonamento mensile da 10 dollari. Questa strategia evidenzia il passaggio da hardware a servizi AI.

2026-05-07 📰 Fonte
Startup Battlefield 200: un trampolino per l'innovazione AI e le soluzioni on-premise
📁 Market AI generated ✅ TechCrunch AI

Startup Battlefield 200: un trampolino per l'innovazione AI e le soluzioni on-premise

La scadenza per le candidature a Startup Battlefield 200 si avvicina, offrendo a fondatori pre-Series A l'accesso a capitali, visibilità globale e un premio di 100.000 dollari. Per le startup che operano nel settore dell'intelligenza artificiale, in particolare quelle focalizzate su soluzioni on-premise, questa rappresenta un'opportunità cruciale per accelerare lo sviluppo e il deployment di stack locali, hardware per inference e training, e architetture che privilegiano la sovranità dei dati e il controllo infrastrutturale.

2026-05-07 📰 Fonte
Crollo delle vendite di schede madri: il mercato AI devia la produzione di chip
📁 Market AI generated ℹ️ Tom's Hardware

Crollo delle vendite di schede madri: il mercato AI devia la produzione di chip

Il mercato delle schede madri per PC enthusiast sta subendo un calo significativo, con vendite previste in diminuzione di oltre il 25%. La causa principale è la decisione dei produttori di chip di dirottare risorse e capacità produttiva verso i semiconduttori per l'intelligenza artificiale. Aziende come Asus, Gigabyte, MSI e ASRock si aspettano una riduzione delle consegne, con Asus che prevede 5 milioni di schede in meno nel 2025. Questo scenario evidenzia le priorità attuali dell'industria del silicio.

2026-05-07 📰 Fonte
Incendio ad Almere: il data center offline e le lezioni per l'on-premise
📁 Altro AI generated ℹ️ The Next Web

Incendio ad Almere: il data center offline e le lezioni per l'on-premise

Un incendio in un data center ad Almere ha causato interruzioni significative, mettendo offline un'università e disabilitando il sistema di comunicazione di emergenza per il trasporto pubblico in un'intera provincia. L'evento ha richiesto l'intervento di mezzi speciali e ha evidenziato la vulnerabilità delle infrastrutture fisiche, sollevando interrogativi cruciali sulla resilienza e il controllo nei deployment tecnicici.

2026-05-07 📰 Fonte
La specifica FIT 1.0 finalizzata: un nuovo standard per i sistemi embedded Linux
📁 Altro AI generated ✅ Phoronix

La specifica FIT 1.0 finalizzata: un nuovo standard per i sistemi embedded Linux

La specifica Flattened Image Tree (FIT) 1.0 è stata ufficialmente finalizzata, introducendo un formato container standardizzato per i sistemi embedded Linux. Utilizzata da U-Boot, FIT consolida componenti essenziali come le immagini del kernel Linux e i Device Tree Blob (DTB) in un singolo file, semplificando il processo di boot e migliorando l'integrità e la sicurezza dei deployment su dispositivi edge.

2026-05-07 📰 Fonte
AMD presenta l'acceleratore Instinct MI350P: CDNA 4 arriva sulle schede PCIe
📁 Hardware AI generated ℹ️ LocalLLaMA

AMD presenta l'acceleratore Instinct MI350P: CDNA 4 arriva sulle schede PCIe

AMD ha annunciato il nuovo acceleratore Instinct MI350P, basato sull'architettura CDNA 4 e disponibile in formato PCIe. Questa introduzione è significativa per le aziende che considerano il deployment di Large Language Models (LLM) on-premise, offrendo nuove opzioni hardware per l'inference e il training. Sebbene i dettagli su prezzi e disponibilità non siano ancora stati rivelati, l'arrivo di nuove soluzioni PCIe rafforza il panorama delle infrastrutture locali, cruciale per la sovranità dei dati e il controllo sui carichi di lavoro AI.

2026-05-07 📰 Fonte
Google presenta Fitbit Air: il wearable senza schermo che punta sui dati e l'AI
📁 Hardware AI generated ✅ Ars Technica AI

Google presenta Fitbit Air: il wearable senza schermo che punta sui dati e l'AI

Google ha svelato Fitbit Air, un nuovo wearable privo di schermo che si integra con l'app Google Health. Il dispositivo, un piccolo "puck" di plastica, si concentra sulla raccolta continua di dati biometrici, offrendo un'autonomia di circa una settimana e la capacità di memorizzare informazioni offline. L'app complementare introduce anche un coach per la salute basato su AI, segnando un ritorno alla filosofia dei tracker essenziali.

2026-05-07 📰 Fonte
Violazione dati record nell'istruzione: il bersaglio era un fornitore, non una scuola
📁 Altro AI generated ℹ️ The Next Web

Violazione dati record nell'istruzione: il bersaglio era un fornitore, non una scuola

Una vulnerabilità nei sistemi di Instructure, fornitore del sistema di gestione dell'apprendimento Canvas, ha portato alla più grande violazione di dati nel settore dell'istruzione. L'attacco, avvenuto il 30 aprile, ha colpito un'azienda che serve il 41% delle istituzioni di istruzione superiore in Nord America, evidenziando i rischi legati alla dipendenza da terze parti per servizi critici e sollevando questioni sulla sovranità dei dati.

2026-05-07 📰 Fonte
Spotify punta sull'audio personalizzato generato da AI
📁 LLM AI generated ✅ TechCrunch AI

Spotify punta sull'audio personalizzato generato da AI

Spotify intende posizionarsi come piattaforma centrale per l'audio personalizzato generato tramite intelligenza artificiale. Gli utenti potranno creare podcast utilizzando modelli AI come Codex o Claude Code e importarli direttamente nel servizio, aprendo nuove frontiere per la creazione di contenuti audio su larga scala e su misura.

2026-05-07 📰 Fonte
Moonshot AI: 2 miliardi di dollari di finanziamento e 20 miliardi di valutazione, spinta dall'AI Open Source
📁 Market AI generated ✅ TechCrunch AI

Moonshot AI: 2 miliardi di dollari di finanziamento e 20 miliardi di valutazione, spinta dall'AI Open Source

Moonshot AI, azienda cinese, ha ottenuto un finanziamento significativo, raggiungendo una valutazione di 20 miliardi di dollari. Questo traguardo è alimentato dalla crescente domanda di soluzioni AI Open Source e da un'impressionante crescita dei ricavi annualizzati, che hanno superato i 200 milioni di dollari ad aprile, grazie all'espansione delle sottoscrizioni a pagamento e all'utilizzo delle API. Il contesto evidenzia l'attrattiva degli LLM Open Source per le aziende che cercano controllo e flessibilità.

2026-05-07 📰 Fonte
Musk tentò di acquisire i fondatori di OpenAI per un'unità AI in Tesla
📁 Market AI generated ✅ Ars Technica AI

Musk tentò di acquisire i fondatori di OpenAI per un'unità AI in Tesla

Documenti emersi in un processo legale rivelano che Elon Musk tentò di integrare il team fondatore di OpenAI, inclusi Sam Altman, Greg Brockman e Ilya Sutskever, in Tesla nel 2018. L'obiettivo era creare un nuovo laboratorio di intelligenza artificiale all'interno della casa automobilistica, proponendo l'ingresso di Altman nel consiglio di amministrazione o la trasformazione di OpenAI in una sussidiaria. Queste rivelazioni gettano luce sulle dispute interne di OpenAI e sulle motivazioni dietro la causa intentata da Musk.

2026-05-07 📰 Fonte
AMD Instinct MI350P: La scheda PCIe per l'AI e il calcolo ad alte prestazioni
📁 Hardware AI generated ✅ Phoronix

AMD Instinct MI350P: La scheda PCIe per l'AI e il calcolo ad alte prestazioni

AMD ha presentato la Instinct MI350P, una scheda PCIe progettata per estendere le capacità di calcolo della serie MI350 ai server esistenti con slot PCIe 5.0 e raffreddamento ad aria. Questa soluzione si propone come alternativa ai moduli OAM, offrendo flessibilità per i deployment on-premise di carichi di lavoro AI e di calcolo ad alte prestazioni, con un focus sull'ecosistema Open Source.

2026-05-07 📰 Fonte
AMD Instinct MI350P: CDNA 4 porta l'accelerazione AI nei server PCIe tradizionali
📁 Hardware AI generated ✅ ServeTheHome

AMD Instinct MI350P: CDNA 4 porta l'accelerazione AI nei server PCIe tradizionali

AMD ha introdotto l'acceleratore Instinct MI350P, una versione PCIe dei suoi chip MI350. Progettato per server tradizionali, questo nuovo componente integra l'architettura CDNA 4, offrendo capacità di accelerazione AI avanzate in un formato compatibile con infrastrutture esistenti. Il MI350P si presenta come una soluzione per le aziende che necessitano di potenza di calcolo AI on-premise senza stravolgere l'architettura dei propri data center.

2026-05-07 📰 Fonte
DeepL, la startup tedesca di traduzione AI, riduce il personale di 250 unità
📁 Market AI generated ℹ️ Tech.eu

DeepL, la startup tedesca di traduzione AI, riduce il personale di 250 unità

DeepL, la startup tedesca specializzata in traduzione e scrittura basata su intelligenza artificiale, ha annunciato il taglio di circa 250 dipendenti, circa un quarto della sua forza lavoro globale. La decisione, comunicata dal CEO Jarek Kutylowski, mira a riorganizzare l'azienda in team più snelli e agili. L'obiettivo è competere efficacemente nel panorama dell'AI, che sta evolvendo a ritmi senza precedenti, integrando l'intelligenza artificiale in ogni aspetto delle operazioni interne.

2026-05-07 📰 Fonte
L'Orchestrazione AI Ridefinisce l'Esperienza di Acquisto Automotive
📁 Frameworks AI generated ℹ️ The Next Web

L'Orchestrazione AI Ridefinisce l'Esperienza di Acquisto Automotive

BadCo.AI evidenzia l'importanza crescente dei livelli di orchestrazione AI per connettere e ottimizzare ogni fase del percorso di acquisto nel settore automotive. L'azienda sottolinea come il futuro del retail automobilistico dipenda dall'integrazione di tecnicie connesse e dalle aspettative dei consumatori, superando l'approccio basato su strumenti AI isolati.

2026-05-07 📰 Fonte
Il kernel Linux dice addio ai vecchi SoC AMD Elan degli anni '90
📁 Hardware AI generated ✅ Phoronix

Il kernel Linux dice addio ai vecchi SoC AMD Elan degli anni '90

Il ciclo di sviluppo di Linux 7.1 segna l'inizio della dismissione del supporto per i processori Intel 486 e, di conseguenza, per i System-on-Chip AMD Elan risalenti agli anni '90. Questa mossa, che ha già visto la rimozione delle opzioni di configurazione Kconfig, prelude alla successiva eliminazione del codice driver effettivo, evidenziando l'evoluzione e la pulizia del kernel da architetture obsolete.

2026-05-07 📰 Fonte
Spotify: il DJ basato su AI ora supporta italiano, francese, tedesco e portoghese brasiliano
📁 LLM AI generated ✅ TechCrunch AI

Spotify: il DJ basato su AI ora supporta italiano, francese, tedesco e portoghese brasiliano

Spotify ha ampliato il supporto linguistico per la sua funzionalità AI DJ, includendo ora italiano, francese, tedesco e portoghese brasiliano. Questa espansione evidenzia le crescenti capacità dei Large Language Models (LLM) nel personalizzare l'esperienza utente su scala globale, ponendo l'accento sulle sfide e opportunità legate al deployment di tali sistemi, dalla gestione delle risorse hardware alla sovranità dei dati.

2026-05-07 📰 Fonte
Meatly raccoglie 10,4 milioni di sterline per il più grande impianto di bioreattori d'Europa
📁 Market AI generated ℹ️ Tech.eu

Meatly raccoglie 10,4 milioni di sterline per il più grande impianto di bioreattori d'Europa

Meatly, pioniere europeo della carne coltivata, ha annunciato un finanziamento di Serie A da 10,4 milioni di sterline. I fondi saranno impiegati per costruire a Londra il più grande impianto di bioreattori per carne coltivata d'Europa, con l'obiettivo di avviare le consegne di prodotti entro il 2027. L'azienda ha già raggiunto importanti traguardi nella riduzione dei costi e nella commercializzazione del primo cibo per animali domestici a base di carne coltivata.

2026-05-07 📰 Fonte
MiMo v2.5 arriva su llama.cpp: un LLM multimodale per l'inference locale
📁 LLM AI generated ℹ️ LocalLLaMA

MiMo v2.5 arriva su llama.cpp: un LLM multimodale per l'inference locale

L'integrazione del modello MiMo v2.5 in `llama.cpp` segna un passo significativo per l'inference di Large Language Models multimodali su hardware locale. Con un'architettura Sparse MoE da 310 miliardi di parametri totali (di cui 15 miliardi attivati) e una finestra di contesto fino a 1 milione di token, MiMo v2.5 supporta testo, immagini, video e audio, offrendo nuove opportunità per deployment on-premise che richiedono controllo sui dati e ottimizzazione dei costi.

2026-05-07 📰 Fonte
Nvidia sotto accusa: il framework NeMo al centro di una causa per copyright su 197.000 libri
📁 Frameworks AI generated ℹ️ Tom's Hardware

Nvidia sotto accusa: il framework NeMo al centro di una causa per copyright su 197.000 libri

Nvidia si trova ad affrontare una causa per violazione di copyright, con un giudice che ha respinto la richiesta di archiviazione. Al centro della controversia vi è il framework NeMo, i cui script sarebbero stati utilizzati per accelerare la pirateria di oltre 197.000 libri. La vicenda solleva interrogativi sull'uso degli strumenti di sviluppo AI e sulle responsabilità delle aziende tecniciche nel garantire un impiego etico e legale delle proprie piattaforme.

2026-05-07 📰 Fonte
Michigan: il data center Stargate da 16 miliardi e la sfida energetica da 1.4 GW per ChatGPT
📁 Altro AI generated ℹ️ Tom's Hardware

Michigan: il data center Stargate da 16 miliardi e la sfida energetica da 1.4 GW per ChatGPT

Il data center Stargate AI, un impianto da 16 miliardi di dollari in Michigan, è stato realizzato nonostante l'opposizione locale. Con un consumo previsto di 1.4 Gigawatt per alimentare ChatGPT, la struttura ha scatenato una corsa tra le amministrazioni locali per bloccare ulteriori costruzioni. La vicenda evidenzia le crescenti tensioni tra lo sviluppo di infrastrutture AI e le preoccupazioni ambientali e comunitarie, ponendo nuove sfide per i deployment su larga scala.

2026-05-07 📰 Fonte
DeepSeek verso una valutazione di 45 miliardi di dollari con il “Big Fund” cinese
📁 Market AI generated ℹ️ LocalLLaMA

DeepSeek verso una valutazione di 45 miliardi di dollari con il “Big Fund” cinese

DeepSeek, sviluppatore di Large Language Models, si avvicina a una valutazione di 45 miliardi di dollari nel suo primo round di investimenti. Il “Big Fund” cinese guida le trattative, evidenziando l'importanza strategica degli LLM e l'intensità di capitale richiesta per lo sviluppo e il deployment di queste tecnicie avanzate.

2026-05-07 📰 Fonte
Musica e AI: il caso Stick Figure tra successo virale e battaglie legali
📁 Altro AI generated ✅ Wired AI

Musica e AI: il caso Stick Figure tra successo virale e battaglie legali

Il successo inaspettato di una vecchia canzone della band reggae Stick Figure, spinto da remix non autorizzati generati dall'intelligenza artificiale, solleva interrogativi cruciali sulla proprietà intellettuale nell'era dell'AI. Il caso evidenzia le sfide per gli artisti e le aziende che devono navigare tra le opportunità e i rischi delle tecnicie generative, specialmente in contesti di deployment on-premise dove il controllo sui dati e sui modelli è fondamentale.

2026-05-07 📰 Fonte
Migliaia di app AI espongono dati sensibili sul web pubblico
📁 Altro AI generated ✅ Wired AI

Migliaia di app AI espongono dati sensibili sul web pubblico

Un'analisi rivela come migliaia di applicazioni web create rapidamente con l'AI da piattaforme come Lovable, Base44, Replit e Netlify stiano involontariamente esponendo dati aziendali e personali altamente sensibili su internet, sollevando preoccupazioni sulla sicurezza e la sovranità dei dati.

2026-05-07 📰 Fonte
Qwen 3.6: Nuovi Modelli e le Sfide del Deployment On-Premise
📁 LLM AI generated ℹ️ LocalLLaMA

Qwen 3.6: Nuovi Modelli e le Sfide del Deployment On-Premise

La serie Qwen 3.6 ha visto recenti rilasci di modelli da 27B e 35B parametri, alimentando l'attesa per versioni da 9B e 122B. Questa diversità di scale pone interrogativi cruciali per le strategie di deployment on-premise, influenzando direttamente i requisiti hardware, i costi e la gestione della sovranità dei dati per le aziende che valutano soluzioni self-hosted.

2026-05-07 📰 Fonte
Parloa e gli agenti di servizio clienti basati su LLM: un approccio scalabile
📁 Market AI generated 🏆 OpenAI Blog

Parloa e gli agenti di servizio clienti basati su LLM: un approccio scalabile

Parloa propone agenti di servizio clienti basati su intelligenza artificiale e controllo vocale, sfruttando i Large Language Models di OpenAI. La soluzione mira a offrire alle aziende la capacità di progettare, simulare e rilasciare interazioni scalabili, affidabili e in tempo reale per migliorare l'assistenza.

2026-05-07 📰 Fonte
KDE Plasma 6.7: Migliorie per il Rendering su CPU e l'Efficienza delle Risorse
📁 Altro AI generated ✅ Phoronix

KDE Plasma 6.7: Migliorie per il Rendering su CPU e l'Efficienza delle Risorse

La prossima versione di KDE Plasma, la 6.7, introduce un significativo miglioramento per il rendering basato su CPU, grazie al lavoro dello sviluppatore Xaver Hugl. L'ottimizzazione, che sfrutta UDMABUF per ridurre le copie di buffer, mira a offrire un'esperienza utente più fluida, specialmente nell'uso della memoria condivisa Wayland. Questa innovazione sottolinea l'importanza della gestione efficiente delle risorse computazionali, un principio chiave anche per i deployment AI su hardware meno specializzato.

2026-05-07 📰 Fonte
Quantum Motion raccoglie 160 milioni di dollari per computer quantistici su silicio
📁 Hardware AI generated ℹ️ Tech.eu

Quantum Motion raccoglie 160 milioni di dollari per computer quantistici su silicio

Quantum Motion, spin-out britannica specializzata in computer quantistici full-stack basati su tecnicia a chip di silicio, ha chiuso un round di finanziamento Series C da 160 milioni di dollari. L'azienda, che ha superato i 200 milioni di dollari di capitale raccolto, mira a commercializzare la propria offerta e a espandere la ricerca e sviluppo. L'approccio al silicio promette riduzioni significative di costi, spazio e consumo energetico, posizionando l'azienda come leader nel settore quantistico del Regno Unito.

2026-05-07 📰 Fonte
Violazione critica per la ferrovia ad alta velocità di Taiwan: 19 anni senza rotazione delle chiavi crittografiche
📁 Altro AI generated ℹ️ Tom's Hardware

Violazione critica per la ferrovia ad alta velocità di Taiwan: 19 anni senza rotazione delle chiavi crittografiche

Un incidente di sicurezza ha messo in luce gravi vulnerabilità nella gestione della ferrovia ad alta velocità di Taiwan. Uno studente universitario ha utilizzato Software Defined Radios (SDR) per fermare quattro treni, sfruttando una falla critica: la mancata rotazione delle chiavi crittografiche per quasi due decenni. L'episodio sottolinea l'importanza di rigorose pratiche di cybersecurity e gestione dell'infrastruttura, specialmente in contesti on-premise e per sistemi critici.

2026-05-07 📰 Fonte
AMD e il supporto SR-IOV per le NPU Ryzen AI di prossima generazione
📁 Hardware AI generated ✅ Phoronix

AMD e il supporto SR-IOV per le NPU Ryzen AI di prossima generazione

AMD sta preparando il terreno per le sue NPU AIE4 di prossima generazione, integrando il supporto nel kernel Linux 7.2. Un recente sviluppo include una serie di patch per abilitare la tecnicia SR-IOV, fondamentale per la virtualizzazione e l'allocazione efficiente delle risorse hardware. Questa mossa sottolinea l'importanza di soluzioni flessibili per i carichi di lavoro AI, specialmente in contesti on-premise dove il controllo e l'ottimizzazione delle risorse sono prioritari.

2026-05-07 📰 Fonte
GCC Ritorna su WebAssembly: Nuove Prospettive per i Deployment Locali
📁 Frameworks AI generated ✅ Phoronix

GCC Ritorna su WebAssembly: Nuove Prospettive per i Deployment Locali

Una nuova proposta mira a integrare un back-end WebAssembly (WASM) nella toolchain GNU, segnando un potenziale cambiamento nel panorama della compilazione C/C++. Storicamente dominato da LLVM/Clang, questo sviluppo potrebbe offrire maggiore flessibilità e opzioni per gli sviluppatori che mirano a deployment on-premise e a stack locali, riaccendendo un'iniziativa di quasi un decennio fa.

2026-05-07 📰 Fonte
Samsung, sciopero dei lavoratori: il costo potenziale di 11,7 miliardi e l'ombra sulla filiera AI
📁 Market AI generated ℹ️ Tom's Hardware

Samsung, sciopero dei lavoratori: il costo potenziale di 11,7 miliardi e l'ombra sulla filiera AI

I lavoratori del settore chip di Samsung hanno rifiutato un bonus una tantum di 340.000 dollari, chiedendo pagamenti annuali simili a quelli di SK Hynix (900.000 dollari). La richiesta è legata alla volontà di condividere i profitti generati dal boom dell'intelligenza artificiale. Un potenziale sciopero di 18 giorni potrebbe costare a Samsung fino a 11,7 miliardi di dollari, sollevando interrogativi sulla stabilità della catena di fornitura di componenti critici per l'AI.

2026-05-07 📰 Fonte
L'Intelligenza Artificiale a Supporto del Servizio Sanitario Britannico
📁 Market AI generated ℹ️ AI News

L'Intelligenza Artificiale a Supporto del Servizio Sanitario Britannico

Il Servizio Sanitario Nazionale del Regno Unito (NHS) affronta pressioni senza precedenti, con lunghe liste d'attesa e carenze di personale. L'adozione di soluzioni di cura virtuale basate sull'AI, come quelle offerte da Doccla, sta emergendo come strumento chiave per alleggerire il carico. Queste tecnicie utilizzano modelli di Machine Learning e dati da wearable clinici per monitorare i pazienti a distanza, migliorando l'efficienza operativa e generando significativi risparmi, pur mantenendo i clinici al centro del processo.

2026-05-07 📰 Fonte
Ottimizzazione LLM On-Premise: il Dilemma della Decodifica Speculativa in llama.cpp
📁 Frameworks AI generated ℹ️ LocalLLaMA

Ottimizzazione LLM On-Premise: il Dilemma della Decodifica Speculativa in llama.cpp

La community di `llama.cpp` si interroga sulla possibilità di combinare diverse metodologie di decodifica speculativa, come "mtp speculative decode" e `ngram`. L'impossibilità attuale di utilizzarle simultaneamente, nonostante i benefici specifici di ciascuna (es. `ngram` per il coding agentico), solleva interrogativi su limiti architetturali o di implementazione. Questa discussione è cruciale per chi cerca di massimizzare le performance dei Large Language Models in ambienti self-hosted.

2026-05-07 📰 Fonte
MediaTek: la corsa ai chip AI spinge la valutazione oltre i 165 miliardi di dollari
📁 Market AI generated ✅ DigiTimes

MediaTek: la corsa ai chip AI spinge la valutazione oltre i 165 miliardi di dollari

La borsa di Taiwan ha sospeso le negoziazioni su MediaTek dopo che la sua valutazione ha superato i 165 miliardi di dollari, un traguardo raggiunto grazie alla forte domanda di chip per l'intelligenza artificiale. Questo evento sottolinea l'intensa dinamica del mercato dei semiconduttori, cruciale per lo sviluppo e il deployment di soluzioni AI, inclusi i Large Language Models on-premise.

2026-05-07 📰 Fonte
Invest Europe: Il Private Equity europeo registra una solida crescita nel 2025
📁 Market AI generated ℹ️ Tech.eu

Invest Europe: Il Private Equity europeo registra una solida crescita nel 2025

Invest Europe ha pubblicato il suo rapporto annuale sull'attività di private equity in Europa per il 2025. Il mercato ha mostrato resilienza, con raccolta fondi e investimenti che hanno raggiunto i secondi livelli più alti di sempre. La raccolta ha toccato 147 miliardi di euro, mentre gli investimenti totali sono saliti a 135 miliardi. I buyout hanno guidato l'attività, mentre il venture capital ha mostrato segni di ripresa, superando la media quinquennale. ICT, biotech e deep tech sono settori chiave.

2026-05-07 📰 Fonte
Quantum Motion raccoglie 160 milioni: il primo grande investimento del fondo UE
📁 Hardware AI generated ℹ️ The Next Web

Quantum Motion raccoglie 160 milioni: il primo grande investimento del fondo UE

Quantum Motion, azienda londinese specializzata in qubit a spin basati su silicio-CMOS, ha ottenuto un finanziamento di 160 milioni di dollari. L'investimento è guidato dal nuovo Scaleup Europe Fund dell'Unione Europea, segnando la sua prima operazione di rilievo in fase avanzata. Questa mossa, annunciata post-Brexit, evidenzia il continuo supporto dell'UE alle tecnicie quantistiche europee, riconoscendo Quantum Motion come attore chiave nel panorama dell'hardware quantistico.

2026-05-07 📰 Fonte
SWEBAL raccoglie 30 milioni di euro per la produzione di TNT in Svezia
📁 Market AI generated ℹ️ Tech.eu

SWEBAL raccoglie 30 milioni di euro per la produzione di TNT in Svezia

SWEBAL, azienda svedese di produzione per la difesa, ha annunciato un round di finanziamento da 30 milioni di euro. L'investimento mira a completare la costruzione del primo impianto svedese per la produzione di trinitrotoluene (TNT) a Nora. L'iniziativa è strategica per affrontare le carenze nella catena di approvvigionamento di materiali energetici critici, rafforzando la resilienza della NATO e la sicurezza europea, con una produzione annua prevista di oltre 4.000 tonnellate entro il 2028.

2026-05-07 📰 Fonte
Advantech: la domanda robusta si scontra con i vincoli di fornitura, frenando la crescita
📁 Market AI generated ✅ DigiTimes

Advantech: la domanda robusta si scontra con i vincoli di fornitura, frenando la crescita

Advantech, azienda leader nel settore dei PC industriali e sistemi embedded, ha segnalato una forte domanda per i suoi prodotti. Tuttavia, l'azienda avverte che i persistenti vincoli nella catena di fornitura limiteranno la crescita nel breve termine. Questa situazione evidenzia le sfide che le imprese affrontano nell'approvvigionamento di hardware critico per infrastrutture AI, specialmente per i deployment on-premise, influenzando pianificazione e TCO.

2026-05-07 📰 Fonte
MediaTek inaugura un centro R&D AI con Nvidia DGX SuperPOD a Taiwan
📁 Altro AI generated ✅ DigiTimes

MediaTek inaugura un centro R&D AI con Nvidia DGX SuperPOD a Taiwan

MediaTek ha aperto un nuovo data center di ricerca e sviluppo AI a Taiwan, basato sull'infrastruttura Nvidia DGX SuperPOD. Questa mossa sottolinea l'impegno dell'azienda nello sviluppo di tecnicie AI avanzate e l'adozione di soluzioni on-premise per carichi di lavoro intensivi, offrendo controllo e sovranità sui dati.

2026-05-07 📰 Fonte
WinWay: Ricavi record ad aprile spinti dalla domanda di AI e HPC
📁 Market AI generated ✅ DigiTimes

WinWay: Ricavi record ad aprile spinti dalla domanda di AI e HPC

WinWay ha registrato il suo secondo miglior risultato di sempre in termini di ricavi ad aprile, un incremento significativo attribuito alla forte domanda nei settori dell'intelligenza artificiale (AI) e del calcolo ad alte prestazioni (HPC). Questo dato evidenzia la crescente necessità di infrastrutture robuste e specializzate per supportare l'espansione di queste tecnicie, con implicazioni dirette per le strategie di deployment on-premise delle aziende.

2026-05-07 📰 Fonte
Nexus Luxembourg: il vertice tech europeo e l'impatto dell'AI Act
📁 Market AI generated ℹ️ The Next Web

Nexus Luxembourg: il vertice tech europeo e l'impatto dell'AI Act

Il Lussemburgo ospita la terza edizione del Nexus, un vertice tecnicico cruciale che si svolge a poche settimane dall'entrata in vigore delle disposizioni più significative dell'EU AI Act. L'evento assume un'importanza particolare quest'anno, offrendo una piattaforma per discutere le implicazioni della nuova normativa sull'adozione e il deployment dell'intelligenza artificiale in Europa, evidenziando il ruolo strategico del Granducato nel panorama tecnicico continentale.

2026-05-07 📰 Fonte
Silex Microsystems: debutto in borsa con valutazione da 8,9 miliardi di SEK per la fonderia MEMS
📁 Hardware AI generated ℹ️ The Next Web

Silex Microsystems: debutto in borsa con valutazione da 8,9 miliardi di SEK per la fonderia MEMS

Silex Microsystems, una fonderia specializzata in MEMS supportata da Bure Equity e Creades, ha debuttato con successo sul Nasdaq Stockholm. L'offerta, prezzata a 81 SEK per azione e sottoscritta più volte, ha portato la valutazione aziendale a 8,9 miliardi di SEK, con le azioni che hanno registrato un forte rialzo all'apertura. Investitori di rilievo hanno acquisito circa tre quarti del deal.

2026-05-07 📰 Fonte
← Precedente Page 34 / 119 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge