AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

Wistron: profitti triplicati grazie alla robusta domanda di server e AI
📁 Market AI generated ✅ DigiTimes

Wistron: profitti triplicati grazie alla robusta domanda di server e AI

Wistron ha registrato un aumento significativo dei profitti, triplicando i risultati precedenti, spinto da una forte crescita nella domanda di server. Questo incremento riflette la robustezza del mercato dell'intelligenza artificiale, che continua a richiedere infrastrutture dedicate e performanti. Il fenomeno evidenzia le sfide e le opportunità per le aziende che valutano deployment on-premise di LLM, tra esigenze di sovranità dei dati e ottimizzazione del TCO.

2026-05-09 📰 Fonte
La crescente carenza di chip di potenza minaccia l'espansione dei server AI
📁 Market AI generated ✅ DigiTimes

La crescente carenza di chip di potenza minaccia l'espansione dei server AI

La domanda di server per l'intelligenza artificiale sta esacerbando la carenza di chip di potenza, un componente critico per l'infrastruttura di calcolo. Questa situazione, aggravata dalla competizione nello sviluppo di tecnicie come il nitruro di gallio (GaN), impone nuove sfide e considerazioni strategiche per le aziende che pianificano deployment di Large Language Models (LLM) on-premise, influenzando TCO e disponibilità hardware.

2026-05-09 📰 Fonte
Le nuove regole cyber UE: un cambio di paradigma per la sicurezza AI e la difesa umana
📁 Altro AI generated ✅ DigiTimes

Le nuove regole cyber UE: un cambio di paradigma per la sicurezza AI e la difesa umana

Le recenti normative europee sulla sicurezza informatica stanno ridefinendo l'approccio alla protezione dei sistemi basati sull'intelligenza artificiale. L'attenzione si sposta dall'entusiasmo per l'AI a una difesa più robusta, guidata dall'intervento umano. Questo implica nuove sfide per le aziende che implementano LLM, con un'enfasi crescente sulla sovranità dei dati e sulla compliance, influenzando le decisioni di deployment on-premise.

2026-05-09 📰 Fonte
Aprile 2026: Una Svolta per i Large Language Models Locali
📁 Altro AI generated ℹ️ LocalLLaMA

Aprile 2026: Una Svolta per i Large Language Models Locali

Il mese di aprile 2026 ha segnato un punto di svolta significativo per i Large Language Models (LLM) destinati a deployment locali. Questa evoluzione apre nuove opportunità per le aziende che cercano maggiore controllo sui dati, sovranità e ottimizzazione del Total Cost of Ownership (TCO), spostando l'attenzione dalle soluzioni cloud-centriche verso architetture self-hosted e air-gapped, cruciali per la gestione di carichi di lavoro AI sensibili.

2026-05-09 📰 Fonte
Semiconduttori e AI: la domanda spinge le supply chain al limite
📁 Market AI generated ✅ DigiTimes

Semiconduttori e AI: la domanda spinge le supply chain al limite

Il mercato globale dei semiconduttori sta affrontando carenze significative, spinte dalla crescente domanda di intelligenza artificiale. Questa situazione mette sotto forte stress le catene di approvvigionamento, con implicazioni dirette per le aziende che pianificano deployment di Large Language Models (LLM), sia on-premise che in cloud. La disponibilità di hardware specializzato, come le GPU, diventa un fattore critico per la scalabilità e i costi operativi, influenzando il Total Cost of Ownership (TCO) e le strategie di deployment.

2026-05-09 📰 Fonte
Oracle e i licenziamenti: la classificazione dei lavoratori remoti impatta le tutele
📁 Market AI generated ✅ TechCrunch AI

Oracle e i licenziamenti: la classificazione dei lavoratori remoti impatta le tutele

Alcuni dipendenti Oracle licenziati hanno tentato di negoziare condizioni di uscita migliori, ma l'azienda ha rifiutato. La classificazione come lavoratori remoti ha impedito ad alcuni di accedere alle tutele previste dal WARN Act, come il preavviso di due mesi, sollevando interrogativi sulle implicazioni delle politiche aziendali per la forza lavoro distribuita.

2026-05-08 📰 Fonte
Qwen3.6-27B su RTX 4090: 80 t/s con MTP e TurboQuant a 262K di contesto
📁 Altro AI generated ℹ️ LocalLLaMA

Qwen3.6-27B su RTX 4090: 80 t/s con MTP e TurboQuant a 262K di contesto

Un recente esperimento ha dimostrato la capacità di eseguire il Large Language Model Qwen3.6-27B su una singola GPU NVIDIA RTX 4090, raggiungendo performance di 80-87 token al secondo con una finestra di contesto di ben 262K token. L'ottimizzazione è stata possibile grazie all'implementazione congiunta di MTP (Multi-Token Prediction) e TurboQuant, evidenziando il potenziale per deployment on-premise efficienti di LLM di grandi dimensioni su hardware consumer. Questo risultato apre nuove prospettive per le aziende che cercano soluzioni locali per la sovranità dei dati e il controllo dei costi.

2026-05-08 📰 Fonte
Qwen 35B-A3B su 12GB VRAM: prestazioni solide per LLM on-premise
📁 Hardware AI generated ℹ️ LocalLLaMA

Qwen 35B-A3B su 12GB VRAM: prestazioni solide per LLM on-premise

Un'analisi tecnica rivela che 12GB di VRAM, come quelli offerti da una RTX 3060, rappresentano un punto di equilibrio ideale per l'esecuzione locale del modello LLM Qwen 35B-A3B. Questa configurazione permette di mantenere un numero sufficiente di blocchi MoE sulla GPU, garantendo buone prestazioni di decoding e supportando contesti ampi fino a 32k token, un aspetto cruciale per i deployment on-premise che cercano efficienza e controllo.

2026-05-08 📰 Fonte
AI2 presenta EMO: un nuovo LLM MoE con routing documentale avanzato
📁 LLM AI generated ℹ️ LocalLLaMA

AI2 presenta EMO: un nuovo LLM MoE con routing documentale avanzato

AI2 ha rilasciato EMO, un nuovo Large Language Model basato su architettura Mixture of Experts. Addestrato su un trilione di token, EMO presenta 1 miliardo di parametri attivi su un totale di 14 miliardi. La sua innovazione risiede nel routing a livello di documento, che consente agli esperti di specializzarsi in domini specifici come salute o notizie, ottimizzando l'elaborazione delle informazioni.

2026-05-08 📰 Fonte
Rocket Lab: Ricavi in Forte Crescita e Backlog Record, in Attesa del Lancio Neutron
📁 Market AI generated ℹ️ The Next Web

Rocket Lab: Ricavi in Forte Crescita e Backlog Record, in Attesa del Lancio Neutron

Rocket Lab ha registrato una crescita dei ricavi del 64% e un backlog di 2,2 miliardi di dollari, con il titolo azionario a livelli record. L'azienda ha venduto più lanci nel primo trimestre del 2026 che nell'intero anno precedente, ma l'atteso razzo Neutron deve ancora effettuare il suo volo inaugurale, un fattore già prezzato dal mercato.

2026-05-08 📰 Fonte
Tesla Model Y: test di sicurezza superati, ma indagini in corso su 3,2 milioni di veicoli
📁 Altro AI generated ℹ️ The Next Web

Tesla Model Y: test di sicurezza superati, ma indagini in corso su 3,2 milioni di veicoli

L'NHTSA ha annunciato che la Tesla Model Y è il primo veicolo a superare i nuovi test di sicurezza per sistemi avanzati di assistenza alla guida. Contemporaneamente, l'agenzia sta indagando su 3,2 milioni di veicoli Tesla per incidenti avvenuti durante l'uso del sistema di guida autonoma avanzato dell'azienda. La notizia evidenzia la complessità della valutazione delle tecnicie AI in ambito automotive, tra certificazioni e sfide sul campo.

2026-05-08 📰 Fonte
Google integra più link ai siti web negli AI Overviews
📁 Market AI generated ✅ Ars Technica AI

Google integra più link ai siti web negli AI Overviews

Google sta modificando i suoi AI Overviews per includere un maggior numero di link diretti a siti web, una mossa che segue le preoccupazioni dei publisher riguardo al calo di traffico. Le nuove sezioni "Further Exploration" e "Expert Advice" mirano a fornire agli utenti risorse aggiuntive, bilanciando le risposte generate dall'intelligenza artificiale con l'accesso ai contenuti originali del web.

2026-05-08 📰 Fonte
OpenAI e la sicurezza di Codex: un modello per gli agenti di codice
📁 Altro AI generated 🏆 OpenAI Blog

OpenAI e la sicurezza di Codex: un modello per gli agenti di codice

OpenAI ha delineato le strategie adottate per garantire la sicurezza del suo modello Codex, un agente di codice basato su Large Language Models. L'approccio si fonda su sandboxing, processi di approvazione rigorosi, politiche di rete mirate e telemetria nativa dell'agente. Queste misure sono cruciali per supportare un'adozione sicura e conforme degli agenti di programmazione, affrontando le sfide intrinseche legate all'esecuzione di codice generato dall'IA in ambienti produttivi.

2026-05-08 📰 Fonte
Violate cinque centrali idriche polacche: la minaccia delle password deboli
📁 Altro AI generated ℹ️ The Next Web

Violate cinque centrali idriche polacche: la minaccia delle password deboli

Nel 2025, hacker hanno compromesso cinque impianti di trattamento delle acque in Polonia, accedendo ai sistemi di controllo industriale. Il vettore d'attacco si è rivelato essere l'uso di password deboli o predefinite, una vulnerabilità che affligge anche il 70% delle utility idriche americane. L'incidente evidenzia i rischi per le infrastrutture critiche e l'importanza di robuste pratiche di sicurezza per i deployment on-premise.

2026-05-08 📰 Fonte
Il Pentagono pubblica 162 dossier UFO: trasparenza o segreti?
📁 Altro AI generated ℹ️ The Next Web

Il Pentagono pubblica 162 dossier UFO: trasparenza o segreti?

Il Dipartimento della Guerra statunitense ha lanciato un portale dedicato ai Fenomeni Aerei Non Identificati (UAP), comunemente noti come UFO. Il sito war.gov/ufo ospita 162 documenti, tra cui immagini della missione Apollo 17 e video militari, ma due terzi del materiale risulta parzialmente censurato. L'iniziativa, presentata come un gesto di trasparenza, solleva interrogativi sulla completezza delle informazioni divulgate al pubblico.

2026-05-08 📰 Fonte
Indagine NHTSA su Avride: 16 incidenti in quattro mesi per i robotaxi di Uber
📁 Market AI generated ℹ️ The Next Web

Indagine NHTSA su Avride: 16 incidenti in quattro mesi per i robotaxi di Uber

La National Highway Traffic Safety Administration (NHTSA) ha avviato un'indagine su Avride, partner di Uber per i veicoli autonomi, dopo aver registrato 16 incidenti e un infortunio minore in soli quattro mesi a Dallas. L'agenzia ha criticato i robotaxi per la loro "eccessiva assertività e insufficiente capacità", sollevando interrogativi sulla maturità delle tecnicie di guida autonoma e le loro implicazioni per il deployment di sistemi AI in contesti critici.

2026-05-08 📰 Fonte
Lemonade integra vLLM con supporto ROCm: un nuovo backend sperimentale per LLM on-premise
📁 Frameworks AI generated ℹ️ LocalLLaMA

Lemonade integra vLLM con supporto ROCm: un nuovo backend sperimentale per LLM on-premise

Lemonade, una piattaforma per l'esecuzione locale di Large Language Models, ha annunciato l'integrazione sperimentale di vLLM con supporto ROCm. Questa novità permette di eseguire LLM in formato `.safetensors` direttamente su hardware AMD, offrendo agli sviluppatori e alle aziende un'alternativa per i deployment on-premise. Il team cerca feedback dalla community per guidare lo sviluppo futuro di questa integrazione, mirando a un ecosistema AI più diversificato e flessibile.

2026-05-08 📰 Fonte
Cloudflare: l'AI rende obsoleti 1.100 ruoli, ricavi record
📁 Market AI generated ✅ TechCrunch AI

Cloudflare: l'AI rende obsoleti 1.100 ruoli, ricavi record

Cloudflare ha annunciato il suo primo licenziamento su larga scala, che ha interessato circa 1.100 posizioni. Secondo il CEO Matthew Prince, l'efficienza operativa ottenuta grazie all'intelligenza artificiale ha ridotto la necessità di ruoli di supporto. Questo avviene in un contesto di crescita, con l'azienda che ha registrato ricavi record. La notizia solleva interrogativi sull'impatto dell'AI sulla forza lavoro aziendale.

2026-05-08 📰 Fonte
Il Dilemma di VS Code
📁 General Editoriale

Il Dilemma di VS Code

Do you abandon your carefully curated Visual Studio Code environment for a sleek, AI-native fork like Windsurf or Cursor? Or do you fortify your existing VS Code setup with powerful, "bring-your-own-key" (BYOK) extensions like Cline, Roo Code, and Continue?

2026-05-08
DeepSeek punta a un finanziamento record da 7,35 miliardi di dollari e accelera lo sviluppo LLM
📁 Market AI generated ℹ️ LocalLLaMA

DeepSeek punta a un finanziamento record da 7,35 miliardi di dollari e accelera lo sviluppo LLM

DeepSeek, l'azienda cinese di intelligenza artificiale, starebbe cercando di raccogliere 7,35 miliardi di dollari in un round di finanziamento che potrebbe essere il più grande nella storia del settore AI cinese. L'operazione mira ad accelerare la strategia di commercializzazione e monetizzazione, con l'azienda che prevede di intensificare il rilascio dei suoi Large Language Models. Tra le novità attese, il lancio della versione V4.1 del suo modello è previsto per giugno.

2026-05-08 📰 Fonte
La community DGX Spark: ingegno e ottimizzazione oltre i limiti hardware
📁 Hardware AI generated ℹ️ LocalLLaMA

La community DGX Spark: ingegno e ottimizzazione oltre i limiti hardware

Nonostante le iniziali critiche sulle specifiche hardware del DGX Spark, in particolare riguardo alla larghezza di banda della memoria e al chip SM-121, la sua community di sviluppatori sta dimostrando un'eccezionale tenacia. Attraverso un forum dedicato, i membri collaborano attivamente per ottimizzare ogni aspetto della piattaforma, migliorando le performance di inference e lo stack software. Questo sforzo collettivo mira a superare i limiti percepiti, trasformando le sfide tecniche in opportunità di innovazione e sviluppo di progetti specifici, sfruttando la coerenza dell'hardware e del sistema operativo.

2026-05-08 📰 Fonte
Violazione Canvas: il rischio della centralizzazione dei dati studenteschi nel cloud
📁 Altro AI generated ✅ 404 Media

Violazione Canvas: il rischio della centralizzazione dei dati studenteschi nel cloud

Un attacco ransomware al sistema Canvas ha esposto i dati di oltre 275 milioni di studenti e miliardi di messaggi. L'incidente, definito "il più grande disastro di privacy dei dati studenteschi della storia", evidenzia i pericoli della centralizzazione delle informazioni sensibili in servizi cloud, in contrasto con le soluzioni self-hosted che offrono maggiore controllo e sovranità sui dati.

2026-05-08 📰 Fonte
L'AI per l'impresa: alleanze strategiche e acquisizioni miliardarie infiammano il mercato
📁 Market AI generated ✅ TechCrunch AI

L'AI per l'impresa: alleanze strategiche e acquisizioni miliardarie infiammano il mercato

Il mercato dell'AI per l'impresa è in piena ebollizione, con un'intensa attività che spazia da nuove joint venture a significative acquisizioni. Aziende come Anthropic e OpenAI stanno stringendo alleanze per il deployment di soluzioni AI, mentre giganti come SAP investono massicciamente, come dimostra l'acquisizione da un miliardo di dollari della startup tedesca Prior Labs. Questo scenario suggerisce che le startup focalizzate su strumenti AI per le aziende sono ora obiettivi primari per acquisizioni strategiche.

2026-05-08 📰 Fonte
z-lab rilascia DFlash per Gemma 4 26B: un nuovo approccio all'inference LLM on-premise
📁 Frameworks AI generated ℹ️ LocalLLaMA

z-lab rilascia DFlash per Gemma 4 26B: un nuovo approccio all'inference LLM on-premise

z-lab ha introdotto DFlash, una nuova tecnicia per l'inference di Large Language Models come Gemma 4 26B. Promettendo miglioramenti significativi nella gestione del contesto e nella velocità rispetto ad alternative come MTP, DFlash si propone come soluzione per ottimizzare i deployment on-premise, sebbene sia attualmente limitato a vLLM. La sua efficienza è cruciale per chi cerca controllo e costi contenuti.

2026-05-08 📰 Fonte
Gemma 4 26B: Oltre 570 token/s su una singola RTX 5090 con DFlash
📁 Frameworks AI generated ℹ️ LocalLLaMA

Gemma 4 26B: Oltre 570 token/s su una singola RTX 5090 con DFlash

Un recente benchmark ha dimostrato come la decodifica speculativa DFlash in vLLM possa accelerare significativamente l'inference di Large Language Models. Testando Gemma 4 26B su una RTX 5090 con 32GB VRAM, si è raggiunto un throughput di quasi 580 token al secondo, con una riduzione della latenza di oltre il 60%. Questi risultati evidenziano il potenziale di ottimizzazione per i deployment on-premise.

2026-05-08 📰 Fonte
ICE valuta occhiali smart per potenziare il riconoscimento facciale
📁 Altro AI generated ✅ 404 Media

ICE valuta occhiali smart per potenziare il riconoscimento facciale

L'agenzia statunitense Immigration and Customs Enforcement (ICE) sta esplorando lo sviluppo di occhiali smart per integrare la sua applicazione di riconoscimento facciale, Mobile Fortify. Questo sistema permette agli ufficiali di identificare persone e interrogare database governativi per verificarne la cittadinanza e prendere decisioni di detenzione. La mossa rappresenta un'ulteriore escalation tecnicica nell'ambito delle operazioni di controllo migratorio, sollevando questioni cruciali su sovranità dei dati e deployment all'edge.

2026-05-08 📰 Fonte
RingCentral potenzia AI Receptionist con integrazioni Shopify, Calendly e WhatsApp
📁 Market AI generated ℹ️ AI News

RingCentral potenzia AI Receptionist con integrazioni Shopify, Calendly e WhatsApp

RingCentral ha ampliato le funzionalità del suo prodotto AI Receptionist (AIR), integrando Shopify, Calendly e WhatsApp. Questa espansione mira a estendere le capacità di AIR oltre la gestione base delle chiamate, includendo la gestione degli ordini, la pianificazione degli appuntamenti e la risposta ai messaggi WhatsApp. L'obiettivo è supportare le organizzazioni di piccole e medie dimensioni nella gestione delle richieste dei clienti, migliorando l'efficienza operativa e riducendo i tempi di attesa.

2026-05-08 📰 Fonte
Quando l'AI Incontra la Creatività: Nuove Prospettive per la Pubblicità Locale
📁 LLM AI generated 🏆 Google AI Blog

Quando l'AI Incontra la Creatività: Nuove Prospettive per la Pubblicità Locale

L'iniziativa "The Small Brief" vede quattro icone del settore pubblicitario collaborare per supportare le piccole imprese locali. Utilizzando l'intelligenza artificiale per creare campagne, il progetto esplora il potenziale dell'AI nel generare contenuti pubblicitari innovativi, evidenziando al contempo le sfide e le opportunità legate al deployment di tali tecnicie, dalla sovranità dei dati ai costi infrastrutturali e alla necessità di un'attenta valutazione del TCO per le soluzioni self-hosted.

2026-05-08 📰 Fonte
California: proposta per tutelare i lavoratori dall'impatto dell'AI
📁 Market AI generated ✅ Wired AI

California: proposta per tutelare i lavoratori dall'impatto dell'AI

Un candidato governatore della California ha avanzato una proposta per garantire nuovi posti di lavoro ai dipendenti che potrebbero essere sostituiti dall'intelligenza artificiale. L'iniziativa evidenzia il crescente dibattito sull'impatto sociale ed economico dell'AI, un tema rilevante per le aziende che valutano strategie di deployment on-premise o cloud e le relative implicazioni sulla forza lavoro e sul TCO.

2026-05-08 📰 Fonte
La visione di Nick Bostrom: l'IA avanzata per un "mondo risolto"
📁 LLM AI generated ✅ Wired AI

La visione di Nick Bostrom: l'IA avanzata per un "mondo risolto"

Il filosofo Nick Bostrom propone una visione audace per il futuro dell'umanità, immaginando un "grande ritiro" reso possibile da un'intelligenza artificiale altamente avanzata. Questa prospettiva suggerisce che l'IA potrebbe condurre a un "mondo risolto", dove le sfide fondamentali dell'esistenza umana sono superate, sollevando interrogativi sulle implicazioni tecniciche e infrastrutturali di sistemi così potenti.

2026-05-08 📰 Fonte
Intel: la crescita del titolo e le sfide strategiche della leadership
📁 Market AI generated ℹ️ The Next Web

Intel: la crescita del titolo e le sfide strategiche della leadership

Il valore azionario di Intel è triplicato in dodici mesi sotto la guida del CEO Lip-Bu Tan, in carica da marzo 2025. Nonostante il successo finanziario, il piano strategico aziendale non è ancora stato comunicato alla maggior parte dei dipendenti. La sua gestione si è concentrata sulle relazioni esterne, sollevando interrogativi sulle implicazioni per lo sviluppo interno e le future offerte hardware per il settore AI.

2026-05-08 📰 Fonte
Proposta H-1B: Aumenti salariali significativi per ingegneri tech negli USA
📁 Market AI generated ℹ️ The Next Web

Proposta H-1B: Aumenti salariali significativi per ingegneri tech negli USA

Una proposta dell'amministrazione Trump, pubblicata a marzo, mira a innalzare le soglie salariali minime per i visti H-1B, con impatti notevoli sui costi del personale tech negli Stati Uniti. Per un ingegnere software entry-level a San Francisco, il salario minimo richiesto salirebbe a 162.000 dollari annui, mentre a Dallas e New York si registrerebbero aumenti simili, superando del 30% gli attuali requisiti.

2026-05-08 📰 Fonte
Transformer Lab: fine-tuning di LLM TTS su hardware locale
📁 Altro AI generated ℹ️ LocalLLaMA

Transformer Lab: fine-tuning di LLM TTS su hardware locale

Transformer Lab, una piattaforma open source per la ricerca in machine learning, ha presentato una demo che illustra il processo di fine-tuning del modello Orpheus 3B per applicazioni text-to-speech. La soluzione permette agli utenti di eseguire l'addestramento direttamente sul proprio hardware, enfatizzando i benefici del deployment on-premise per la sovranità dei dati e il controllo sull'infrastruttura, offrendo sia un'interfaccia grafica che una CLI.

2026-05-08 📰 Fonte
Qwen3.6-27B su llama.cpp MTP: le sfide del contesto esteso on-premise
📁 Altro AI generated ℹ️ LocalLLaMA

Qwen3.6-27B su llama.cpp MTP: le sfide del contesto esteso on-premise

Un'analisi approfondita dell'implementazione di Qwen3.6-27B con llama.cpp MTP rivela sfide significative nella gestione di contesti estesi per i Large Language Models self-hosted. I dati mostrano un calo delle prestazioni di generazione oltre gli 85.000 token, evidenziando l'importanza dell'ottimizzazione della cache KV per i deployment on-premise. Le osservazioni sottolineano i trade-off tra la profondità del contesto e la velocità di Inference in ambienti locali.

2026-05-08 📰 Fonte
NVIDIA Personaplex e il Tool Calling: capacità e implicazioni per i LLM
📁 LLM AI generated ℹ️ LocalLLaMA

NVIDIA Personaplex e il Tool Calling: capacità e implicazioni per i LLM

NVIDIA Personaplex, un modello vocale in tempo reale, solleva interrogativi sul supporto al Tool Calling. Questa capacità, cruciale per l'interazione dei Large Language Models con sistemi esterni, è fondamentale per estendere le loro funzionalità. L'articolo esplora le implicazioni di tale integrazione, specialmente nei deployment on-premise, dove sovranità dei dati e controllo della pipeline sono prioritari.

2026-05-08 📰 Fonte
Consumi di memoria crescenti in llama.cpp: un'analisi on-premise
📁 Altro AI generated ℹ️ LocalLLaMA

Consumi di memoria crescenti in llama.cpp: un'analisi on-premise

Un utente ha segnalato un consumo di memoria progressivamente crescente durante l'esecuzione di un LLM da 105GB con un contesto di 150K token su un sistema locale da 128GB, utilizzando `llama.cpp` e LM Studio. Nonostante i tentativi di liberare la memoria, il consumo è salito a 120GB, suggerendo una potenziale perdita di memoria. Questo solleva interrogativi sulla stabilità e l'efficienza dei deployment on-premise di LLM di grandi dimensioni.

2026-05-08 📰 Fonte
HP Z6 G5 A: La workstation si aggiorna per l'AI on-premise con Threadripper PRO 9000 e Blackwell
📁 Hardware AI generated ✅ Phoronix

HP Z6 G5 A: La workstation si aggiorna per l'AI on-premise con Threadripper PRO 9000 e Blackwell

HP ha aggiornato la sua workstation Z6 G5 A, ora equipaggiata con i processori AMD Ryzen Threadripper PRO 9000 e le GPU NVIDIA RTX PRO Blackwell. Questo sistema, già noto per la sua compatibilità con Linux, offre prestazioni elevate per carichi di lavoro AI e LLM, posizionandosi come una soluzione robusta per deployment on-premise che richiedono controllo e sovranità dei dati.

2026-05-08 📰 Fonte
NVIDIA lancia CUDA-Oxide 0.1: Rust incontra CUDA per le GPU
📁 Frameworks AI generated ✅ Phoronix

NVIDIA lancia CUDA-Oxide 0.1: Rust incontra CUDA per le GPU

NVIDIA Labs ha rilasciato CUDA-Oxide 0.1, un compilatore sperimentale che permette di sviluppare kernel CUDA per le GPU NVIDIA utilizzando il linguaggio di programmazione Rust. Questo progetto mira a migliorare le capacità di programmazione ad alte prestazioni, offrendo i vantaggi di sicurezza e controllo di Rust. L'iniziativa è particolarmente rilevante per le organizzazioni che cercano di ottimizzare i carichi di lavoro AI e LLM in ambienti self-hosted, dove il controllo granulare sull'hardware e sul software è cruciale per il TCO e la sovranità dei dati.

2026-05-08 📰 Fonte
Front Ventures: 5 milioni di euro per la tecnicia di difesa in Ucraina e Svezia
📁 Market AI generated ℹ️ Tech.eu

Front Ventures: 5 milioni di euro per la tecnicia di difesa in Ucraina e Svezia

Front Ventures, società di investimento con sede a Stoccolma, ha raccolto 5 milioni di euro attraverso un'emissione di azioni sottoscritta al 278%. Il capitale sarà destinato a sostenere aziende di tecnicia di difesa in fase iniziale, con un focus su Ucraina e Svezia. L'obiettivo è accelerare la scalabilità di soluzioni innovative già testate sul campo, in settori come droni, comunicazioni e software, facilitando partnership industriali europee e NATO.

2026-05-08 📰 Fonte
Mercato Tech Europeo: ElevenLabs raccoglie oltre 550 milioni, DeepL taglia 250 posti e le tendenze di aprile
📁 Market AI generated ℹ️ Tech.eu

Mercato Tech Europeo: ElevenLabs raccoglie oltre 550 milioni, DeepL taglia 250 posti e le tendenze di aprile

Il panorama tecnicico europeo ha registrato un aprile dinamico, con oltre 65 accordi di finanziamento per un valore superiore a 1,4 miliardi di euro. Tra le notizie di spicco, ElevenLabs ha ampliato il suo Series D a oltre 550 milioni di dollari, coinvolgendo investitori come BlackRock e Nvidia. Parallelamente, DeepL, startup tedesca di traduzione AI, ha annunciato il taglio di 250 posti di lavoro, segnalando un periodo di consolidamento nel settore. Il mese ha visto anche importanti acquisizioni e un crescente focus sulla sovranità della difesa con il nuovo hub per droni.

2026-05-08 📰 Fonte
Coinbase: licenziamenti, perdite e un blackout di sette ore per un data center surriscaldato
📁 Altro AI generated ℹ️ The Next Web

Coinbase: licenziamenti, perdite e un blackout di sette ore per un data center surriscaldato

Coinbase ha affrontato una settimana difficile, caratterizzata da un taglio di 700 posti di lavoro e una perdita trimestrale di 394 milioni di dollari. La situazione è culminata in un blackout di sette ore, causato dal surriscaldamento di un data center in Virginia. L'incidente evidenzia le sfide infrastrutturali che possono colpire anche aziende che puntano sull'efficienza dell'intelligenza artificiale per le proprie operazioni.

2026-05-08 📰 Fonte
Malware nei repository AI: Hugging Face sotto attacco, rischio per la supply chain
📁 Altro AI generated ℹ️ The Next Web

Malware nei repository AI: Hugging Face sotto attacco, rischio per la supply chain

I principali repository di modelli e agenti AI sono stati sistematicamente compromessi da malware. Hugging Face, una piattaforma cruciale che ospita oltre un milione di modelli di machine learning, è stata trovata contenere centinaia di modelli malevoli. Questi modelli sono in grado di eseguire codice arbitrario sulle macchine degli utenti, trasformando l'infrastruttura di sviluppo AI in un vettore di attacco e sollevando gravi preoccupazioni per la sicurezza della supply chain software.

2026-05-08 📰 Fonte
DS4: un motore di inference ottimizzato per DeepSeek 4 su MacBook da 128GB
📁 Altro AI generated ℹ️ LocalLLaMA

DS4: un motore di inference ottimizzato per DeepSeek 4 su MacBook da 128GB

Il progetto DS4 introduce un motore di inference specifico per il modello DeepSeek 4, progettato per operare in modo efficiente sui MacBook dotati di 128GB di RAM. Questa iniziativa, guidata da antirez, si concentra sull'ottimizzazione per la memoria flash, evidenziando il crescente interesse verso l'esecuzione di Large Language Models direttamente su dispositivi client. Rappresenta un passo significativo per chi cerca soluzioni di AI on-device, garantendo controllo e sovranità dei dati.

2026-05-08 📰 Fonte
Linux 7.2 introduce dm-inlinecrypt per la crittografia on-premise dei dati
📁 Altro AI generated ✅ Phoronix

Linux 7.2 introduce dm-inlinecrypt per la crittografia on-premise dei dati

Il prossimo kernel Linux 7.2 integrerà `dm-inlinecrypt`, una nuova funzionalità del DeviceMapper che abilita la crittografia inline dei dispositivi a blocchi. Questa innovazione è cruciale per le aziende che gestiscono carichi di lavoro sensibili, inclusi gli LLM, in ambienti self-hosted, migliorando la sicurezza dei dati e l'efficienza operativa. La crittografia inline offre vantaggi in termini di performance e compliance, aspetti fondamentali per la sovranità dei dati.

2026-05-08 📰 Fonte
Strategie di comunicazione tech: spunti dal Summit EU-Startups 2026
📁 Altro AI generated ℹ️ The Next Web

Strategie di comunicazione tech: spunti dal Summit EU-Startups 2026

Il Summit EU-Startups 2026 a Valletta ha ospitato un panel dedicato alle strategie di PR per le startup. La discussione ha offerto spunti pratici su come ottenere copertura mediatica, dalla verifica interna delle notizie alla scelta di un'agenzia. Questi principi sono cruciali anche per le aziende tech che sviluppano soluzioni complesse, come i deployment on-premise di LLM, dove la chiarezza comunicativa è fondamentale per CTO e decision-makers che valutano TCO e sovranità dei dati.

2026-05-08 📰 Fonte
USA: 69 giurisdizioni bloccano nuovi data center AI, 4 divieti permanenti
📁 Altro AI generated ℹ️ Tom's Hardware

USA: 69 giurisdizioni bloccano nuovi data center AI, 4 divieti permanenti

Negli Stati Uniti, un numero crescente di giurisdizioni sta imponendo moratorie o divieti permanenti sulla costruzione di nuovi data center dedicati all'intelligenza artificiale. Attualmente, 69 località hanno bloccato nuove edificazioni, con quattro di questi provvedimenti che sono stati resi definitivi. Questa tendenza evidenzia le crescenti preoccupazioni legate all'impatto ambientale e infrastrutturale delle strutture AI ad alta densità.

2026-05-08 📰 Fonte
Spotify espande il suo AI DJ: nuove lingue per l'Europa e il Brasile
📁 LLM AI generated ℹ️ The Next Web

Spotify espande il suo AI DJ: nuove lingue per l'Europa e il Brasile

Spotify ha annunciato l'espansione della sua funzionalità premium AI DJ, introducendo il supporto per quattro nuove lingue: francese, tedesco, italiano e portoghese brasiliano. Questa mossa mira a migliorare l'esperienza utente in Europa e Brasile, rendendo il DJ virtuale interattivo accessibile a un pubblico più ampio. La tecnicia sottostante implica l'uso di Large Language Models per la generazione vocale e la selezione musicale personalizzata.

2026-05-08 📰 Fonte
Il 'Tiny Lab' per LLM: un approccio self-hosted alla sperimentazione AI
📁 Altro AI generated ℹ️ LocalLLaMA

Il 'Tiny Lab' per LLM: un approccio self-hosted alla sperimentazione AI

L'idea di un 'tiny lab' personale per Large Language Models evidenzia la crescente tendenza verso deployment self-hosted. Questa scelta offre controllo sui dati e costi operativi prevedibili, contrapponendosi alle soluzioni cloud e ponendo l'accento sull'hardware locale e la sovranità dei dati.

2026-05-08 📰 Fonte
L'Evoluzione del Software Enterprise: Dalla Compliance all'Framework Operativa Globale
📁 Altro AI generated ℹ️ The Next Web

L'Evoluzione del Software Enterprise: Dalla Compliance all'Framework Operativa Globale

Il software HR globale sta trascendendo il ruolo di mero strumento di compliance, trasformandosi in uno strato infrastrutturale operativo essenziale per le aziende distribuite. Questa evoluzione porta con sé nuove sfide nella gestione di team globali, evidenziando la crescente complessità e la necessità di decisioni strategiche sull'infrastruttura e la sovranità dei dati.

2026-05-08 📰 Fonte
Lime punta al Nasdaq: la micromobilità alla prova del mercato
📁 Market AI generated ℹ️ The Next Web

Lime punta al Nasdaq: la micromobilità alla prova del mercato

Lime, operatore di scooter e e-bike supportato da Uber, ha presentato la richiesta per una IPO al Nasdaq con il ticker LIME. Con 686 milioni di dollari di ricavi nel 2024 e due anni consecutivi di free cash flow, l'azienda si distingue nel settore della micromobilità, rappresentando il primo test significativo sul mercato pubblico in otto anni per la categoria.

2026-05-08 📰 Fonte
G2A nomina Krzysztof Krawczyk alla guida del consiglio consultivo dopo l'ingresso di CVC
📁 Market AI generated ℹ️ The Next Web

G2A nomina Krzysztof Krawczyk alla guida del consiglio consultivo dopo l'ingresso di CVC

G2A, il marketplace digitale di origini polacche che ha raggiunto quasi 400 milioni di dollari di GMV annuo senza finanziamenti esterni, ha nominato Krzysztof Krawczyk, veterano di CVC, presidente del suo consiglio consultivo. L'ingresso di CVC con una quota di minoranza segna una nuova fase per G2A, che punta a espansione globale e M&A, affidandosi all'esperienza di Krawczyk nel private equity per guidare la crescita futura dopo 16 anni di sviluppo organico.

2026-05-08 📰 Fonte
Il data center AI Stargate in Texas e l'infrastruttura energetica on-site
📁 Altro AI generated ℹ️ Tom's Hardware

Il data center AI Stargate in Texas e l'infrastruttura energetica on-site

Il data center AI Stargate ad Abilene, Texas, sta sviluppando un'infrastruttura energetica on-site. Durante un tour per la stampa, sono state mostrate le turbine a gas di GE Vernova, parte di un impianto a gas naturale in costruzione. Questa scelta evidenzia l'importanza della generazione di energia localizzata per i grandi carichi di lavoro AI, un fattore chiave per il TCO e la resilienza dei deployment on-premise.

2026-05-08 📰 Fonte
OpenZL 0.2 di Meta: l'evoluzione della compressione consapevole dei formati
📁 Frameworks AI generated ✅ Phoronix

OpenZL 0.2 di Meta: l'evoluzione della compressione consapevole dei formati

Meta ha rilasciato OpenZL 0.2, la nuova versione del suo framework di compressione dati consapevole dei formati. Annunciato lo scorso ottobre, OpenZL punta a offrire velocità elevate e rapporti di compressione superiori, rappresentando il successore di Zstandard (Zstd). Questa tecnicia è cruciale per ottimizzare lo storage e il trasferimento di grandi volumi di dati, con implicazioni dirette per le infrastrutture on-premise.

2026-05-08 📰 Fonte
DeepMind addestra l'AI su Eve Online: Google investe in Fenris Creations
📁 LLM AI generated ℹ️ Tom's Hardware

DeepMind addestra l'AI su Eve Online: Google investe in Fenris Creations

Google DeepMind avvia un progetto per addestrare l'intelligenza artificiale sulle complesse interazioni dei giocatori nel MMORPG Eve Online. L'iniziativa è supportata da un investimento di Google in Fenris Creations, la società dietro il gioco. L'obiettivo è sfruttare la vasta mole di dati generati da centinaia di migliaia di giocatori per sviluppare modelli AI più sofisticati, con implicazioni che vanno oltre il gaming e toccano le sfide infrastrutturali per il training di modelli su larga scala.

2026-05-08 📰 Fonte
CarCollect ottiene finanziamenti per espandere il remarketing automobilistico B2B
📁 Market AI generated ℹ️ Tech.eu

CarCollect ottiene finanziamenti per espandere il remarketing automobilistico B2B

La piattaforma olandese CarCollect, specializzata nel software B2B per il remarketing automobilistico, ha ricevuto un finanziamento da Main Capital Partners. La soluzione SaaS, basata su un'architettura cloud-native, digitalizza l'intero flusso di lavoro per i veicoli usati e mira a rafforzare la sua posizione nel mercato europeo, accelerare l'espansione internazionale e lanciare nuove funzionalità, inclusa la gestione dello stock.

2026-05-08 📰 Fonte
OpenAI introduce GPT-Realtime-2 e nuovi modelli vocali per API
📁 LLM AI generated ℹ️ The Next Web

OpenAI introduce GPT-Realtime-2 e nuovi modelli vocali per API

OpenAI ha ampliato la sua offerta di modelli vocali tramite API, introducendo GPT-Realtime-2 con capacità di ragionamento di classe GPT-5 per l'audio in tempo reale. L'azienda ha inoltre rilasciato un modello di traduzione che supporta oltre 70 lingue e una variante di Whisper per la trascrizione in streaming. La strategia di prezzo aggressiva mira a rendere queste soluzioni competitive per gli sviluppatori.

2026-05-08 📰 Fonte
SoftBank riduce il target del prestito garantito da azioni OpenAI a 6 miliardi di dollari
📁 Market AI generated ℹ️ The Next Web

SoftBank riduce il target del prestito garantito da azioni OpenAI a 6 miliardi di dollari

SoftBank Group ha tagliato del 40% l'obiettivo per un prestito garantito da azioni OpenAI, portandolo a 6 miliardi di dollari. La decisione, maturata a due settimane dalla richiesta iniziale di 10 miliardi, riflette la riluttanza dei creditori a valutare le azioni OpenAI come garanzia. Questo evidenzia una discrepanza tra la valutazione percepita di OpenAI e la disponibilità delle banche a concedere finanziamenti, un segnale per il mercato dell'AI.

2026-05-08 📰 Fonte
AMD spinge l'AI locale open source: integrazione con Gmail per GAIA
📁 Frameworks AI generated ✅ Phoronix

AMD spinge l'AI locale open source: integrazione con Gmail per GAIA

AMD continua a rafforzare il suo impegno nell'intelligenza artificiale locale e open source, focalizzandosi sull'hardware consumer Radeon e Ryzen. La recente versione 0.17.6 del software AMD GAIA introduce miglioramenti significativi per l'elaborazione AI su Windows, Linux e macOS, aggiungendo una nuova funzionalità che permette l'interazione con gli account Gmail, sottolineando la crescente fiducia nelle pipeline LLM eseguite in locale.

2026-05-08 📰 Fonte
Il finanziamento tech europeo rallenta ad aprile: investitori più selettivi
📁 Market AI generated ℹ️ Tech.eu

Il finanziamento tech europeo rallenta ad aprile: investitori più selettivi

Ad aprile 2026, le startup europee hanno raccolto 5,1 miliardi di euro attraverso 290 accordi, segnando un rallentamento nei finanziamenti. Il settore cleantech ha guidato gli investimenti, mentre il Regno Unito è rimasto il principale beneficiario, nonostante una diminuzione complessiva del capitale. Gli investitori mostrano una crescente selettività.

2026-05-08 📰 Fonte
I giocattoli AI per bambini: tra innovazione, privacy e sfide normative
📁 Altro AI generated ✅ Wired AI

I giocattoli AI per bambini: tra innovazione, privacy e sfide normative

I nuovi giocattoli connessi basati sull'intelligenza artificiale stanno ridefinendo il gioco e le interazioni quotidiane dei bambini. Tuttavia, la loro capacità di elaborare e interagire con i dati solleva significative preoccupazioni in termini di privacy e sicurezza, spingendo alcuni legislatori a considerare misure restrittive. Questo scenario evidenzia la crescente necessità di bilanciare l'innovazione tecnicica con la protezione dei dati sensibili, specialmente in contesti vulnerabili.

2026-05-08 📰 Fonte
← Precedente Page 32 / 119 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge