AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes

🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.

👥 160+ membri · Iscriviti gratis →

📡

Il Segnale del Giorno

Lo spettro delle sanzioni sull’open source AI: perché l’on-premise trema

Limiti all’export sui modelli open weight potrebbero minare la sovranità dei dati, spingendo le aziende che hanno investito in stack on-premise verso ...

📡 Segnale AI 2026-07-23

⚡ In Tendenza

View All →

📊 Statistiche

Archivio Totale

Articoli indicizzati nel sistema RAG

Categorie

📡 RSS Feed

🛠️ Guide & Osservatorio On-Premise

🚀 Esegui i modelli in locale → Tutte le guide →

Riferimenti evergreen e pratici per far girare l'AI in locale — hardware, costi, privacy e stack completo.

🖥️ Osservatorio LLM On-Premise Hardware, stack, governance e architetture di riferimento per l'AI in locale. →

⚡ Le migliori GPU per LLM locali 💰 Quanto costa un LLM in locale 🧩 Ollama vs LM Studio 🔒 ChatGPT privato per aziende 📉 Quantizzazione LLM spiegata 📊 Quanta VRAM per Llama 70B 🚀 Esegui i modelli in locale (Qwen, Llama, R1…)

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

📁 Hardware AI generated ✅ DigiTimes

Zhonghao Xinying lancia Xuyu, il processore TPU che sfida le GPU nel computing AI

L'azienda cinese Zhonghao Xinying ha presentato Xuyu, un processore TPU pensato per competere con le architetture GPU nei carichi di lavoro AI. L'annuncio segnala un'evoluzione nel mercato degli acceleratori custom, con possibili implicazioni per chi valuta deployment on-premise e sovranità dei dati.

2026-07-05 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

I magnati tech spendono 120 milioni per affondare la patrimoniale californiana

La Silicon Valley si mobilita con fondi record per bloccare la Proposition 40, che introdurrebbe un’imposta una tantum del 5% sui grandi patrimoni. La battaglia politica rivela la posta in gioco per chi detiene asset digitali e infrastrutture strategiche, e accende riflettori su TCO e controllo delle risorse.

2026-07-05 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Minions & Monsters: esordio al box office da 64 milioni, il più basso della saga

L'ultimo capitolo animato di Universal, Minions & Monsters, ha guidato il box office del weekend del 4 luglio negli Stati Uniti con un incasso di circa 64 milioni di dollari nei primi cinque giorni. Si tratta del debutto più debole nella storia del franchise di Cattivissimo Me, ben al di sotto dei 120 milioni e oltre dei due predecessori. Il risultato solleva interrogativi sulla stanchezza del pubblico per il marchio animato più redditizio di Comcast.

2026-07-05 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Startup AI-native: meno junior, più senior. Lo studio Harvard fa il punto

Un working paper di Harvard e INSEAD mostra che le startup costruite attorno all’intelligenza artificiale assumono meno personale entry-level e puntano su profili tecnici senior. Team snelli, gerarchie piatte e una concentrazione di competenze specialistiche disegnano un modello che ha implicazioni dirette per chi pianifica deployment on-premise di LLM, dove il talento senior scarseggia.

2026-07-05 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Un LLM da 270 milioni di parametri nato dal nulla e pensato per l'inference locale

Un ricercatore indipendente ha costruito un modello linguistico custom con architettura Transformer ottimizzata per l'esecuzione in locale. Rotary Positional Embeddings, RMSNorm, SwiGLU e grouped query attention compongono un decoder autoregressivo che segnala una direzione chiara: portare l'intelligenza artificiale direttamente sui dispositivi.

2026-07-05 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

VLM locali, il punto a luglio 2026: la community condivide setup e scelte

Un thread su Reddit invita a condividere i migliori Vision-Language Model eseguiti in locale. Emergono dettagli su hardware, engine di inference e casi d’uso, rivelando come la comunità aggiri l’inaffidabilità dei benchmark con resoconti pratici. Uno spaccato prezioso per chi valuta stack on-premise.

2026-07-05 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Open weight a rischio obsolescenza? Il ritardo delle Qwen e il nodo hardware

La decisione del team Qwen di posticipare il rilascio di modelli più grandi solleva dubbi sulla sostenibilità a lungo termine degli LLM open weight. Con un divario prestazionale già di 2-4 mesi rispetto ai sistemi state-of-the-art, ulteriori ritardi potrebbero allontanare la comunità che fa affidamento su GPU consumer per l'inference locale.

2026-07-05 📰 Fonte

📁 Hardware AI generated ℹ️ Tom's Hardware

La follia dei prezzi della RAM spinge un maker a costruirsi memoria fai-da-te con nuclei magnetici dell'era Apollo

Un appassionato ha assemblato un drive USB con memoria a nuclei magnetici fatti a mano, riciclando componenti russi d'epoca. Una risposta estrema ai costi attuali, che solleva interrogativi sulla longevità e sovranità dei dati per chi valuta stack hardware auto-gestiti.

2026-07-05 📰 Fonte

📁 Hardware AI generated ℹ️ LocalLLaMA

Qwen 3.6 27B: l'FP8 è il compromesso ideale per l'inference locale su Blackwell

Test sul campo con una RTX 6000 Pro 96 GB mostrano che la quantization FP8 offre il miglior equilibrio tra velocità di generazione e stabilità. L'NVFP4 spinge i token al massimo ma introduce instabilità in modalità agente, mentre BF16 è più lento. vLLM si conferma stabile e veloce grazie all'attenzione paginata.

2026-07-05 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

L'India intima a Meta: 7 giorni per rimuovere le inserzioni Instagram con abusi su minori

Il ministero dell'IT indiano ha ordinato la rimozione immediata di tutti i contenuti pubblicitari su Instagram che promuovono materiale pedopornografico. Meta dovrà spiegare in una settimana come quegli annunci siano stati approvati e illustrare le misure che intende adottare. L’episodio riaccende il dibattito su responsabilità delle piattaforme e controllo dei contenuti generati dagli utenti.

2026-07-05 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Le due corse dell’AI nel banking secondo Jane Fraser: non solo crescita, ma difesa

Jane Fraser, CEO di Citigroup, ha delineato due gare parallele nell’adozione dell’intelligenza artificiale nel settore bancario: una offensiva per generare ricavi e migliorare l’esperienza cliente, e una difensiva per proteggere gli istituti. Quest’ultima impone una riflessione su infrastrutture, sovranità dei dati e deployment on-premise, aspetti che AI-RADAR monitora con attenzione.

2026-07-05 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Il dominio USA sull’AI di frontiera incombe sul vertice NATO ad Ankara

La Casa Bianca decide quali alleati possono accedere ai modelli AI più avanzati. Il summit del 7 e 8 luglio accende il dibattito su sovranità digitale e spinge l’Europa a valutare stack on-premise per ridurre la dipendenza tecnicica.

2026-07-05 📰 Fonte

📁 Altro AI generated ℹ️ Tom's Hardware

‘Sweet niblets’, Hannah Montana Linux rinasce: v26 su Debian con KDE Plasma

A distanza di quasi due decenni, la distribuzione a tema Hannah Montana torna con una nuova release. Basata su Debian e con un’interfaccia KDE Plasma ri-skinata, la v26 mostra come un progetto nato per gioco possa ancora vivere, appoggiandosi sulla solidità delle fondamenta open source.

2026-07-05 📰 Fonte

📁 Hardware AI generated ℹ️ The Next Web

Hon Hai vola a +40% di vendite: la spinta dell’AI server per Nvidia

Il colosso taiwanese Hon Hai (Foxconn) registra un balzo dei ricavi del 40% su base trimestrale, trainato dalla domanda di server AI per Nvidia. Il dato, superiore alle attese, mette in evidenza la pressione sulla catena di fornitura hardware e i riflessi per chi sta valutando deployment on-premise di Large Language Models.

2026-07-05 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

La Corea del Sud punta i proventi fiscali dei chip AI su un fondo per il futuro

Il governo sudcoreano trasformerà l’extra gettito fiscale generato dal boom dei semiconduttori in un veicolo di investimento dedicato a intelligenza artificiale e manifattura avanzata. L’obiettivo dichiarato è creare risorse per le prossime generazioni, rafforzando la posizione del paese nella catena di fornitura globale dei chip per AI.

2026-07-05 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

L’app NHS userà l’AI per il triage: il delicato equilibrio tra innovazione e sovranità dei dati

Il governo britannico ha annunciato che l’app del Servizio Sanitario Nazionale utilizzerà un tool AI per valutare i sintomi e indirizzare i pazienti verso il servizio appropriato. La sperimentazione coinvolgerà 200.000 persone in Inghilterra entro il prossimo anno, all’interno di un piano di modernizzazione digitale da 10 miliardi di sterline. L’iniziativa solleva interrogativi aperti su privacy, controllo dei dati sanitari e architetture di deployment, temi centrali per chi segue l’evoluzione dell’AI on-premise in contesti regolati.

2026-07-05 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Allarme UK: non pubblicate foto dei figli, l'IA le usa per abusi

L'agenzia britannica contro il crimine mette in guardia i genitori: pubblicare immagini di minori online alimenta la creazione di abusi sessuali generati dall'AI. L'Internet Watch Foundation ha già identificato oltre 8.000 tra foto e video. La crescita esponenziale dei deepfake pedopornografici obbliga a ripensare la condivisione pubblica e i sistemi di rilevamento, con implicazioni per chi gestisce dati sensibili on-premise.

2026-07-05 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Mistral: i LLM chiusi danno ai provider un controllo enorme sui tuoi dati

Arthur Mensch, CEO di Mistral, mette in guardia le aziende: i modelli chiusi obbligano alla retention dei dati e concedono ai fornitori una leva sproporzionata. Una presa di posizione che rilancia il dibattito su sovranità digitale e convenienza del self-hosting.

2026-07-05 📰 Fonte

📁 Altro AI generated ℹ️ Tom's Hardware

Alibaba vieta Claude Code dopo presunto backdoor anti-Cina: arriva Qoder

Il gruppo cinese avrebbe scoperto una funzione nascosta in Claude Code in grado di riconoscere l'accesso dal territorio cinese. Ai dipendenti è stato ordinato di passare a Qoder, mentre cresce la tensione fra le due aziende. Un caso che riporta al centro del dibattito la sovranità dei dati e i rischi dei servizi AI basati su cloud.

2026-07-05 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Qwen 3.7 9B: Alibaba chiude i modelli, cosa cambia per chi fa self-hosting

Alibaba ha reso proprietari e solo API i modelli Qwen 3.7, alimentando la ricerca di alternative open nella classe 8B-9B per deployment locale. Il silenzio su una versione 9B invita a riflettere sulla direzione del mercato LLM per chi punta su sovranità e controllo.

2026-07-05 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

LongCat 2.0 open source: licenza MIT per il modello da 1,6T parametri e 48B attivi

I pesi di longcat 2.0 (1,6 trilioni di parametri totali, 48 miliardi attivi) sono ora disponibili sotto licenza MIT. Un segnale forte per i team che valutano LLM on-premise, con ricadute su sovranità dei dati, customizzazione e TCO.

2026-07-05 📰 Fonte

📁 Hardware AI generated ℹ️ Tom's Hardware

DARPA punta su batterie nucleari da 30 anni per droni autonomi e AI off-grid

Il progetto SYMPHONEE sfrutta lo Stronzio-90 per alimentare droni militari persistenti per decenni. Una scelta che potrebbe cambiare i contorni del calcolo AI edge, riducendo la dipendenza dal cloud e abbattendo il TCO per missioni a lunga durata senza manutenzione energetica.

2026-07-05 📰 Fonte

📁 Hardware AI generated ✅ Phoronix

AMD prepara i driver grafici Linux 7.3: segnali per l'on-premise AI

AMD ha inviato le prime richieste di pull per i driver grafici destinati al kernel Linux 7.3. Il lavoro di staging riflette l’impegno continuativo sullo stack open source, con potenziali implicazioni per le infrastrutture on-premise che usano GPU AMD per inference LLM.

2026-07-05 📰 Fonte

📁 Frameworks AI generated ℹ️ LocalLLaMA

MrFlow: accelerazione fino a 25x per i modelli di diffusione senza training

Un nuovo metodo training-free, MrFlow, accelera la generazione testo-immagine con una pipeline a risoluzioni multiple. Raggiunge speedup fino a 10x senza sacrificare la qualità visiva, combinabile con distillation per arrivare a 25x, senza kernel custom né riaddestramento.

2026-07-05 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

LLM locali e carichi agentici: il prefill è tutto, i KV head battono i parametri

Un benchmark su 13 modelli a contesto 65K-128K su GPU consumer mostra che il prefill assorbe il 94-99% del tempo per output brevi, diventando la metrica chiave. Il numero di KV head, non i parametri, determina la scalabilità. Sorprendenti i risultati sulla quantization del KV cache e sull’architettura Mamba2, mentre MLA soffre su Vulkan. L’analisi ridefinisce i criteri per deployment agentici on-premise.

2026-07-05 📰 Fonte

📁 Hardware AI generated ℹ️ LocalLLaMA

Qwen3.6-27B a Q8: finestra di contesto a 100K su 32 GB di VRAM

Un utente mostra come spingere la finestra di contesto di Qwen3.6-27B a 8 bit fino a 115.000 token su una singola GPU con 32 GB di VRAM, quantizzando la cache KV a diversi livelli. I benchmark su speculative decoding rivelano trade-off tra lunghezza del contesto, velocità d'inference e precisione. Un caso concreto per deployment on-premise su hardware consumer di fascia alta.

2026-07-05 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

L'onda di AI e HPC spinge i ricavi di CHPT a un nuovo picco mensile

La domanda di interfacce di test per chip destinati a carichi AI e HPC ha fatto segnare a Chunghwa Precision Test Tech (CHPT) il fatturato mensile più alto di sempre a giugno. Il dato riflette la pressione sulla filiera dei semiconduttori avanzati, con possibili effetti per chi pianifica deployment on-premise di GPU e acceleratori.

2026-07-05 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Inflazione dei componenti: l’allarme PMI da Taiwan che tocca anche l’AI on-premise

Il rallentamento dell’indice PMI manifatturiero a Taiwan, legato all’aumento dei costi dei semiconduttori, è un segnale da non ignorare per chi pianifica infrastrutture LLM on-premise. Tempi di consegna più lunghi e TCO in salita mettono alla prova le strategie di deployment self-hosted.

2026-07-05 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Robot, visori AR e AI PC incidono sui display: l'inference locale cambia le regole

La triade AI PC, occhiali per realtà aumentata e robotica sta ridisegnando le tecnicie di visualizzazione, spostando carichi di inference su dispositivi edge e impattando le scelte hardware per deployment on-premise. Latenza, costi e sovranità dei dati guidano l’evoluzione.

2026-07-05 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Da Bloomberg a DIGITIMES: come il giornalismo tech si adatta all’era dell’AI

Il passaggio da un modello informativo generalista a uno specialistico, rappresentato da DIGITIMES, non è solo una scelta editoriale ma una necessità per chi, nel mondo enterprise, deve prendere decisioni su hardware, LLM e sovranità dei dati.

2026-07-05 📰 Fonte

📁 Frameworks AI generated ℹ️ LocalLLaMA

L’architettura a “applicazioni” che potenzia i piccoli LLM nei compiti complessi

Un utente Reddit mostra come confinare un agente LLM in “applicazioni” dedicate, ognuna con strumenti e contesto ridotti, renda un modello Gemma 4 da 4 miliardi di parametri più efficace della versione da 26 miliardi su hardware consumer.

2026-07-05 📰 Fonte

📁 Altro AI generated ℹ️ LocalLLaMA

RTX 3090 e LLM: eseguire Qwen 27B con 200K token in locale è realtà

La community dei maker AI celebra la potenza della NVIDIA RTX 3090: un utente condivide la sua esperienza nell’eseguire il modello Qwen 27B con una finestra di contesto di 200.000 token, utilizzando la configurazione ‘club 3090’ disponibile su GitHub. La GPU consumer con 24 GB di VRAM dimostra la fattibilità di inference on‑premise con contesti lunghi, evidenziando l’evoluzione degli strumenti di quantization e ottimizzazione per chi cerca soluzioni locali.

2026-07-05 📰 Fonte

📁 Altro AI generated ✅ TechCrunch AI

Google immagina l'AI tra i Padri Fondatori: produttività cloud o rinuncia alla sovranità?

Un nuovo spot Google mostra i Padri Fondatori che usano l'AI in Workspace per la Dichiarazione d'Indipendenza. Un'immagine potente che solleva domande su controllo dei dati e scelte di deployment per chi non può permettersi di cedere informazioni sensibili a servizi cloud.

2026-07-04 📰 Fonte

📁 Altro AI generated ℹ️ LocalLLaMA

Anthropic accusata di prompt injection letterale: la segnalazione su Reddit che fa discutere

Un utente Reddit sostiene di aver trovato prove di prompt injection deliberata da parte di Anthropic. Qualunque sia la fondatezza, la vicenda riaccende i riflettori sulla trasparenza dei provider cloud di LLM e sul valore del controllo diretto dello stack per chi non può delegare la fiducia.

2026-07-04 📰 Fonte

📁 Altro AI generated ✅ TechCrunch AI

Midjourney chiede conto a Hollywood: svelino come usano l’IA

In un contenzioso legale con tre major, la società di generative AI cerca di obbligare gli studi a dichiarare come utilizzano i modelli di intelligenza artificiale. Una mossa che sposta il confronto dall’accusa di violazione del copyright alla trasparenza sull’adozione reale dell’IA nell’industria cinematografica, con possibili ricadute sulle scelte di deployment.

2026-07-04 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Starling Bank riduce il personale: l’IA accelera, ma la sovranità dei dati resta un nodo

La neobank londinese taglia 130 ruoli per semplificare le operation e integrare l’intelligenza artificiale. Mentre l’IA promette efficienza, il deployment on-premise diventa cruciale per chi gestisce dati finanziari sensibili e vuole evitare vincoli con i cloud provider.

2026-07-04 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Step 3.7 Flash: prompt alla Claude batte Hermes nel coding, e per i modelli locali è un segnale

Il blog di StepFun mostra che il modello Step 3.7 Flash, guidato da una strategia di prompting ispirata a Claude, supera il popolare sistema Hermes nei compiti di programmazione. Un risultato che obbliga a riflettere sul peso della configurazione software per chi esegue LLM on-premise.

2026-07-04 📰 Fonte

📁 Altro AI generated ✅ TechCrunch AI

Alibaba vieta l’uso di Claude Code: la mossa che accende i riflettori sulla sovranità dei dati codice

Il colosso cinese avrebbe classificato l’assistente di codifica di Anthropic come software ad alto rischio, bloccandone l’impiego interno. Una decisione che solleva interrogativi sull’effettiva proprietà dei dati quando si usano LLM di terze parti e che, per chi gestisce stack on-premise, rafforza la spinta verso soluzioni self-hosted.

2026-07-04 📰 Fonte

📁 Altro AI generated ✅ Phoronix

Linux: le patch del DRM scheduler riducono la latenza di invio job sotto carico

Un insieme di patch per lo scheduler Direct Rendering Manager del kernel Linux promette di abbattere la latenza di invio dei job GPU quando il sistema è gravato da molti processi CPU. Un miglioramento che interessa da vicino i deployment on-premise di LLM, dove la concorrenza tra carichi di lavoro può compromettere la reattività dell'inference locale.

2026-07-04 📰 Fonte

📁 LLM AI generated ✅ TechCrunch AI

Mistral AI: la sfida open source all’egemonia di OpenAI

La startup francese ha raccolto finanziamenti significativi dal 2023 per portare modelli di frontiera al pubblico. Ma dietro la retorica, il vero differenziale sta nei modelli aperti: una scelta che ridefinisce il controllo sui dati e le strategie di deployment per le imprese.

2026-07-04 📰 Fonte

📁 Hardware AI generated ℹ️ LocalLLaMA

Caldo record e DGX Spark: il comando che scongiura i crash estivi

Un utente Reddit ha condiviso una soluzione per prevenire i blocchi del DGX Spark durante le ondate di calore: underclock della GPU via nvidia-smi. Le temperature crollano da 85°C a 60°C, ripristinando la stabilità. L’episodio accende un riflettore su una sfida spesso trascurata del deployment on-premise: la gestione termica in ambienti non professionali.

2026-07-04 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Macron e Modi corteggiano i CEO per i data center: così si vince la corsa all’infrastruttura AI

La competizione per l’infrastruttura AI è diventata una partita di relazioni personali. Emmanuel Macron e Narendra Modi stanno conquistando investimenti miliardari in data center, determinando dove saranno addestrati i modelli del futuro. Una strategia che ridisegna la geopolitica del calcolo e offre nuove opzioni a chi cerca controllo e sovranità digitale.

2026-07-04 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Cina: i cinema abbracciano AI e caffè per sopravvivere, non solo film

Le nuove linee guida di Pechino spingono le sale a diversificare: agenti AI concierge, caffetterie e merchandise. Un’analisi su cosa significhi portare modelli linguistici nei locali, tra edge computing, latenza e sovranità dei dati.

2026-07-04 📰 Fonte

📁 Hardware AI generated ℹ️ The Next Web

Micron rompe il silicio a Hiroshima con 9 miliardi di dollari per la memoria dell’AI

L’azienda avvia l’espansione da 1.500 miliardi di yen per produrre HBM, la memoria impilata che accelera i carichi AI. L’investimento segnala una domanda che plasmerà la disponibilità di GPU e i calcoli del TCO per chi valuta deployment on-premise.

2026-07-04 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Stargate UK, OpenAI non ha mai visto il sito del progetto bandiera

Secondo il Guardian, OpenAI non ha mai visitato il terreno designato per il data center Stargate UK prima dell’annuncio. La vicenda solleva dubbi sulla solidità del programma governativo e sulla reale due diligence. Per chi progetta deployment on-premise di LLM, la scelta del sito è un passaggio critico spesso trascurato nella narrazione pubblica.

2026-07-04 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Instagram ads CSAM: l'India convoca Meta, la sovranità dei dati torna al centro

Dopo un'inchiesta BBC, il ministero IT indiano chiama i vertici Meta. Dietro lo scandalo degli annunci a pagamento con materiale pedopornografico, si apre il dibattito su chi controlla i modelli di moderazione AI e dove girano i dati: spunti per chi valuta architetture on-premise.

2026-07-04 📰 Fonte

📁 Altro AI generated ✅ Phoronix

Cattura video USB 4K a 60 fps: il kernel Linux sistema i conti in sospeso

Le versioni più recenti del kernel Linux attenuano un vecchio punto dolente per chi lavora con la cattura video USB a risoluzione e refresh elevati. Un segnale importante per ambienti edge e on-premise dove l’elaborazione locale del flusso video resta nodale.

2026-07-04 📰 Fonte

📁 Altro AI generated ℹ️ LocalLLaMA

dSpark e MTP: lo spillover su disco diventa accettabile per l’inference?

Nuovi booster per l’inference come dSpark, dflash, MTP e QAT promettono accelerazioni, ma storicamente lo spillover su disco faceva precipitare le prestazioni da 4-5 token/s a 0,5 token/s. La domanda: questi miglioramenti rendono il calo sopportabile?

2026-07-04 📰 Fonte

📁 Hardware AI generated ℹ️ Tom's Hardware

Un guru di Windows adatta un motore Stirling ottocentesco per raffreddare un Threadripper AMD

Un appassionato ha montato un motore Stirling da 40 dollari su un sistema AMD Threadripper 3970X, usando il calore di scarto della CPU per azionare il volano e ottenere raffreddamento ausiliario senza consumare elettricità. Un ritorno a una tecnicia del 1816 che solleva interrogativi sulla gestione termica nei PC ad alte prestazioni.

2026-07-04 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

TabFM di Google: classificazione e regressione tabulare senza addestramento

Google Research ha rilasciato TabFM, un foundation model zero-shot per dati tabulari. Il modello gestisce classificazione e regressione su colonne miste numeriche e categoriche, senza fine-tuning o ricerca di iperparametri: gli esempi di training vengono passati come contesto, e le previsioni sono prodotte in un singolo passaggio. Per chi opera con dati strutturati in ambiti regolamentati, l'approccio promette di semplificare il deployment on-premise, mantenendo i dati locali e riducendo la dipendenza da pipeline di addestramento cloud.

2026-07-04 📰 Fonte

📁 Hardware AI generated ✅ Phoronix

Linux 7.3 accoglie nuovi PCI ID per le GPU Intel Nova Lake S

Il ramo drm-xe-next del kernel Linux 7.3 inizia a includere gli identificatori PCI per le future GPU Intel Nova Lake S. L’enablement prosegue mentre cresce l’interesse verso soluzioni grafiche Intel per carichi di lavoro on-premise, anche se la strada per una maturità software competitiva è ancora lunga.

2026-07-04 📰 Fonte

📁 Hardware AI generated ✅ Phoronix

Linux 7.2-rc2 porta a 256 il limite di core CPU per RISC-V 64-bit

Una modifica nel kernel Linux, pronta per la prossima release candidate, innalza il tetto predefinito di core supportati per l’architettura RISC-V a 64 bit. Il nuovo valore di 256 core indica l’arrivo imminente di processori many-core pensati per server e carichi di lavoro paralleli.

2026-07-04 📰 Fonte

📁 Altro AI generated ℹ️ Tom's Hardware

Giappone: idranti stradali con Starlink diventano hotspot Wi-Fi di emergenza

Il progetto sfrutta l’infrastruttura diffusa dei segnali degli idranti per creare una rete di connettività di backup via satellite, pensata per scenari di disastro naturale.

2026-07-04 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

Infineon vince la quarta causa tedesca contro Innoscience: guerra GaN a Shanghai

Infineon ha ottenuto la quarta vittoria in tribunale in Germania contro Innoscience in una disputa sui brevetti GaN, con il conflitto che si estende ora anche a Shanghai. La contesa riguarda semiconduttori di potenza sempre più rilevanti per l'efficienza dei datacenter e il costo operativo di infrastrutture AI on-premise.

2026-07-04 📰 Fonte

📁 Frameworks AI generated ✅ Phoronix

GNOME Mutter impara a sopravvivere ai reset della GPU

Un progetto del Google Summer of Code introduce il recupero automatico dopo un reset della GPU in Mutter, salvando la sessione da arresti improvvisi. Un passo avanti per la stabilità del desktop Linux, cruciale anche per chi lavora con carichi computazionali pesanti sulle stesse macchine.

2026-07-04 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Chip di potenza più cari: l’effetto a catena sulle infrastrutture AI on-premise

L’annuncio di CR Micro si inserisce in un ciclo di rincari dei semiconduttori di potenza che tocca anche la componentistica per server e nodi GPU. Per chi gestisce deployment AI locali, l’aumento dei costi hardware incide su TCO e cicli di rinnovo, riaprendo un fronte spesso trascurato nelle valutazioni on-premise.

2026-07-04 📰 Fonte

📁 Market AI generated ✅ DigiTimes

TSMC paga meno delle concorrenti fabless: è un rischio per l’hardware AI

Rivelazioni normative indicano che la retribuzione mediana in TSMC è inferiore a quella di realtà IC design più piccole. In un settore dove la competizione per i talenti è feroce, questo gap potrebbe aggravare la carenza di ingegneri e rallentare la produzione di chip avanzati, con effetti a catena su disponibilità e costi per chi costruisce infrastrutture AI on-premise.

2026-07-04 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Machvision, fatturato record a giugno: la domanda di AI infiamma la supply chain hardware

Il produttore di sistemi di ispezione ottica ha chiuso giugno con il fatturato più alto di sempre, spinto dalla corsa globale all’intelligenza artificiale. Il dato mette in luce le pressioni a monte sulla produzione di chip per AI e i potenziali effetti sui tempi di approvvigionamento per chi pianifica deployment on-premise di LLM.

2026-07-04 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Tesla spinge su Taiwan e taglia le tariffe: la lezione energetica per chi fa AI on-premise

A giugno 2026 Tesla ha dominato le importazioni a Taiwan e ridotto i costi dei Supercharger. Dietro le manovre commerciali, si intravede un tema cruciale per i deploy on-premise: il controllo del costo dell’energia, variabile che incide in modo determinante sul Total Cost of Ownership delle infrastrutture per LLM.

2026-07-04 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Longcat 2: quantization INT8 e FP8 per il deployment on-premise

Meituan ha rilasciato i pesi di Longcat 2 nelle varianti INT8 e FP8. Per chi gestisce LLM in locale, la disponibilità di modelli già quantizzati riduce la barriera hardware e i costi di inference, mantenendo un buon equilibrio fra prestazioni e consumo di VRAM.

2026-07-03 📰 Fonte

← Precedente Page 23 / 124 Successiva →

Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

LAUNCHING SOON ON LaunchTry

AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il Segnale del Giorno

Lo spettro delle sanzioni sull’open source AI: perché l’on-premise trema

⚡ In Tendenza

🛠️ Guide &amp; Osservatorio On-Premise

Ultime analisi & news dal radar

🛠️ Guide & Osservatorio On-Premise