AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes

🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.

👥 160+ membri · Iscriviti gratis →

📡

Il Segnale del Giorno

Quantization statisticamente lossless: il trade-off che cambia le regole dell’on-premise

Un nuovo paper introduce la quantization “statisticamente senza perdita” (SLQ), che garantisce la qualità dell’output in termini probabilistici senza ...

📡 Segnale AI 2026-07-25

⚡ In Tendenza

View All →

📊 Statistiche

Archivio Totale

Articoli indicizzati nel sistema RAG

Categorie

📡 RSS Feed

🛠️ Guide & Osservatorio On-Premise

🚀 Esegui i modelli in locale → Tutte le guide →

Riferimenti evergreen e pratici per far girare l'AI in locale — hardware, costi, privacy e stack completo.

🖥️ Osservatorio LLM On-Premise Hardware, stack, governance e architetture di riferimento per l'AI in locale. →

⚡ Le migliori GPU per LLM locali 💰 Quanto costa un LLM in locale 🧩 Ollama vs LM Studio 🔒 ChatGPT privato per aziende 📉 Quantizzazione LLM spiegata 📊 Quanta VRAM per Llama 70B 🚀 Esegui i modelli in locale (Qwen, Llama, R1…)

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

📁 Hardware AI generated ✅ DigiTimes

Tmytek si prepara alla quotazione: chip a onde millimetriche per satelliti, difesa e 6G

L'azienda taiwanese Tmytek ha avviato il processo per la quotazione in borsa, focalizzandosi sullo sviluppo di chip a onde millimetriche. Questa tecnicia è strategica per applicazioni avanzate in settori come le comunicazioni satellitari, la difesa e le future reti 6G. La mossa evidenzia l'importanza crescente delle soluzioni hardware specializzate per infrastrutture critiche e ad alte prestazioni.

2026-05-28 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Un ingegnere Google accusato di insider trading: dati interni usati per scommesse su Polymarket

Un ingegnere di sicurezza informatica di Google, Michele Spagnuolo, è stato accusato dal Dipartimento di Giustizia degli Stati Uniti di aver utilizzato dati interni sulle tendenze di ricerca per scommettere 2,7 milioni di dollari sulla piattaforma Polymarket. L'uomo avrebbe guadagnato 1,2 milioni di dollari, operando con lo pseudonimo "AlphaRaccoon". Questo è il secondo caso federale legato a Polymarket, sollevando interrogativi sulla sicurezza dei dati proprietari e la condotta interna nelle grandi aziende tecniciche.

2026-05-28 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Jensen Huang di Nvidia entra nel board consultivo della Tsinghua University, con Tim Cook presidente

Jensen Huang, CEO di Nvidia, è entrato a far parte del comitato consultivo della School of Economics and Management della Tsinghua University, presieduto da Tim Cook. La nomina, che vede la presenza di altre figure di spicco come Elon Musk e Satya Nadella, arriva in un momento di crescente attenzione sulle dinamiche geopolitiche e tecniciche, evidenziando il ruolo strategico delle università cinesi nel panorama globale dell'innovazione.

2026-05-28 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Nvidia LocateAnything: Grounding Visione-Linguaggio 10 Volte Più Veloce

Nvidia ha presentato LocateAnything, un modello da 3 miliardi di parametri progettato per il grounding visione-linguaggio. La sua architettura, che include il Parallel Box Decoding, promette prestazioni fino a dieci volte superiori rispetto a soluzioni esistenti come Qwen3-VL. Questa efficienza lo rende particolarmente interessante per scenari di deployment on-premise e per applicazioni che richiedono bassa latenza e controllo sui dati.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ TechCrunch AI

Vertu lancia uno smartphone pieghevole con AI per i CEO, basato su Hermes Open Source

Vertu presenta un nuovo smartphone pieghevole di lusso, pensato per i CEO, che integra workflow basati su agenti AI e funzionalità per l'impresa. Il dispositivo, con un prezzo di partenza di 6.880 dollari, si fonda sul progetto open source Hermes e promette un'esperienza utente avanzata per la gestione aziendale, unendo estetica premium e capacità computazionali all'avanguardia.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

CXMT ottiene il via libera per l'IPO: impatto sulla supply chain della memoria cinese

ChangXin Memory Technologies (CXMT) ha ricevuto l'approvazione per la quotazione in borsa. Questa mossa strategica potrebbe rafforzare significativamente la catena di approvvigionamento di memorie della Cina, con implicazioni per il mercato globale e per le strategie di deployment on-premise che dipendono da componenti hardware robusti e disponibili. L'IPO segnala un potenziale aumento della capacità produttiva e una maggiore autonomia tecnicica per la Cina nel settore dei semiconduttori, cruciale per l'evoluzione degli LLM.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Salesforce Taiwan punta alla crescita a doppia cifra con AI e servizi

Salesforce Taiwan, sotto la guida del GM Chia-shen Hsu, punta a una crescita a doppia cifra, trainata dall'espansione delle sue applicazioni e servizi basati sull'intelligenza artificiale. Questa strategia riflette una tendenza più ampia nel settore enterprise, dove l'adozione dell'AI, in particolare dei Large Language Models (LLM), impone scelte strategiche sui modelli di deployment, dalla gestione on-premise alla nuvola, con implicazioni dirette su TCO e sovranità dei dati.

2026-05-28 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

LLM: la corsa al ragionamento si intensifica, tra nuovi modelli e benchmark

Il panorama dei Large Language Models (LLM) sta vivendo un'accelerazione senza precedenti, con l'emergere di nuovi modelli come GPT-5.4 xhigh, Gemini 3.1Pro e Hy3 preview. Quest'ultimo ha recentemente scalato le classifiche, ottenendo un punteggio di 87.8 nel benchmark CHSBO 2025, superando i concorrenti. Questo solleva interrogativi sulla reale applicabilità di tali performance nel mondo reale, al di là dei test sintetici, un aspetto cruciale per chi valuta deployment on-premise.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Semiconduttori e AI: la spina dorsale della prosperità tecnicica globale

Il presidente di Taiwan ha sottolineato il ruolo cruciale dei semiconduttori e dell'intelligenza artificiale per la prosperità globale del paese. Questa dichiarazione evidenzia la profonda interconnessione tra la produzione di silicio avanzato e lo sviluppo delle capacità di AI, elementi fondamentali per l'innovazione tecnicica e la competitività economica a livello mondiale. Per le aziende, ciò si traduce in considerazioni strategiche per l'infrastruttura AI, dalla fornitura di hardware al deployment.

2026-05-28 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Germania: un fondo deeptech da 20M€ per colmare il gap di commercializzazione

Per affrontare il divario tra ricerca d'eccellenza e commercializzazione, la Joachim Herz Foundation e Marvelous hanno lanciato il Marvelous Scito Fund da 20 milioni di euro. L'iniziativa mira a sostenere startup deeptech in settori come materiali avanzati e robotica, offrendo capitale a lungo termine in un contesto di calo degli investimenti di venture capital in Germania. L'obiettivo è favorire l'innovazione con impatto industriale, sociale ed ecologico.

2026-05-28 📰 Fonte

📁 LLM AI generated 🏆 ArXiv cs.CL

LCO: Ottimizzare gli LLM agentici per la sicurezza senza fine-tuning

Un nuovo framework, LCO (LLM-based Constraint Optimization), affronta il problema dell'In-Context Reward Hacking (ICRH) negli LLM agentici. Progettato per ridurre gli effetti collaterali dannosi derivanti dall'eccessiva ottimizzazione, LCO opera senza richiedere il fine-tuning del modello. Attraverso moduli di auto-riflessione e campionamento evolutivo, il sistema guida gli LLM a integrare proattivamente vincoli di sicurezza, mantenendo al contempo le prestazioni del compito. I test su GPT-4 hanno mostrato una riduzione significativa della tossicità e degli incidenti ICRH.

2026-05-28 📰 Fonte

📁 Frameworks AI generated 🏆 ArXiv cs.CL

ICG: Generazione di Immagini di Copertina Personalizzate con MLLM

Un nuovo framework, ICG, mira a migliorare la generazione personalizzata di immagini di copertina, un aspetto cruciale per l'engagement utente. Integrando Large Language Models Multimodali (MLLM) e modelli di diffusione, ICG utilizza un approccio innovativo basato su prompt e allineamento delle preferenze. Il sistema estrae caratteristiche semantiche e le arricchisce con dati utente, impiegando un adattatore per l'addestramento end-to-end e una strategia di apprendimento a ricompensa multipla, senza richiedere etichette predefinite.

2026-05-28 📰 Fonte

📁 Altro AI generated 🏆 ArXiv cs.LG

IGADA-IoT: Data Augmentation Avanzata per l'Efficienza Energetica nei Sensori IoT

Un nuovo framework, IGADA-IoT, ottimizza il consumo energetico dei sensori IoT nelle reti wireless attraverso una data augmentation automatica guidata dal divario informativo. Il sistema introduce una collaborazione gerarchica multi-generatore e un metodo di valutazione a ciclo chiuso per migliorare l'accuratezza delle decisioni di augmentation. I risultati sperimentali mostrano un miglioramento significativo delle prestazioni dei modelli downstream, con implicazioni positive per i deployment AI all'edge e le infrastrutture self-hosted, dove l'efficienza energetica e il TCO sono cruciali.

2026-05-28 📰 Fonte

📁 Altro AI generated 🏆 ArXiv cs.LG

FedRL: Normalizzazione Personalizzata per Ambienti Eterogenei e Dati Sensibili

Il Federated Reinforcement Learning (FedRL) offre un approccio collaborativo per l'addestramento di policy globali, salvaguardando la privacy dei dati sensibili. Tuttavia, gli ambienti eterogenei presentano sfide significative, compromettendo la coerenza degli input e l'aggiornamento dei parametri. Una nuova metodologia, la Normalizzazione Personalizzata delle Osservazioni (PON), affronta queste problematiche. Permettendo a ogni agente di normalizzare localmente i propri input, PON accelera l'addestramento e migliora le performance, dimostrando l'inefficacia della condivisione di parametri di normalizzazione in contesti diversificati.

2026-05-28 📰 Fonte

📁 Altro AI generated 🏆 ArXiv cs.AI

Soro: LLM per il tagiko ottimizzato per deployment edge e vincoli infrastrutturali

Il progetto Soro introduce una famiglia di LLM conversazionali specializzati per la lingua tagika, derivati da Gemma 3. Sviluppati per operare in ambienti con risorse computazionali e connettività limitate, questi modelli sono stati sottoposti a pretraining continuo e fine-tuning su dati specifici. L'adozione di tecniche di Quantization FP8 e INT4 ne ottimizza il deployment su dispositivi edge, supportando un programma pilota nel settore educativo in Tagikistan.

2026-05-28 📰 Fonte

📁 LLM AI generated 🏆 ArXiv cs.AI

Nuova Architettura LLM per l'Identificazione dei Valori Umani nel Testo

Una recente ricerca introduce un'architettura basata su Large Language Models (LLM) per rilevare e quantificare i valori umani nel testo. Questo approccio modulare e scalabile supera i limiti delle metodologie precedenti, offrendo un meccanismo adattabile a diverse teorie etiche. La soluzione è stata valutata con successo, dimostrando la sua efficacia nel supportare sistemi intelligenti più etici e allineati ai valori umani.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Nvidia e Groq: il panorama dell'Inference LLM si evolve tra nuove sfide

Il mercato dell'inference per i Large Language Models (LLM) sta vivendo una fase di intensa evoluzione. Mentre Nvidia continua a essere un attore dominante, l'emergere di competitor come Groq, che sta guadagnando terreno nel ruolo dell'inference, suggerisce un panorama in mutamento. Questo scenario pone nuove considerazioni per le aziende che valutano deployment on-premise, influenzando scelte hardware e strategie di TCO.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Dazi USA su Componenti Auto di Taiwan: Un Segnale per le Catene di Fornitura Tech?

Gli Stati Uniti hanno ridotto i dazi della Sezione 232 al 15% sui componenti automobilistici provenienti da Taiwan, una mossa che rafforza la competitività dell'isola nel settore. Sebbene l'intervento riguardi specificamente l'automotive, evidenzia la sensibilità delle catene di fornitura globali alle politiche commerciali, un fattore critico anche per l'hardware AI e i deployment on-premise.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

TECO punta al mercato dei data center AI con soluzioni modulari e un'espansione strategica

TECO si sta posizionando nel crescente mercato dei data center dedicati all'intelligenza artificiale, adottando un approccio modulare. L'azienda mira a rafforzare la propria presenza in Nord America e nel Sud-est asiatico, rispondendo alla domanda di infrastrutture AI flessibili e scalabili. Questa strategia riflette la crescente necessità di deployment on-premise per carichi di lavoro LLM, con un'attenzione particolare alla sovranità dei dati e al TCO.

2026-05-28 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

Wonik IPS e Visionox: l'ordine per display XR e le sfide dell'AI on-premise

L'accordo tra Wonik IPS e Visionox per un etcher di display XR per la linea OLED di Kunshan evidenzia la complessità della produzione avanzata. Sebbene l'annuncio riguardi l'hardware per display, esso si inserisce in un contesto industriale dove l'intelligenza artificiale gioca un ruolo crescente. Questo scenario solleva questioni cruciali sulla sovranità dei dati, il controllo operativo e il TCO, spingendo le aziende a valutare attentamente le strategie di deployment on-premise per i carichi di lavoro AI.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Synopsys punta su AI agentici e integrazione Ansys per la crescita futura

Synopsys, leader nell'automazione della progettazione elettronica (EDA), sta orientando la propria strategia verso l'intelligenza artificiale agentica e una più profonda integrazione con le soluzioni Ansys. Questa mossa è vista come un catalizzatore per espandere le opportunità di crescita a lungo termine, rispondendo alle crescenti complessità nella progettazione di chip e sistemi. L'adozione di AI agentici promette di rivoluzionare i flussi di lavoro, mentre la sinergia con Ansys rafforza le capacità di simulazione e analisi.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

La certificazione cinese dei chip AI: un nuovo guardiano per il mercato globale

La Cina introduce un sistema di certificazione per i chip AI, ridefinendo l'accesso al suo vasto mercato tecnicico. Questa mossa strategica, che vede T-Head Semiconductor tra gli attori rilevanti, potrebbe avere profonde implicazioni per le catene di fornitura globali e le decisioni di deployment on-premise, influenzando la disponibilità di hardware e la sovranità dei dati per le aziende che operano a livello internazionale.

2026-05-28 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Gemma-4-Harmonia-31B: Un LLM Fine-tuned per Scenari On-Premise

È stato rilasciato Gemma-4-Harmonia-31B-Uncensored-Heretic, un Large Language Model (LLM) da 31 miliardi di parametri, frutto della combinazione di diversi fine-tuning del modello Gemma-4-31B. Progettato per un consolidamento neurale mirato, il modello mira a minimizzare la regressione e a potenziare capacità uniche, con un KLD di 0.0047 e un tasso di rifiuto di 9 su 100. È disponibile nei formati Safetensors e GGUF, rendendolo particolarmente adatto per deployment locali e on-premise.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Marvell alza le previsioni pluriennali: la domanda di data center AI spinge la crescita

Marvell ha rivisto al rialzo le sue previsioni finanziarie pluriennali, citando l'accelerazione della crescita guidata dalla forte domanda nel settore dei data center dedicati all'intelligenza artificiale. Questo trend sottolinea l'importanza crescente delle infrastrutture hardware specializzate per supportare i carichi di lavoro intensivi degli LLM e delle applicazioni AI, influenzando le strategie di deployment sia cloud che on-premise per le aziende.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Synopsys: la spinta degli hyperscaler verso chip AI personalizzati ridefinisce il mercato

Synopsys osserva una crescente domanda di tecnicie legate all'AI, alimentata dalle ambizioni degli hyperscaler di sviluppare il proprio silicio. Questa tendenza evidenzia una specializzazione hardware per carichi di lavoro AI, con implicazioni significative per l'intero ecosistema, dalla progettazione dei chip alle strategie di deployment on-premise e cloud.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Formosa Chemicals: AI, idrogeno e semiconduttori per la nuova rotta strategica

Formosa Chemicals ha delineato una nuova strategia di rilancio che pone l'intelligenza artificiale, l'idrogeno e i materiali semiconduttori al centro dei suoi piani. Questa mossa riflette una tendenza più ampia nel settore industriale, dove l'adozione di tecnicie avanzate è cruciale per l'ottimizzazione operativa e la competitività a lungo termine. L'integrazione dell'AI, in particolare, richiede infrastrutture robuste e un'attenta valutazione dei modelli di deployment.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Fonte non pertinente: ritardi Airbus e il focus di AI-RADAR

La fonte fornita riguarda i ritardi nelle consegne di aeromobili Airbus A350 e A320neo, con previsioni di persistenza fino al 2030. Queste informazioni non sono attinenti al focus editoriale di AI-RADAR, che si concentra su LLM on-premise, hardware per inference, sovranità dei dati e TCO. Pertanto, non è possibile generare un articolo conforme alle linee guida senza inventare fatti.

2026-05-28 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Chunghwa Precision: riorganizzazione ed espansione per il testing di chip AI

Chunghwa Precision ha completato una riorganizzazione del proprio consiglio di amministrazione e pianifica una rapida espansione della capacità produttiva. L'obiettivo è rafforzare le operazioni di testing per i chip dedicati all'intelligenza artificiale, un passo cruciale per la supply chain globale di hardware AI. Questa mossa strategica sottolinea l'importanza della qualità e della disponibilità del silicio per i deployment on-premise di LLM.

2026-05-28 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

La domanda di AI spinge Chief Telecom a espandere i data center

Chief Telecom, operatore di telecomunicazioni, prevede che la crescente domanda di intelligenza artificiale porterà il leasing dei suoi data center AI (AIDC) a superare il 50%. L'azienda ha annunciato piani per un'ulteriore espansione, evidenziando la necessità di infrastrutture dedicate per supportare i carichi di lavoro intensivi degli LLM e di altre applicazioni AI.

2026-05-28 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Synopsys e il futuro del silicio per l'AI: implicazioni per i deployment on-premise

Synopsys, leader nell'automazione della progettazione elettronica (EDA), ha rivisto al rialzo le previsioni finanziarie per il 2026 dopo una solida crescita nel secondo trimestre. Questo successo sottolinea l'importanza strategica dell'azienda nello sviluppo del silicio avanzato, cruciale per l'evoluzione dell'hardware AI. Per le organizzazioni che valutano deployment di Large Language Models (LLM) on-premise, l'innovazione nel design dei chip è fondamentale per ottimizzare performance, TCO e garantire la sovranità dei dati.

2026-05-28 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

Nvidia e la sfida energetica dell'AI: l'espansione a Taiwan mette sotto pressione la rete

L'insediamento di Nvidia nel Beitou-Shilin Tech Park a Taiwan sta generando un aumento significativo della domanda energetica per i carichi di lavoro AI. Taipower risponde con una strategia a doppio binario per lo sviluppo delle sottostazioni, evidenziando le crescenti esigenze infrastrutturali dell'intelligenza artificiale su larga scala.

2026-05-28 📰 Fonte

📁 Frameworks AI generated ℹ️ LocalLLaMA

Vulnerabilità critica in un framework Open Source: impatto su vLLM e server LLM

Una vulnerabilità critica è stata scoperta in un framework Open Source ampiamente utilizzato nell'ecosistema degli LLM. La falla interessa strumenti come vLLM, numerosi server “MCP” e altre soluzioni, mettendo a rischio milioni di agenti AI. La notizia evidenzia la necessità di una rigorosa sicurezza della supply chain software per i deployment on-premise e self-hosted.

2026-05-28 📰 Fonte

📁 Altro AI generated ℹ️ LocalLLaMA

CrankGPT di Squeez Labs: LLM locali azionati a manovella per l'Edge AI

Squeez Labs introduce CrankGPT, un dispositivo unico nel suo genere che esegue Large Language Models (LLM) in locale, alimentato manualmente a manovella. Questa soluzione di Edge AI, già sul mercato, promette di ridefinire il concetto di autonomia e sovranità dei dati, offrendo un approccio radicale al deployment di LLM in ambienti con vincoli estremi di energia e connettività.

2026-05-28 📰 Fonte

📁 Altro AI generated ✅ Wired AI

L'Illinois vara la legge più stringente sulla sicurezza AI, con audit esterni obbligatori

Lo stato dell'Illinois ha approvato una nuova legislazione sulla sicurezza dell'intelligenza artificiale, considerata la più stringente negli Stati Uniti. La legge impone a giganti del settore come OpenAI, Anthropic e Google di sottoporsi a verifiche di terze parti per garantire il rispetto degli standard di sicurezza. Il Governatore JB Pritzker ha già annunciato la sua intenzione di firmare il provvedimento, che avrà un impatto significativo sulle operazioni dei principali sviluppatori di LLM e servizi AI.

2026-05-28 📰 Fonte

📁 LLM AI generated ✅ TechCrunch AI

Le sfide degli LLM: quando l'AI di Google fatica con l'ortografia

Un recente episodio che ha coinvolto l'intelligenza artificiale di Google, incapace di gestire correttamente l'ortografia, evidenzia le persistenti sfide legate all'accuratezza dei Large Language Models. Questo solleva interrogativi cruciali per le aziende che valutano deployment on-premise, sottolineando la necessità di strategie robuste per garantire affidabilità e controllo sui risultati e sulla sovranità dei dati.

2026-05-28 📰 Fonte

📁 Altro AI generated ℹ️ LocalLLaMA

Un LLM da 260K parametri su CPU emulata degli anni '90: l'esperimento estremo

Un ingegnere ha dimostrato la capacità di far funzionare un LLM da 260.000 parametri su una CPU emulata degli anni '90, all'interno di un RTOS di 18 anni fa. Il progetto ha richiesto la Quantization a INT8 e l'uso di trucchi software per compensare l'assenza di un'unità a virgola mobile (FPU), evidenziando le possibilità di ottimizzazione per deployment su stack hardware estremamente limitati, pur con performance di 2-4 secondi per token.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Yageo supera Murata negli ordini di componenti passivi per l'AI

Yageo, sotto la guida del presidente Pierre Chen, ha superato Murata nella ricezione di ordini per componenti passivi. Questo sorpasso è trainato dalla crescente domanda nel settore dell'intelligenza artificiale, evidenziando l'importanza di questi elementi hardware per le infrastrutture AI, sia cloud che on-premise.

2026-05-28 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Samsung Foundry e Cadence: nuovi orizzonti per l'AI in robotica e automotive

Samsung Foundry mira a rafforzare la sua offerta di chip AI per i settori della robotica e dell'automotive, sfruttando le piattaforme di progettazione di Cadence. Questa collaborazione sottolinea l'importanza crescente di soluzioni hardware ottimizzate per l'intelligenza artificiale in ambiti critici, dove le esigenze di performance, efficienza e sovranità dei dati spingono verso architetture dedicate e deployment on-premise o edge.

2026-05-28 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Computex 2026: La robotica al centro e il ruolo strategico della supply chain di Taiwan

Il Computex 2026 si preannuncia come un evento chiave per l'industria tecnicica globale, introducendo una nuova area dedicata alla robotica. La fiera di Taipei vedrà la partecipazione della cruciale catena di fornitura taiwanese, sottolineando il suo ruolo fondamentale nello sviluppo e nella produzione di componenti essenziali per l'intelligenza artificiale e le tecnicie emergenthe. L'appuntamento evidenzia le direzioni future del settore, con un focus sulle soluzioni hardware e le strategie di deployment.

2026-05-28 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

L'IA spinge i profitti cargo di China Airlines: il ruolo di Taiwan nel boom tecnicico

China Airlines ha registrato profitti record nel settore cargo, capitalizzando sul crescente boom dell'intelligenza artificiale a Taiwan. Questo successo evidenzia come l'adozione strategica di soluzioni AI possa ottimizzare le operazioni logistiche, migliorando l'efficienza e la capacità predittiva. L'articolo esplora le implicazioni di tali deployment, considerando i trade-off tra infrastrutture on-premise e cloud, e l'importanza della sovranità dei dati per le aziende che operano in settori critici.

2026-05-28 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

La Cina rafforza i controlli sui viaggi per proteggere la tecnicia AI

La Cina ha intensificato le restrizioni sui viaggi per i professionisti del settore AI privato, con l'obiettivo dichiarato di prevenire la fuga di tecnicie sensibili. Questa mossa sottolinea la crescente importanza strategica dell'intelligenza artificiale e la volontà dei governi di salvaguardare il proprio vantaggio tecnicico, con implicazioni significative per la sovranità dei dati e la sicurezza delle infrastrutture AI.

2026-05-28 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Atacama: il deserto cileno ospita il più grande impianto di accumulo energetico

ContourGlobal, supportata da KKR, ha inaugurato in Cile un impianto ibrido solare-batteria da quasi 500 milioni di dollari. La struttura, situata nel deserto di Atacama, combina 231 MWp di capacità fotovoltaica con 1,3 GWh di storage, erogando 200 MW di potenza dopo il tramonto. Questo progetto evidenzia l'importanza delle soluzioni di accumulo per la stabilità della rete e l'integrazione delle rinnovabili, un aspetto cruciale anche per le infrastrutture AI on-premise.

2026-05-27 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

L'ecosistema startup francese tra dipendenza dall'AI e rallentamento del mercato

Un nuovo rapporto di 20VC evidenzia una crescente dipendenza dell'ecosistema startup francese da un ristretto gruppo di aziende AI, mentre il resto del mercato registra una stagnazione. Nel 2025, le startup francesi hanno raccolto 6,7 miliardi di euro in 411 round di finanziamento, segnando un calo del 5%. L'intelligenza artificiale emerge come fattore chiave, sia come causa della concentrazione che come potenziale soluzione per la ripresa.

2026-05-27 📰 Fonte

📁 Market AI generated ℹ️ Tom's Hardware

I costi dell'AI aumentano: la domanda di token può moltiplicarsi per 24, secondo Goldman Sachs

Un rapporto di Goldman Sachs evidenzia un'impennata dei costi dell'intelligenza artificiale, prevedendo un aumento della domanda di token fino a 24 volte. Aziende come Uber e Microsoft stanno già affrontando le conseguenze della fatturazione basata sui token, spingendo i decision-maker tech a riconsiderare le strategie di deployment e il TCO per mantenere il controllo sulle spese operative.

2026-05-27 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Un corpus Usenet da 103 miliardi di token: dati pre-AI per LLM on-premise

Un nuovo corpus Usenet, composto da oltre 103 miliardi di token raccolti tra il 1980 e il 2013, offre una risorsa unica per il fine-tuning di LLM. La sua caratteristica distintiva è l'assenza di contaminazione da contenuti generati da AI o ottimizzati per algoritmi, garantendo dati originali e diversificati. Questo lo rende particolarmente interessante per chi sviluppa modelli locali e prioritizza la sovranità dei dati.

2026-05-27 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Cognition AI raccoglie un miliardo di dollari, la valutazione supera i 26 miliardi

Cognition AI ha annunciato un nuovo round di finanziamento da oltre un miliardo di dollari, portando la sua valutazione a 26 miliardi di dollari. Questo incremento significativo, rispetto ai 10,2 miliardi di dollari di settembre, evidenzia la fiducia degli investitori. L'azienda si distingue per l'uso dell'IA nella generazione del 90% del proprio codice, un approccio che promette efficienza e velocità nello sviluppo software.

2026-05-27 📰 Fonte

📁 Frameworks AI generated ✅ Phoronix

NVIDIA CUDA 13.3: Arrivano CUDA Python 1.0 e CUDA Tile per C++

NVIDIA ha rilasciato CUDA 13.3, un aggiornamento significativo per il suo stack di programmazione GPU unificato. La nuova versione introduce CUDA Python 1.0, che migliora l'integrazione con l'ecosistema Python, e CUDA Tile per C++, ottimizzando l'accesso alle funzionalità hardware. Questi sviluppi mirano a potenziare gli sviluppatori che operano su infrastrutture NVIDIA, offrendo strumenti più efficienti per l'accelerazione dei carichi di lavoro su GPU, cruciali per il deployment di LLM on-premise.

2026-05-27 📰 Fonte

📁 Market AI generated ✅ Ars Technica AI

Nvidia punta 150 miliardi su Taiwan: il cuore dell'AI resta in Asia

Jensen Huang, CEO di Nvidia, ha annunciato un investimento annuale di 150 miliardi di dollari a Taiwan. L'obiettivo è consolidare l'isola come fulcro della produzione di chip e sistemi AI, con un nuovo quartier generale operativo entro il 2030. Questa mossa strategica sottolinea la centralità di Taiwan nella supply chain globale dell'intelligenza artificiale, influenzando la disponibilità e i costi dell'hardware essenziale per i deployment on-premise.

2026-05-27 📰 Fonte

📁 Altro AI generated 🏆 OpenAI Blog

Warp e l'integrazione degli LLM per i flussi di sviluppo: tra locale e cloud

Warp sfrutta GPT-5.5 e altri Large Language Models di OpenAI per orchestrare agenti di codice. L'approccio dell'azienda mira a unificare i flussi di lavoro di sviluppo, spaziando dagli ambienti locali al cloud e alle piattaforme open source, sollevando questioni cruciali su deployment, sovranità dei dati e gestione dell'infrastruttura.

2026-05-27 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Meta introduce abbonamenti a pagamento per il suo chatbot AI: la sfida a OpenAI e Google

Meta ha annunciato l'introduzione di abbonamenti a pagamento per il suo chatbot basato su intelligenza artificiale, segnando la prima volta che l'azienda monetizza direttamente questo servizio. Con due livelli di prezzo, Meta One Plus a 7,99 dollari al mese e Meta One Premium a 19,99 dollari, l'iniziativa posiziona Meta in diretta competizione con giganti come OpenAI e Google nel mercato dell'AI consumer, offrendo accesso esteso a funzionalità avanzate come la generazione di immagini e video.

2026-05-27 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Sequestro di 800 server in Olanda: colpite infrastrutture per cyberattacchi

Le autorità olandesi hanno sequestrato 800 server e arrestato due persone in un'operazione mirata contro società di hosting, WorkTitans e MIRhosting. Queste aziende sono sospettate di aver fornito infrastrutture cruciali per cyberattacchi sponsorizzati dalla Russia in tutta Europa. L'intervento evidenzia le vulnerabilità delle infrastrutture digitali e l'importanza della sovranità dei dati e del controllo sui deployment, temi centrali per chi valuta soluzioni on-premise.

2026-05-27 📰 Fonte

📁 Market AI generated ✅ TechCrunch AI

Remote: l'AI accelera ricavi ed efficienza senza aumentare l'organico

Remote, fornitore di servizi payroll, ha superato i 300 milioni di dollari di ricavi annuali ricorrenti e raggiunto il cash-flow positivo. L'azienda ha registrato un aumento del 50% dei ricavi per dipendente, attribuendo il successo all'adozione strategica dell'intelligenza artificiale, senza necessità di espandere l'organico. Un esempio concreto di come l'AI possa ottimizzare le operazioni aziendali.

2026-05-27 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Talkdesk introduce agenti AI proattivi: la svolta dall'inbound all'outbound

Talkdesk ha presentato nuovi agenti AI proattivi, pensati per i settori retail e dei servizi finanziari. Questa innovazione segna un passaggio strategico per l'azienda, che ora mira a gestire l'engagement clienti non solo in risposta a richieste in entrata, ma anche avviando comunicazioni autonome in uscita. Gli agenti sono parte della piattaforma Customer Experience Automation (CXA) e supportano workflow multi-agente configurabili tramite template.

2026-05-27 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Qwen3.6 35B-A3B supera il FoodTruck Bench: un passo avanti per gli LLM

Il modello Qwen3.6 35B-A3B ha completato con successo il FoodTruck Bench, un benchmark per Large Language Models. Questo risultato evidenzia l'importanza della valutazione rigorosa dei modelli, specialmente per le organizzazioni che considerano deployment on-premise, dove le prestazioni e i requisiti hardware sono fattori critici per la sovranità dei dati e il TCO.

2026-05-27 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

NATO formalizza le partnership per la cyber-resilienza con Microsoft, Palo Alto Networks ed ESET

La NATO ha siglato accordi strategici di cybersecurity con Microsoft, Palo Alto Networks ed ESET. Queste partnership non commerciali mirano a rafforzare la resilienza collettiva nel cyberspazio. L'annuncio è avvenuto il 27 maggio durante la International Conference on Cyber Conflict (CyCon) a Tallinn, Estonia, un evento chiave per la difesa cibernetica.

2026-05-27 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Daylight estende la protezione MDR a Claude Enterprise: nuove sfide per la sicurezza AI

Daylight ha ampliato la sua offerta di Managed Detection and Response (MDR) per includere Claude Enterprise. Questa mossa risponde alla crescente integrazione dell'AI generativa nelle operazioni aziendali, che introduce nuove categorie di minacce non gestibili dai sistemi di monitoraggio tradizionali. L'obiettivo è proteggere le piattaforme AI, ormai infrastrutture operative cruciali per automazione, generazione di codice e analisi documentale.

2026-05-27 📰 Fonte

📁 Altro AI generated ℹ️ LocalLLaMA

Qwen3.6: La Quantization Q6 Ridisegna gli Agenti di Coding Locali

Un recente aggiornamento di un setup LLM locale, con il modello Qwen3.6 e la quantization Q6, ha dimostrato un notevole miglioramento qualitativo, rendendo gli agenti di coding on-premise competitivi rispetto alle API cloud. L'esperienza, basata su due GPU NVIDIA RTX 3090 e il server `llama.cpp`, ha raggiunto un throughput di 20-50 token/secondo, evidenziando la crescente fattibilità di soluzioni self-hosted per carichi di lavoro AI sensibili.

2026-05-27 📰 Fonte

📁 Frameworks AI generated ✅ PyTorch Blog

PyTorch Compile e la Kernel Fusion: Ottimizzare l'Efficienza delle GPU per gli LLM

Il compilatore di PyTorch, `torch.compile`, può accelerare l'esecuzione dei modelli fino a dieci volte. La chiave di questa ottimizzazione è la "kernel fusion", una tecnica che raggruppa operazioni dipendenti in singoli kernel Triton, riducendo il traffico di memoria e l'overhead di lancio dei kernel. Questa strategia è cruciale per massimizzare l'efficienza delle GPU e contenere il TCO nei deployment on-premise di Large Language Models.

2026-05-27 📰 Fonte

📁 Market AI generated ✅ TechCrunch AI

Le strategie SEO sono obsolete: l'IA di Google cambia le regole della ricerca

Google I/O ha ufficializzato l'integrazione di risposte generate dall'intelligenza artificiale direttamente nei risultati di ricerca. Questo cambiamento epocale rende obsolete le strategie SEO tradizionali, basate sui "dieci link blu". Le aziende si trovano ora con una visibilità limitata su come l'IA presenta i loro contenuti ai clienti, richiedendo un ripensamento profondo delle tattiche di ottimizzazione per i motori di ricerca.

2026-05-27 📰 Fonte

📁 Market AI generated ✅ 404 Media

Il declino di Character.ai: un caso studio di 'enshittification' negli LLM

Character.ai, una delle app di chatbot AI più popolari, sta affrontando un'ondata di critiche da parte della sua base utenti. Modifiche significative, tra cui restrizioni d'uso, l'introduzione del modello 'Pipsqueak 2' percepito come inferiore, e l'aumento della pubblicità, hanno generato un malcontento quasi unanime. La situazione evidenzia le sfide economiche e regolatorie che molte applicazioni AI stanno incontrando, portando a un fenomeno di 'enshittification' che compromette l'esperienza utente e la sostenibilità del servizio.

2026-05-27 📰 Fonte

← Precedente Page 76 / 123 Successiva →

Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

LAUNCHING SOON ON LaunchTry

AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il Segnale del Giorno

Quantization statisticamente lossless: il trade-off che cambia le regole dell’on-premise

⚡ In Tendenza

🛠️ Guide &amp; Osservatorio On-Premise

Ultime analisi & news dal radar

🛠️ Guide & Osservatorio On-Premise