AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

MacBook Air 13" (M5): analisi delle prestazioni
📁 Hardware AI generated ℹ️ Tom's Hardware

MacBook Air 13" (M5): analisi delle prestazioni

Recensione del MacBook Air 13 pollici con chip M5. L'articolo analizza le prestazioni del dispositivo, focalizzandosi sull'esperienza utente e sull'efficienza del nuovo processore. Non vengono forniti dettagli su specifiche hardware per inference LLM o considerazioni sul deployment on-premise.

2026-03-23 📰 Fonte
Gimlet Labs: inference AI su hardware eterogeneo grazie a finanziamento Serie A
📁 Market AI generated ✅ TechCrunch AI

Gimlet Labs: inference AI su hardware eterogeneo grazie a finanziamento Serie A

Gimlet Labs ha raccolto 80 milioni di dollari in un round di finanziamento Serie A per la sua tecnicia che permette di eseguire modelli di intelligenza artificiale su chip di diversi produttori, tra cui NVIDIA, AMD, Intel, ARM, Cerebras e d-Matrix, simultaneamente. La soluzione punta a risolvere i colli di bottiglia nell'inference AI.

2026-03-23 📰 Fonte
Credo Ventures lancia il fondo Stage 5 da 88 milioni $ per l'Europa centro-orientale
📁 Market AI generated ℹ️ Tech.eu

Credo Ventures lancia il fondo Stage 5 da 88 milioni $ per l'Europa centro-orientale

Credo Ventures, società di venture capital con sede a Praga e Cracovia, ha annunciato il lancio di Credo Stage 5, un fondo da 88 milioni di dollari. L'obiettivo è supportare i fondatori più ambiziosi dell'Europa centrale e orientale (CEE) e della loro diaspora, concentrandosi in particolare sugli investimenti pre-seed. Credo ha già finanziato oltre 100 aziende, tra cui UiPath e ElevenLabs.

2026-03-23 📰 Fonte
Interloom: 16,5 milioni di dollari per mappare le decisioni aziendali
📁 Market AI generated ℹ️ The Next Web

Interloom: 16,5 milioni di dollari per mappare le decisioni aziendali

La startup di Monaco Interloom ha raccolto 16,5 milioni di dollari per sviluppare un 'context graph', una mappa costantemente aggiornata di come le decisioni operative vengono prese all'interno delle aziende. L'obiettivo è ridurre le frizioni nell'implementazione di soluzioni di intelligenza artificiale.

2026-03-23 📰 Fonte
Warren critica il Pentagono per la decisione su Anthropic
📁 Market AI generated ✅ TechCrunch AI

Warren critica il Pentagono per la decisione su Anthropic

La senatrice Elizabeth Warren (D-MA) ha contestato la decisione del Dipartimento della Difesa di considerare Anthropic un "rischio per la catena di approvvigionamento". Warren suggerisce che il Pentagono avrebbe potuto semplicemente risolvere il contratto con il laboratorio di AI, invece di ricorrere a quella che definisce una "ritorsione".

2026-03-23 📰 Fonte
Zuckerberg sviluppa un assistente AI personale per compiti dirigenziali
📁 LLM AI generated ℹ️ The Next Web

Zuckerberg sviluppa un assistente AI personale per compiti dirigenziali

Mark Zuckerberg sta sviluppando un agente AI per assisterlo nelle sue funzioni di CEO di Meta. Il sistema, ancora in fase di sviluppo, funge già da strumento di informazione on-demand, consentendo al CEO di accedere ai dati più rapidamente rispetto ai canali gerarchici tradizionali.

2026-03-23 📰 Fonte
Adzuna acquisisce le divisioni lavoro di Trovit e Mitula
📁 Market AI generated ℹ️ The Next Web

Adzuna acquisisce le divisioni lavoro di Trovit e Mitula

Il motore di ricerca di lavoro britannico Adzuna ha ampliato la sua presenza in Spagna, Italia e America Latina acquisendo le divisioni lavoro di Trovit e Mitula da Lifull Connect. Questa mossa strategica segue la decisione della società madre giapponese di cedere asset non immobiliari.

2026-03-23 📰 Fonte
SWE-rebench: GPT-5.4, Qwen3.5 e Gemini 3.1 Pro a confronto
📁 LLM AI generated ℹ️ LocalLLaMA

SWE-rebench: GPT-5.4, Qwen3.5 e Gemini 3.1 Pro a confronto

Aggiornato il benchmark SWE-rebench con i risultati di febbraio su 57 nuove attività GitHub PR. Claude Opus 4.6 rimane in testa, ma GPT-5.2, GLM-5 e GPT-5.4 sono molto vicini. I modelli open-weight come Qwen3.5 e Step-3.5-Flash continuano a migliorare, riducendo il divario.

2026-03-23 📰 Fonte
Firefox 149: aggiornamenti e decoder JPEG-XL in Rust
📁 Frameworks AI generated ✅ Phoronix

Firefox 149: aggiornamenti e decoder JPEG-XL in Rust

La nuova versione di Firefox, la 149, introduce diversi miglioramenti, tra cui un file picker XDG Portal e un decoder JPEG-XL sviluppato in Rust. L'aggiornamento mira a migliorare l'esperienza utente e la sicurezza del browser multipiattaforma di Mozilla.

2026-03-23 📰 Fonte
L'AI sta trasformando il settore legale: un caso di studio
📁 Market AI generated ✅ Ars Technica AI

L'AI sta trasformando il settore legale: un caso di studio

L'articolo esplora come l'intelligenza artificiale sta iniziando a influenzare il settore legale, attraverso l'analisi di un caso specifico in cui un avvocato ha dovuto affrontare difficoltà nell'ottenere una perizia indipendente in seguito a un decesso inaspettato. L'AI potrebbe potenzialmente assistere i professionisti legali nell'analisi di dati e nella preparazione dei casi.

2026-03-23 📰 Fonte
Il marketing ingannevole dell'AI: una critica al sensazionalismo
📁 Market AI generated ✅ 404 Media

Il marketing ingannevole dell'AI: una critica al sensazionalismo

Un nuovo podcast smaschera le strategie di marketing aggressive nel campo dell'intelligenza artificiale, evidenziando i pericoli reali derivanti dalle tecnicie di automazione. Esperti del settore mettono in discussione le promesse eccessive e promuovono un approccio più critico e consapevole verso l'AI.

2026-03-23 📰 Fonte
Idomoo presenta Strata, modello AI per video a livelli modificabili
📁 LLM AI generated ℹ️ The Next Web

Idomoo presenta Strata, modello AI per video a livelli modificabili

Idomoo, società israeliana specializzata in personalizzazione video, ha lanciato Strata, un modello fondazionale che genera video con livelli separati e modificabili per testo, animazioni, riprese e attori. L'azienda punta a superare i limiti architetturali dei generatori video basati su diffusione.

2026-03-23 📰 Fonte
Interloom raccoglie 16,5 milioni $ per la memoria enterprise degli agenti AI
📁 Market AI generated ℹ️ Tech.eu

Interloom raccoglie 16,5 milioni $ per la memoria enterprise degli agenti AI

Interloom, una piattaforma per operazioni enterprise che acquisisce la conoscenza degli esperti e la converte in un livello di memoria persistente per gli agenti AI, ha chiuso un round di finanziamento seed da 16,5 milioni di dollari. L'azienda utilizzerà i fondi per sviluppare ulteriormente la sua piattaforma e ampliare le sue capacità nell'automazione dei flussi di lavoro e nell'AI enterprise.

2026-03-23 📰 Fonte
Chip fotonico per KV cache: seleziona 944x più veloce, consuma 18.000x meno
📁 Hardware AI generated ℹ️ LocalLLaMA

Chip fotonico per KV cache: seleziona 944x più veloce, consuma 18.000x meno

Un dottorando in nanofotonica ha progettato un chip fotonico per accelerare la selezione dei blocchi nella KV cache, un collo di bottiglia nelle applicazioni di modelli linguistici di grandi dimensioni (LLM). La soluzione, denominata PRISM, promette prestazioni superiori e consumi energetici drasticamente inferiori rispetto alle scansioni GPU tradizionali, specialmente in scenari con contesti ampi.

2026-03-23 📰 Fonte
Adzuna acquisisce Trovit e Mitula per espandere la ricerca di lavoro
📁 Market AI generated ℹ️ Tech.eu

Adzuna acquisisce Trovit e Mitula per espandere la ricerca di lavoro

Adzuna, piattaforma di ricerca lavoro, ha acquisito le divisioni lavoro di Trovit e Mitula, motori di ricerca del gruppo Lifull Connect. L'operazione consolida la posizione di Adzuna nel mercato globale, ampliando la sua presenza in paesi chiave come Spagna e Italia e integrando tecnicie di ricerca basate su intelligenza artificiale.

2026-03-23 📰 Fonte
360 Capital raccoglie 85 milioni di euro per fondo deeptech
📁 Market AI generated ℹ️ The Next Web

360 Capital raccoglie 85 milioni di euro per fondo deeptech

La società di venture capital con sede a Parigi e Milano ha raccolto 85 milioni di euro per un nuovo fondo deeptech. L'iniziativa evidenzia un crescente interesse degli investitori europei verso tecnicie avanzate, con un focus particolare sul settore della difesa.

2026-03-23 📰 Fonte
Egide raccoglie 8 milioni per la difesa aerea europea
📁 Market AI generated ℹ️ The Next Web

Egide raccoglie 8 milioni per la difesa aerea europea

La startup Egide, attiva nel settore della difesa aerea, ha chiuso un round di finanziamento seed da 8 milioni di euro. L'obiettivo è colmare le lacune nella protezione dei cieli europei, tema diventato cruciale per la sicurezza del continente.

2026-03-23 📰 Fonte
Nvidia: token AI per i suoi ingegneri, valore pari a metà dello stipendio
📁 Market AI generated ℹ️ Tom's Hardware

Nvidia: token AI per i suoi ingegneri, valore pari a metà dello stipendio

Jensen Huang, CEO di Nvidia, ritiene che l'utilizzo di strumenti di intelligenza artificiale sia fondamentale per la produttività degli ingegneri. Ha suggerito di fornire ai dipendenti token AI equivalenti a metà del loro stipendio annuale, paragonando il non utilizzo dell'AI all'uso di carta e penna nella progettazione di chip.

2026-03-23 📰 Fonte
EGIDE raccoglie 8 milioni di euro per sistemi di difesa a basso costo
📁 Market AI generated ℹ️ Tech.eu

EGIDE raccoglie 8 milioni di euro per sistemi di difesa a basso costo

La startup francese EGIDE, specializzata in tecnicie per la difesa, ha ottenuto un finanziamento di 8 milioni di euro. L'obiettivo è sviluppare sistemi di intercettazione a propulsione elettrica e una piattaforma software, Mystique, basata su intelligenza artificiale, per contrastare la minaccia crescente di droni a basso costo e munizioni guidate. I fondi saranno utilizzati per accelerare la produzione e ampliare il team di ingegneri.

2026-03-23 📰 Fonte
La community LocalLLaMA celebra la creatività umana prima dell'avvento massivo dell'AI
📁 LLM AI generated ℹ️ LocalLLaMA

La community LocalLLaMA celebra la creatività umana prima dell'avvento massivo dell'AI

Un post su Reddit/LocalLLaMA esprime apprezzamento per il contenuto creato da umani prima che i modelli linguistici di grandi dimensioni (LLM) generino la maggior parte dei contenuti online. La discussione riflette una preoccupazione crescente riguardo al futuro della creatività umana nell'era dell'intelligenza artificiale generativa e del suo impatto sul panorama digitale.

2026-03-23 📰 Fonte
Newly raccoglie 2 milioni di dollari per la creazione di app native
📁 Market AI generated ℹ️ Tech.eu

Newly raccoglie 2 milioni di dollari per la creazione di app native

Newly, una società con sede a Stoccolma specializzata nello sviluppo di app mobile, ha ottenuto oltre 2 milioni di dollari di finanziamenti. L'obiettivo è accelerare la crescita della sua piattaforma che semplifica la creazione di applicazioni native per iOS e Android, rendendola accessibile anche a chi non sa sviluppare.

2026-03-23 📰 Fonte
India apre (con controllo) ai cinesi nella filiera dei semiconduttori
📁 Market AI generated ✅ DigiTimes

India apre (con controllo) ai cinesi nella filiera dei semiconduttori

L'India modifica le sue politiche sugli investimenti diretti esteri (FDI), aprendo la porta, seppur in modo controllato, alla partecipazione cinese nelle catene di approvvigionamento dei semiconduttori. La mossa è strategica per diversificare le fonti e rafforzare l'industria locale.

2026-03-23 📰 Fonte
Boom dei chip AI spinge la domanda di test presso Chunghwa Precision Test
📁 Market AI generated ✅ DigiTimes

Boom dei chip AI spinge la domanda di test presso Chunghwa Precision Test

L'aumento della domanda di chip per applicazioni di intelligenza artificiale sta generando una crescita significativa per Chunghwa Precision Test, azienda specializzata in soluzioni di test per semiconduttori. Questo riflette la crescente complessità e le stringenti esigenze di validazione dei nuovi processori AI.

2026-03-23 📰 Fonte
Inergy Technology punta su SiC per HVDC con la crescente domanda AI
📁 Market AI generated ✅ DigiTimes

Inergy Technology punta su SiC per HVDC con la crescente domanda AI

Inergy Technology prevede di espandere l'utilizzo del carburo di silicio (SiC) per i sistemi HVDC (High Voltage Direct Current) in risposta all'aumento della domanda di energia da parte delle applicazioni di intelligenza artificiale. Questa mossa strategica mira a migliorare l'efficienza e la capacità dei sistemi di trasmissione di potenza.

2026-03-23 📰 Fonte
Metrologia termica: la sfida dei semiconduttori di nuova generazione
📁 Hardware AI generated 🏆 IEEE Spectrum

Metrologia termica: la sfida dei semiconduttori di nuova generazione

L'aumento della densità di potenza, l'integrazione 3D e i nuovi materiali nei semiconduttori richiedono un'evoluzione della metrologia termica. Le misurazioni tradizionali non sono più sufficienti per affrontare le sfide poste dai nuovi requisiti di progettazione, in particolare per quanto riguarda l'affidabilità e la gestione del calore.

2026-03-23 📰 Fonte
Project Maven: da scetticismo a pilastro dell'AI militare
📁 Market AI generated ✅ Wired AI

Project Maven: da scetticismo a pilastro dell'AI militare

Iniziato tra dubbi e perplessità, il progetto Maven del Pentagono ha visto una notevole trasformazione. Oggi, molti di coloro che inizialmente si mostravano scettici sono diventati convinti sostenitori dell'iniziativa di intelligenza artificiale.

2026-03-23 📰 Fonte
Air Street Capital lancia il Fondo III da 232 milioni $ per l'AI
📁 Market AI generated ℹ️ Tech.eu

Air Street Capital lancia il Fondo III da 232 milioni $ per l'AI

Air Street Capital, fondata da Nathan Benaich, ha annunciato la chiusura del suo Fondo III con una dotazione di 232 milioni di dollari. Questo rende Air Street il più grande fondo di venture capital con un singolo General Partner in Europa, focalizzato su aziende AI-first in Nord America ed Europa, con investimenti early-stage tra 500.000 e 15 milioni di dollari.

2026-03-23 📰 Fonte
Air Street Capital lancia un fondo da 232 milioni di dollari
📁 Market AI generated ℹ️ The Next Web

Air Street Capital lancia un fondo da 232 milioni di dollari

Air Street Capital ha annunciato un nuovo fondo da 232 milioni di dollari, diventando il più grande fondo europeo gestito da un singolo General Partner (GP). Questo segna un cambiamento rispetto alla tendenza consolidata nel venture capital europeo, dove i fondi di grandi dimensioni erano tradizionalmente gestiti da team estesi e strutture decisionali complesse.

2026-03-23 📰 Fonte
LM Studio: plugin per ricerca web locale migliorati
📁 Frameworks AI generated ℹ️ LocalLLaMA

LM Studio: plugin per ricerca web locale migliorati

Sono disponibili versioni rielaborate dei plugin di LM Studio per la ricerca web, progettate per migliorare l'affidabilità e la qualità dei risultati. I plugin aggiornati, DuckDuckGo Reworked e Visit Website Reworked, sono scaricabili da LM Studio Hub e offrono un'alternativa locale a servizi basati su cloud.

2026-03-23 📰 Fonte
RTX 5060 sopravvive a incendio: PCB intatto, raffreddamento fuso
📁 Hardware AI generated ℹ️ Tom's Hardware

RTX 5060 sopravvive a incendio: PCB intatto, raffreddamento fuso

Una scheda RTX 5060 è sopravvissuta a un incendio domestico con il PCB intatto, nonostante lo shroud e le ventole completamente fusi. Dopo una pulizia e la sostituzione del sistema di raffreddamento, la scheda è tornata a funzionare. Un esempio di resilienza in condizioni estreme.

2026-03-23 📰 Fonte
360 Capital raccoglie 85 milioni di euro per il fondo Poli360 2
📁 Market AI generated ℹ️ Tech.eu

360 Capital raccoglie 85 milioni di euro per il fondo Poli360 2

La società di venture capital 360 Capital ha annunciato la chiusura di 85 milioni di euro per Poli360 2, un fondo focalizzato su startup deeptech in fase iniziale. Il fondo, classificato come Articolo 8 secondo SFDR, mira a raggiungere i 100 milioni di euro e investirà principalmente in Italia, con un focus su automazione industriale e sostenibilità. Tra gli investitori figurano il Fondo Europeo per gli Investimenti e CDP Venture Capital.

2026-03-23 📰 Fonte
L'analisi dati potenzia le Leonesse inglesi nel calcio
📁 Market AI generated ✅ The Register AI

L'analisi dati potenzia le Leonesse inglesi nel calcio

La federazione calcistica inglese (FA) utilizza la tecnicia Google Cloud per migliorare selezione, sviluppo, allenamento e performance della nazionale femminile. L'analisi dei dati supporta le decisioni tecniche, ottimizzando le strategie di gioco e la preparazione atletica delle calciatrici.

2026-03-23 📰 Fonte
La corsa all'IA mette sotto pressione le reti elettriche europee
📁 Altro AI generated ✅ Wired AI

La corsa all'IA mette sotto pressione le reti elettriche europee

L'aumento dei data center dedicati all'intelligenza artificiale sta mettendo a dura prova le reti elettriche europee. I gestori di rete stanno sperimentando nuove soluzioni per fare spazio alle crescenti richieste di energia, ottimizzando l'utilizzo delle infrastrutture esistenti.

2026-03-23 📰 Fonte
GTC 2026: NVIDIA e Taiwan, un legame indissolubile
📁 Market AI generated ✅ DigiTimes

GTC 2026: NVIDIA e Taiwan, un legame indissolubile

Secondo DIGITIMES, il GTC 2026 metterà in luce la stretta collaborazione tra NVIDIA e Taiwan. L'evento evidenzierà come le aziende taiwanesi siano partner chiave per NVIDIA nello sviluppo e nella produzione di tecnicie avanzate.

2026-03-23 📰 Fonte
Groq utilizza silicio Samsung per la sua LPU: strategia e inference
📁 Hardware AI generated ✅ DigiTimes

Groq utilizza silicio Samsung per la sua LPU: strategia e inference

Groq, azienda specializzata in unità di elaborazione del linguaggio (LPU), ha scelto Samsung per la fabbricazione dei suoi chip. Questa decisione strategica è legata alla scalabilità e alle esigenze di inference di Groq, che punta a ottimizzare le prestazioni e l'efficienza energetica per carichi di lavoro di intelligenza artificiale.

2026-03-23 📰 Fonte
Cina: autosufficienza GPU AI all'80% entro il 2030, sfida per Nvidia
📁 Market AI generated ✅ DigiTimes

Cina: autosufficienza GPU AI all'80% entro il 2030, sfida per Nvidia

Secondo DIGITIMES, la Cina punta a raggiungere l'80% di autosufficienza nella produzione di GPU per applicazioni di intelligenza artificiale entro il 2030. Questa ambiziosa mossa rappresenta una crescente sfida per aziende come Nvidia, leader nel mercato delle GPU ad alte prestazioni.

2026-03-23 📰 Fonte
Zenitron: carenza di memoria impatterà le filiere tech globali
📁 Market AI generated ✅ DigiTimes

Zenitron: carenza di memoria impatterà le filiere tech globali

Zenitron avverte che la scarsità di memorie DRAM e HBM potrebbe avere ripercussioni significative sull'intera filiera tecnicica globale. La disponibilità limitata di memorie ad alte prestazioni potrebbe frenare l'innovazione e aumentare i costi di produzione per server, PC e dispositivi mobile.

2026-03-23 📰 Fonte
Brinno punta su time-lapse, AI visiva e difesa per la crescita entro il 2026
📁 Market AI generated ✅ DigiTimes

Brinno punta su time-lapse, AI visiva e difesa per la crescita entro il 2026

Brinno, azienda specializzata in soluzioni di imaging, punta a una crescita significativa entro il 2026. La strategia si concentra su time-lapse, intelligenza artificiale visiva e imaging per la difesa. L'espansione mira a consolidare la posizione di Brinno in mercati chiave attraverso l'innovazione tecnicica.

2026-03-23 📰 Fonte
Cursor riconosce Kimi K2.5 come miglior modello open source
📁 LLM AI generated ℹ️ LocalLLaMA

Cursor riconosce Kimi K2.5 come miglior modello open source

L'editor di codice Cursor ha riconosciuto Kimi K2.5 come il miglior modello open source disponibile. La notizia è emersa su Reddit, dove un utente ha condiviso uno screenshot della dichiarazione di Cursor. Questo riconoscimento da parte di un attore chiave nel settore dello sviluppo software sottolinea la crescente importanza dei modelli open source.

2026-03-23 📰 Fonte
Tescan apre un laboratorio a Seul per test su memorie AI e packaging avanzato
📁 Hardware AI generated ✅ DigiTimes

Tescan apre un laboratorio a Seul per test su memorie AI e packaging avanzato

Tescan ha inaugurato un nuovo laboratorio dimostrativo a Seul, in Corea del Sud, per accelerare i test e la validazione di soluzioni di memoria per applicazioni di intelligenza artificiale e packaging avanzato. L'iniziativa mira a supportare più rapidamente i clienti nell'innovazione tecnicica.

2026-03-23 📰 Fonte
Elasticsearch e OpenSearch: alternative per il RAG con LLM?
📁 Frameworks AI generated ℹ️ LocalLLaMA

Elasticsearch e OpenSearch: alternative per il RAG con LLM?

Un ingegnere dati esperto di LLM sottolinea come strumenti consolidati come Elasticsearch e OpenSearch possano essere validi sostituti dei vector store tradizionali per il Retrieval Augmented Generation (RAG), specialmente in scenari con dataset di dimensioni contenute. L'articolo esplora l'uso di modelli BERT in questo contesto.

2026-03-23 📰 Fonte
DuCCAE: un motore ibrido per conversazioni immersive
📁 Frameworks AI generated 🏆 ArXiv cs.CL

DuCCAE: un motore ibrido per conversazioni immersive

Baidu ha presentato DuCCAE, un motore ibrido che mira a bilanciare reattività e capacità di gestione di task complesse nei sistemi di conversazione. Il sistema disaccoppia la generazione di risposte in tempo reale dall'esecuzione asincrona, integrando i risultati nel dialogo in corso. L'implementazione ha portato a un aumento della retention degli utenti e del tasso di completamento di task complesse.

2026-03-23 📰 Fonte
LLM: Attacchi Adversariali tramite Ottimizzazione Automatica dei Prompt
📁 LLM AI generated 🏆 ArXiv cs.CL

LLM: Attacchi Adversariali tramite Ottimizzazione Automatica dei Prompt

Un nuovo studio rivela come modelli linguistici di grandi dimensioni (LLM) siano vulnerabili ad attacchi automatizzati che affinano iterativamente i prompt per eludere le misure di sicurezza. Le tecniche di ottimizzazione dei prompt, originariamente pensate per migliorare le consegne, vengono riutilizzate per identificare falle nella sicurezza, specialmente nei modelli open-source più piccoli.

2026-03-23 📰 Fonte
Visualizzazione avanzata per l'analisi comparativa di modelli di regressione
📁 Frameworks AI generated 🏆 ArXiv cs.LG

Visualizzazione avanzata per l'analisi comparativa di modelli di regressione

Un nuovo approccio di visualizzazione facilita la comparazione delle performance di modelli di regressione. Il metodo proposto considera i residui in uno spazio 2D, sfruttando la distanza di Mahalanobis e una colormap per identificare regioni dense e outlier, offrendo una comprensione più dettagliata delle distribuzioni degli errori rispetto alle metriche aggregate tradizionali.

2026-03-23 📰 Fonte
Inference accelerata per modelli Mixture-of-Experts tramite Speculating Experts
📁 LLM AI generated 🏆 ArXiv cs.LG

Inference accelerata per modelli Mixture-of-Experts tramite Speculating Experts

Un nuovo approccio, denominato Speculating Experts, promette di accelerare l'inference per i modelli Mixture-of-Experts (MoE) riducendo i colli di bottiglia dovuti al trasferimento di dati tra CPU e GPU. La tecnica prevede quali esperti saranno necessari in futuro, sovrapponendo i trasferimenti di memoria ai calcoli e ottenendo una riduzione fino al 14% nel tempo per token di output.

2026-03-23 📰 Fonte
Hyperagents: AI auto-miglioranti senza limiti predefiniti
📁 Frameworks AI generated 🏆 ArXiv cs.AI

Hyperagents: AI auto-miglioranti senza limiti predefiniti

Un nuovo approccio all'AI auto-migliorante, chiamato Hyperagents, integra agenti di task e meta-agenti in un singolo programma modificabile. Questo permette l'auto-modifica metacognitiva, migliorando sia le prestazioni nelle consegne che il meccanismo di miglioramento stesso, superando i limiti degli approcci tradizionali.

2026-03-23 📰 Fonte
Planning con SAT: codifica parzialmente groundata per performance scalabile
📁 Frameworks AI generated 🏆 ArXiv cs.AI

Planning con SAT: codifica parzialmente groundata per performance scalabile

Un nuovo studio esplora un approccio ibrido per la pianificazione automatica, combinando tecniche lifted e grounded tramite codifiche SAT. Il metodo proposto mira a superare i limiti di scalabilità delle soluzioni tradizionali, mantenendo azioni lifted e groundando parzialmente i predicati. I risultati mostrano miglioramenti nelle performance, specialmente su piani di lunga durata.

2026-03-23 📰 Fonte
Nvidia spinge sull'inference AI per contrastare i chip custom
📁 Market AI generated ✅ DigiTimes

Nvidia spinge sull'inference AI per contrastare i chip custom

Nvidia intensifica gli sforzi nell'inference AI per competere con i chip custom. La mossa strategica mira a consolidare la posizione di Nvidia in un mercato in rapida evoluzione, dove la domanda di soluzioni di inference efficienti è in forte crescita.

2026-03-23 📰 Fonte
Banca Centrale di Taiwan rivede al rialzo la crescita del PIL 2027
📁 Market AI generated ✅ DigiTimes

Banca Centrale di Taiwan rivede al rialzo la crescita del PIL 2027

La banca centrale di Taiwan ha aggiornato le previsioni di crescita del PIL per il 2027. La revisione riflette un'analisi più ottimistica delle prospettive economiche a medio termine, tenendo conto di fattori come gli investimenti tecnicici e la domanda globale. L'articolo di Digitimes riporta i dettagli della nuova stima.

2026-03-23 📰 Fonte
Ritorno alla dGPU per carichi di lavoro LLM in locale
📁 Hardware AI generated ℹ️ LocalLLaMA

Ritorno alla dGPU per carichi di lavoro LLM in locale

Un post su Reddit celebra il ritorno in auge delle GPU dedicate (dGPU) per l'esecuzione di modelli linguistici di grandi dimensioni (LLM) in locale. La discussione sottolinea i vantaggi prestazionali e di controllo offerti dall'utilizzo di hardware dedicato per l'inference e il training di modelli AI, rispetto a soluzioni cloud o integrate.

2026-03-23 📰 Fonte
← Precedente Page 100 / 121 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge