📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

Un gruppo di ricercatori ha sviluppato un nuovo metodo per analizzare i conflitti, separando le funzioni di alleanza e conflitto. Questo approccio può aiutare a comprendere meglio le relazioni tra gli agenti e le questioni in gioco.

2025-12-29 Fonte

Elon Musk ha affermato che xAI raggiungerà un potere di calcolo superiore a quello di tutti gli altri entro cinque anni. La dichiarazione è stata fatta su X e sembra essere una sfida diretta a Microsoft.

2025-12-26 Fonte

Il nuovo modello Erkang-Diagnosis rappresenta un passo significativo nella tecnologia di assistenza sanitaria AI. La sua capacità di comprendere i sintomi degli utenti e fornire suggerimenti diagnostici preziosi può avere un impatto significativo sulla gestione della salute.

2025-12-26 Fonte

Un gruppo di ricercatori ha sviluppato una nuova tecnologia che consente ai modelli di linguaggio di comprendere meglio il contesto e le relazioni tra concetti. Questa innovazione potrebbe rivoluzionare l'approccio ai problemi di comprensione del testo.

2025-12-26 Fonte

L'intelligence artificiale sta rivoluzionando l'illuminazione intelligente nelle case. Il nuovo modello BitRL-Light combina Llama con il Deep Q-Network per ottimizzare l'alimentazione elettrica, migliorando la comodità degli abitanti.

2025-12-26 Fonte

La valutazione dei grandi modelli linguistici (LLM) si basa pesantemente su benchmarks standardizzati. Questi benchmarks offrono metriche aggregate utili per una data capacità, ma queste metriche aggregate possono nascondere (i) aree particolari dove i modelli sono deboli ('lacune del modello') e (ii) distorsioni nella copertura dei benchmark stessi ('lacune del benchmark'). Presentiamo un nuovo metodo che utilizza autoencoditori sparsi (SAEs) per scoprire automaticamente entrambi tipi di lacuna. Sfruttando le attivazioni concettuali degli SAE e calcolando i punteggi dei prestazioni salienza-weighted in base a dati benchmark, il metodo pone l'evaluzione sulle rappresentazioni interne del modello ed permette una comparazione tra i benchmarks.

2025-12-25 Fonte

La predizione degli esiti trattamentistici del cancro polmonare rimane un desafio a causa della scarsità, dell'omogeneità e dello sovraccarico delle informazioni elettroniche sanitarie reali. Un gruppo di ricercatori ha sviluppato un nuovo framework che utilizza modelli di linguaggio grandi per trasformare dati laboratoriali, genetici e farmaceutici in caratteristiche ad alta fidelità al fine di migliorare la predizione degli esiti trattamentistici. I risultati sono stati pubblicati su arXiv.

2025-12-25 Fonte

Un nuovo studio propone un framework linguistico multagitore che consente all'evoluzione strategica continua senza riscrivere i parametri del modello di linguaggio. I ricercatori hanno liberato i vettori latenti dei concetti astratti dai rappresentazioni semantiche statiche tradizionali, consentendo la loro aggiornamento continuo attraverso l'interazione ambientale e il feedback rafforzante.

2025-12-25 Fonte

Un recente studio analizza la stabilità dei modelli di sentimento basati su transformer sulla loro capacità di adattarsi ai cambiamenti temporali sui flussi sociali. I risultati mostrano una significativa instabilità dei modelli con cadute dell'accuratezza fino al 23,4% durante i periodi degli eventi. L'autore propone quattro metriche di drift nuove e validate sulle 12.279 pubblicazioni sociali autentiche, ottenendo risultati promettenti per l'applicazione in produzione.

2025-12-25 Fonte

Un nuovo approccio per i modelli neurali controllati differenziali (Neural CDEs) potrebbe rivoluzionare il campo dell'intelligenza artificiale. Questo metodo, che richiede molto meno parametri rispetto agli attuali modelli, offre una soluzione innovativa per analizzare sequenze temporali.

2025-12-25 Fonte