Un nuovo studio introduce l'analisi dell'inclusione, un framework basato sull'analisi del discorso per valutare l'inclusione come processo dinamico nell'apprendimento collaborativo uomo-AI. Il metodo misura equità di partecipazione, clima affettivo ed equità epistemica, rivelando schemi nascosti nelle interazioni.
Un nuovo studio introduce Spectral Disentanglement and Enhancement (SDE), un framework che mira a migliorare le rappresentazioni multimodali. SDE separa i segnali utili dal rumore nei dati, ottimizzando l'allineamento tra feature e spettro per una generalizzazione più robusta. I risultati mostrano miglioramenti rispetto allo stato dell'arte.
Un nuovo approccio per migliorare i Transformer applicati a grafi, specialmente per compiti a livello di grafo. La serializzazione dei token del grafo permette di catturare meglio le dipendenze interne e ottenere rappresentazioni più espressive, superando i limiti dei metodi tradizionali basati su un singolo token.
Il supporto per MCP (Multi-Control-Panel) in llama.cpp è ora disponibile per la fase di test. Questa integrazione introduce nuove funzionalità, tra cui la gestione dei messaggi di sistema, un server proxy CORS e strumenti avanzati per la gestione dei prompt e delle risorse. L'obiettivo è fornire un'interfaccia più completa per l'interazione con i modelli.
Plano, un framework open-source per lo sviluppo di agenti AI, ha superato le 5000 stelle su GitHub. Il progetto punta su modelli LLM di dimensioni contenute per il routing e l'orchestrazione, con un approccio agnostico rispetto ai framework sottostanti. Plano funge da proxy server e data plane integrato con i modelli.
Unsloth AI ha annunciato ottimizzazioni per l'addestramento di modelli Mixture of Experts (MoE), promettendo velocità superiori di 12 volte e una riduzione del consumo di VRAM di oltre il 35%. Le ottimizzazioni, basate su kernel Triton personalizzati, supportano architetture come gpt-oss, Qwen3 e DeepSeek, e sono compatibili con GPU consumer e data center.
Un utente ha sviluppato un'estensione per Chrome che utilizza un agente AI per automatizzare attività all'interno del browser. Il codice sorgente è disponibile su GitHub, aprendo la strada a nuove possibilità di automazione basate su LLM.
Femtobot è un agente sviluppato in Rust, progettato per operare su macchine con risorse limitate come vecchi Raspberry Pi o istanze VPS economiche. L'obiettivo è fornire funzionalità di automazione con un footprint minimo, evitando le dipendenze pesanti tipiche di altri stack. Supporta Telegram, storage locale e esecuzione di tool tramite rig-core, il tutto in un binario da soli 10MB.
BiomechAgent è un agente AI che genera codice per analisi biomeccaniche tramite linguaggio naturale. Permette interrogazioni di database, visualizzazioni e interpretazione dati senza sviluppare codice. Un benchmark ne valuta le capacità in data retrieval, visualizzazione, classificazione attività, segmentazione temporale e ragionamento clinico. L'uso di istruzioni specifiche per la biomeccanica migliora le prestazioni, ma un modello locale open-source ha prestazioni inferiori rispetto a LLM cloud.
Sviluppata una rete neurale (LBC-PINN) per simulare il consolidamento del suolo non saturo sotto carico a lungo termine. Il framework integra segmentazione temporale logaritmica e transfer learning per migliorare la precisione e l'efficienza computazionale. I risultati sono stati validati con il metodo degli elementi finiti (FEM).
ST-Raptor è un sistema agentivo per il question answering (QA) su tabelle semi-strutturate. Combina editing visuale, modellazione strutturale ad albero e risoluzione di query guidata da agenti per migliorare l'accuratezza e l'usabilità nell'interpretazione delle tabelle. I risultati sperimentali mostrano prestazioni superiori rispetto ai metodi esistenti.
Un recente aggiornamento a llama.cpp sembra migliorare il supporto per il modello linguistico Qwen. Questo sviluppo potrebbe facilitare l'esecuzione e l'inference di modelli di grandi dimensioni su hardware locale, aprendo nuove possibilità per applicazioni on-premise e ambienti con risorse limitate. La discussione online si concentra sull'impatto potenziale di questa integrazione.
La distribuzione Debian ha annunciato la disponibilità generale di tag2upload, uno strumento progettato per migliorare il workflow di packaging basato su Git per gli sviluppatori e i manutentori di Debian. L'obiettivo è semplificare e rendere più efficiente il processo di creazione e gestione dei pacchetti software.
Nvidia ha incrementato di tre volte le consegne di codice internamente, grazie all'adozione di una versione specializzata di Cursor. Oltre 30.000 tecnici Nvidia utilizzano questo strumento per migliorare la loro produttività nello sviluppo di software.
L'integrazione di GLM-5 nel framework Transformers di Hugging Face suggerisce un imminente rilascio del modello. Indizi puntano a una possibile implementazione sotto copertura di GLM-5, denominata Pony Alpha, sulla piattaforma OpenRouter. Questo sviluppo potrebbe ampliare le opzioni per chi cerca soluzioni LLM self-hosted.
Indiscrezioni sul prossimo modello linguistico GLM-5 emergono da una pull request relativa a vLLM, un framework per l'inference di LLM. La notizia, diffusa inizialmente su Reddit, suggerisce che il nuovo modello potrebbe presto essere integrato e disponibile per la comunità open source.
Un nuovo metodo di decodifica, RMCD, migliora i Large Vision Language Models (LVLM) integrando contesti multipli da knowledge base esterne. RMCD pesa i contesti in base alla loro rilevanza, aggregando informazioni utili ed attenuando gli effetti negativi di contesti irrilevanti. RMCD surclassa altri metodi di decodifica su benchmark di visual question answering.
Un nuovo framework, EVE, affronta i limiti degli LLM nel fornire risposte complete e fedeli basate su un singolo documento. EVE utilizza un approccio strutturato che migliora significativamente il richiamo, la precisione e l'F1-score, superando il compromesso tra copertura e accuratezza tipico della generazione LLM standard.
Un nuovo studio introduce NanoNet, un framework per il text mining che mira a ridurre i costi computazionali e i requisiti di supervisione tramite l'apprendimento con parametri efficienti e la distillazione della conoscenza online. L'obiettivo è ottenere modelli leggeri ad inference rapida, adatti a scenari con risorse limitate.
Ricercatori propongono Jackpot, un framework per il reinforcement learning (RL) con LLM. Jackpot utilizza un campionamento di reiezione con budget ottimale (OBRS) per ridurre la discrepanza tra il modello di rollout e la policy in evoluzione, migliorando la stabilità e l'efficienza dell'addestramento. I risultati mostrano prestazioni paragonabili all'RL on-policy con Qwen3-8B-Base.