Il modello LFM2-24B-A2B di Liquid AI, un modello MoE con 24 miliardi di parametri totali (2 miliardi attivi), raggiunge circa 50 token al secondo in un browser web utilizzando WebGPU. La variante 8B A1B supera i 100 token al secondo sullo stesso hardware. Sono disponibili demo e modelli ONNX ottimizzati.
Google presenta TurboQuant, un algoritmo di compressione lossless progettato per ridurre l'impronta di memoria dei modelli di intelligenza artificiale. L'algoritmo promette una compressione fino a 6 volte, ma al momento è solo un esperimento di laboratorio. La comunità online ha già soprannominato l'iniziativa "Pied Piper", in riferimento alla serie TV Silicio Valley.
OpenAI ha introdotto il Model Spec, un framework pubblico per definire il comportamento dei modelli di intelligenza artificiale. Questo approccio mira a bilanciare sicurezza, libertà dell'utente e responsabilità, diventando sempre più cruciale con l'evoluzione dei sistemi di AI.
LangSmith Fleet introduce le skill condivise, permettendo ai team di dotare gli agenti AI di conoscenze specialistiche. Le skill possono essere create da prompt, manualmente, da template o da chat precedenti, e condivise nel workspace, rimanendo automaticamente sincronizzate. Questo approccio mira a risolvere il problema della perdita di conoscenza aziendale quando i dipendenti lasciano l'azienda, codificando il sapere per un uso più ampio.
JetBrains introduce Central per lo sviluppo software agentic basato su AI, dismettendo la funzionalità di pair programming Code With Me. L'azienda si concentra su nuove aree, evolvendo il proprio ecosistema di strumenti per sviluppatori.
Dopo un attacco alla supply chain che ha compromesso le versioni 1.82.7 e 1.82.8 di LiteLLM su PyPI, sono state proposte diverse alternative open source. Tra queste, Bifrost, Kosong ed Helicone, che offrono funzionalità simili o estese, con diversi approcci all'astrazione di LLM e all'osservabilità.
La versione 10.0.1 di Lemonade SDK introduce miglioramenti al processo di configurazione per sfruttare le NPU Ryzen AI di AMD su sistemi Linux. Questo aggiornamento segue il rilascio della versione 10.0 di Lemonade SDK e FastFlowLM 0.9.35, che avevano reso possibile l'utilizzo delle NPU AMD XDNA 2 per carichi di lavoro LLM in ambiente Linux.
MERIT è un framework che combina LLM con una memoria pedagogica strutturata per il knowledge tracing, ovvero la modellazione dello stato di conoscenza degli studenti. Sfrutta un meccanismo di retrieval gerarchico e vincoli semantici per migliorare l'accuratezza delle consegne senza costosi fine-tuning, riducendo i costi computazionali e aumentando la trasparenza.
Un nuovo approccio all'apprendimento per rinforzo offline sicuro affronta i vincoli di costo cumulativi, superando le limitazioni dei metodi tradizionali che gestiscono solo vincoli rigidi. L'innovazione risiede nella definizione di un insieme di raggiungibilità condizionato dalla sicurezza, che disaccoppia la massimizzazione della ricompensa dai vincoli di costo, garantendo politiche sicure senza ottimizzazioni instabili.
Memory Bear AI è un framework incentrato sulla memoria per l'intelligenza affettiva multimodale. Trasforma i segnali multimodali in unità di memoria emotive strutturate (EMU), preservando, riattivando e rivedendo le informazioni affettive. I risultati sperimentali mostrano miglioramenti in accuratezza e robustezza, specialmente in condizioni di input imperfetti.
Segnalazioni su Reddit riguardo a possibili infezioni malware in LM Studio hanno destato preoccupazione. Gli sviluppatori hanno prontamente risposto, attribuendo le segnalazioni a falsi positivi identificati e risolti da Microsoft. La comunità resta in allerta, ma la situazione sembra rientrata.
Peter Wilson di Mozilla.ai presenta cq, un progetto che mira a risolvere i problemi di obsolescenza delle informazioni e di ridondanza negli agenti AI. L'obiettivo è creare una piattaforma di condivisione della conoscenza per migliorare l'efficienza e ridurre il consumo di risorse, affrontando però sfide di sicurezza e accuratezza.
AMD e CIQ collaborano a una versione di Rocky Linux ottimizzata per carichi di lavoro di intelligenza artificiale (AI) e calcolo ad alte prestazioni (HPC). La distribuzione sarà integrata con ROCm, la piattaforma software open source di AMD per il calcolo accelerato.
OpenAI rilascia strumenti open source per aiutare gli sviluppatori a integrare policy di sicurezza specifiche per gli adolescenti nelle loro applicazioni AI. L'iniziativa mira a fornire risorse riutilizzabili per proteggere i giovani online.
Moda, piattaforma di design basata su AI, utilizza Deep Agents e LangSmith per automatizzare la creazione di presentazioni e contenuti visivi. L'architettura multi-agente permette di gestire design complessi, integrando ricerca, brand identity e generazione di layout tramite un DSL custom. L'interfaccia utente favorisce la collaborazione tra utente e AI.
I leader del settore finanziario stanno adottando framework di AI multimodale per automatizzare i workflow complessi. L'analisi di documenti non strutturati, come i rendiconti finanziari, è resa più efficiente dall'uso di modelli linguistici di grandi dimensioni (LLM) e strumenti specializzati per l'estrazione di dati e la generazione di riassunti. L'implementazione richiede scelte architetturali specifiche per bilanciare accuratezza e costi.
Anthropic lancia Claude Code e Claude Cowork, agenti AI capaci di controllare direttamente il desktop del tuo computer. Questi strumenti possono aprire file, navigare nel browser ed eseguire tool di sviluppo per completare task, anche da remoto tramite Dispatch. Disponibile per abbonati Pro e Max su MacOS in versione "research preview".
La versione 6.0 di Krita, software per la pittura digitale, introduce il porting completo a Qt6, allineandosi così allo sviluppo di KDE/Qt. Contestualmente, è disponibile la versione 5.3, basata sul toolkit Qt5. Il passaggio a Qt6 promette miglioramenti significativi, in particolare per il supporto a Wayland.
Mozilla ha annunciato cq, un progetto open source concepito come una piattaforma collaborativa dove agenti di intelligenza artificiale possono condividere e valutare conoscenza collettiva. L'obiettivo è creare un database di conoscenza dinamico e accessibile.
È disponibile la versione 0.3.32 di OpenBLAS, la libreria open-source ottimizzata per le routine BLAS (Basic Linear Algebra Subprograms). Questa release si concentra sul miglioramento dell'auto-rilevamento delle CPU Intel di ultima generazione, un aspetto cruciale per massimizzare le performance su hardware moderno.