LangChain e MongoDB annunciano una partnership strategica per semplificare lo sviluppo e il deployment di agenti AI. L'integrazione permette alle aziende di sfruttare le infrastrutture dati esistenti, come MongoDB Atlas, per funzionalità cruciali quali la ricerca vettoriale, la memoria persistente e l'osservabilità end-to-end. L'obiettivo è accelerare il passaggio dal prototipo alla produzione, riducendo la complessità e i costi associati alla gestione di stack AI frammentati, con un focus sulla flessibilità di deployment e la sovranità dei dati.
Kestra, la piattaforma francese di orchestrazione open source per flussi di lavoro di dati, AI e infrastruttura, ha chiuso un round di finanziamento Series A da 25 milioni di dollari guidato da RTP Global. L'azienda ha visto una crescita significativa dei ricavi enterprise e ha gestito oltre due miliardi di workflow nel 2025, portando il finanziamento totale a 36 milioni di dollari.
Un nuovo framework, PAA (Prototype-driven Adversarial Alignment), affronta la sfida del riconoscimento emozionale basato su EEG in contesti di dati eterogenei. Il sistema migliora la robustezza e la stabilità dei modelli AI, riducendo la sensibilità al rumore delle etichette e la distorsione dei confini decisionali. Con configurazioni progressive (PAA-L, PAA-C, PAA-M), il framework raggiunge prestazioni all'avanguardia su dataset EEG e dimostra efficacia anche nell'identificazione della depressione clinica, evidenziando il suo potenziale per deployment AI critici.
AMD ha annunciato che la libreria ROCDXG, nota come "librocdxg", è ora pronta per la produzione. Questa soluzione migliora significativamente il supporto per le GPU AMD all'interno del Windows Subsystem for Linux (WSL2) su Windows 11, abilitando la compatibilità con ROCm. Permette agli sviluppatori di sfruttare il software di calcolo GPU Linux direttamente in ambienti Windows, facilitando lo sviluppo e il deployment di carichi di lavoro AI locali.
Il driver open source RadeonSI Gallium3D, insieme a Rusticl per OpenCL basato su Rust, è prossimo a ottenere la conformità formale con lo standard OpenCL 3.0. Questo traguardo è significativo, poiché rappresenta la prima volta in un decennio che l'hardware grafico moderno di AMD potrebbe ricevere un riconoscimento ufficiale per la conformità OpenCL, un aspetto cruciale per i deployment on-premise di carichi di lavoro computazionali.
Un nuovo modello di deep learning, STAINet, combina l'analisi dei dati con principi fisici per prevedere i livelli settimanali delle falde acquifere. L'approccio ibrido migliora l'affidabilità e la capacità di generalizzazione, con la variante STAINet-ILB che mostra performance eccellenti. Questa metodologia apre nuove strade per i modelli di sistema terrestre basati sull'IA, offrendo maggiore trasparenza e robustezza per applicazioni critiche.
AutoB2G è un nuovo framework che automatizza la co-simulazione tra edifici e reti energetiche, sfruttando i Large Language Models (LLM). Affronta le lacune degli ambienti di simulazione esistenti, che spesso trascurano l'impatto a livello di rete e richiedono configurazioni manuali complesse. Estendendo CityLearn V2 e integrando il framework SOCIA, AutoB2G permette di generare, eseguire e perfezionare simulazioni basandosi su descrizioni in linguaggio naturale, migliorando l'efficienza e le metriche prestazionali della rete.
AMD ha rilasciato una nuova versione di GAIA, il framework per agenti AI destinato all'hardware Ryzen AI. La versione 0.17 introduce Agent UI, una web app focalizzata sulla privacy per la gestione di agenti AI eseguiti in locale.
Il popolare editor di testo Gedit ha rilasciato la versione 50, allineata al desktop GNOME. Gli sviluppatori puntano ora a rilasci più frequenti e hanno deciso di escludere contributi basati su intelligenza artificiale o modelli linguistici di grandi dimensioni (LLM).
OpenAI ha introdotto il supporto per i plugin nella sua applicazione di coding agentic, Codex. Questa mossa sembra mirata a colmare il divario con funzionalità simili offerte da Anthropic in Claude Code e Google con l'interfaccia a riga di comando di Gemini. I plugin includono skill, integrazioni di app e server MCP, configurando Codex per task specifici e replicabili.
Google presenta TurboQuant-v3, una tecnica per comprimere i pesi dei modelli linguistici di grandi dimensioni (LLM), riducendo l'utilizzo di VRAM e accelerando l'inference. A differenza delle precedenti versioni focalizzate sulla cache KV, TurboQuant-v3 agisce direttamente sui pesi, rendendo possibile l'esecuzione di LLM più grandi su GPU consumer. Promette una riduzione della memoria di circa 4 volte e un aumento della velocità di 2-3 volte.
Un affinamento open source per Llama.cpp riduce drasticamente il tempo di dequantization della cache KV, accelerando l'inference del modello Qwen3.5-35B-A3B fino al 22.8% su un M5 Max. La tecnica sfrutta la sparsità dell'attenzione, saltando la dequantization per posizioni irrilevanti, con impatto minimo sulla perplexity.
AMD ha rilasciato ROCm 7.12 come nuova anteprima tecnica, in preparazione alla versione 8.0. Questa release estende il supporto a un numero maggiore di APU e GPU consumer, ampliando le opzioni per gli sviluppatori che utilizzano l'ecosistema ROCm.
È stato rilasciato wlroots 0.20, libreria di supporto Wayland utilizzata da alcuni compositori Wayland. Successivamente, è stata rilasciata la versione 1.12-rc1 di Sway per i test, un compositore Wayland ispirato al window manager i3.
Copla offre una piattaforma per automatizzare i processi di compliance a standard come ISO 27001, SOC 2 e DORA, con supporto CISO. L'obiettivo è semplificare la raccolta di evidenze e la gestione delle policy, riducendo i tempi necessari per gli audit di compliance. Il servizio parte da 2.999 euro all'anno.
La definizione di valutazioni (evals) mirate è cruciale per plasmare il comportamento degli agenti AI. L'articolo esplora come curare i dati, definire le metriche e condurre valutazioni per migliorare l'accuratezza e l'affidabilità degli agenti, con un focus sull'importanza di evals che riflettano i comportamenti desiderati in produzione.
RotorQuant, una nuova tecnica di quantization vettoriale basata sull'algebra di Clifford, promette prestazioni superiori rispetto a TurboQuant. Implementata su CUDA e Metal shader, offre velocità superiori con un numero significativamente inferiore di parametri, mantenendo un'alta similarità coseno e ottimi risultati nei test needle-in-haystack.
Un utente si interroga sull'utilità di MCP (Meta-Control Protocol) e strumenti come MCPorter, considerando che le interfacce a riga di comando (CLI) già offrono funzionalità simili per interagire con servizi come GitHub e AWS. L'articolo esplora il potenziale valore aggiunto di MCP in termini di standardizzazione e astrazione per gli agenti AI.
Un nuovo approccio, Implicit Turn-wise Policy Optimization (ITPO), mira a migliorare le interazioni uomo-AI in scenari collaborativi multi-turno. ITPO utilizza un modello di ricompensa implicito per derivare ricompense granulari, incrementando la robustezza e la stabilità del training. I risultati mostrano convergenza migliorata in compiti come il tutoring matematico, la scrittura di documenti e la raccomandazione medica.
Un nuovo approccio, chiamato Environment Maps, mira a migliorare l'automazione dei workflow software complessi. Utilizzando una rappresentazione strutturata dell'ambiente, consolida dati eterogenei per mitigare errori a cascata e migliorare le performance degli agenti in task di lunga durata, quasi raddoppiando il tasso di successo rispetto ai sistemi di riferimento.