Rakuten ha implementato Codex, l'agente di sviluppo di OpenAI, per velocizzare e rendere più sicuro il rilascio di software. L'adozione ha portato a una riduzione del 50% del MTTR (Mean Time To Repair), all'automazione delle revisioni CI/CD e alla realizzazione di build full-stack in poche settimane.
Langchain introduce una funzionalità di compressione contestuale autonoma per gli agenti Deep Agents, sia nella versione SDK Python che nella CLI. Questa novità permette agli agenti di ridurre autonomamente le informazioni nel loro contesto operativo, ottimizzando l'utilizzo delle finestre contestuali e mitigando il deterioramento del contesto. L'obiettivo è dare agli agenti un maggiore controllo sulla propria memoria di lavoro, riducendo la necessità di interventi manuali.
OpenAI ha creato un runtime agent utilizzando l'API Responses, uno strumento shell e container ospitati. L'obiettivo è fornire agent sicuri e scalabili, dotati di file, strumenti e gestione dello stato. Questo approccio abilita nuove modalità di interazione con i modelli.
WordPress introduce my.WordPress.net, un servizio che permette di creare siti privati direttamente nel browser, senza necessità di hosting o registrazione. Trasforma la piattaforma in un ambiente di lavoro personale per scrittura, ricerca e strumenti di intelligenza artificiale.
Secondo indiscrezioni, Nvidia starebbe sviluppando una piattaforma open source di agenti AI, denominata NemoClaw, per competere con OpenClaw. La società avrebbe già avviato discussioni con potenziali partner, tra cui Salesforce, Cisco e Google, in vista della sua prossima conferenza annuale per sviluppatori.
Microsoft accelera il ciclo di rilascio di Visual Studio Code, passando a una cadenza settimanale. Contestualmente, introduce la modalità Autopilot, che automatizza ulteriormente lo sviluppo con l'ausilio dell'intelligenza artificiale, seguendo una tendenza già intrapresa da Google.
Secondo indiscrezioni, Nvidia starebbe sviluppando NemoClaw, un'alternativa open-source a OpenCL. La mossa potrebbe ampliare l'adozione delle GPU Nvidia in scenari di calcolo eterogeneo, tradizionalmente dominati da OpenCL.
Le interfacce a riga di comando (CLI) stanno vivendo una rinascita, poiché le interfacce grafiche (GUI) si rivelano inadatte per gli agenti autonomi. Google sembra consapevole di questa problematica, a differenza forse di Microsoft. Questo cambiamento potrebbe avere implicazioni significative per molti sviluppatori di software.
Un nuovo framework, HCAPO, affronta le sfide di assegnazione del credito in agenti LLM che operano su orizzonti temporali estesi. Sfruttando il modello LLM stesso come critico post-hoc, HCAPO raffina i valori Q a livello di step tramite ragionamento a posteriori e meccanismi di vantaggio multi-scala. I risultati mostrano miglioramenti significativi rispetto ai metodi RL esistenti.
Un nuovo framework di apprendimento multi-task equo, denominato OWO-FMTL, mira a garantire prestazioni di inference eque tra utenti eterogenei in reti di accesso radio basate su AI (AI-RAN). Il metodo adatta dinamicamente le priorità degli utenti, bilanciando efficienza ed equità con un basso overhead computazionale, adatto per il deployment edge.
Un nuovo protocollo, chiamato LDP (LLM Delegate Protocol), mira a migliorare la comunicazione tra sistemi multi-agente basati su LLM. LDP introduce meccanismi per la gestione delle identità, il trasferimento di payload, la gestione delle sessioni, il tracciamento della provenienza e la definizione di domini di fiducia, con l'obiettivo di ottimizzare l'efficienza e la sicurezza delle consegne.
MASEval è un framework per valutare sistemi multi-agente basati su LLM, considerando l'intero sistema e non solo il modello. Confronta diverse implementazioni, rivelando che la scelta del framework impatta le performance tanto quanto la scelta del modello stesso. MASEval supporta la progettazione di sistemi e l'identificazione dell'implementazione migliore per ogni caso d'uso.
Il progetto Fedora sta valutando una nuova proposta per un "Processo di ciclo di vita dell'innovazione tecnicica per Fedora". L'obiettivo è fornire maggiore spazio a concetti sperimentali e stimolare l'interesse verso idee innovative, senza l'obbligo di integrazione immediata nel sistema Fedora.
JetBrains ha svelato Air, un ambiente di sviluppo integrato (IDE) focalizzato sull'intelligenza artificiale agentica. Air consente a molteplici agenti AI di eseguire consegne in parallelo. Gli utenti di IntelliJ si interrogano sui vantaggi specifici per loro.
Microsoft presenta PlugMem, un sistema di memoria plug-and-play per agenti AI che trasforma le interazioni grezze in conoscenza strutturata e riutilizzabile. PlugMem organizza la cronologia delle interazioni in unità di conoscenza compatte, migliorando l'efficienza e le prestazioni in diversi scenari.
AgentMail ha raccolto 6 milioni di dollari per sviluppare una piattaforma API che fornisce agli agenti AI caselle di posta elettronica dedicate. La soluzione supporta conversazioni bidirezionali, analisi, threading, etichettatura, ricerca e risposta automatica.
Un nuovo studio presenta un sistema basato su Transformer che migliora le prestazioni nell'Abstraction and Reasoning Corpus (ARC). L'approccio combina inference neurale con priorità strutturali e adattamento online, ottenendo progressi significativi nel ragionamento simbolico e colmando il divario verso la generalizzazione a livello umano.
È stato presentato vLLM Hook, un plugin open source per migliorare la programmabilità degli stati interni dei modelli di linguaggio di grandi dimensioni (LLM) distribuiti tramite vLLM. Questo strumento consente la programmazione passiva e attiva, aprendo nuove possibilità per il rilevamento di prompt avversari, il miglioramento del RAG e la modifica del comportamento del modello.
In vista della sua conferenza annuale per sviluppatori, Nvidia sta per presentare un nuovo approccio al software che integra agenti di intelligenza artificiale, in modo simile a OpenClaw. La piattaforma dovrebbe essere open-source.
NVIDIA ha rilasciato i driver beta 595.44.02 per Linux, focalizzati sugli sviluppatori Vulkan. Questi driver introducono nuove funzionalità API Vulkan e rappresentano un'evoluzione della serie R595, già testata con successo. L'aggiornamento è principalmente rivolto a chi sviluppa applicazioni grafiche ad alte prestazioni su sistemi Linux.