Environment Maps: rappresentazioni ambientali strutturate per agenti long-horizon

Environment Maps: Navigare la complessità dei workflow software

L'automazione di workflow software complessi rimane una sfida aperta, nonostante i progressi nei modelli linguistici di grandi dimensioni (LLM). In scenari di lunga durata, gli agenti software sono spesso soggetti a errori a cascata e alla stocasticità dell'ambiente, con un singolo passo falso che può compromettere l'intero task.

Un nuovo approccio, presentato in un recente articolo di ricerca, introduce le $\textit{Environment Maps}$: una rappresentazione persistente e indipendente dall'agente che mira a mitigare questi problemi. Le Environment Maps consolidano evidenze eterogenee, come registrazioni dello schermo e tracce di esecuzione, in un grafo strutturato. Questa rappresentazione è composta da quattro componenti principali:

Contesti: astrazioni delle posizioni.
Azioni: affordance parametrizzate.
Workflow: traiettorie osservate.
Conoscenza Tacita: definizioni di dominio e procedure riutilizzabili.

Le valutazioni sul benchmark WebArena, attraverso cinque domini, mostrano che gli agenti dotati di Environment Maps raggiungono un tasso di successo del 28.2%, quasi il doppio rispetto alle baseline limitate al contesto della sessione (14.2%) e superando anche gli agenti con accesso ai dati grezzi delle traiettorie utilizzati per generare le Environment Maps (23.3%).

Fornendo un'interfaccia strutturata tra il modello e l'ambiente, le Environment Maps stabiliscono una base persistente per la pianificazione a lungo termine, che è interpretabile, modificabile e continuamente raffinabile.

Environment Maps: rappresentazioni ambientali strutturate per agenti long-horizon

Environment Maps: Navigare la complessità dei workflow software

💻 Hai bisogno di infrastruttura GPU cloud?

💬 Commenti (0)

🔍 Continua a esplorare

Approfondisci su LLM On-Premise

OGD4All: LLM per accesso semplificato a dati governativi geospaziali

Google Maps: navigazione immersiva potenziata da AI

Meridian.AI: 17 milioni di dollari per i fogli di calcolo agentivi

👥 Unisciti a 160+ appassionati di AI