Environment Maps: Navigare la complessitร  dei workflow software

L'automazione di workflow software complessi rimane una sfida aperta, nonostante i progressi nei modelli linguistici di grandi dimensioni (LLM). In scenari di lunga durata, gli agenti software sono spesso soggetti a errori a cascata e alla stocasticitร  dell'ambiente, con un singolo passo falso che puรฒ compromettere l'intero task.

Un nuovo approccio, presentato in un recente articolo di ricerca, introduce le $\textit{Environment Maps}$: una rappresentazione persistente e indipendente dall'agente che mira a mitigare questi problemi. Le Environment Maps consolidano evidenze eterogenee, come registrazioni dello schermo e tracce di esecuzione, in un grafo strutturato. Questa rappresentazione รจ composta da quattro componenti principali:

  1. Contesti: astrazioni delle posizioni.
  2. Azioni: affordance parametrizzate.
  3. Workflow: traiettorie osservate.
  4. Conoscenza Tacita: definizioni di dominio e procedure riutilizzabili.

Le valutazioni sul benchmark WebArena, attraverso cinque domini, mostrano che gli agenti dotati di Environment Maps raggiungono un tasso di successo del 28.2%, quasi il doppio rispetto alle baseline limitate al contesto della sessione (14.2%) e superando anche gli agenti con accesso ai dati grezzi delle traiettorie utilizzati per generare le Environment Maps (23.3%).

Fornendo un'interfaccia strutturata tra il modello e l'ambiente, le Environment Maps stabiliscono una base persistente per la pianificazione a lungo termine, che รจ interpretabile, modificabile e continuamente raffinabile.