Environment Maps: Navigare la complessitร dei workflow software
L'automazione di workflow software complessi rimane una sfida aperta, nonostante i progressi nei modelli linguistici di grandi dimensioni (LLM). In scenari di lunga durata, gli agenti software sono spesso soggetti a errori a cascata e alla stocasticitร dell'ambiente, con un singolo passo falso che puรฒ compromettere l'intero task.
Un nuovo approccio, presentato in un recente articolo di ricerca, introduce le $\textit{Environment Maps}$: una rappresentazione persistente e indipendente dall'agente che mira a mitigare questi problemi. Le Environment Maps consolidano evidenze eterogenee, come registrazioni dello schermo e tracce di esecuzione, in un grafo strutturato. Questa rappresentazione รจ composta da quattro componenti principali:
- Contesti: astrazioni delle posizioni.
- Azioni: affordance parametrizzate.
- Workflow: traiettorie osservate.
- Conoscenza Tacita: definizioni di dominio e procedure riutilizzabili.
Le valutazioni sul benchmark WebArena, attraverso cinque domini, mostrano che gli agenti dotati di Environment Maps raggiungono un tasso di successo del 28.2%, quasi il doppio rispetto alle baseline limitate al contesto della sessione (14.2%) e superando anche gli agenti con accesso ai dati grezzi delle traiettorie utilizzati per generare le Environment Maps (23.3%).
Fornendo un'interfaccia strutturata tra il modello e l'ambiente, le Environment Maps stabiliscono una base persistente per la pianificazione a lungo termine, che รจ interpretabile, modificabile e continuamente raffinabile.
๐ฌ Commenti (0)
๐ Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!