Microsoft ha presentato CORPGEN, un framework progettato per dotare gli agenti AI delle capacità di memoria, pianificazione e apprendimento necessarie per operare in ambienti di lavoro complessi, dove il multitasking è la norma.
Multi-Horizon Task Environments (MHTEs)
Per valutare le prestazioni degli agenti in scenari realistici, è stato sviluppato Multi-Horizon Task Environments (MHTEs). In questi ambienti, gli agenti devono gestire simultaneamente molteplici attività complesse, ciascuna richiedente tra i 10 e i 30 passaggi dipendenti, all'interno di una sessione di cinque ore. I test su agenti AI esistenti hanno rivelato debolezze nella gestione della memoria, interferenze tra attività e difficoltà nella gestione delle dipendenze.
Architettura di CORPGEN
CORPGEN introduce "digital employees", agenti AI alimentati da LLM con identità persistenti, competenze specifiche per ruolo e orari di lavoro realistici. Questi agenti operano applicazioni Microsoft Office tramite automazione della GUI e mantengono prestazioni elevate all'interno di MHTEs per ore di attività continua. L'architettura di CORPGEN include pianificazione gerarchica, subagenti isolati, un sistema di memoria a livelli e summarization adattiva.
Collaborazione tra agenti
In un ambiente con più digital employees, la collaborazione avviene attraverso canali di comunicazione standard come email e Microsoft Teams, senza regole di coordinamento predefinite. Questo approccio simula le interazioni reali sul posto di lavoro.
Valutazione di CORPGEN
Le valutazioni hanno dimostrato che CORPGEN mantiene o migliora i tassi di completamento delle attività all'aumentare del carico di lavoro, superando significativamente le prestazioni dei sistemi di base. L'apprendimento esperienziale ha contribuito maggiormente ai miglioramenti, consentendo agli agenti di riutilizzare i modelli di successo precedenti. Per chi valuta deployment on-premise, esistono trade-off da considerare attentamente, come evidenziato dai framework analitici di AI-RADAR su /llm-onpremise.
Prospettive future
I risultati suggeriscono che la gestione della memoria e il recupero delle informazioni sono cruciali per l'efficacia degli agenti AI nel mondo reale. I prossimi passi includono testare la capacità degli agenti di mantenere la memoria su più giorni lavorativi e di coordinarsi in team.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!