Microsoft ha presentato CORPGEN, un framework progettato per dotare gli agenti AI delle capacità di memoria, pianificazione e apprendimento necessarie per operare in ambienti di lavoro complessi, dove il multitasking è la norma.

Multi-Horizon Task Environments (MHTEs)

Per valutare le prestazioni degli agenti in scenari realistici, è stato sviluppato Multi-Horizon Task Environments (MHTEs). In questi ambienti, gli agenti devono gestire simultaneamente molteplici attività complesse, ciascuna richiedente tra i 10 e i 30 passaggi dipendenti, all'interno di una sessione di cinque ore. I test su agenti AI esistenti hanno rivelato debolezze nella gestione della memoria, interferenze tra attività e difficoltà nella gestione delle dipendenze.

Architettura di CORPGEN

CORPGEN introduce "digital employees", agenti AI alimentati da LLM con identità persistenti, competenze specifiche per ruolo e orari di lavoro realistici. Questi agenti operano applicazioni Microsoft Office tramite automazione della GUI e mantengono prestazioni elevate all'interno di MHTEs per ore di attività continua. L'architettura di CORPGEN include pianificazione gerarchica, subagenti isolati, un sistema di memoria a livelli e summarization adattiva.

Collaborazione tra agenti

In un ambiente con più digital employees, la collaborazione avviene attraverso canali di comunicazione standard come email e Microsoft Teams, senza regole di coordinamento predefinite. Questo approccio simula le interazioni reali sul posto di lavoro.

Valutazione di CORPGEN

Le valutazioni hanno dimostrato che CORPGEN mantiene o migliora i tassi di completamento delle attività all'aumentare del carico di lavoro, superando significativamente le prestazioni dei sistemi di base. L'apprendimento esperienziale ha contribuito maggiormente ai miglioramenti, consentendo agli agenti di riutilizzare i modelli di successo precedenti. Per chi valuta deployment on-premise, esistono trade-off da considerare attentamente, come evidenziato dai framework analitici di AI-RADAR su /llm-onpremise.

Prospettive future

I risultati suggeriscono che la gestione della memoria e il recupero delle informazioni sono cruciali per l'efficacia degli agenti AI nel mondo reale. I prossimi passi includono testare la capacità degli agenti di mantenere la memoria su più giorni lavorativi e di coordinarsi in team.