I modelli linguistici di grandi dimensioni (LLM) spesso falliscono nella pianificazione quando le precondizioni essenziali non sono specificate. Tendono a generare fatti inesistenti o piani che violano vincoli rigidi.

SQ-BCP: Un nuovo approccio

È stato introdotto il Self-Querying Bidirectional Categorical Planning (SQ-BCP). Questo metodo rappresenta esplicitamente lo stato delle precondizioni (Sat/Viol/Unk) e risolve le incognite tramite:

  • Query mirate all'utente.
  • Ipotesi di bridging che stabiliscono la condizione mancante attraverso un'azione aggiuntiva.

SQ-BCP esegue una ricerca bidirezionale e utilizza un verifier basato su pullback come certificato categorico di compatibilità degli obiettivi, usando punteggi basati sulla distanza solo per il ranking e il pruning.

Risultati

Nei task WikiHow e RecipeNLG con precondizioni omesse, SQ-BCP ha ridotto i tassi di violazione delle risorse al 14.9% e al 5.8%, rispetto al 26.0% e al 15.7% della baseline migliore.