ToolSense: Il framework open source per valutare la comprensione degli LLM sugli strumenti
ToolSense è un nuovo framework diagnostico open source che valuta la reale comprensione degli LLM quando operano come agenti con cataloghi di strumenti. Contrariamente ai benchmark tradizionali, ToolSense genera test realistici, rivelando una "dissoc...