TMax, la ricetta aperta per agenti terminale che insidia Claude e Kimi
AllenAI presenta TMax, un dataset di ambienti RL e una ricetta di addestramento aperti che producono agenti terminale compatti, fino a 27B parametri. Il modello da 9B batte tutti gli open sotto i 10B su Terminal Bench 2.0 e si avvicina a sistemi chiu...