PrimeIntellect ha rilasciato INTELLECT-3.1, un modello di ragionamento Mixture-of-Experts (MoE) con 106 miliardi di parametri (A12B).
Dettagli del modello
INTELLECT-3.1 è il risultato di un training continuo del modello INTELLECT-3, con l'aggiunta di apprendimento per rinforzo focalizzato su matematica, programmazione, ingegneria del software e task agentici. Il training è stato eseguito utilizzando prime-rl e ambienti creati con la libreria verifiers. Tutti gli ambienti di training e valutazione sono disponibili sull'Environments Hub.
Open Source
Il modello, i framework di training e gli ambienti sono rilasciati con licenze open source completamente permissive (MIT e Apache 2.0). Ulteriori dettagli sono disponibili nel report tecnico.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!