Nvidia ha presentato Nemotron Cascade 2 30B A3B, un nuovo modello linguistico di grandi dimensioni (LLM) open-source. Questo modello รจ costruito a partire dal Nemotron 3 Nano Base, ma include miglioramenti significativi nel post-training.
Performance
Le prime valutazioni suggeriscono che Nemotron Cascade 2 30B A3B offre prestazioni paragonabili a quelle di modelli con 120 miliardi di parametri in benchmark specifici per matematica e codice. Ulteriori test sono necessari per convalidare questi risultati iniziali.
Risorse
Il modello รจ accessibile tramite Hugging Face. La sua architettura e le metodologie di training sono descritte in dettaglio in un paper di ricerca disponibile su arXiv.
๐ฌ Commenti (0)
๐ Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!