Nvidia ha presentato Nemotron Cascade 2 30B A3B, un nuovo modello linguistico di grandi dimensioni (LLM) open-source. Questo modello รจ costruito a partire dal Nemotron 3 Nano Base, ma include miglioramenti significativi nel post-training.

Performance

Le prime valutazioni suggeriscono che Nemotron Cascade 2 30B A3B offre prestazioni paragonabili a quelle di modelli con 120 miliardi di parametri in benchmark specifici per matematica e codice. Ulteriori test sono necessari per convalidare questi risultati iniziali.

Risorse

Il modello รจ accessibile tramite Hugging Face. La sua architettura e le metodologie di training sono descritte in dettaglio in un paper di ricerca disponibile su arXiv.