Nemotron Cascade 2 30B-A3B, un modello che non si basa sull'architettura Qwen nonostante le dimensioni simili, sta attirando l'attenzione per le sue performance.
Performance preliminari
I primi risultati, ottenuti con una quantization IQ4_XS, sono promettenti. Su HumanEval, Nemotron Cascade 2 ha raggiunto un punteggio del 97.6%, superando i modelli Qwen3.5 di medie dimensioni. Anche su ClassEval, il modello ha ottenuto un risultato notevole, con un punteggio dell'88%.
Architettura
A differenza di altri modelli di dimensioni comparabili, Nemotron Cascade 2 utilizza un'architettura ibrida proprietaria. Questa scelta progettuale potrebbe essere alla base delle sue performance superiori in determinati benchmark. Ulteriori test sono in corso per valutare appieno le capacitร del modello.
๐ฌ Commenti (0)
๐ Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!