Step-3.5-Flash: un nuovo modello efficiente
Un nuovo modello, Step-3.5-Flash, si distingue per le sue performance elevate in rapporto al numero di parametri utilizzati. Secondo i dati disponibili, Step-3.5-Flash supera DeepSeek v3.2 in diversi benchmark incentrati su coding e capacitร di agenti, pur avendo un numero di parametri attivi significativamente inferiore.
- Step-3.5-Flash: 196B parametri totali / 11B parametri attivi
- DeepSeek v3.2: 671B parametri totali / 37B parametri attivi
Il modello Step-3.5-Flash รจ disponibile su Hugging Face, aprendo la strada a nuove possibilitร per applicazioni che richiedono efficienza computazionale e basse latenze. L'utilizzo di modelli con un numero inferiore di parametri attivi puรฒ portare a vantaggi significativi in termini di costi e requisiti hardware, specialmente in scenari di deployment on-premise.
Per chi valuta deployment on-premise, esistono trade-off da considerare attentamente. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.
๐ฌ Commenti (0)
๐ Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!