Step-3.5-Flash: un nuovo modello efficiente

Un nuovo modello, Step-3.5-Flash, si distingue per le sue performance elevate in rapporto al numero di parametri utilizzati. Secondo i dati disponibili, Step-3.5-Flash supera DeepSeek v3.2 in diversi benchmark incentrati su coding e capacitร  di agenti, pur avendo un numero di parametri attivi significativamente inferiore.

  • Step-3.5-Flash: 196B parametri totali / 11B parametri attivi
  • DeepSeek v3.2: 671B parametri totali / 37B parametri attivi

Il modello Step-3.5-Flash รจ disponibile su Hugging Face, aprendo la strada a nuove possibilitร  per applicazioni che richiedono efficienza computazionale e basse latenze. L'utilizzo di modelli con un numero inferiore di parametri attivi puรฒ portare a vantaggi significativi in termini di costi e requisiti hardware, specialmente in scenari di deployment on-premise.

Per chi valuta deployment on-premise, esistono trade-off da considerare attentamente. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.