StepFun AI si prepara a rilasciare Step-3.5-Flash-Base, un nuovo modello linguistico, e promette ulteriori novità per celebrare il capodanno cinese.

Ottimizzazioni e collaborazione con NVIDIA

Il team ha inoltre reso noto di essere in contatto con NVIDIA per quanto riguarda l'implementazione di NVFP4, una tecnica di quantization che potrebbe migliorare l'efficienza del modello. Sono in corso anche lavori per ottimizzare l'utilizzo dei token, in risposta ai feedback degli utenti.

Per chi valuta deployment on-premise, esistono trade-off tra performance e costi che AI-RADAR analizza in dettaglio nella sezione /llm-onpremise.