📁 LLM AI generated

StepFun: in arrivo Step-3.5-Flash-Base e novità per il capodanno cinese

Pubblicato il 2026-02-09 03:41 ℹ️ LocalLLaMA 📰 Leggi l'articolo originale →

StepFun AI si prepara a rilasciare Step-3.5-Flash-Base, un nuovo modello linguistico, e promette ulteriori novità per celebrare il capodanno cinese.

Ottimizzazioni e collaborazione con NVIDIA

Il team ha inoltre reso noto di essere in contatto con NVIDIA per quanto riguarda l'implementazione di NVFP4, una tecnica di quantization che potrebbe migliorare l'efficienza del modello. Sono in corso anche lavori per ottimizzare l'utilizzo dei token, in risposta ai feedback degli utenti.

Per chi valuta deployment on-premise, esistono trade-off tra performance e costi che AI-RADAR analizza in dettaglio nella sezione /llm-onpremise.

Takeaway AI-Radar

Il team di StepFun AI ha annunciato l'imminente rilascio di Step-3.5-Flash-Base e anticipa ulteriori sorprese in occasione del capodanno cinese. Sono in corso discussioni con NVIDIA sull'utilizzo di NVFP4 e ottimizzazioni per la gestione dei token.

🤖 Chiedi all'AI di questo argomento

Vuoi approfondire? Leggi l'articolo completo dalla fonte:

📖 VAI ALLA FONTE ORIGINALE

💻 Hai bisogno di infrastruttura GPU cloud?

Per eseguire inferenza LLM, training di modelli o testare configurazioni hardware, dai un'occhiata a questa piattaforma:

🚂

Railway Infrastruttura Cloud

Piattaforma cloud moderna con deployment istantanei. Deploy da GitHub in secondi con HTTPS automatico, database e monitoring. Perfetta per web app, API e servizi di inferenza LLM.

✓ Integrazione GitHub ✓ HTTPS automatico ✓ Prezzi semplici

🔗 Questo è un link affiliato - potremmo ricevere una commissione senza costi aggiuntivi per te.

AI-RADAR NEWSLETTER

Resta aggiornato — segnali AI nella tua inbox

Digest giornaliero o settimanale delle notizie AI più importanti. 160+ lettori, zero spam.

💬 Commenti (0)

🔒 Accedi o registrati per commentare gli articoli.

Nessun commento ancora. Sii il primo a commentare!

🔍 Continua a esplorare

SEZIONE

Approfondisci su LLM On-Premise

Guida completa per eseguire modelli AI in locale: hardware, stack e privacy.

Leggi →

Frameworks Jan 28

Modelence raccoglie 13 milioni per ottimizzare lo stack AI

Modelence ha raccolto 13 milioni di dollari per sviluppare strumenti che semplifichino lo stack software per l'intelligenza artificiale. L'azienda punta a risol

Leggi →

LLM Feb 25

Efficienza nel training AI: dal Throughput al Goodput

L'addestramento preliminare di modelli linguistici di grandi dimensioni (LLM) con oltre 100 miliardi di parametri richiede migliaia di acceleratori e corpora di

Leggi →

LLM Mar 03

Gemini 3.1 Flash-Lite: intelligenza artificiale scalabile ed efficiente

Google presenta Gemini 3.1 Flash-Lite, un modello della serie Gemini 3 progettato per offrire prestazioni elevate e costi contenuti. Questo modello mira a forni

Leggi →

Market Feb 25

Profitti record di TSMC: il boom dell'IA è tutt'altro che finito

I profitti record di TSMC segnalano una forte domanda di chip avanzati per l'intelligenza artificiale. Questo indica che la crescita del settore IA è destinata

Leggi →

Hardware Mar 18

Nvidia collabora con produttori di chip per la robotica industriale

Nvidia sta collaborando con diversi produttori di chip per accelerare lo sviluppo di soluzioni di robotica industriale avanzata. Questa partnership mira a sfrut

Leggi →

Altri articoli in LLM

Il divario prestazionale tra modelli aperti e chiusi potrebbe essere illusorio

Jul 01, 2026

→

Giugno 2026: NVIDIA, AMD e Intel guidano la spinta alla quantization per LLM on-premise

Jul 01, 2026

→

Meta legge il pensiero mentre scrivi: interfaccia neurale senza bisturi, ma con un paradosso

Jul 01, 2026

→

Qwen3.6-27B e Gemma 4 31B nella classifica SWE-rebench: le prestazioni dei modelli locali

Jul 01, 2026

→

openPangu-2.0-Flash: MoE e contesto esteso addestrati su Ascend per l’inference on-premise

Jul 01, 2026

→

OpenAI: scoperto un metodo per dimezzare i costi di inference

Jul 01, 2026

→ Vedi tutti in LLM →

🖥️

AI-Radar LLM On-Premise

Guida completa per eseguire modelli AI in locale: hardware, stack, privacy e architetture di riferimento.

→

👥 Unisciti a 160+ appassionati di AI

Una community gratuita di sviluppatori, ingegneri e appassionati di AI — newsletter, commenti, radar settimanale.

Iscriviti gratis → Hai già un account? Accedi