È disponibile un nuovo modello linguistico di grandi dimensioni, denominato Intern-S1-Pro.

Dettagli del modello

Intern-S1-Pro è un modello con circa 1 trilione di parametri. La sua architettura suggerisce una derivazione dal modello Qwen3-235B, scalato per utilizzare 512 esperti. Ulteriori dettagli sulle prestazioni, requisiti hardware e costi di gestione non sono al momento disponibili.

Per chi valuta deployment on-premise, esistono trade-off significativi tra costi iniziali e controllo sui dati. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.