È disponibile un nuovo modello linguistico di grandi dimensioni, denominato Intern-S1-Pro.
Dettagli del modello
Intern-S1-Pro è un modello con circa 1 trilione di parametri. La sua architettura suggerisce una derivazione dal modello Qwen3-235B, scalato per utilizzare 512 esperti. Ulteriori dettagli sulle prestazioni, requisiti hardware e costi di gestione non sono al momento disponibili.
Per chi valuta deployment on-premise, esistono trade-off significativi tra costi iniziali e controllo sui dati. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!