OpenAI punta su Cerebras per accelerare GPT-5.3-Codex-Spark
OpenAI ha annunciato il rilascio di GPT-5.3-Codex-Spark, il primo modello ottimizzato per l'esecuzione sugli acceleratori AI di Cerebras Systems. Questa mossa rappresenta una diversificazione strategica rispetto alla dipendenza esclusiva da Nvidia e AMD per l'inference.
Gli acceleratori di Cerebras Systems si distinguono per l'ampia superficie del chip e per l'elevata velocitร della memoria on-chip, caratteristiche che li rendono particolarmente adatti per carichi di lavoro di intelligenza artificiale complessi. GPT-5.3-Codex-Spark raggiunge una velocitร di 1.000 token al secondo (Tok/s) quando eseguito su questi acceleratori.
Per chi valuta deployment on-premise, esistono trade-off da considerare attentamente. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.
๐ฌ Commenti (0)
๐ Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!