OpenAI punta su Cerebras per accelerare GPT-5.3-Codex-Spark

OpenAI ha annunciato il rilascio di GPT-5.3-Codex-Spark, il primo modello ottimizzato per l'esecuzione sugli acceleratori AI di Cerebras Systems. Questa mossa rappresenta una diversificazione strategica rispetto alla dipendenza esclusiva da Nvidia e AMD per l'inference.

Gli acceleratori di Cerebras Systems si distinguono per l'ampia superficie del chip e per l'elevata velocitร  della memoria on-chip, caratteristiche che li rendono particolarmente adatti per carichi di lavoro di intelligenza artificiale complessi. GPT-5.3-Codex-Spark raggiunge una velocitร  di 1.000 token al secondo (Tok/s) quando eseguito su questi acceleratori.

Per chi valuta deployment on-premise, esistono trade-off da considerare attentamente. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.