I risultati del benchmark AIME 2026 sono stati pubblicati, evidenziando come sia i modelli proprietari che quelli open source abbiano raggiunto punteggi superiori al 90%.

DeepSeek V3.2: efficienza nei costi

Un aspetto particolarmente interessante รจ rappresentato dalle performance di DeepSeek V3.2, che ha completato l'intero test AIME 2026 con un costo di soli 0,09 dollari. Questo dato suggerisce un'ottimizzazione significativa in termini di risorse computazionali necessarie per l'esecuzione del modello.

Rilevanza per il mondo LLM

Questi risultati sono significativi per la comunitร  che sviluppa e utilizza modelli linguistici di grandi dimensioni (LLM), in quanto dimostrano che รจ possibile ottenere performance elevate con costi contenuti. Per chi valuta deployment on-premise, esistono trade-off da considerare attentamente, come evidenziato dai framework analitici disponibili su /llm-onpremise.