inclusionAI ha rilasciato Ring-1T-2.5, un modello linguistico di grandi dimensioni (LLM) che promette prestazioni di alto livello nel "deep thinking".

Disponibilità

Il modello è accessibile tramite Hugging Face in formato FP8. Questo livello di quantization può consentire un'inference più efficiente su hardware con capacità computazionali limitate, rendendolo potenzialmente adatto per scenari on-premise o edge computing.

Per chi valuta deployment on-premise, esistono trade-off da considerare attentamente. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.