DeepSeek al lavoro su un nuovo modello?

Un aggiornamento a una delle repository di DeepSeek ha rivelato un riferimento a un nuovo modello, provvisoriamente denominato "model1".

La menzione è stata individuata all'interno del file flash_mla_interface.py nella repository FlashMLA di DeepSeek su GitHub.

Al momento, non ci sono informazioni aggiuntive sulle caratteristiche o sulle finalità di questo nuovo modello. Resta da vedere se "model1" rappresenti un'evoluzione dei modelli esistenti o un progetto completamente nuovo. Ulteriori sviluppi sono attesi nelle prossime settimane.

DeepSeek è una realtà sempre più rilevante nel panorama dell'intelligenza artificiale, specialmente nel campo dei modelli linguistici di grandi dimensioni (LLM). L'azienda si è fatta notare per le sue architetture efficienti e le sue consegne open source, che hanno permesso alla comunità di sviluppare ulteriormente le proprie soluzioni di intelligenza artificiale. La scoperta di "model1" suggerisce che DeepSeek continua a investire nello sviluppo di nuove tecnicie e modelli.