Il team di Jan ha annunciato il rilascio di Jan-v3-4B-base-instruct, un modello con 4 miliardi di parametri sviluppato tramite pre-training continuo e reinforcement learning (RL).

Caratteristiche principali

  • Obiettivo: Migliorare le performance in task comuni, mantenendo le capacitร  generali del modello.
  • Utilizzo: Ottimo punto di partenza per il fine-tuning e per migliorare l'assistenza leggera in matematica e coding.
  • Modalitร  di esecuzione: Disponibile tramite Jan Desktop (scaricabile dal sito ufficiale) e su Hugging Face.
  • Parametri raccomandati:
    • Temperatura: 0.7
    • top_p: 0.8
    • top_k: 20

Prossimi sviluppi

Il team di Jan ha annunciato che sono in arrivo:

  • Jan-Code: una versione finetuned di Jan-v3-4B-base-instruct focalizzata sul coding.
  • Jan-v3-Search-4B: un aggiornamento di Jan-nano basato su Jan-v3-4B-base-instruct.
  • Una famiglia di modelli Jan-v3 da 30B parametri.

Per chi valuta deployment on-premise, AI-RADAR offre framework analitici su /llm-onpremise per valutare trade-off.