Il team di Jan ha annunciato il rilascio di Jan-v3-4B-base-instruct, un modello con 4 miliardi di parametri sviluppato tramite pre-training continuo e reinforcement learning (RL).
Caratteristiche principali
- Obiettivo: Migliorare le performance in task comuni, mantenendo le capacitร generali del modello.
- Utilizzo: Ottimo punto di partenza per il fine-tuning e per migliorare l'assistenza leggera in matematica e coding.
- Modalitร di esecuzione: Disponibile tramite Jan Desktop (scaricabile dal sito ufficiale) e su Hugging Face.
- Parametri raccomandati:
- Temperatura: 0.7
- top_p: 0.8
- top_k: 20
Prossimi sviluppi
Il team di Jan ha annunciato che sono in arrivo:
- Jan-Code: una versione finetuned di Jan-v3-4B-base-instruct focalizzata sul coding.
- Jan-v3-Search-4B: un aggiornamento di Jan-nano basato su Jan-v3-4B-base-instruct.
- Una famiglia di modelli Jan-v3 da 30B parametri.
Per chi valuta deployment on-premise, AI-RADAR offre framework analitici su /llm-onpremise per valutare trade-off.
๐ฌ Commenti (0)
๐ Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!