AI-RADAR.IT · AI-RADAR.NET · AI-RADAR.TECH

News & analisi per LLM locali, stack e hardware on-prem.

📁 LLM AI generated

Jan v3 Instruct: modello di coding da 4B con miglioramenti del 40%

Pubblicato il 2026-01-27 04:53 ℹ️ LocalLLaMA 📰 Leggi l'articolo originale →

🏷️ LLM On-Premise 🏷️ Fine-Tuning 🏷️ DevOps

Jan v3 Instruct: modello di coding da 4B con miglioramenti del 40%

Il team di Jan ha annunciato il rilascio di Jan-v3-4B-base-instruct, un modello con 4 miliardi di parametri sviluppato tramite pre-training continuo e reinforcement learning (RL).

Caratteristiche principali

Obiettivo: Migliorare le performance in task comuni, mantenendo le capacità generali del modello.
Utilizzo: Ottimo punto di partenza per il fine-tuning e per migliorare l'assistenza leggera in matematica e coding.
Modalità di esecuzione: Disponibile tramite Jan Desktop (scaricabile dal sito ufficiale) e su Hugging Face.
Parametri raccomandati:
- Temperatura: 0.7
- top_p: 0.8
- top_k: 20

Prossimi sviluppi

Il team di Jan ha annunciato che sono in arrivo:

Jan-Code: una versione finetuned di Jan-v3-4B-base-instruct focalizzata sul coding.
Jan-v3-Search-4B: un aggiornamento di Jan-nano basato su Jan-v3-4B-base-instruct.
Una famiglia di modelli Jan-v3 da 30B parametri.

Per chi valuta deployment on-premise, AI-RADAR offre framework analitici su /llm-onpremise per valutare trade-off.

Takeaway AI-Radar

Il team di Jan ha rilasciato Jan-v3-4B-base-instruct, un modello da 4 miliardi di parametri addestrato con pre-training continuo e reinforcement learning. L'obiettivo è migliorare le capacità in attività comuni preservando le capacità generali. Il modello è un buon punto di partenza per l'ulteriore fine-tuning e offre prestazioni migliorate in matematica e coding.

🤖 Chiedi all'AI di questo argomento

Vuoi approfondire? Leggi l'articolo completo dalla fonte:

📖 VAI ALLA FONTE ORIGINALE

💻 Hai bisogno di infrastruttura GPU cloud?

Per eseguire inferenza LLM, training di modelli o testare configurazioni hardware, dai un'occhiata a questa piattaforma:

Vast.ai Marketplace GPU

Marketplace GPU decentralizzato con prezzi ultra-competitivi. Noleggia da una rete globale di provider. Perfetto per sperimentazione, sviluppo e carichi ottimizzati sui costi.

✓ Prezzi minimi ✓ Rete globale ✓ Opzioni flessibili

🔗 Questo è un link affiliato - potremmo ricevere una commissione senza costi aggiuntivi per te.

AI-RADAR NEWSLETTER

Resta aggiornato — segnali AI nella tua inbox

Digest giornaliero o settimanale delle notizie AI più importanti. 160+ lettori, zero spam.

💬 Commenti (0)

🔒 Accedi o registrati per commentare gli articoli.

Nessun commento ancora. Sii il primo a commentare!

🔍 Continua a esplorare

Approfondisci su LLM On-Premise

Guida completa per eseguire modelli AI in locale: hardware, stack e privacy.

Jan-Code-4B: un modello compatto ottimizzato per il codice

Jan-Code-4B: un modello compatto ottimizzato per il codice

Il team di Jan ha rilasciato Jan-Code-4B, un modello di piccole dimensioni ottimizzato per attività di programmazione. Basato su Jan-v3-4B-base-instruct, mira a

Ex-Anthropic raccoglie 200 milioni per l'AI che si migliora da sola

Ex-Anthropic raccoglie 200 milioni per l'AI che si migliora da sola

Mirendil, fondata da due ex ricercatori di Anthropic, ha raccolto 200 milioni di dollari con una valutazione di 1 miliardo. La promessa: commercializzare i sist

Amalia: il Portogallo lancia un LLM nazionale da 9 miliardi di parametri

Amalia: il Portogallo lancia un LLM nazionale da 9 miliardi di parametri

Il governo portoghese ha rilasciato Amalia, un Large Language Model da 9 miliardi di parametri con licenza Apache 2.0. Il modello, disponibile nelle varianti SF

PROPEL: Ottimizzare la Generazione di Task per l'Addestramento di LLM con Reinforcement Learning

PROPEL: Ottimizzare la Generazione di Task per l'Addestramento di LLM con Reinforcement Learning

Un nuovo framework, PROPEL, affronta la sfida della scarsità di task di qualità per l'addestramento di agenti tramite Reinforcement Learning. Superando i limiti

ICLR 2026: focus su allineamento, efficienza dati e sicurezza

ICLR 2026: focus su allineamento, efficienza dati e sicurezza

Un'analisi dei paper accettati a ICLR 2026 rivela un cambio di passo nelle priorità della ricerca. L'attenzione si sposta verso metodi di allineamento avanzati,

Altri articoli in LLM

TabFM di Google: classificazione e regressione tabulare senza addestramento

Longcat 2: quantization INT8 e FP8 per il deployment on-premise

Perché l’AI ha bisogno di un glossario (e cosa c’entra il deployment on-premise)

Smartschool e l’AI per i test d’ammissione: perché insegnare è più difficile che rispondere

Mistral rilascia Leanstral 1.5: verifica formale con 6 miliardi di parametri attivi

DeepSeek annuncia DSpark: un salto di velocità per l’inference degli LLM

→ Vedi tutti in LLM →

AI-Radar LLM On-Premise

Guida completa per eseguire modelli AI in locale: hardware, stack, privacy e architetture di riferimento.

👥 Unisciti a 160+ appassionati di AI

Una community gratuita di sviluppatori, ingegneri e appassionati di AI — newsletter, commenti, radar settimanale.

Iscriviti gratis → Hai già un account? Accedi