GPT-OSS 120B: modello open-source non censurato per inference locale

Pubblicato il 2026-02-13 21:31 ℹ️ LocalLLaMA 📰 Leggi l'articolo originale →

È stata rilasciata una versione non censurata del modello linguistico open-source GPT-OSS 120B. Questa versione "aggressiva" è progettata per non rifiutare alcuna query.

Specifiche Tecniche

Parametri totali: 117 miliardi
Parametri attivi: ~5.1 miliardi (MoE con 128 esperti, top-4 routing)
Finestra di contesto: 128K
Formato: MXFP4 (precisione nativa del modello)

Il modello è fornito in un singolo file da 61GB e può essere eseguito su una singola GPU H100. Per configurazioni con VRAM inferiore, è possibile scaricare i livelli MoE sulla CPU tramite l'opzione --n-cpu-moe N in llama.cpp. Funziona con llama.cpp, LM Studio, Ollama e altri.

Altri Modelli

Sono disponibili anche versioni non censurate di GPT-OSS 20B, GLM 4.7 Flash e Qwen3 8b VL.

Per chi valuta deployment on-premise, AI-RADAR offre framework analitici su /llm-onpremise per valutare i trade-off.

Takeaway AI-Radar

È disponibile una versione non censurata di GPT-OSS 120B, un modello linguistico open-source con 117 miliardi di parametri totali e una finestra di contesto di 128K. Il modello è in formato MXFP4 e può essere eseguito su hardware consumer o server dotato di GPU ad alta capacità, come una singola H100.

🤖 Chiedi all'AI di questo argomento

Vuoi approfondire? Leggi l'articolo completo dalla fonte:

📖 VAI ALLA FONTE ORIGINALE

💻 Hai bisogno di infrastruttura GPU cloud?

Per eseguire inferenza LLM, training di modelli o testare configurazioni hardware, dai un'occhiata a questa piattaforma:

🚀

PeerPush Piattaforma Community AI

Scopri e condividi strumenti e progetti AI. Connettiti con sviluppatori, ottieni feedback e fai crescere la tua startup AI in una community vibrante di innovatori.

✓ Community AI ✓ Vetrina Progetti ✓ Rete Sviluppatori

🔗 Questo è un link affiliato - potremmo ricevere una commissione senza costi aggiuntivi per te.