Qwen-35B: analisi di immagini e tool calling su hardware consumer

Pubblicato il 2026-03-06 11:01 ℹ️ LocalLLaMA 📰 Leggi l'articolo originale →

Un utente di Reddit ha condiviso un test interessante su Qwen-35B, un modello linguistico di grandi dimensioni (LLM). L'esperimento si è concentrato sulle capacità di analisi visiva e di tool calling del modello.

Dettagli del test

All'LLM è stata fornita un'immagine di bassa qualità e gli è stato chiesto di individuare un anello. Qwen-35B è stato in grado di analizzare l'immagine, comprendere la posizione esatta dell'anello e, cosa ancora più notevole, utilizzare un terminale Linux per cerchiare l'area corrispondente.

Performance

L'utente ha evidenziato la velocità di elaborazione del modello, che raggiunge i 100 token al secondo (tk/s) su hardware consumer, nello specifico una GPU 3090. Questo suggerisce un'ottimizzazione significativa per l'inference su hardware meno costoso rispetto alle soluzioni enterprise.

Per chi valuta deployment on-premise, esistono trade-off da considerare. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.

Punto chiave

Un utente ha testato Qwen-35B con una immagine di bassa qualità, chiedendo al modello di identificare un anello. Il modello ha non solo individuato la posizione esatta, ma ha anche utilizzato il terminale Linux per cerchiare l'area. La velocità di elaborazione è notevole, raggiungendo i 100tk/s su una GPU consumer (3090).

🤖 Chiedi all'AI di questo argomento

Vuoi approfondire? Leggi l'articolo completo dalla fonte:

📖 VAI ALLA FONTE ORIGINALE

💻 Hai bisogno di infrastruttura GPU cloud?

Per eseguire inferenza LLM, training di modelli o testare configurazioni hardware, dai un'occhiata a questa piattaforma:

🌐

Vast.ai Marketplace GPU

Marketplace GPU decentralizzato con prezzi ultra-competitivi. Noleggia da una rete globale di provider. Perfetto per sperimentazione, sviluppo e carichi ottimizzati sui costi.

✓ Prezzi minimi ✓ Rete globale ✓ Opzioni flessibili

🔗 Questo è un link affiliato - potremmo ricevere una commissione senza costi aggiuntivi per te.

💬 Commenti (0)

🔒 Accedi o registrati per commentare gli articoli.

Nessun commento ancora. Sii il primo a commentare!

🔍 Continua a esplorare

SEZIONE

AI-Radar LLM On-Premise

Guida completa per eseguire modelli AI in locale: hardware, stack, privacy e architetture di riferimento.

→

Qwen-35B: analisi di immagini e tool calling su hardware consumer

Dettagli del test

Performance

💻 Hai bisogno di infrastruttura GPU cloud?

💬 Commenti (0)

🔍 Continua a esplorare

Approfondisci su LLM On-Premise

Benchmark LLM: Ragionamento logico e il test 'dell'autolavaggio'

Taalas: LLM integrati nell'hardware, fino a 16.000 token/secondo

Valutazione di LLM piccoli: l'importanza del parsing negli agenti locali