AI-RADAR.IT · AI-RADAR.NET · AI-RADAR.TECH

News & analisi per LLM locali, stack e hardware on-prem.

📁 LLM AI generated

WebGym: ambiente open source per addestrare agenti web visivi

Pubblicato il 2026-01-07 05:04 🏆 ArXiv cs.LG 📰 Leggi l'articolo originale →

WebGym: Un nuovo ambiente per l'addestramento di agenti web visivi

È stato presentato WebGym, un ambiente open source progettato per l'addestramento di agenti web visivi realistici. Questo strumento si distingue per la sua vasta gamma di task, quasi 300.000, che coprono siti web reali e diversi livelli di difficoltà.

Scalabilità e prestazioni

Per scalare l'apprendimento per rinforzo (RL), WebGym introduce un sistema di rollout asincrono ad alta velocità, ottimizzato per agenti web. Questo sistema accelera il campionamento delle traiettorie di 4-5 volte rispetto alle implementazioni standard. L'addestramento di un modello vision-language, Qwen-3-VL-8B-Instruct, su WebGym ha portato a un aumento del tasso di successo su un set di test out-of-distribution dal 26,2% al 42,9%, superando agenti basati su modelli proprietari come GPT-4o e GPT-5-Thinking.

Implicazioni

La capacità di WebGym di migliorare le prestazioni su siti web mai visti durante l'addestramento rappresenta un passo avanti significativo nello sviluppo di agenti web visivi robusti e adattabili. Questo è particolarmente importante perché molti lavori precedenti si concentravano su task su siti web già visti durante l'addestramento.

Takeaway AI-Radar

WebGym è un nuovo ambiente open source per l'addestramento di agenti web visivi realistici. Contiene quasi 300.000 task su siti web reali, con valutazioni basate su rubric e diversi livelli di difficoltà. Un sistema di rollout asincrono ad alta velocità accelera il campionamento delle traiettorie, migliorando significativamente le prestazioni rispetto ai modelli proprietari.

🤖 Chiedi all'AI di questo argomento

Vuoi approfondire? Leggi l'articolo completo dalla fonte:

📖 VAI ALLA FONTE ORIGINALE

💻 Hai bisogno di infrastruttura GPU cloud?

Per eseguire inferenza LLM, training di modelli o testare configurazioni hardware, dai un'occhiata a questa piattaforma:

Railway Infrastruttura Cloud

Piattaforma cloud moderna con deployment istantanei. Deploy da GitHub in secondi con HTTPS automatico, database e monitoring. Perfetta per web app, API e servizi di inferenza LLM.

✓ Integrazione GitHub ✓ HTTPS automatico ✓ Prezzi semplici

🔗 Questo è un link affiliato - potremmo ricevere una commissione senza costi aggiuntivi per te.

AI-RADAR NEWSLETTER

Resta aggiornato — segnali AI nella tua inbox

Digest giornaliero o settimanale delle notizie AI più importanti. 160+ lettori, zero spam.

💬 Commenti (0)

🔒 Accedi o registrati per commentare gli articoli.

Nessun commento ancora. Sii il primo a commentare!

🔍 Continua a esplorare

Approfondisci su LLM On-Premise

Guida completa per eseguire modelli AI in locale: hardware, stack e privacy.

Agenti Web Autonomi: La Sicurezza Sotto la Lente delle Interfacce Ingannatrici

Agenti Web Autonomi: La Sicurezza Sotto la Lente delle Interfacce Ingannatrici

Uno studio recente ha esaminato la vulnerabilità degli agenti web autonomi di fronte a interfacce ingannevoli nel settore e-commerce. Utilizzando il framework W

Holos: Il sistema multi-agente LLM per un Web autonomo e scalabile

Frameworks Apr 06

Holos: Il sistema multi-agente LLM per un Web autonomo e scalabile

Holos è un innovativo sistema multi-agente basato su Large Language Models (LLM) progettato per operare su scala web. Affronta le sfide critiche dei sistemi mul

I bot basati su AI potrebbero superare gli utenti umani sul web

I bot basati su AI potrebbero superare gli utenti umani sul web

Il traffico generato dai bot di AI, in particolare quelli che utilizzano architetture RAG (Retrieval-Augmented Generation), sta crescendo rapidamente. Alcune st

Firecrawl: il layer web open source per l'AI si consolida

Frameworks May 05

Firecrawl: il layer web open source per l'AI si consolida

Firecrawl, un progetto open source, sta rapidamente diventando uno strumento essenziale per l'interazione degli agenti AI con il web. Con oltre 100.000 stelle s

TextWeb: un renderer Markdown per LLM on-premise e agenti AI

Frameworks May 11

TextWeb: un renderer Markdown per LLM on-premise e agenti AI

Uno sviluppatore ha presentato TextWeb, un renderer web che converte le pagine in formato Markdown per l'elaborazione nativa da parte degli LLM. Questo approcci

Altri articoli in LLM

Longcat 2: quantization INT8 e FP8 per il deployment on-premise

Perché l’AI ha bisogno di un glossario (e cosa c’entra il deployment on-premise)

Smartschool e l’AI per i test d’ammissione: perché insegnare è più difficile che rispondere

Mistral rilascia Leanstral 1.5: verifica formale con 6 miliardi di parametri attivi

DeepSeek annuncia DSpark: un salto di velocità per l’inference degli LLM

Zuckerberg: gli agenti AI di Meta procedono più lentamente del previsto

→ Vedi tutti in LLM →

AI-Radar LLM On-Premise

Guida completa per eseguire modelli AI in locale: hardware, stack, privacy e architetture di riferimento.

👥 Unisciti a 160+ appassionati di AI

Una community gratuita di sviluppatori, ingegneri e appassionati di AI — newsletter, commenti, radar settimanale.

Iscriviti gratis → Hai già un account? Accedi