Gemma 4 31B addestrata per il copywriting: +290 Elo e niente più frasi fatte

Chi scrive testi pubblicitari lo sa: i modelli generalisti, anche i più capaci, tendono a ricorrere a formule di rito. Aperture come «Nell’attuale panorama competitivo», promesse fumose e call to action fiacche sono il marchio di fabbrica di un copy prodotto senza un vero addestramento sul mestiere.

Un progetto condiviso su Reddit mostra cosa succede quando si affronta il problema con un fine-tuning chirurgico. Prendendo come base Gemma-4-31B-it, il team ha curato un corpus di brief creativi abbinati a testi finali, includendo annunci Facebook, email a freddo, landing page e script video. L’addestramento è stato fatto in QLoRA, quindi con un impatto computazionale ridotto, e i pesi finali sono stati riportati a piena precisione bf16 per semplificare il deployment. Il modello risultante ha 31 miliardi di parametri e una finestra di contesto di 256K token, due caratteristiche che lo rendono utilizzabile su hardware consumer di fascia alta senza troppi compromessi.

Per valutare i progressi, è stato costruito un benchmark specifico basato sulla metodologia EQ-Bench 3: 30 brief reali, giudicati alla cieca tramite confronto a coppie da DeepSeek V4 Flash, controllando anche l’ordine di presentazione per eliminare distorsioni. Il verdetto è netto: il modello raffinato raggiunge un punteggio Elo di 1657 contro i 1367 della versione base, vincendo l’80% degli scontri diretti. I guadagni più consistenti si registrano proprio dove il copywriting a risposta diretta fa la differenza: forza dell’apertura, concretezza dei dettagli, concisione.

Non è solo un esercizio di tuning creativo. Per chi gestisce carichi di lavoro di generazione testi in locale, questo risultato segnala la maturità dei modelli aperti quando vengono specializzati su domini verticali. Gemma 4 occupa meno VRAM rispetto ad alternative più grandi, e la versione quantizzata disponibile su Hugging Face (con il tag base_model:quantized:akwin123/copywriter-gemma4-31b) apre possibilità di inference su GPU con 24-48 GB di memoria, un margine interessante per reparti marketing che vogliono mantenere il controllo completo dei dati, evitando API cloud e le relative incognite di privacy.

Un dettaglio operativo da non ignorare: il modello va utilizzato con enable_thinking=false. Attivare la modalità di ragionamento di Gemma 4, paradossalmente, peggiora la qualità dei testi generati. Non è una sorpresa per chi lavora con i modelli istruiti a seguire istruzioni precise: il cosiddetto “thinking mode” può introdurre catene di ragionamento che allontanano dall’esecuzione pulita di un brief creativo, un trade-off che ricorda le discussioni sui prompt troppo elaborati nei sistemi RAG.

L’integrazione è pensata per essere immediata: i pesi sono rilasciati in formato Transformers e compatibili con vLLM, senza bisogno di gestire adattatori separati. Basta caricare il modello e puntarlo verso un flusso di generazione testi. Chi cerca ispirazione per il proprio stack locale troverà nella scheda tecnica su Hugging Face esempi di caricamento e qualche avvertenza sui parametri di decoding consigliati.

Il punto non è se l’intelligenza artificiale possa scrivere headline migliori di un copywriter esperto. È che un modello con un addestramento così specifico diventa un compagno di lavoro affidabile per chi fa A/B test su larga scala o produce varianti in volumi industriali, senza dover inviare dati a server esterni.

Gemma 4 31B addestrata per il copywriting: +290 Elo e niente più frasi fatte

💻 Hai bisogno di infrastruttura GPU cloud?

Resta aggiornato — segnali AI nella tua inbox

💬 Commenti (0)

🔍 Continua a esplorare

Altri articoli in LLM

👥 Unisciti a 160+ appassionati di AI