L'errore più comune dei team è fare fine-tuning per aggiungere conoscenza — un modo costoso e lento per fare ciò che RAG fa a basso costo e all'istante. Le due tecniche risolvono problemi diversi, e la domanda giusta non è "quale è meglio" ma "cosa voglio cambiare: ciò che il modello sa, o come si comporta?"
A confronto
| RAG | Fine-tuning | |
|---|---|---|
| Cambia | Conoscenza | Comportamento/stile |
| Aggiornare i dati | Istantaneo (modifichi i doc) | Richiede retraining |
| Costo iniziale | Basso | Più alto (training) |
| Rischio allucinazioni | Minore (cita le fonti) | Invariato |
| Ideale per | Doc, FAQ, fatti aggiornati | Tono, formato, task specifici |
L'ordine pragmatico
1) Parti da prompting + RAG — più economico, veloce e aggiornabile. 2) Se comportamento o formato non vanno, fai fine-tuning su un piccolo dataset di qualità. 3) Combina: un modello fine-tuned che fa anche retrieval è la configurazione più forte per assistenti in produzione.