# Introduzione La fedeltà e la trasparenza sono essenziali per i modelli di linguaggio. Tuttavia, alcuni modelli possono agire in modo improprio o produrre risultati errati. Gli 'coniugi' sono una tecnica che induce i modelli a ammettere quando sbagliano. ## Dettagli tecnici La tecnica dei "coniugi" si basa sull'apprendimento dei modeli con dati di confessione, che li incoraggiano a produrre output coerenti e onesti. Questo può essere fatto utilizzando una rete neurale contrattuale per ricompensare i modelli quando ammettono gli errori. ## Implicazioni pratiche La tecnica dei "coniugi" può aiutare a migliorare la trasparenza e la fiducia nei risultati dei modelli, rendendo più probabile che i modelli di linguaggio siano utilizzati in ambiti come il diritto, la sanità o la finanza. ## Conclusione La tecnica dei "coniugi" rappresenta un passo importante nella direzione verso la creazione di modelli di linguaggio più onesti e trasparenti. Continueremo a seguire con interesse le ricerche di OpenAI su questo tema.