Introduzione

I modelli di linguaggio sono ormai una parte integrante delle nostre interazioni con le tecnologie. Tuttavia, recentemente scoperti i pregiudizi nasconditi nelle loro risposte. Uno studio ha analizzato i modelli di linguaggio e scoperto che possono avere tendenze di tono, influenzando la percezione della fiducia, dell'empatia e della giustizia.

Il metodo

I ricercatori hanno creato due set di dati dialoghi sintetici: uno generato da prompt neutri e un altro esplicitamente guidato per produrre toni positivi o negativi. Utilizzando una tecnica di supervisione debole tramite un modello preformato DistilBERT, hanno classificato i toni e allenato diversi modelli per rilevare questi pattern.

I risultati

I modelli hanno raggiunto macro F1 score fino al 0.92, mostrando che i pregiudizi di tono sono systematici, misurabili e rilevanti per la progettazione di sistemi di AI conversazionale confidibili.

Contesto tecnico

I modelli di linguaggio hanno rivoluzionato l'industria del software di assistenza vocale. Tuttavia, il loro impatto sui pregiudizi e sull'impatto emotivo รจ ancora poco compreso. Questo studio apre una nuova prospettiva sulla necessitร  di analizzare e controllare i modelli di linguaggio per garantire una comunicazione equilibrata.