La maggior parte delle strategie di allineamento per l'intelligenza artificiale parte da un presupposto tanto comodo quanto fragile: che le preferenze umane siano bersagli fissi, da dedurre e ottimizzare. Un'ipotesi, questa, che si scontra con decenni di evidenze empiriche in psicologia ed economia comportamentale: ciò che vogliamo non è scolpito nella pietra, ma stratificato, dinamico, e in larga parte costruito proprio durante l'interazione con gli strumenti che usiamo. Strumenti che, oggi, sono sempre più spesso modelli di linguaggio, sistemi di raccomandazione e assistenti digitali progettati per accompagnarci per mesi o anni, personalizzandosi su di noi.

Il gruppo di ricerca che ha formalizzato il concetto di Constructive Alignment parte da qui per smontare l'approccio tradizionale. Invece di trattare l'allineamento come un problema di inference e soddisfacimento immediato, lo riformula come un problema di controllo su traiettorie di preferenze in evoluzione. L'idea è che ogni interazione con un sistema di IA non si limiti a servire un bisogno attuale, ma alteri — anche in modo impercettibile — gli stati valutativi della persona, indirizzandone l'attenzione e, nel tempo, rinforzando determinati valori a scapito di altri.

Tradotto in termini operativi, l'IA diventa un agente che co-determina gli orizzonti di ciò che riteniamo desiderabile. Il framework, che attinge alla teoria del controllo e alle scienze sociali costruttiviste, modella le preferenze come variabili di stato stratificate, influenzate sia dalle azioni del sistema sia dal design dell'interfaccia e del contesto d'uso. Non si tratta più, quindi, di «allineare il comportamento dell'IA» in senso stretto, ma di governare come l'IA stessa modella l'evoluzione dei giudizi umani, garantendo traiettorie di valore coerenti, epistemicamente fondate, resistenti alla manipolazione e capaci di preservare l'autodeterminazione anche in condizioni di incertezza.

Per chi osserva il settore dal punto di vista del deployment, specialmente in contesti on-premise o ibridi dove la sovranità dei dati è un requisito irrinunciabile, questo cambio di prospettiva è dirompente. Se un sistema viene eseguito localmente, all'interno dell'infrastruttura controllata da un'organizzazione, la responsabilità di come quel sistema interagisce con i propri utenti non è più delegabile a un provider cloud. I modelli, una volta serviti in locale, instaurano loop di feedback prolungati: ogni risposta generata, ogni contenuto suggerito, contribuisce a rimodellare le preferenze di chi li utilizza. In ambiti regolamentati (sanità, finanza, pubblica amministrazione) non basta più chiedersi «il modello è accurato?»; occorre chiedersi «quale effetto a lungo termine sta avendo sul modo in cui i dipendenti o i cittadini formano le loro valutazioni?».

Il Constructive Alignment offre allora un prisma per valutare le scelte di design: dalla frequenza con cui un assistente propone scorciatoie decisionali, alla trasparenza con cui segnala l'incertezza, fino alla capacità di preservare spazi di riflessione non mediati. Non è un caso che le aziende più attente alla compliance stiano già iniziando a integrare audit delle dinamiche di preferenza nei processi di validazione dei modelli, affiancandoli ai classici benchmark di qualità. L'obiettivo ultimo, secondo gli autori, non è solo un'IA che si comporta bene, ma un'ecologia di interazioni in cui le persone possano sviluppare e revisionare i propri valori in modo riflessivo, senza essere intrappolate in cammini di preferenza eterodiretti.