Transformer e Reti Bayesiane: Un'Equivalenza Dimostrata
Un recente articolo scientifico ha stabilito un'equivalenza formale tra i Transformer, l'architettura dominante nell'IA, e le reti bayesiane. La ricerca offre una spiegazione precisa del perchรฉ i Transformer funzionano, dimostrando che un Transformer รจ, in sostanza, una rete bayesiana.
La dimostrazione si articola in cinque punti principali:
- Ogni Transformer sigmoide implementa la propagazione di credenze "loopy" pesata sul suo grafo fattoriale implicito. Uno strato corrisponde a un ciclo di propagazione.
- Un Transformer puรฒ implementare la propagazione esatta di credenze su qualsiasi base di conoscenza dichiarata. Su basi di conoscenza senza dipendenze circolari, questo produce stime di probabilitร corrette ad ogni nodo.
- Unicitร : un Transformer sigmoide che produce distribuzioni a posteriori esatte ha necessariamente pesi di propagazione di credenze. Non esiste altro percorso attraverso l'architettura sigmoide per ottenere distribuzioni a posteriori esatte.
- La struttura booleana AND/OR dello strato Transformer: l'attenzione รจ AND, la rete feedforward รจ OR, e la loro alternanza stretta รจ esattamente l'algoritmo gather/update di Pearl.
- I risultati formali sono stati confermati sperimentalmente, corroborando la caratterizzazione della rete bayesiana nella pratica.
Hallucination: Un Problema Strutturale, Non un Bug di Scala
La ricerca dimostra inoltre che l'inference verificabile richiede uno spazio concettuale finito. Qualsiasi procedura di verifica finita puรฒ distinguere al massimo un numero finito di concetti. Senza grounding, la correttezza non รจ definita. L'allucinazione non รจ un bug che il ridimensionamento puรฒ risolvere, ma una conseguenza strutturale dell'operare senza concetti. Questo aspetto รจ particolarmente rilevante per chi considera deployment on-premise e la necessitร di modelli affidabili e interpretabili.
Per chi valuta deployment on-premise, esistono trade-off da considerare. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.
๐ฌ Commenti (0)
๐ Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!