Fragilità Percettiva dei Modelli Multimodali

I modelli multimodali di linguaggio (MLLM), nonostante le loro notevoli capacità, mostrano una certa fragilità percettiva di fronte a scene visivamente complesse. Questa debolezza deriva principalmente dalla dipendenza da dataset di training finiti, la cui scalabilità risulta proibitiva in termini di costi.

AOT-SFT e AOT: Un Nuovo Approccio

Per affrontare questa problematica, è stato introdotto extbf{AOT-SFT}, un dataset avversariale su larga scala progettato per migliorare la robustezza dei MLLM. Inoltre, è stato proposto extbf{AOT (Adversarial Opponent Training)}, un framework di self-play che mira a sviluppare la robustezza dei MLLM attraverso la creazione autonoma di dati di training.

Co-evoluzione Attaccante-Difensore

Il metodo AOT orchestra una co-evoluzione tra un attaccante (image-editing Attacker) e un difensore MLLM (Defender MLLM). L'attaccante genera un curriculum diversificato e dinamico di manipolazioni delle immagini, costringendo il difensore ad adattarsi e migliorare le sue capacità percettive. Gli esperimenti condotti dimostrano che AOT migliora significativamente la robustezza percettiva del difensore e riduce le allucinazioni, stabilendo un nuovo paradigma scalabile per l'addestramento di MLLM più affidabili.

Per chi valuta deployment on-premise, esistono trade-off da considerare. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.