Introduzione
La generazione di dati sintetici è un'approccio promettente per consentire il condivisione di dati in studi biomedici senza compromettere la privacy dei pazienti. Tuttavia, i modelli attuali di generazione richiedono grandi dataset e procedure di allenamento complesse, limitando la loro applicabilità in ambienti con pochi dati.
In questo lavoro, presentiamo un nuovo quadro di riferimento per la generazione di dati sintetici basato sull'apprendimento di rinforzo (RL) e presentiamo RLSyn, un nuovo framework che modella il generatore di dati come una politica aleatoria sui registri dei pazienti e lo ottimizza utilizzando l'ottimizzazione della politica con discriminatori derivati, ottenendo allenamenti più stabili e efficienti.
Risultati
RLSyn è stato valutato su due dataset biomedici - AI-READI e MIMIC-IV - e confrontato con i modelli di generazione adversarial (GAN) e diffusivi in una serie di valutazioni di privacy, utilità e fidelità estese. RL-Syn esegue al pari dei modelli diffusivi e supera i GAN su MIMIC-IV, mentre supera entrambi sui dati più piccoli AI-READI.
Conclusioni
Questi risultati dimostrano che l'apprendimento di rinforzo offre una soluzione principale e efficace per la generazione di dati biomedici sintetici, in particolare in ambienti con pochi dati.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!