Reflow Studio v0.5 si propone come soluzione per il neural dubbing completamente locale e portabile, eliminando la necessità di servizi cloud o complesse configurazioni Python.

Funzionalità Principali

  • Voice Cloning Neurale: Integrazione di RVC per il voice cloning istantaneo e di alta qualità.
  • Wav2Lip Sync: Sincronizzazione automatica dei movimenti labiali del video con l'audio doppiato.
  • Face Enhancement: GFPGAN integrato per correggere le sfocature comuni con Wav2Lip.
  • Vision Meter: Filtro dei contenuti in tempo reale.
  • Portabilità: Nessuna installazione di Python/CUDA richiesta. Basta scaricare lo zip, estrarlo ed eseguire il file .bat.

Stack Tecnologico

  • Frontend: Gradio (CSS pesantemente personalizzato)
  • Backend: PyTorch, FFmpeg
  • Modelli: RVC v2, Wav2Lip-GAN, GFPGAN

Il codice sorgente è disponibile su GitHub. Per chi valuta deployment on-premise, esistono trade-off in termini di costi iniziali e gestione dell'infrastruttura. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.