Voicebox: Clonazione Vocale Locale Open Source

Un sviluppatore ha rilasciato Voicebox, un'applicazione open source per la clonazione vocale che punta a essere un "Ollama per la voce". Il progetto sfrutta Qwen3-TTS per la clonazione vocale rapida e locale, combinato con Whisper per la trascrizione.

Caratteristiche Principali

Voicebox è un'applicazione desktop nativa (Tauri/Rust/Python) progettata per essere leggera e senza dipendenze complesse. Le sue funzionalità includono:

  • Clonazione vocale istantanea con Qwen3-TTS (supporta campioni singoli o multipli).
  • Timeline multi-traccia in stile DAW per la composizione di conversazioni e podcast.
  • Registrazione audio di sistema e da microfono con trascrizione Whisper integrata.
  • API REST e server locale one-click per l'integrazione in giochi e applicazioni.

Il codice sorgente è disponibile su GitHub con licenza MIT. Sono disponibili download per macOS e Windows, con una versione Linux in arrivo. Lo sviluppatore prevede di aggiungere il supporto per altri modelli come XTTS e Bark in futuro. Per chi valuta deployment on-premise, esistono trade-off da considerare; AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.