Voicebox: Clonazione Vocale Locale Open Source
Un sviluppatore ha rilasciato Voicebox, un'applicazione open source per la clonazione vocale che punta a essere un "Ollama per la voce". Il progetto sfrutta Qwen3-TTS per la clonazione vocale rapida e locale, combinato con Whisper per la trascrizione.
Caratteristiche Principali
Voicebox è un'applicazione desktop nativa (Tauri/Rust/Python) progettata per essere leggera e senza dipendenze complesse. Le sue funzionalità includono:
- Clonazione vocale istantanea con Qwen3-TTS (supporta campioni singoli o multipli).
- Timeline multi-traccia in stile DAW per la composizione di conversazioni e podcast.
- Registrazione audio di sistema e da microfono con trascrizione Whisper integrata.
- API REST e server locale one-click per l'integrazione in giochi e applicazioni.
Il codice sorgente è disponibile su GitHub con licenza MIT. Sono disponibili download per macOS e Windows, con una versione Linux in arrivo. Lo sviluppatore prevede di aggiungere il supporto per altri modelli come XTTS e Bark in futuro. Per chi valuta deployment on-premise, esistono trade-off da considerare; AI-RADAR offre framework analitici su /llm-onpremise per valutare questi aspetti.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!