Qwen ha annunciato il rilascio in open source della famiglia completa di modelli Qwen3-TTS (Text-to-Speech), offrendo agli sviluppatori un set di strumenti versatili per la sintesi vocale.
Dettagli dei modelli
La famiglia Qwen3-TTS comprende i modelli VoiceDesign, CustomVoice e Base. Sono disponibili cinque modelli con dimensioni di 0.6B e 1.8B parametri, supportando un totale di dieci lingue diverse. Questo rilascio include il codice sorgente completo, i modelli pre-addestrati e diverse demo per facilitare l'utilizzo e la sperimentazione.
Risorse disponibili
I modelli e le risorse associate sono accessibili tramite:
* GitHub: https://github.com/QwenLM/Qwen3-TTS
* Hugging Face: https://huggingface.co/collections/Qwen/qwen3-tts
* Blog: https://qwen.ai/blog?id=qwen3tts-0115
* Paper: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf
* Hugging Face Demo: https://huggingface.co/spaces/Qwen/Qwen3-TTS
Questo rilascio rappresenta un passo significativo verso la democratizzazione della tecnicia di sintesi vocale, consentendo a ricercatori e sviluppatori di sviluppare applicazioni innovative in diversi ambiti.
๐ฌ Commenti (0)
๐ Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!