Qwen ha annunciato il rilascio in open source della famiglia completa di modelli Qwen3-TTS (Text-to-Speech), offrendo agli sviluppatori un set di strumenti versatili per la sintesi vocale.

Dettagli dei modelli

La famiglia Qwen3-TTS comprende i modelli VoiceDesign, CustomVoice e Base. Sono disponibili cinque modelli con dimensioni di 0.6B e 1.8B parametri, supportando un totale di dieci lingue diverse. Questo rilascio include il codice sorgente completo, i modelli pre-addestrati e diverse demo per facilitare l'utilizzo e la sperimentazione.

Risorse disponibili

I modelli e le risorse associate sono accessibili tramite:
* GitHub: https://github.com/QwenLM/Qwen3-TTS
* Hugging Face: https://huggingface.co/collections/Qwen/qwen3-tts
* Blog: https://qwen.ai/blog?id=qwen3tts-0115
* Paper: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf
* Hugging Face Demo: https://huggingface.co/spaces/Qwen/Qwen3-TTS

Questo rilascio rappresenta un passo significativo verso la democratizzazione della tecnicia di sintesi vocale, consentendo a ricercatori e sviluppatori di sviluppare applicazioni innovative in diversi ambiti.