Kitten ML ha annunciato il rilascio di Kitten TTS V0.8, una nuova suite di modelli text-to-speech (TTS) open source progettati per essere estremamente compatti ed efficienti.
Caratteristiche Principali
- Dimensioni ridotte: Il modello più piccolo, Nano 14M, occupa solo 25 MB.
- Voci espressive: Offre otto voci distinte (4 maschili e 4 femminili) con elevata espressività.
- Esecuzione su CPU: Non richiede GPU, ideale per dispositivi edge e sistemi con risorse limitate.
- Licenza Open Source: Distribuito con licenza Apache 2.0 per uso gratuito.
- Applicazioni On-Device: Permette di creare agenti vocali e applicazioni vocali locali senza necessità di API cloud.
Modelli Disponibili
- Mini 80M
- Micro 40M
- Nano 14M
I modelli Kitten TTS V0.8 rappresentano un significativo passo avanti rispetto alle versioni precedenti, offrendo qualità, espressività e realismo migliorati grazie a pipeline di training avanzate e dataset più ampi. La capacità di operare su CPU e le dimensioni contenute li rendono particolarmente adatti per applicazioni in cui la sovranità dei dati e la bassa latenza sono cruciali. Per chi valuta deployment on-premise, esistono trade-off da considerare, come evidenziato dai framework analitici di AI-RADAR su /llm-onpremise.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!