Kitten ML ha annunciato il rilascio di Kitten TTS V0.8, una nuova suite di modelli text-to-speech (TTS) open source progettati per essere estremamente compatti ed efficienti.

Caratteristiche Principali

  • Dimensioni ridotte: Il modello più piccolo, Nano 14M, occupa solo 25 MB.
  • Voci espressive: Offre otto voci distinte (4 maschili e 4 femminili) con elevata espressività.
  • Esecuzione su CPU: Non richiede GPU, ideale per dispositivi edge e sistemi con risorse limitate.
  • Licenza Open Source: Distribuito con licenza Apache 2.0 per uso gratuito.
  • Applicazioni On-Device: Permette di creare agenti vocali e applicazioni vocali locali senza necessità di API cloud.

Modelli Disponibili

  • Mini 80M
  • Micro 40M
  • Nano 14M

I modelli Kitten TTS V0.8 rappresentano un significativo passo avanti rispetto alle versioni precedenti, offrendo qualità, espressività e realismo migliorati grazie a pipeline di training avanzate e dataset più ampi. La capacità di operare su CPU e le dimensioni contenute li rendono particolarmente adatti per applicazioni in cui la sovranità dei dati e la bassa latenza sono cruciali. Per chi valuta deployment on-premise, esistono trade-off da considerare, come evidenziato dai framework analitici di AI-RADAR su /llm-onpremise.