Uno sviluppatore ha segnalato un progetto open source chiamato Kanade Tokenizer, disponibile su GitHub.

Kanade Tokenizer: voice cloning rapido

Kanade Tokenizer è presentato come un tokenizer audio ottimizzato per il voice cloning in tempo reale. Secondo lo sviluppatore, il tool raggiunge un real-time factor elevato, superando alternative come RVC (Retrieval-Based Voice Conversion). Un aspetto interessante è la sua capacità di operare su CPU, mantenendo prestazioni superiori al real-time.

Lo sviluppatore ha creato una fork del progetto con un'interfaccia utente (GUI) basata su Gradio e Tkinter, semplificandone l'utilizzo. Sono forniti esempi audio che dimostrano la conversione della voce da ljspeech a kokoro.

Il progetto e la fork sono disponibili ai seguenti indirizzi:

Per chi valuta deployment on-premise di soluzioni simili, AI-RADAR offre framework analitici su /llm-onpremise per valutare i trade-off tra diverse architetture.