Trasforma i tuoi libri in audiolibri con l'AI
Un nuovo tool open source permette di convertire file PDF, EPUB, DOCX e TXT in audiolibri di alta qualità, sfruttando Qwen3 TTS, un modello di sintesi vocale open source.
Funzionalità principali:
- Conversione di documenti in vari formati (PDF, EPUB, DOCX, DOC, TXT).
- Due modalità vocali: voci predefinite (Ryan, Serena, ecc.) o voice cloning da un audio di riferimento.
- Utilizzo del modello 1.7B per una qualità ottimale.
- Chunking intelligente con rilevamento dei confini delle frasi.
- Caching intelligente per evitare rielaborazioni.
- Pulizia automatica dei file temporanei.
Caratteristiche chiave:
- Modalità voce personalizzata: narratori professionali ottimizzati per la lettura di audiolibri.
- Modalità voice cloning: trascrizione automatica dell'audio di riferimento e clonazione della voce.
- Supporto multi-formato: compatibile con PDF, EPUB, documenti Word e testo semplice.
- Elaborazione sequenziale: assicura che i chunk siano combinati nell'ordine corretto.
- Monitoraggio dei progressi: aggiornamenti in tempo reale con stime dei tempi.
Esempio di voice cloning:
python audiobook_converter.py --voice-clone --voice-sample reference.wav
Il tool trascrive automaticamente l'audio di riferimento, senza necessità di input manuale di testo.
Performance:
- Velocità di elaborazione: circa 4-5 minuti per chunk (modello 1.7B).
- Qualità: audio di alta qualità adatto per audiolibri.
- Output: formato MP3, bitrate configurabile.
Repository GitHub:
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!