Trasforma i tuoi libri in audiolibri con l'AI

Un nuovo tool open source permette di convertire file PDF, EPUB, DOCX e TXT in audiolibri di alta qualità, sfruttando Qwen3 TTS, un modello di sintesi vocale open source.

Funzionalità principali:

  • Conversione di documenti in vari formati (PDF, EPUB, DOCX, DOC, TXT).
  • Due modalità vocali: voci predefinite (Ryan, Serena, ecc.) o voice cloning da un audio di riferimento.
  • Utilizzo del modello 1.7B per una qualità ottimale.
  • Chunking intelligente con rilevamento dei confini delle frasi.
  • Caching intelligente per evitare rielaborazioni.
  • Pulizia automatica dei file temporanei.

Caratteristiche chiave:

  • Modalità voce personalizzata: narratori professionali ottimizzati per la lettura di audiolibri.
  • Modalità voice cloning: trascrizione automatica dell'audio di riferimento e clonazione della voce.
  • Supporto multi-formato: compatibile con PDF, EPUB, documenti Word e testo semplice.
  • Elaborazione sequenziale: assicura che i chunk siano combinati nell'ordine corretto.
  • Monitoraggio dei progressi: aggiornamenti in tempo reale con stime dei tempi.

Esempio di voice cloning:

python audiobook_converter.py --voice-clone --voice-sample reference.wav

Il tool trascrive automaticamente l'audio di riferimento, senza necessità di input manuale di testo.

Performance:

  • Velocità di elaborazione: circa 4-5 minuti per chunk (modello 1.7B).
  • Qualità: audio di alta qualità adatto per audiolibri.
  • Output: formato MP3, bitrate configurabile.

Repository GitHub:

https://github.com/WhiskeyCoder/Qwen3-Audiobook-Converter