**Introduzione**
Il dataset di riconoscimento della voce automatico Loquacious è stato pubblicato recentemente e si presenta come un sostituto per i dataset estesati di riconoscimento della voce inglesi come LibriSpeech o TED-Lium. L'obiettivo principale del dataset è quello di fornire divisi di allenamento e test ben definiti in diversi domini acustici e linguistici, con una licenza aperta adatto sia alla ricerca accademica che all'industria.
**Nuove risorse per il datasets Loquacious**
Per promuovere ulteriormente la benchmarking e l'utilizzabilità di questo nuovo dataset, abbiamo presentato ulteriori risorse in forma di modelli di linguaggio n-grammici (LMs), un modello G2P (Grapheme-to-Phoneme) e lessicografie di pronuncia, con accesso aperto e pubblico. Utilizzando queste nuove risorse abbiamo presentato risultati sperimentali su una vasta gamma di architetture di riconoscimento della voce automatico con diverse unità etichette e topologie.
**Risultati iniziali e applicabilità**
I risultati iniziali mostrano che il dataset Loquacious offre un caso di studio prezioso per una varietà di sfide comuni nel riconoscimento della voce automatica.
📁 LLM
AI generated
Nuove risorse e analisi per i sistemi di riconoscimento della voce automatico
Vuoi approfondire? Leggi l'articolo completo dalla fonte:
📖 VAI ALLA FONTE ORIGINALE
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!