TSI
Évènements
Soutenance de thèse de Shiuan-Sung Lin
Mardi 5 Juin à 14H00, Amphi B312
Télécom Paris - 46, rue Barrault - 75013 Paris

Optimisation du graphe de décodage d’un système de reconnaissance vocale
par apprentissage discriminant

Auteur
Shiuan-Sung Lin
Date
Mardi 5 Juin 2007 à 14H00
Lieu
Télécom Paris, Barrault, Amphi B312
Directeur de thèse
Membres du jury
Rapporteurs
  • Paul Deléglise (Université du Maine),
  • Kamel Smaïli (Université Nancy 2)
Examinateurs
  • Claire Waast (EDF),
  • Guillaume Gravier (IRISA),
  • Jean-Paul Haton (Université Henri Poincaré)

Résumé

Les trois sources principalement utilisées en reconnaissance vocale automatique (Automatic Speech Recognition, ASR) sont les modèles acoustiques, le dictionnaire et le modèle de langage. Elles sont habituellement conçues et optimisées de manière séparée. Notre travail a proposé une méthodologie, à savoir un apprentissage discriminant sur un grand graphe de décodage, pour optimiser conjointement les paramètres de ces différents modèles, en se fondant sur l'intégration des ressources dans un transducteur fini pondéré dont les poids des transitions sont estimés par de manière discriminante.

Dans ce cadre d'apprentissage, les paramètres du modèle sont ajustés itérativement de façon à réduire progressivement le nombre d’erreurs de retranscription commises par le système. Nous considérons en particulier dans ce travail, de mettre en oeuvre ce cadre d'apprentissage pour une tâche de reconnaissance à « grand vocabulaire » : la transcription automatique des nouvelles de la radio française. Nous proposons plusieurs techniques pour un accélérer les algorithmes de décodage, afin de rendre ce type d’apprentissage computationnellement faisable.

Une série d’expériences conduites sur cette tâche montrent qu'une réduction de 1 point du taux d’erreur de retranscription peut être obtenu, démontrant que cette méthodologie d'apprentissage permet d’améliorer les performances des systèmes de reconnaissance. Diverses extensions de cette méthode seront finalement présentées et discutées.


Page maintenue par le webmaster - 3 février 2010
© Télécom ParisTech/TSI 1998-2010