TSI
Évènements
Soutenance de thèse de Leila Zouari
Jeudi 22 Mars à 14H00, Amphi B312
Télécom Paris - 46, rue Barrault - 75013 Paris

Vers le temps réel en transcription automatique
de la parole grand vocabulaire

Auteur
Leila Zouari
Date
Jeudi 22 Mars 2007 à 14H00
Lieu
Télécom Paris, Barrault, Amphi B312
Directeur de thèse
Membres du jury
Rapporteurs
  • Denis Jouvet (France Télécom, Division R&D - TECH/ SSTP),
  • Jean-Luc Zarader (Université Pierre et Marie Curie, LISIF)
Examinateurs
  • Régine André-Obrecht (Université Paul Sabatier, IRIT),
  • Paul Deléglise (Université du Maine, Institut d'Informatique Claude Chappe, LIUM),
  • Chafic Mokbel (Université de Balamand)
  • Dijana Petrovska (Institut National des Télécommunications, EPH)

Résumé

Le principal frein à l’utilisation des systèmes de reconnaissance automatique de la parole grand vocabulaire relève aujourd’hui principalement de leur relative lenteur d’exécution, lenteur rendant par exemple complexe leur portage dans des environnements pauvres en ressources calculatoires (PDA, etc.). L’étude réalisée au cours de cette thèse a ainsi porté sur la recherche de méthodes efficaces d’accélération de la reconnaissance.

Une première phase d’étude des méthodes d’accélération du décodage et en particulier de celles liées à la limitation du nombre de densités, nous a permis de regrouper celles-ci en trois catégories distinctes selon qu’elles se basent sur le partitionnement hiérarchique, sur la classification de type k-moyennes ou sur la sous-quantification vectorielle. Notre travail a consisté à étudier et à améliorer les méthodes issues de chacune de ces catégories.

Les contributions de notre étude se déclinent alors en trois propositions concernant respectivement le partitionnement hiérarchique multi-niveaux, la sélection contextuelle des gaussiennes par regroupement k-moyennes et la sous-quantification vectorielle contextuelle.

Les expériences ont montré un gain important en termes de réduction du nombre de densités calculées puisque cette réduction se mesure autour de 87% sans perte de performances.


Page maintenue par le webmaster - 3 février 2010
© Télécom ParisTech/TSI 1998-2010