TSI
Évènements
Soutenance de thèse de Guillaume Picard
Vendredi 15 Décembre à 10H00, Amphi B312
Télécom Paris - 46, rue Barrault - 75013 Paris

Traitements statistiques de la distorsion non-linéaire
pour la restauration des enregistrements sonores

Auteur
Guillaume Picard
Date
Vendredi 15 Décembre à 10H00
Lieu
Télécom Paris, Barrault, Amphi B312
Directeur de thèse
Membres du jury
Rapporteurs
  • Laurent Daudet (LAM, Paris),
  • Jean-Yves Tourneret (ENSEEIHT, Toulouse)
Examinateurs
  • Xavier Rodet (IRCAM, Paris),
  • Bertrand David (ENST, Paris)
Invités
  • Jean-Hugues Chenot (INA)

Résumé

La restauration des enregistrements sonores est l'une des étapes indispensables pour la conservation et la mise en valeur des archives audiovisuelles. La technologie disponible aujourd'hui offre d'ores et déjà la possibilité d'atténuer certaines dégradations audibles induites par les divers processus survenant lors de l'enregistrement et de l'archivage des supports analogiques. Des résultats appréciables ont par exemple été obtenus pour la réduction des bruits de fonds, l'élimination de défauts impulsionnels («clicks» et «scratches») et la localisation des pertes locales du signal («dropouts»).

L'objet de la thèse est l'étude, la modélisation et le traitement des distorsions non linéaires, pour lesquelles les techniques actuelles s'avèrent impuissantes. L'approche retenue consiste à représenter, globalement, à la fois le signal audio à restaurer et le processus de distorsion, dans le cadre d'un modèle statistique. Cette approche présente un bon compromis entre une souhaitable généricité -possibilité de traiter à l'aide d'une méthode globale plusieurs types de distorsions- et l'utilisation de connaissances spécifiques, notamment concernant les sources de distorsions.

Les phénomènes de saturation ou de sur-modulation qui induisent de graves distorsions du signal peuvent avoir pour origine différents éléments de la chaîne d'enregistrement-lecture. Les phénomènes les plus courants sont la saturation des enregistrements magnétiques, les distorsions d'inscription des enregistrements gramophones ou les distorsions dans les amplificateurs de puissance. Une caractéristique importante du domaine de la restauration et de la conservation des archives sonores est le fait que le matériel d'origine (d'enregistrement et de lecture) est souvent inconnu ou perdu. La caractérisation des sources de distorsion est donc, malheureusement, le plus souvent impossible ou tout au moins très partielle. La ligne directrice de ce projet consiste à appréhender de manière robuste les effets non-linéaires directement à partir de la donnée du signal numérisé, en intégrant l'ensemble des connaissances disponibles, tant sur le signal que sur les processus de distorsion.

La première étape de la thèse consiste en une analyse des mécanismes de la distorsion basée sur une série de mesures où plusieurs séquences audio sont enregistrées en entrée et en sortie d'appareils audiofréquences standards (amplificateurs de puissance, convertisseurs numérique-analogique, enregistreurs sur bandes magnétiques). Les éléments d'analyse retenus conduisent à la présentation des hypothèses principales du traitement. La méthode est basée sur un modèle de transmission non-linéaire choisi parmi ceux étudiés dans la littérature (modèles en cascades de Hammerstein simple), ainsi qu'un modèle des signaux à restaurer (modélisation autorégressive et modèle gaussien à écart-type variable). La seconde étape définit d'une part, la méthode d'identification ``autodidacte'' (à partir de la donnée seule du signal distordu) du modèle de distorsion et d'autre part, la technique de reconstruction de l'extrait sonore associée aux modèles de distorsion et de signal.

Les exemples récents de travaux analogues montrent que la complexité des situations à modéliser implique nécessairement l'utilisation de modèles statistiques avancés, et notamment de modèles «à variables latentes» ou partiellement observés. Les outils d'analyse numérique Bayésienne par échantillonnage MCMC (Markov Chain Monte-Carlo) constituent à ce jour l'approche la plus générique pour aborder ce type de problèmes. Leur utilisation dans un cadre réaliste de restauration, sans même parler de temps réel nécessite toutefois un important travail sur les questions de convergence et d'efficacité d'implémentation.

Plusieurs simulations sont présentées pour illustrer le comportement des algorithmes proposés en fonction de la prépondérance des effets de la dégradation du signal enregistré. Le cas particulier des écrêtages numériques est traité séparément, suivant une formulation simplifiée des algorithmes de simulation.


Page maintenue par le webmaster - 3 février 2010
© Télécom ParisTech/TSI 1998-2010