TSI
Évènements
Soutenance de thèse de Miguel Alonso
Lundi 13 novembre à 14H30, Amphi B312
ENST -- 46, rue Barrault -- 75013 Paris

Extraction d'information rythmique à partir d'enregistrements musicaux

Auteur
Miguel Alonso
Date
Lundi 13 novembre 2006 à 14H30
Lieu
ENST, Barrault, Amphi B312
Directeur de thèse
Membres du jury
Rapporteurs
  • Régine André-Obrecht, Professeur (Université Paul Sabatier, IRIT de Toulouse),
  • Myriam Desainte-Catherine, Professeur (Université Bordeaux 1, LaBRI de Talence).
Examinateurs
  • Emmanuel Saint-James, Maître de Conférences (Université Pierre et Marie Curie, LIP6 Paris),
  • Anssi Klapuri, Maître de Conférences (Tampere University of Technology, Tampere, Finland).

Résumé

L'objectif de cette thèse est la recherche d'outils de détection et de reconnaissance de la structure rythmique d'un morceau de musique. Il existe de nombreuses applications nécessitant l'information rythmique, parmi lesquelles la transcription musicale par ordinateur, l'alignement rythmique de plusieurs instruments, tâches de «music information retrieval».

L'axe principal du travail de recherche a consisté en le développement de techniques pour l'estimation des paramètres rhythmiques (cadences et localisation de ½«beats» à plusieurs niveaux). Parmi les originalités de ce travail de recherche, nous avons proposé de effectuer l'analyse rythmique de façon separée sur la partie déterministe du signal musical (contenant les sons harmoniques) et sur la partie stochastique (contenant le signal résiduel après extraire la partie harmonique du son original). Dans le domaine du traitement des signaux audio, la détection robuste et efficace des attaques (onsets) des signaux musicaux est consideré comme un sujet difficile. A ce propos, nous utilisons le concept du flux énergétique spectral comme le taux auquel l'énergie du contenu fréquentiel du signal audio change à un instant donné. Et nous nous sommes servis de ce principe pour développer un détecteur d'attaques très performant qui améliore de façon considerable la méthode de calcule traditionelle. Une autre originalité de ce travail consiste en l'utilisation d'un algorithme de programmation dynamique modifiée pour suivre simultanément plusieurs trajectoires rythmiques à l'interior d'un signal musical.

L'efficacité de cette approche a été validée sur une base de données comportant 1435 morceaux musicaux (annotés à la main par des musicians excercés) appartenant à une dizaine de genres. Le taux de reconnaissance global du système proposé est de 92.3%. Certains des algorithmes développés ont été soumis aux trois concours internationaux «Music Information Retrieval Evaluation eXchange» (MIREX) dans la catégorie de «tempo extraction» et dans la avant dernière édition de cette compétition nous avons obtenu la prémière place parmi trece autres équipes participantes.


Page maintenue par le webmaster - 3 février 2010
© Télécom ParisTech/TSI 1998-2010