Seminar: “Graph-Convolutional Neural Networks” by Dr. Diego Valsesia | Machine learning compression

We are glad to announce the next Seminar of the ML-Compr study group: “Graph-Convolutional Neural Networks”  by Dr. Diego Valsesia (Politecnico di Torino, Italy) on the 7th of March at 10h00, Télécom Paristech, 46 rue Barrault, Amphi GRENAT

Source: Seminar: “Graph-Convolutional Neural Networks” by Dr. Diego Valsesia | Machine learning compression

Ouverture de poste dans l’équipe!

Source: Site Web de Marco Cagnazzo | Mon blog professionnel d’enseignant/chercheur de Telecom-ParisTech

Soutenance de thèse de Shuo Zheng

Shuo Zheng soutient sa thèse mardi 05 Février à 10h en amphi Opale à Télécom ParisTech (46 rue Barrault, 75013 Paris).

Titre: Prise en compte des contraintes de canal dans les schémas de codage vidéo conjoint du source-canal

Composition du jury:

  • M. François-Xavier Coudoux, Université Polytechnique Hauts-de-France, Rapporteur
  • Mme Aline Roumy, INRIA Rennes, Rapportrice
  • M. Jean-Marie Gorce, INSA Lyon, Examinateur
  • M.Marc Leny, Ektacom, Examinateur
  • Mme Michèle Wigger, TélécomParitech, Examinatrice
  • M. Marco Cagnazzo, TélécomParisTech, Directeur de thèse
  • M. Michel Kieffer, Université de Paris-sud, Co-directeur de thèse

Résumé: Les schémas de Codage Vidéo Linéaire (CVL) inspirés de SoftCast ont émergé dans la dernière décennie comme une alternative aux schémas de codage vidéo classiques. Ces schémas de codage source-canal conjoint exploitent des résultats théoriques montrant qu’une transmission (quasi-) analogique est plus performante dans des situations de multicast que des schémas numériques lorsque les rapports signal-à-bruit des canaux (C-SNR) dièrent d’un récepteur à l’autre. Dans ce contexte, les schémas de CVL permettent d’obtenir une qualité de vidéo décodée proportionnelle au C-SNR du récepteur. Une première contribution de cette thèse concerne l’optimisation de la matrice de précodage de canal pour une transmission de type OFDM de ux générés par un CVL lorsque les contraintes de puissance dièrent d’un sous-canal à l’autre. Ce type de contrainte apparait en sur des canaux DSL, ou dans des dispositifs de transmission sur courant porteur en ligne (CPL). Cette thèse propose une solution optimale à ce problème de type multi-level water lling et nécessitant la solution d’un problème de type Structured Hermitian Inverse Eigenvalue. Trois algorithmes sous-optimaux de complexité réduite sont également proposés. Des nombreux ré- sultats de simulation montrent que les algorithmes sous-optimaux ont des performances très proches de l’optimum et réduisent signicativement le temps de codage. Le calcul de la matrice de précodage dans une situation de multicast est également abordé. Une seconde contribution principale consiste en la réduction de l’impact du bruit impulsif dans les CVL. Le problème de correction du bruit impulsif est formulé comme un probl ème d’estimation d’un vecteur creux. Un algorithme de type Fast Bayesian Matching Pursuit (FBMP) est adapté au contexte CVL. Cette approche nécessite de réserver des sous-canaux pour la correction du bruit impulsif, entrainant une diminution de la qualité vidéo en l’absence de bruit impulsif. Un modèle phénoménologique (MP) est proposé pour décrire l’erreur résiduelle après correction du bruit impulsif. Ce modèle permet de d’optimiser le nombre de sous-canaux à réserver en fonction des caractéristiques du bruit impulsif. Les résultats de simulation montrent que le schéma proposé améliore considérablement les performances lorsque le ux CVL est transmis sur un canal sujet à du bruit impulsif.

Rapport d’activité HCERES

Les activités de l’équipe ont été présentée à l’occasion de l’évaluation du laboratoire LTCI par l’HCERES.


Journée de la recherche du LTCI

L’équipe MM contribue à la journée de la recherche du LTCI avec un poster sur le dernier article publié à la conférence IEEE Multimedia Signal Processing

Version PDF du poster


Compression avec Deep-Learning

Les activités de recherche du groupe MM dans le domaine de la compression avec apprentissage profond ont été présentées à la journée de la recherche du département IDS


Séminaire Mariem Ben Yahia

Mercredi 4 juillet Meriem Ben Yahia exposera ses travaux sur le Streaming adaptif dynamique dans un séminaire entitulé : Dynamic Adaptive Streaming Solutions for Future Networks: HTTP/2 as a Key. Les transparents sont disponibles ici.

Best student paper award

L’article de Anas El Rhammad sur la compression des hologrammes a reçu le prix de meilleur article étudiant à la conférence SPIE Photonics Europe.

Source: Best student paper award | Site Web de Marco Cagnazzo

Nouveaux arrivants

Deux stagiaires en provenance de l’université de Naples, Chiara Scolavino et Ciro Assediato, rejoignent l’équipe pour les mois d’avril, mai et juin 2018. Vous les trouverez en salle B612. Ils travaillent sur la synthèse de vue virtuelle avec méthodes d’apprentissage profond.

Arrivée Attilio Fiandrotti

Attilio Fiandrotti a rejoint l’équipe Multimédia en qualité de Maître de Conférences en Vidéo Immersive. Son bureau est le E509. Bienvenu !

Voici quelques informations supplémentaire :

Attilio Fiandrotti received his M.Sc. and Ph.D. degrees in Computer Science from Politecnico di Torino in 2005 and 2010 respectively.
As a Ph.D. student at PoliTo and as a visiting student at EPFL, his research activities focused on robust streaming of scalable and multiview video contents over wireless networks.
Between 2010 and 2013, as a postdoctoral researcher at PoliTo, his research interests included Network Coding-based peer-to-peer video streaming and sparse signals recovery in a compressive sensing framework.
Between 2014 and 2016 he was research engineer at Sisvel group, working on a number of standardization and intellectual property related activities.
Between 2016 and 2018 he was senior researcher at Telecom Italia Joint Open Labs, researching on deep learning architectures for computer vision related applications.
Since 2018, he is with Télècom Paristech, IDS department, MM group, his research interests including deep learning techniques for immersive video analysis and compression.