Effet de la normalisation

Précédente ] Accueil ] Suivante ]


Passage d'un résultat à l'autre

Comme nous l'avons vu, les variables, ou canaux spectraux, sont centrés, puis leur variances sont normées (ACP) ou non (TKL). Les résultats obtenus dans les deux cas sont différents. En effet, dans le premier cas nous recherchons les valeurs propres de la matrice de covariance, et dans le second celles de la matrice de corrélation. Ces deux matrices ont des valeurs et vecteurs propres qui n'ont à priori pas de raison d'être identiques. Les deux ensembles de variables initiales analysées engendrent le même espace, puisque la transformation de l'un des ensembles à l'autre est une simple multiplication de chaque variable par un coefficient constant. Mais les deux bases principales sont différentes, chacune étant spécifique du système de générateurs qui a servi à la construire. On peut trouver  la matrice permettant d'exprimer le passage de la base formée par les vecteurs principaux issus de l'analyse normée et ceux de l'analyse non-normée. Avec les notations introduites dans le chapitre précédent (Interprétation), si nous notons U la matrice formée par les aij (coordonnées des vecteurs propres résultats de la TKL), V la matrice formée par les bij (coordonnées des vecteurs propres résultats de l'ACP), et D la matrice diagonale suivante :

   (15)

Où si est l'écart-type du canal initial i, alors on peut exprimer les vecteurs propres résultats de l'ACP en fonction de ceux de la TKL par la matrice (voir référence [1] en bibliographie pour plus de détails) :

   (16)

Influence de la normalisation sur le résultat de l'analyse

Lorsque les unités de mesure diffèrent d'une variable à l'autre (ex : age moyen des parents, nombre d'enfants), le recours à la réduction des variables est systématique, car permettant d'atténuer l'effet d'échelle. Ce n'est pas le cas ici, où les variables sont homogènes, c'est pourquoi la question mérite d'être posée.

Les différences entre les variances des divers canaux viennent à priori de leur présence plus ou moins importante dans la scène représentée dans l'image, si l'on suppose la réponse des divers canaux du détecteur constante sur tout le spectre d'observation.

La question qui se pose alors est de savoir si il faut laisser les variances des données initiales intactes, ou si il faut normaliser leurs variances. Le fait de ne pas normaliser revient à donner aux variables un poids proportionnel à sa variance.

La TKL permet donc de respecter les différences de quantité d'information présentes dans chacun des canaux. Le sous-espace engendré par le ou les r (r<=p) premiers axes principaux fourniront une image correspondant à la meilleure manière de projeter le nuage de points de l'image à p canaux de départ, donc en accordant plus ou moins d'importance aux variables suivant leurs variances. L'ACP, quant à elle, effectue la même opération, mais le résultat obtenu avec le ou les r premiers axes principaux donneront une image qui sera la meilleure représentation de l'image de départ si l'on impose que l'information fournie par chaque canal est la même. L'ACP donne donc un résultat qui ne reflète plus les différences quantitatives d'information dans chacun des canaux.

L'ACP se justifie, suivant l'utilisation faite de l'image, si l'on désire que l'information présente dans tous les canaux prenne part égale dans la représentation artificielle résultat de l'analyse, indépendamment de sa quantité au sens de sa variance. Dans le cas un ou quelques uns des canaux ont une variance très supérieure ou très inférieure aux autres canaux, l'ACP fournit des résultats très différents de ceux de la TKL (voir exemples).

Au delà de cette normalisation, on peut très bien choisir de pondérer les variables suivant l'importance que l'on désire qu'elles prennent dans le résultat de l'analyse. La matrice de corrélation s'obtient normalement en fonction de la matrice de covariance par la relation :

   (17)

On peut remplacer la matrice de corrélation par une autre matrice, que l'on obtiendrait en pondérant chacune des variables de la manière suivante :

   (18)

On ajuste alors chacun des coefficients a i suivant le poids que l'on veut donner à telle ou telle variable.


Précédente ] Accueil ] Suivante ]