Effet de la normalisation |
|
|
Passage d'un résultat à l'autre
Comme nous l'avons vu, les variables, ou canaux spectraux, sont centrés, puis leur variances sont normées (ACP) ou
non (TKL). Les résultats obtenus dans les deux cas sont différents. En effet, dans le
premier cas nous recherchons les valeurs propres de la matrice de covariance, et dans le
second celles de la matrice de corrélation. Ces deux matrices ont des valeurs et vecteurs
propres qui n'ont à priori pas de raison d'être identiques. Les deux ensembles de
variables initiales analysées engendrent le même espace, puisque la transformation de
l'un des ensembles à l'autre est une simple multiplication de chaque variable par un
coefficient constant. Mais les deux bases principales sont différentes, chacune étant
spécifique du système de générateurs qui a servi à la construire. On peut
trouver la matrice permettant d'exprimer le passage de la base formée par les
vecteurs principaux issus de l'analyse normée et ceux de l'analyse non-normée. Avec les notations introduites dans le chapitre
précédent (Interprétation), si nous notons U la matrice
formée par les aij (coordonnées des vecteurs propres résultats de la TKL), V
la matrice formée par les bij (coordonnées des vecteurs propres résultats de
l'ACP), et D la
matrice diagonale suivante :
Les différences entre les variances des divers canaux viennent à priori de leur présence plus ou moins importante dans la scène représentée dans l'image, si l'on suppose la réponse des divers canaux du détecteur constante sur tout le spectre d'observation. La question qui se pose alors est de savoir si il faut laisser les variances des données initiales intactes, ou si il faut normaliser leurs variances. Le fait de ne pas normaliser revient à donner aux variables un poids proportionnel à sa variance. La TKL permet donc de respecter les différences de quantité d'information présentes dans chacun des canaux. Le sous-espace engendré par le ou les r (r<=p) premiers axes principaux fourniront une image correspondant à la meilleure manière de projeter le nuage de points de l'image à p canaux de départ, donc en accordant plus ou moins d'importance aux variables suivant leurs variances. L'ACP, quant à elle, effectue la même opération, mais le résultat obtenu avec le ou les r premiers axes principaux donneront une image qui sera la meilleure représentation de l'image de départ si l'on impose que l'information fournie par chaque canal est la même. L'ACP donne donc un résultat qui ne reflète plus les différences quantitatives d'information dans chacun des canaux. L'ACP se justifie, suivant l'utilisation faite de l'image, si l'on désire que l'information présente dans tous les canaux prenne part égale dans la représentation artificielle résultat de l'analyse, indépendamment de sa quantité au sens de sa variance. Dans le cas un ou quelques uns des canaux ont une variance très supérieure ou très inférieure aux autres canaux, l'ACP fournit des résultats très différents de ceux de la TKL (voir exemples). Au delà de cette normalisation, on peut très bien choisir de pondérer les variables suivant l'importance que l'on désire qu'elles prennent dans le résultat de l'analyse. La matrice de corrélation s'obtient normalement en fonction de la matrice de covariance par la relation :
On peut remplacer la matrice de corrélation par une autre matrice, que l'on obtiendrait en pondérant chacune des variables de la manière suivante :
On ajuste alors chacun des coefficients a i suivant le poids que l'on veut donner à telle ou telle variable. |
|
|