Jérôme Darbon - Pablo Musé
DEA MVA 2000-2001
La segmentation a pour but de déterminer les régions cohérentes d'une image à la fois spatialement et du point de vue de leur contenu. Nous présentons la méthode de Cheng et Sun décrite dans [1] dont le but est la segmentation d'images en couleur.
Cette méthode procède en trois étapes:
L'homégénéité est une information locale et correspond au caractère
uniforme d'une région. Elle est composée de deux informations sur
l'intensité : d'une part son écart-type, d'autre part ses
discontinuités (norme du gradient). En chaque point l'écart-type
décrit le contraste de l'intensité dans le voisinage du point
considéré, et la mesure de discontinuité indique le changement brusque
de niveau de gris toujours dans un voisinage de ce point. Pour une
représentation RGB, l'intensité
vérifie
.
Soit
l'intensité du pixel
situé à la
position
dans une image da taille
.
L'écart-type
du Pixel
est calculé sur une fenêtre
de taille
:
La mesure de discontinuité
de l'intensité au pixel
est calculée par l'opérateur de Sobel, sur une fenêtre de taille
:
où
et
sont respectivement les composantes du gradient de I
au point (i,j) dans les directions
et
.
L'écart type
et la mesure de discontinuité
sont
normalisés; on obtient alors l'écart type normalisé
et la
mesure de discontinuité normalisée
. L'homogénéité
est représenté par
Un choix adéquat pour la taille des fenêtres est
et
.
L'algorithme de détection des pics donné dans [1] est présenté dans cette section. Dans la méthode de segmentation décrite dans [1], il est appliqué à l'histogramme d'homogénéité aussi bien qu'à l'histogramme de teinte de chaque région.
Soit h un histogramme tel que
avec
.
L'algorithme de recherche des pics est le suivant:
Nous trouvons les modes le plus significatifs dans l'histogramme d'homogénéité en appliquant l'algorithme précédent. L'intensité correspondant aux vallées segmente l'image en des régions homogènes.
La caractéristique Hue (
) peut être obtenue des composantes R, G, B
par la transformation non linéaire suivante:
La deuxième phase de cette technique de segmentation d'images en couleur consiste alors à analyser l'histogramme de caractéristique Hue. Pour chaque région issue de l'étape 1, chaque région est divisée en sous-régions de couleurs similaires. C'est dans ce sens que la technique décrite est hiérarchique: d'abord on segmente l'image à partir de l'histogramme d'homogénéité, puis à partir des histogrammes de la caractéristique Hue (la hauteur de la hiérarchie est 2 !).
La caractéristique Hue présente un inconvénient: elle n'est pas
définie pour un niveau de saturation nul, et elle a un problème
d'instabilité pour les bas niveaux de saturation. Pour résoudre cet
inconvénient, la méthode que nous décrivons redéfinit
pour les
pixels singuliers. Un tel pixel reçoit la moyenne de la teinte de ses
huit voisins. Si tous ses voisins correspondent aussi à des points
présentant une singularité dans la teinte, sa teinte reste indéfinie
jusqu'à l'étape de fusion de régions (section 4.2).
Précisons que de tels pixels sont plutôt rares.
Pour chaque région issue de la segmentation basée sur l'homogénéité,
on calcule le
de ses pixels, on le normalise dans l'intervalle
et on construit l'histogramme la caractéristique Hue.
Ensuite on lui applique l'algorithme de détection de pics décrit dans
la section 2.2, et finalement on cherche les vallées entre
les pics. Puis, on divise l'intervalle de la caractéristique Hue en
segments déterminés par les vallées. Chaque segment de l'histogramme
de la caractéristique Hue représente une sous-région caractérisée par
une couleur similaire. Une fois que toutes les régions ont été
caractérisées, on assigne à chaque sous-région sa couleur moyenne, en
affectant à chaque pixel les composantes R, G et B correspondantes.
Éventuellement, les deux premières étapes peuvent donner lieu à une
sur-segmentation de l'image. Ceci peut arriver lorsque des pixels qui
correspondent à une même région visuelle, ont des couleurs qui ne sont
pas suffisamment semblables. Une phase de fusion de régions s'avère
alors nécessaire. La mesure de dissimilarité utilisée dans cette
méthode est fondée sur la représentation CIE(L*a*b*). Elle est issue
de la représentation
,
,
définie par la Commission
Internationale de l'Éclairage (CIE):
Les composantes
,
et
sont obtenues de
,
et
par la transformation non linéaire suivante:
où
sont les valeurs du blanc standard.
L'espace CIE(L*a*b*) est bien adapté du point de vue perceptif pour
mesurer la différence entre les couleurs (ce qui n'est pas vrai pour
la représentation RGB). La différence entre deux couleurs de
coordonnées
et
dans la base
CIE(L*a*b*) est:
La possibilité d'exprimer les différences de couleur pour la perception humaine par une distance euclidienne est une propriété remarquable.
Si le nombre de régions obtenues par les étapes précédentes est
,
alors il y a
couleurs dans l'image pré-segmentée. La différence de
couleur pour chaque paire de région est calculée par (1).
L'écart-type
de la liste des différences de couleur s'exprime
ainsi:
où
est la moyenne des différences de couleur,
est la la
différence de couleur, et
est le nombre
total de différences. On fixe le seuil pour la fusion des régions à
. Le processus de fusion est itératif :
Les expériences ont été menées sur lena, un tableau de Kandinsky (comp10), house, airplane , un tableau de Cézanne (lauves), et pills.
Les résultats sont présentés de la façon suivante:
Nous remarquons que les images segmentées sont de bonne qualité. Le nombre de couleurs dans ces images est faible et permet cependant de garder les structures principales. Mais cette méthode ne parvient pas à segmenter les petites structures qui peuvent être importante. Par exemple, dans l'image house, le blanc de la maison est fusionné avec le ciel.
L'algorithme est fragile à la détection des pics des histogrammes. Par
exemple, nous observons que pour l'image lena, l'algorithme de
détection de pics élimine un pic important (indice 106). Il considère
que la vallée n'est pas assez creusée. Nous proposons alors une
modification de cette méthode. Elle consiste à modifier le calcul de
dans la troisième étape de l'algorithme de détection des
pics. Au lieu de calculer
par
nous remplaçons cette formule par :
C'est-à-dire que nous redéfinissons l'intervalle sur lequel nous calculons la moyenne. Au lieu de la calculer sur tout l'intervalle compris entre deux pics, nous ne la calculons que sur le deuxième et troisième quart de celui-ci.
Le résultat de la segmentation avec cette modification est présenté pour lena et pour pills. Nous remarquons qu'avec cette modification, l'algorithme récupère la région bleue de l'image lena originale. Pour l'image pills, l'algorithme modifié permet de récupérer deux couleurs supplémentaires: l'unique rouge récupéré par la méthode originale se décompose en trois qualités de rouge qui correspondent à des types de pilules différentes.
La méthode de segmentation d'images en couleur décrite dans [1] est une méthode simple qui permet d'obtenir de bons résultats. Cependant, l'algorithme d'extraction des pics les plus significatifs dans un histogramme est souvent trop sévère. Ceci a pour conséquence que certaines images sont sous-segmentées. Cet aspect nous a amené à modifier légèrement cet algorithme afin de capturer certains pics importants ; et donc d'obtenir une segmentation plus fine.