Sign up & Download
Sign in

Détection d'objet par mesure de dissimilarités locales

by F Morain-Nicolier, J Landré, S Ruan
XXIIe Colloque GRETSI (2009)

Cite this document (BETA)

Available from Frédéric Morain-Nicolier's profile on Mendeley.
Page 1
hidden

Détection d'objet par mesure de dissimilarités locales

Détection d’objet par mesure de dissimilarités locales
Frédéric MORAIN-NICOLIER, Jérôme LANDRÉ, Su RUAN
Centre de Recherche en STIC (CReSTIC)
9 rue de Québec, IUT, 10026 Troyes Cedex, France
frederic.nicolier@univ-reims.fr
Résumé – Cette comunication porte sur la recherche de la position d’un gabarit de référence dans une image, par mise en correspondance. Le
détecteur proposé s’appuie sur des cartes de dissimilarités locales qui permettent de saisir les écarts entre deux images. La mesure de dissimilarités
locales revient à prendre en compte la non-symétrie de la notion de similarité, ce qui permet une détection fine. Cette non-symétrie est reliée à
la notion de similarité proposée dans un cadre plus général par Tversky. Le détecteur que nous proposons est rapide à calculer. Nous montrons
sur un exemple qu’il renvoie potentiellement moins de faux positifs qu’une autre méthode de référence (chamfer matching). Des simulations
confirment la bonne robustesse du détecteur.
Abstract – In previous works, we have proposed a local dissimilarity map (LDM) in order to compare images. In this research, we show how
the LDM can be applied in the field of shape recognition. A global dissimilarity measure (GDM) is obtained from the LDM. This versatile
mesure allows to measure symetric as well as asymetric similarities. Its properties are related to the human similarity judgement from Tversky
results. A matcher is derived by summing the values of the LDM. The obtained matcher is compared to the chamfer matching. A qualitative
illustration shows the good behaviour of our matcher. In particular, less false-positives are observed. A more intensive test allows to conclude
the good robustness of our matcher with respect to models degradations.
1 Introduction
La reconnaissance d’un objet dans une image constitue une
étape majeure dans un processus d’interprétation visuelle. La
reconnaissance de logos ou la compression vidéo sont quelques-
unes des nombreuses applications de ce sous-ensemble des mé-
thodes de mise en correspondance [6]. Le schéma classique
d’une reconnaissance débute par une segmentation ou une bi-
narisation permettant d’extraire les pixels d’un objet. Puis une
comparaison d’attributs avec ceux d’un objet de référence con-
duisent à une prise de décision. Une méthode éprouvée a été
proposée par Borgefors : le chamfer matching [2]. L’algorithme
consiste à minimiser une distance généralisée entre les contours
d’un gabarit et d’une image.
Dans des travaux antérieurs [1], nous avons introduit une me-
sure de dissimilarité locale permettant la comparaison d’images
binaires. Une carte de dissimilarité locale (CDL) est ainsi cons-
truite en utilisant une fenêtre glissante de taille auto-adaptative.
Nous proposons de construire un détecteur d’objet basé sur
la CDL. La détection est effectuée à partir d’un gabarit. Ce
gabarit est une imagette contenant un exemplaire de l’objet à
trouver. Ce gabarit est comparé localement aux informations
de l’image grâce à la CDL. Ce détecteur de dissimilarités lo-
cales est comparé au détecteur chamfer matching à l’aide un
exemple illustratif et de données simulées .
2 Reformulation de la carte de dissimi-
larités locales
Parmi les distances entre ensembles, la distance de Haus-
dorff (DH) a souvent été utilisée en reconnaissance de formes
[3]. La DH est définie par
DH(A;B) = max(h(A;B); h(B;A)); (1)
avec h(A;B) = maxa2A(minb2B d(a; b)) où d est une dis-
tance sous-jacente. Cette distance est globale. Nous avons pro-
posé une mesure locale puis une carte de dissimilarités locales
(CDL) construite à l’aide d’un algorithme itératif [1]. L’idée
générale est que la taille d’une fenêtre locale croît jusqu’à être
suffisamment grande pour saisir convenablement les caractéris-
tiques locales. Nous avons également proposé une expression
de la CDL qui permet un calcul rapide :
CDLA;B(p) = jA(x)B(x)jmax(tdA(x); tdB(x)); (2)
tdX étant la transformée en distance de l’imageX . Cette equa-
tion peut être simplifiée, pour des images binaires :
CDLA;B(p) = BtdA +AtdB : (3)
Cette nouvelle équation présente un grand intérêt car elle éli-
mine l’opérateur max et la valeur absolue. Il ne reste alors que
des opérations linéaires.
Démonstration. La preuve est assez rapide. CDL1 (resp. CDL2)
est la CDL issue de l’eq. 2 (resp. eq. 3). Pour un pixel p, les al-
ternatives sont :
Page 2
hidden
1.
A(p) = B(p) ) A(p)B(p) = 0
) CDL1(p) = CDL2(p) = 0
2.
A(p) = 1 et B(p) = 0 ) A(p)B(p) = 1
A(p) = 1 ) tdA(p) = 0 (par définition)
) CDL1(p) = max(tdA(p); tdB(p))
) CDL1(p) = tdB(p)
CDL2(p) = B(p)tdA(p) +A(p)tdB(p)
= tdB(p)
) CDL1(p) = CDL2(p)
3. A(p) = 1 et B(p) = 0 : voir 2.
La transformée en distance associe à chaque pixel nul d’une
image, la distance au pixel non-nul le plus proche. Elle peut
être très rapidement calculée par l’utilisation de la distance du
chanfrein, qui représente une bonne approximation de la dis-
tance euclidienne. Elle permet en outre de calculer la transfor-
mée en distance, en ne faisant parcourir à un masque de taille
réduite, que deux fois l’image [4].
3 Utilisation de la CDL comme détec-
teur de motifs
L’objet est représenté par son gabarit, une image binaire G,
et l’image I contenant des objets est une image binaire. Le pro-
blème est de savoir si G est présent autour d’un pixel (x; y) de
I . Nous désignons par I(x;y) la portion de I , centrée en (x; y)
et de taille identique àG. Il s’agit alors de construire un indica-
teur de similarité entre I(x;y) etG. La CDL étant représentative
de la dissimilarité entre deux images, nous choisissons comme
détecteur la somme des distances de la CDL entre I(x;y) et g. Si
cette somme vaut zéro, cela signifie que les deux images sont
identiques et que le gabarit est présent à la position (x; y). Plus
la valeur du détecteur est grande, plus les pixels du gabarit et
de I autour de (x; y) sont distincts. Le détecteur ainsi décrit est
(à partir de l’eq. 3) :
DI;G(x; y) =
X
k
X
l
CDLI(x;y);G(k; l) (4)
=
X
k;l
G(p)tdI(x;y)(p)
+
X
k;l
I(x;y)(p)tdG(p) (5)
Cette équation peut s’interpréter comme un chamfer-mat-
ching symétrique. Le chamfer-matching consiste à cherche la
minimisation d’une distance généralisée entre deux ensembles
de points de contours [2]. La gabarit M est translaté pour par-
courir tdI , la transformée en distance de I . A chaque transla-
tion, le gabarit Gt est superposé à tdI . La moyenne des valeurs
de distances touchées par le gabarit Gt fournit une valeur re-
présentative (chamfer-score : CS) de la ressemblance (locale).
Ainsi pour une translation t donnée :
CS(I;G) =
1
N
X
p
G(p)tdI(p): (6)
CS mesure comment l’image est dissimilaire au gabarit G, ou
encore comment l’image ressemble au gabarit. Par une com-
paraison des équations (4) et (6), il est assez clair que DI;G
mesure comment G est similaire à I , mais aussi comment I est
similaire à G. Tversky a montré que le jugement humain de la
similarité est asymétrique [5]. Par exemple, la similarité de la
Corée du Nord à la Chine n’est pas la même que la similarité de
la Chine à la Corée du Nord. La mesure globale que nous pro-
posons en (4) est symétrique. L’introduction de pondérations
; 2 [0; 1] conduit à une formulation flexible, la mesure de
dissimilarité globale (MDG) :
MDG(A;B) =
X
p
B(p)tdA(p)
+
X
p
A(p)tdB(p): (7)
Une mesure symétrique est obtenue avec = . Des mesures
asymétriques sont obtenues dans les autres cas. En particulier,
= 1 et = 0 permet de retrouver l’équation du chamfer-
matching (eq. 6).
Un rafinement peut-être apporté en suivant la suggestion de
[2] sur le choix d’une somme quadratique des distances mesu-
rées :
MDGq(A;B) =
X
p
B(p)td2A(p)
+
X
p
A(p)TD2B(p): (8)
Si l’on souhaite localiser un gabaritG au sein d’une image I ,
il est donc nécessaire de calculer la dissimilarité entre chaque
translation de G et la portion d’image correspondante de I , ce
qui a été décrit en début de section. Ainsi une version améliorée
de l’équation (4), basée sur la mesure de dissimilarité que nous
venons de mettre au point, est :
DI;G(x; y) = MDGq(I(x;y);M): (9)
Il est clair que cette dernière équation n’est ni plus ni moins
que la somme de deux inter-corrélations :
DI;G = (td
2
I ? G) + (I ? td
2
G): (10)
Les images étant binaires, on a A2 = A. Ainsi une implémen-
tation très-rapide de la mesure globale est réalisable en passant
dans le domaine de Fourier. Le choix des valeurs de et est
conditionné au besoin de l’application proprement dite.
Page 3
hidden
FIG. 1 – (a) Une image test. – (b) un gabarit test, la position
idéale est étiquetée par la lettre G.
FIG. 2 – En (c), le l’image obtenu par le détecteur chamfer
matching. – En (d), celle obtenue avec le détecteur de dissimi-
larités locales. – Une bonne correspondance avec le gabarit est
indiquée par des valeurs faibles, en foncé.
4 Un illustration et un test de robustesse
du détecteur
Nous présentons ici une comparaison de notre détecteur, dit
de dissimilarités locales (DL), et du détecteur de Borgefors.
Dans l’equation (10), le détecteur de dissimilarités locales cor-
respond au cas = = 1 et le détecteur de Borgefors à
= 0; = 1. Les deux détecteurs sont ensuite testé sur leur
robustesse à une dégradation de la qualité du gabarit.
Exemple illustratif Un exemple concret permet d’abord d’i-
dentifier le comportement des deux détecteurs. La figure 1(a)
représente les contours d’une image d’une côte. La figure 1(b)
est le gabarit du motif recherché. La position idéale est mar-
quée par G dans la figure 1(a). Les figures 2(c) et 2(d) repré-
sentent respectivement les images obtenues grâce au détecteur
de Borgefors et au détecteur DL. Une bonne correspondance se
FIG. 3 – Trois images tests et quelques exemples de gabarits
extraits.
FIG. 4 – Courbes de robustesse des détecteurs chamfer mat-
ching et par dissimilarités locales (DL). Les courbes donnent
l’erreur de détection (en localisation) en fonction du pourcen-
tage de perturbation du gabarit extrait de l’image.
traduit par une valeur faible (en foncé).
Pour les deux détecteurs, le minimum est atteint pour le pixel
de coordonnées x = 88, y = 398, ce qui correspond bien à la
position idéale. Cependant, pour le détecteur de Borgefors, des
petites valeurs sont trouvées pour la zone marquée N. Des pe-
tites valeurs indiquent la présence d’une variante du gabarit.
L’interprétation est la suivante : parmi tous les points de cette
zone, il existe un sous-ensemble de points qui correspond au
gabarit cherché, la valeur du détecteur est donc faible. Les va-
leurs de la zone N peuvent être interprétées comme des faux-
positifs potentiels, puisque correspondant à un minimum local
du détecteur.
Le détecteur symétrique est plus discriminant, c.f. fig. 2(d).
La zone N n’est pas détectée positivement du fait de la prise en
compte de la double-similarité. De plus la position idéale est
bien retrouvée.
Test de robustesse Nous proposons un test de la robustesse
du détecteur DL en exploitant trois images de lettrines faisant
Page 4
hidden
partie d’un des projets du laboratoire, c.f. fig. 3(a). Ces trois
images sont de dimensions 256  256. De chaque image, des
gabarits sont extraits. L’opération consiste à extraire une ima-
gette de taille 51 51 centrée en une position déterminée aléa-
toirement. Ce gabarit est alors perturbé en inversant un sous-
ensemble de ses pixels. Les détecteurs chamfer matching et DL
sont alors appliqués. La position estimée de l’objet est alors
déterminée en recherchant le minimum absolu de l’image ren-
voyée par le détecteur. L’erreur est calculée en mesurant la dis-
tance entre la position réelle de l’objet (connue) et sa position
estimée par le détecteur. Pour chaque image, un millier de ga-
barits est ainsi généré.
La figure 4(b) illustre la variation de la moyenne des erreurs
obtenues pour les trois images, pour des perturbations de gaba-
rit entre 0 et 30% des pixels. L’erreur chamfer matching devient
assez importante alors que l’erreur du détecteur DL stagne à 1
pixel pour des perturbations inférieures à 7%. Au delà de 10%
les deux détecteurs ne sont plus capables de retrouver la posi-
tion du motif initial. Sur la base de ces simulations, le détecteur
DL est significativement plus robuste que le chamfer matching.
5 Conclusion et perspectives
Nous avons proposé et testé un détecteur d’objet issu de la
mesure de dissimilarités locales entre une image et un gabarit.
Par rapport au chamfer matching, le détecteur renvoie poten-
tiellement moins de faux positifs, ce qui est confirmé par des
simulations. Nous prévoyons pour la suite des tests dans des
conditions réelles avec vérités terrain, dans le cadre de la re-
connaissance de logos.
Références
[1] E. Baudrier, F. Nicolier, G. Millon, S. Ruan, "Binary-
image comparison with local-dissimilarity quantifica-
tion", Pattern Recognition, vol. 41, n. 5, pp. 1461–1478,
jan. 2008
[2] G. Borgefors, "Hierachical chamfer matching : a parame-
tric edge matching algorithm", IEEE Transactions on Pat-
tern Analysis and Machine Intelligence, vol. 10, n. 6, pp.
849–865, 1988
[3] D.P. Huttenlocher, W.J. Rucklidge, "Comparing images
using the hausdorff distance", IEEE Transactions on Pat-
tern Analysis and Machine Intelligence, vol. 15, n. 9, pp.
850–863, 1993
[4] U. Montanari, "A method for obtaining skeletons using a
quasi-Euclidean distance", Journal of the Association for
Computing Machinery, vol. 15, pp. 600-624, 1968.
[5] A. Tversky, "Features of similarity", Psychological Re-
view, vol. 84, n. 4, pp. 327-352, 1977
[6] B. Zitova, J. Flusser, "Image registration methods : a sur-
vey", Image and Vision Computing, vol. 21, pp. 977–
1000, 2003

Sign up today - FREE

Mendeley saves you time finding and organizing research. Learn more

  • All your research in one place
  • Add and import papers easily
  • Access it anywhere, anytime

Start using Mendeley in seconds!

Already have an account? Sign in

Readership Statistics

3 Readers on Mendeley
by Discipline
 
by Academic Status
 
33% Student (Master)
 
33% Ph.D. Student
 
33% Assistant Professor
by Country
 
33% United States
 
33% France