Mod` eles graphiques pour la combinaison de descripteurs : application ` a la reconnaissance de symboles Graphical models for combining descriptors : application to symbol recognition S. Barrat S. Tabbone LORIA-UMR 7503 Universit´ e de Nancy 2 BP 239, 54506 Vandoeuvre-les-Nancy email : {barrat,tabbone@loria.fr} R´ esum´ e Nous pr´ esentons dans cet article une adaptation ori- ginale des r´ eseaux Bay´ esiens au probl` eme de la recon- naissance de formes. Plus pr´ ecis´ ement, nous propo- sons une m´ ethode de combinaison de descripteurs qui permet d’am´ eliorer signiﬁcativement le taux de recon- naissance, par rapport aux taux obtenus par chaque descripteur pris individuellement. Pour ce faire, un classiﬁcateur est d´ eﬁni en utilisant un mod` ele de mix- tures de Gaussiennes, repr´ esent´ e par un mod` ele gra- phique. Les mod` eles graphiques sont un mode de re- pr´ esentation simple et intuitif des mod` eles de mixtures de Gaussiennes. Aﬁn de pallier le probl` eme de dimen- sionnalit´ e, nous utilisons une m´ ethode de s´ election de variables. Les r´ esultats exp´ erimentaux, obtenus dans un contexte d’apprentissage supervis´ e et test´ es sur dif- f´ erentes bases, sont tr` es prometteurs. Mots Clefs Reconnaissance de symboles, mod` eles graphiques pro- babilistes, r´ eseaux Bay´ esiens, s´ election de variables. Abstract We present in this paper an original adaptation of Bayesian networks to shape recognition problem. More precisely, we propose a descriptor combination method which enables to improve signiﬁcantly the recognition rate compared to the recognition rates obtained by each descriptor. In this perspective, we deﬁne a classiﬁer which uses a Gaussian mixture model, represented by a probabilistic graphical model. Probabilistic graphical models are a simple and intuitive way of Gaussian mixture model representation. In order to solve the di- mensionality problem, we use a variable selection me- thod. Experimental results, obtained in a supervised learning context and tested on diﬀerent databases, are promising. Keywords Symbol recognition, probabilistic graphical models, Bayesian networks, variable selection. 1 Introduction La classiﬁcation est une tˆache courante en analyse de donn´ ees et en reconnaissance de formes. Cette tˆ ache requiert un classiﬁcateur, i.e une fonction qui assigne une classe ` a des observations d´ ecrites par un ensemble de caract´ eristiques. L’induction de classiﬁcateurs ` a partir d’un ensemble de donn´ ees ´ etiquet´ ees (on parle d’apprentissage supervis´ e) est un probl` eme central en apprentissage. En eﬀet, dans de nombreuses applica- tions, l’objectif est d’assigner un vecteur de caract´ e- ristiques f = {f 1 ,f 2 , ..., f n } `a une classe c i parmi k classes, d´ esign´ ees par le vecteur c = {c 1 ,c 2 , ..., c k }. De nombreuses approches de ce probl` eme sont bas´ ees sur des repr´ esentations fonctionnelles vari´ ees, telles que les arbres de d´ ecision, les r´ eseaux de neurones [1], des r` egles de d´ ecision, . . . Les approches proba- bilistes jouent elles aussi un rˆ ole tr` es important en classiﬁcation. Un moyen de r´ ealiser cet objectif est de calculer la distribution de probabilit´ e condition- nelle P (c i |f ),i ∈{1, 2, ..., k} et d’aﬀecter l’observa- tion f ` a la classe i pour laquelle ladite probabilit´ e est maximale. On peut bien sˆ ur formuler et r´ esoudre des mod` eles probabilistes complexes uniquement par manipulations alg´ ebriques. Cependant, on gagne ` a re- pr´ esenter les distributions de probabilit´ es sous forme de diagrammes, appel´ es mod` eles graphiques proba- inria-00232594, version 1 - 1 Feb 2008 Manuscrit auteur, publié dans "16e congrès francophone AFRIF-AFIA Reconnaissance de Formes et Intelligence Artificielle - RFIA08, Amiens : France (2008)"