SETIT 2005 3 rd International Conference : Sciences of Electronic, Technologies of Information and Telecommunications March 27-31, 2005-TUNISIA Repr´ esentation des formes par des histogrammes de caract´ eristiques et son application ` a la reconnaissance en-ligne de carat` eres Arabes isol´ es N. Mezghani*, A. Mitiche*, M. Cheriet** *INRS-T´ el´ ecommunications, 800, de la Gaucheti` ere W, Suite 6900, Montr´ eal QC, H5A 1K6 Canada. neila@inrs-emt.uquebec.ca mitiche@inrs-emt.uquebec.ca **LIVIA, ´ Ecole de Technologie Sup´ erieure, 1100 rue Notre-Dame Ouest, Montr´ eal QC, H3C 1K3 Canada. mohamed.cheriet@etsmtl.ca R´ esum´ e: L’objet de cet article est l’application d’une nouvelle repr´ esentation de formes pour la reconnaissance en-ligne de carat` eres arabes manuscrits. Cette repr´ esentation consiste en des distributions empiriques (histogrammes) de tangentes et de diff´ erences de tangentes ` a des points r´ eguli` erement espac´ es sur le signal de l’´ ecriture. La reconnaissance est effectu´ ee par une m´ emoire de Kohonen. Traditionnellement, la distance euclidienne est utilis´ ee pour la mesure des distances dans la m´ emoire de Kohonen. Cependant nous avons int´ egr´ e et test´ e d’autres mesures de distances telles que la distance de Helinger et la divergence de Kullback-Leibler qui sont plus appropri´ es pour mesurer des distances entre distributions. Les r´ esultats exp´ erimentaux montrent la robustesse de la repr´ esentation et du classificateur propos´ es. Mots Cl´ es : Caract` eres Arabes, m´ emoire de Kohonen, reconnaissance en-ligne, statistiques de caract´ eristiques. 1 Introduction Les nouvelles technologies d’interaction homme- machine comme les ordinateurs stylo (Pen computer) et les PDA (personal digital assistant), ont engendr´ e de nom- breuses applications. Ainsi, les recherches sur la reconnais- sance de l’´ ecriture manuscrite connaissent un nouvel essor et tendent progressivement vers la conception de syst` emes de reconnaissance de plus en plus performants [4, 5]. Cependant la majorit´ e des ´ etudes sont reli´ ees ` a la reconnaissance hors- ligne de caract` eres et de mots. La reconnaissance en-ligne ainsi que les applications pratiques qui en d´ ecoulent sont relativement plus r´ ecentes. La reconnaissance de l’´ ecriture manuscrite est une tˆ ache g´ en´ eralement consid´ er´ ee comme difficile ` a cause des diff´ erence d’´ ecriture et de la variabilit´ e inter et intra scripteurs. De plus, le trac´ e d’un mot Arabe ´ ecrit de mani` ere naturelle est complexe ` a cause de la nature complexe de la forme de ses caract` eres et de la ressemblance entre les caract` eres de son alphabet. La majorit´ e des recherches portant sur la reconnaissance en-ligne de l’´ ecriture manuscrite se sont pench´ ees sur l’´ etude des classificateurs. Cependant, une bonne repr´ esentation est aussi importante qu’un bon classificateur. Plusieurs classi- ficateurs ont ´ et´ e d´ evelopp´ es. Parmi ces classificateurs on retrouve les r´ eseaux neuronaux (TDNN [16], MLP [8]), les mod` eles de Markov cach´ es et les mod` eles hybrides HMM/NN [11, 15], les classificateurs bas´ es sur les k-plus proches voisins avec appariement ´ elastique [13, 14] et ceux a structure d’arbre [7, 6] en combinaison avec diverses r` egles