[P-Et2.3] 517 21 ème Traitement Automatique des Langues Naturelles, Marseille, 2014 RENAM: Système de Reconnaissance des Entités Nommées Amazighes Meryem Talha 1 Siham Boulaknadel 1, 2 Driss Aboutajdine 1 (1) LRIT, Unité Associée au CNRST (URAC 29), Faculté des Sciences, Mohammed V-Agdal, Rabat, Maroc (2) IRCAM, Avenue Allal El Fassi, Madinat Al Irfane, Rabat-Instituts, Maroc meriem.talha@gmail.com, boulaknadel@ircam.ma, aboutaj@fsr.ac.ma Résumé. La reconnaissance des Entités Nommées (REN) en langue amazighe est un prétraitement potentiellement utile pour de nombreuses applications du traitement de la langue amazighe. Cette tâche représente toutefois un sévère challenge, compte tenu des particularités de cette langue. Dans cet article, nous présentons le premier système d’extraction d’entités nommées amazighes (RENAM) fondé sur une approche symbolique qui utilise le principe de transducteur à états finis disponible sous la plateforme GATE. Abstract. Named Entity Recognition (NER) for Amazigh language is a potentially useful pretreatment for many processing applications for the Amazigh language. However, this task represents a tough challenge, given the specificities of this language. In this paper, we present (NERAM) the first named entity system for the Amazigh language based on a symbolic approach that uses linguistic rules built manually by using an information extraction tool available within the platform GATE. Mots-clés : Reconnaissance des entités nommées (REN), Langue Amazighe, Règles d’annotation, JAPE, GATE. Keywords: Named Entities Recognition (NER), Amazigh Language, Annotation Rules, JAPE, GATE. 1 Introduction La langue amazighe fait partie des langues chamito-sémitiques ou encore appelé afro-asiatiques (Cohen 2007, Chaker 1989) qu’on soit au Maroc ou ailleurs. La langue Amazighe est maintenant une langue qui possède tous ses attributs: dotée d’une graphie officielle, un codage propre dans le standard Unicode, une grammaire, une orthographe et un vocabulaire très riche. La tâche REN est une sous tâche du domaine d’extraction d’information consistant à identifier et à catégori ser certaines expressions linguistiques autonomes et mono-référentielles (Ehrmann, 2008). Certaines langues ont éveillé beaucoup d’intérêt, notamment à travers les campagnes d’évaluation telles que CONLL (Tjong Kim Sang, 2002) pour l’espagnol et l’allemand, MUC (Grishman et Sundheim, 1996) pour l’anglais et le japonais, et ESTER (Galliano et al., 2009) pour le français. Toutefois, l’Amazighe étant une langue peu dotée en terme de ressources linguistiques informatisées, les travaux sur de la reconnaissance des entités nommées sont une opportunité pour la valorisation de cette langue dans la société de l’information. C’est dans cette optique que se situe le travail que nous présentons dont le but est de détecter et extraire dans des textes amazighs les entités nommées pertinentes et ceci en développant le premier système de reconnaissance d’entités nommées (RENAM) qui servira à des applications plus spécifiques. Notre système est fondé sur une approche symbolique où l’extraction s’effectue en se basant sur un ensemble de lexiques de noms et des règles construites manuellement en exploitant l’outil d’extraction des entités nommées disponible sous la plateforme GATE 1 . Notre article est structuré comme suit : la première section présente un état de l’art des approches d’extraction des entités nommées, la deuxième examine les difficultés entravant l’extraction des entités nommées en amazighe, la troisième aborde les particularités de la plateforme choisie ainsi que la méthodologie utilisée, tandis que la discussion 1 http ://gate.ac.uk